蓝鲸智云管控平台产品白皮书

导出PDF

平台简介

蓝鲸管控平台,是整个蓝鲸平台的底层管控系统,是蓝鲸所有其他服务的基础,是蓝鲸服务体系与用户机器的连接器。

蓝鲸管控平台是典型的两层分布式 C/S 结构,主要包含智能 Agent,提供各种服务的 Server,以及 zookeeper、redis、MySQL 等周边保障模块。其中Agent 是部署在业务机器上的程序,每台业务机器理论上只可以部署一个;其他模块部署无具体要求,用户可以单独部署,也可以混合部署。

在整个蓝鲸体系中,唯独蓝鲸管控平台没有直面用户,但蓝鲸管控平台在蓝鲸体系中却是不可或缺的,它为蓝鲸其他平台提供了人机交互的通道与能力。蓝鲸管控平台主要提供了三种类型的服务能力:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。

平台架构

  • 图2

  • BK Agent:蓝鲸智能Agent程序,需要安装在业务需要管控的实体机、虚拟机或者容器里面。BK Agent 的启动需要按照要求输入制定的命令行参数,并依赖配置文件。BK Agent是蓝鲸管控平台提供三大服务能力的实际执行者, BK Agent 所在机器的通讯策略、网络状况需要在安装前调整好才能发挥其所有能力。

  • BK TaskServer:蓝鲸管控平台任务及控制服务端程序。该程序提供对集群内Agent的管理能力,并支持对 Agent 批量下和执行发命令或脚本。

  • BK FileServer:蓝鲸管控平台文件传输控制服务端程序。该程序对指定范围内 Agent 节点提供 BT 种子服务,保证对传输的安全性、不同区域及业务模块间的隔离性,并控制BT传输在有限的贪婪特性范围内。单独部署 BK FileServer 并不能提供文件传输服务,受限于安全性考虑,BK FileServer 必须和 BK TaskServer 配合才能完成完整的文件分发流程。

  • BK DataServer:蓝鲸管控平台数据传输服务端程序。该服务端主要提供对 Agent 采集的数据进行汇聚、分类、流转能力。对于普通的千兆网卡机器,BK DataServer 能够最大提供 100MB/s 的数据处理能力。BK DataServer 可以单独为用户提供数据服务,而不需要其他服务端程序配合。

  • BK DB Proxy:蓝鲸管控平台 Redis 集群管理模块。通过代理对 Redis 的操作,完成 Redis 分布式集群的同一管控,支持 hash 写入,多备份写入等。

  • Redis:Redis在本系统中提供工作区数据缓存作用。

  • MySQL:主要存放系统管理相关的数据,便于对系统完成基础的管理和监控。

  • Zookeeper:Zookeeper 主要提供对集群的管理能力。包括集群中不同节点间的相互发现,有效性探测等。

版本差异

功能特性(对外、官网宣传的特性名)社区版企业版公有云版
文件传输/分发
正则表达式
命令批量执行
脚本批量下发并执行
指定用户权限执行
用户环境变量继承
基础数据采集
自定义数据采集
集群自动服务发现
集群Agent状态查询
集群负载均衡支持
支持Windows/Linux等主流OS
目录传输/分发×
区域链控制策略×
跨区域穿透传输×
用户机器密码校验×
采集器插件化支持×
实时数据快照支持×
动态流量负载均衡技术×
集群多区域负载均衡支持×
支持AIX小型机××

支持OS

OS类型主要OS版本
CentOS 5.11 32/64位
5.8 32/64位
6.x 32/64位
7.x 32/64位
Redhat6.x 32/64位
7.x 32/64位
Debian7.4 64位
SUSE10 64位
Ubuntu14.04 32/64位
10.04 32/64位
12.04 64位
Windows Server2012
2008
2003
Win 7
AIX( 企业版)AIX 6
AIX 7

功能特性

文件分发与传输

文件分发是指用户从指定机器将指定文件批量传输到特定范围的机器上。文件分发是用户的一种行为,传输则是针对用户行为的程序行为。

下面将简要描述文件分发传输的主要功能点:

  • 传输模式:
    • BT模式——对于大小大于10KB的文件,蓝鲸管控平台将自动启用BT作为首选传输方式;
    • 值传模式——对于10KB以下的文件,将使用tcp直传模式;
    • 混合模式——在BT模式下,如果发生BT传输持续性失败,则会尝试使用直传模式传输BT文件分片;当BT传输恢复时,则停止直传模式; -传输类型:
    • 文件传输——分发单个文件到指定机器,这里文件可以是任何格式,任何可读目录下的可读文件;文件分发完成后,会自动同步目标文件权限与源文件一致;对于直传模式,文件传输结束后会进行MD5校验,对于BT模式和混合模式,会进行hash值校验文件的完整性;
  • 传输控制:
    • 区域链控制——让文件沿着指定的路径,通过多个中转节点的接力,最终到达目标机器,并且源文件和目标文件所在机器不在同一个物理或逻辑区域。我们称这种传输方式为区域链传输。区域链控制是指通过一定规则指定文件中转的路径,以满足具有特殊专线链接的两个区域间的传输需求。
    • 跨区域穿透——跨区域穿透是指原本相互隔离的两个区域,但是由于特殊目的,需要就本次传输进行定向透传。蓝鲸管控平台允许权限用户适当修改配置来完成这种定向穿透。

实时任务执行

  • 任务类型:
    • 命令类型——linux支持bash命令、windows支持cmd命令、AIX支持ksh命令,支持各种自定义可执行文件格式程序的启动,支持各种解释性语言程序的执行。
    • 脚本类型——linux支持shell脚本、windows支持bat脚本(安装有cygwin的额外支持shell脚本)、powershell、AIX支持ksh脚本,以及各种系统支持的解释性脚本程序。
  • 任务控制:
    • 指定用户——linux及其他类linux系统支持按指定用户执行任务,例如用户设定以user00用户执行ps,则只能看到该用户权限范围内的结果;因为windows操作系统的限制,只有开启校验机器密码(见下文)功能的用户才能指定用户执行任务,否则都已administrator用户执行任务。
    • 继承用户环境——linux及其他类linux系统支持指定用户后继承该用户设定的环境变量;Windows无此功能。
    • 校验机器密码——企业版用户可以选择是否校验机器密码,如果选择不校验,则window Agent不支持按指定用户执行任务的功能。
    • 有害操作告警——管控系统能够对高危操作进行预警,高危操作的定义由系统自动设定。
    • 有害操作防护——管控系统能够对高危操作进行预警并干预,高危操作的定义及干预措施提供选项供用户配置。

数据采集与传输

  • 数据采集服务:
    • 自定义数据采集——Agent开放数据发送接口、cmdline及SDK,供用户开发自定义的数据采集程序或脚本。
    • 采集器插件化支持——Agent支持采集器插件化,自动加载采集插件,并监控插件的存活状况。如果采集插件异常终止,则重新拉起采集插件;如果多次拉起失败则告警。
    • 实时数据快照——管控平台支持缓存安装有Agent的机器1min内的快照数据,并提供接口供用户访问。
    • 动态负载均衡——由于Agent数据采集的量大,切具有随业务特性波动的特点,这些数据在流转时需要高性能的服务端做收敛转发,为了提供服务端机器的利用率,减少由于数据量变化时带来的负载不均衡问题,管控系统支持按分钟级别动态调整数据转发的通道,以达到集群内服务端负载均衡的目的。

集群管理

  • 自动服务发现:管控平台同一个集群内的模块均支持自动发现,用户扩缩容任何节点,系统均能实时感知,并调整通讯策略,保证服务的高可用。
  • 集群负载均衡:管控平台同一个集群内,支持按照Agent链接数进行负载均衡。
  • Agent状态查询:管控平台提供接口,查询Agent状态。接口按照实时性分为两类:一类为实时状态接口,只能查询当前Agent是否正常;二类接口提供24s内的状态查询,查询的内容包括Agent上次心跳时间、Agent版本、Agent使用的cpu、Agent使用的mem。
  • 多区域负载均衡:管控平台支持对同一集群进行不同区域的划分,不同区域按照各区域内的负责均衡规则处理;未划分区域的Agent按照集群负载均衡策略处理。

本文档是否对您有帮助?