蓝鲸智云体系介绍

导出PDF

前言

蓝鲸智云,简称蓝鲸,是腾讯游戏运营部“腾讯智营”下的子品牌。它是一套基于 PaaS 的技术解决方案,提供了完善的前后台开发框架、调度引擎、公共组件等模块,帮助业务的产品和技术人员快速构建低成本、免运维的支撑工具和运营系统;是腾讯游戏运营部沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。

目前,蓝鲸智云团队秉承着开放共赢的态度,正逐渐开放其自主研发的一套具有多项探索式创新的体系——蓝鲸智云软件体系。该套体系不仅提供了基础运维(发布变更、监控处理、数值调整、数据提取等)的无人值守服务,而且还给运维人员提供了解决方案(工具),并随时调整,避免重复性的操作服务。而运维人员则可以做些“用户体验优化”和“运营决策辅助”等运维增值工作,并且可以通过蓝鲸智云提供的集成平台,低成本的学习 DevOps 技能,进一步提升自己的能力,加速转型。此外,这套体系还可以运行轻应用、管理类、及职能类应用,是个全方位的运维、管理平台。

蓝鲸智云,运维领域的一张新名片,正在多个层次、多个领域崭露着头角,逐渐释放着自身特有的价值,引领着行业新标杆,开创了运维体系2.0的新局面。

体系介绍

蓝鲸智云体系由八大平台组成,即管控平台配置平台作业平台数据平台容器管理平台AI平台集成平台移动平台,为各种云(公有云、私有云、混合云)的用户提供不同场景、不同需求的一站式技术运营解决方案。

蓝鲸智云体系依托企业级 SOA、PaaS 等理念,运用 Docker 等最先进的云技术构建起了全新的运维模式,致力于以“原子服务集成”和“低成本工具构建”的方式落地 DevOps,帮助运维快速实现“基础服务无人值守”及“增值服务”,并进一步通过 DevOps 的落地实现企业更全面和可持续的效率提升。

架构图

蓝鲸智云体系中八大平台之间的架构关系如下图所示:

蓝鲸智云体系结构图

管控平台

蓝鲸管控平台是蓝鲸体系的底层管控系统,是上层运维服务体系与底层 IaaS 的连接器,为上层提供指令、文件、数据的通道,支持直连模式、代理模式以及为达到最优连接指定级联路由的方的模式。管控平台是典型的两层分布式 C/S 结构,主要包含智能的蓝鲸 Agent、提供各种服务的 Server 以及 zookeeper、redis、MySQL 等周边保障模块。其中蓝鲸 Agent 是部署在业务机器上的程序,每台业务机器仅部署一个蓝鲸 Agent,其他模块部署无具体要求,用户可以单独部署,也可以混合部署。

在整个蓝鲸体系中,管控平台无需直面用户,但其在体系中却是不可或缺的,它为其他平台模块提供了人机交互的通道与能力。管控平台主要提供了三种类型的服务能力:文件分发传输能力、命令实时执行与反馈的能力、大数据采集与传输的能力。

其功能详情见《蓝鲸智云管控平台产品白皮书》(待更新)。

配置平台

蓝鲸配置平台(CC)是一款面向应用的 CMDB,在 ITIL 体系里,配置管理数据库(CMDB)是构建其它流程的基础,配置平台作为面向业务层面的 CMDB,为蓝鲸体系的其它平台提供了各种运维场景的配置数据服务,存储与管理企业 IT 架构中设备的各种配置信息,它与所有服务支持和服务交付流程都紧密相联,支持这些流程的运转、发挥配置信息的价值,同时依赖于相关流程保证数据的准确性。配置平台提供的主要功能有主机管理、业务拓扑、业务管理、资源池管理、自定义属性管理、操作审计等。

其功能详情见《蓝鲸智云配置平台产品白皮书》

作业平台

蓝鲸作业平台(Job)是一套底层基于管控之上的基础运维操作平台,并且具备海量的并发处理能力,除了支持脚本执行、文件拉取/分发、定时执行等一系列可实现的基础运维场景以外,还运用流程化的理念很好的将零碎的单个任务组装成一个作业流程。同时,可通过平台提供的 API 实现对任意作业的调用、查看等操作,与其它平台或系统联动,实现调度自动化。作业平台的主要功能有:快速传输文件、web化脚本管理、支持批量高效执行、流程式管理,一切皆“作业”等。

其功能详情见《蓝鲸智云作业平台产品白皮书》

数据平台

蓝鲸数据平台是一个专注于运维领域的低门槛大数据平台,提供了数据接入、清洗、计算、存储、查询和分析的全流程自助化大数据服务,运维人员可以通过统一数据接入、可视化计算任务配置、可视化建模、统一查询等功能,快速的构建基于大数据的可视化、智能化运维支撑工具。数据平台的主要功能有:统一数据接入、可视化计算配置管理(Dataflow)、可视化建模(Modelflow)、数据存储查询等。

容器管理平台

蓝鲸容器管理平台是一个用于支撑业务容器化及微服务化的平台,是一种 DevOps 实践。蓝鲸容器管理平台提供了持续集成、持续构建、持续部署的具体实现,并在此基础上,构建了分布式配置管理、服务发现、仓库管理(兼容JFrog与docker hub)、安全健康检查、网络配置服务等主要功能。蓝鲸容器管理平台会以 SaaS 服务的形式提供交互,用户只需通过页面点击就能完成业务镜像的构建、发布等操作。

AI平台

蓝鲸AI平台主要提供数据分析挖掘服务,专注于运维领域,主要目标是降低运维领域数据分析挖掘的门槛。提供了拖拽式式建模、交互式测试调优、自动化模型评估、模型训练运行管理、场景模型(公共的通用的模型)等功能模块,包含了从模型构建评估到模型发布管理这一完整的功能链路,通过将各种基础的数据挖掘、机器学习算法节点化,将模型构建的过程标准化,使普通的业务运维人员通过简单的拖拽配置即可胜任数据分析挖掘的工作,解决算法工程师不懂业务、业务运维不懂算法这一难题。

集成平台

蓝鲸集成平台是一个开放的平台,又称蓝鲸 PaaS,让用户可以简单、快速地创建、部署和管理应用,他提供了完善的前后台开发框架、服务总线(ESB)、调度引擎、公共组件等模块,帮助用户快速、低成本、免运维地构建支撑工具和运营系统。集成平台为一个应用从创建到部署,再到后续的维护管理提供了完善的自助化和自动化服务,如日志查询、监控告警等,从而使用户可以将全部精力投入到应用的开发之中。集成平台的主要功能有:支持多语言的开发框架/样例、免运维托管、SaaS运营数据可视化、企业服务总线(API Gateway)、可拖拽的前端服务(MagicBox)等。 其功能详情见《蓝鲸智云集成平台产品白皮书》

移动平台

蓝鲸移动平台借助微信公众号解决方案,整合蓝鲸的功能特性,助力运维最大化提高工作效率和便捷性,已支持用户在手机端管理/执行作业任务、创建/修改定时任务等操作,真正做到“工作 • 生活,弹指一瞬间”。

通用SaaS

1.故障自愈

故障自愈是一款实现服务器故障自动处理的解决方案,提升企业服务可用性和降低故障处理的人力投入。通过自动化处理来节省人力投入,通过预定的恢复流程让恢复过程更可靠,通过并行分析达到更快的故障定位和恢复,最终减少业务损失的风险。

该 SaaS 在蓝鲸社区版中暂未推出。

2.监控告警

蓝鲸监控是一款针对主机和互联网应用进行监控的产品,监控服务可用于收集主机资源(系统性能、组件服务、数据库、日志等)的监控指标,探测互联网应用服务的可用性,并对指标进行告警设置。

该 SaaS 已在蓝鲸社区版V3.0中推出。

3.标准运维

标准运维是通过一套成熟稳定的任务调度引擎,把在多系统间的工作整合到一个流程,助力运维实现跨系统调度自动化的 SaaS 应用。

该 SaaS 在蓝鲸社区版中暂未推出。

4.日志检索

蓝鲸智云日志检索是为了解决运维场景中查询日志难的问题而推出的一款 SaaS,基于业界主流的全文检索引擎,通过蓝鲸智云的专属 agent 进行日志采集,无需登录各台机器,集中管理所有日志。

该 SaaS 已在蓝鲸社区版V3.0中推出。

5.包管理

包管理是一个针对二进制包的SaaS应用,它后台采用了类似Git管理代码的理念去管理业务二进制包,除此之外,还提供了将业务二进制包部署到测试环境、预发布环境、生产环境的一套标准交付流程。

该 SaaS 已在蓝鲸社区版V3.0中推出。

产品功能

产品种类

蓝鲸智云根据用户群体和版本特性的差异,目前为用户提供了3套产品:社区版、公有云版、企业版。

产品名称 面向对象 使用方法 描述
社区版 个人或企业 官网下载,自行搭建
部署
由蓝鲸智云团队官方提供的一套基础的、基于 PaaS 的
技术解决方案,旨在提高行业运维技能。该版本终身
免费,已开放下载。其中配置平台已经开源,使用
过程中,请遵循《蓝鲸智云软件用户服务协议》。
企业版 企业 联系在线客服咨询 蓝鲸智云团队面向企业出售技术解决方案,为付费
企业定制的自动化运维平台。
公有云版 腾讯云用户 腾讯云注册用户,选择
“云产品”–“基础产品”–
“监控与管理”–“蓝鲸平台
蓝鲸智云团队为服务腾讯云用户定制的版本,该版
本已推出了六大平台的基础功能,助力腾讯云用户
提高运维水准,提升运营能力,为业务的技术运营
保驾护航

版本差异

每个版本产品在平台和功能方面存在较大的差异,即每个版本包含的平台种类,以及各平台的所具有的功能是不一样的。具体差异点请看下表。

表一:各版本产品的平台/SaaS差异

类别 社区版 企业版 公有云版
管控平台
配置平台
作业平台
集成平台
数据平台 × ×
容器管理平台 × × ×
AI平台 × × ×
移动平台 × ×
故障自愈 ×
标准运维 ×
蓝鲸监控
日志检索 ×
包管理 ×

表二:各版本产品的功能/服务差异

类别 社区版 企业版 公有云版
是否收费 免费 License永久授权 免费
服务时间 5*8h在线客服 7*24h专属服务 5*8h在线客服
技术支持 通用技术支持 专家级定制 通用技术支持
培训服务 免费在线培训 企业内部培训 免费在线培训
通用SaaS 基础功能SaaS 高级功能SaaS 高级功能SaaS
高可用方案 支持 支持
API 3000次/日 无限制 无限制
运营管理 企业运营管理方案 基础的运营管理方案
监控保障 基础监控服务 企业监控服务 通用的监控服务

备注: 在以下功能对比中,会出现“*”,“–”, 其代表的含义为: 1):表示相比于社区版(前一个版本),该功能加强了。 2)–:表示该功能被更好的方案替代了,如:“个人工作台”被“个人定制桌面”取代。

表三:管控平台功能/服务差异

类别 社区版 企业版 公有云版
文件传输/分发
正则表达式
命令批量执行
脚本批量下发并执行
指定用户权限执行
用户环境变量继承
基础数据采集
自定义数据采集
集群自动服务发现
集群Agent状态查询
集群负载均衡支持
支持Windows/Linux等主流OS
区域链控制策略 ×
跨区域穿透传输 ×
用户机器密码校验 ×
采集器插件化支持 ×
实时数据快照支持 ×
动态流量负载均衡技术 ×
集群多区域负载均衡支持 ×
支持AIX小型机 × ×

表四:配置平台功能/服务差异

类别 社区版 企业版 公有云版
可视化拓扑
基本的实时数据展示 √* √*
自定义属性 √* √*
主机动态分组 √* √*
主机批量导入
主机自发现
主机跨云管理
业务角色管理 √* √*
资源池管理 √* √*
丰富的API
可扩展的实时数据展示 ×

表五:作业平台功能/服务差异

类别 社区版 企业版 公有云版
无限制的管控节点
可视化任务编排
支持Windows/Linux等主流OS
敏感数据加密
操作审计
作业全局变量
公共脚本库
SQL执行 ×
支持PowerShell
API访问次数无限制 ×
支持AIX小型机 × ×
企业级分布式高可用方案 ×

表六:集成平台功能/服务差异

类别 社区版 企业版 公有云版
三个环境(本地开发环境,测试环境,正式环境)
基本角色管理 √* √*
基本账号体系
Web安全防护
个人工作台
个人定制桌面 ×
可插拔式应用 √* √*
开发框架
企业服务总线(ESB和API Gateway)
基于virtualenv的应用部署
基于容器技术的应用部署 ×
MagicBox
部署操作记录展示
线上基础开发培训
高级角色管理 × ×
对接企业SSO × ×
高可用集群 ×
开发框架增值模块(功能开关、权限控制等) ×
服务状态可视化管理 × ×
可扩展的应用变量 × ×
日志可视化管理 ×
后台任务可视化管理 × ×
功能函数可视化管理 × ×
组件访问权限控制 ×
组件访问频率控制 ×
ESB监控报告 ×
内置代码托管服务 × ×
代码权限管理 × ×
代码提交记录 × ×
代码在线查看 × ×
代码在线编辑 × ×
应用数据库托管服务 ×
应用监控告警 ×
应用运营数据统计 ×
企业贴身定制培训 × ×

表七:标准运维平台功能/服务差异

类别 社区版 企业版 公有云版
自定义流程 暂不提供
流程权限控制 暂不提供
步骤并行执行 暂不提供
轻应用 暂不提供
原子自助开发 暂不提供
职能化 暂不提供

表八:蓝鲸监控平台功能/服务差异

类别 社区版 企业版 公有云版
主机基础性能监控
主机系统事件监控
自定义指标监控
数据源管理
自定义字符型监控 x
进程端口监控 x
事件中心
自动处理 √* √*
Windows/Linux等主流OS支持 √* √*
跨平台支持 √* √*

表九:日志检索功能/服务差异

类别 社区版 企业版 公有云版
数据接入 暂不提供
采集项管理 暂不提供
采集项管理 - 基于数据集管理 × 暂不提供
数据查询 暂不提供
数据高级查询 暂不提供
上下文日志检索 × 暂不提供
日志实时滚动 × 暂不提供

表十:故障自愈功能/服务差异

类别 社区版 企业版 公有云版
告警源支持蓝鲸监控 暂不提供
告警源支持Zabbix 暂不提供
告警源支持Nagios 暂不提供
告警源支持Openfalcon 暂不提供
告警源支持REST API 暂不提供
执行套餐支持作业平台 暂不提供
通知和审批 暂不提供
配置平台原子组件 暂不提供
告警收敛 暂不提供
告警防御 暂不提供
组合套餐 暂不提供
预警自愈 暂不提供
对接标准运维 暂不提供
用户操作审计 暂不提供
故障自愈自监控 暂不提供
架构高可用 暂不提供

结语

运维行业发展阶段有:手工操作 > 脚本自动化 > WEB自动化 > 调度自动化 > 智能化运维,目前很多公司的运维同仁尚处于“脚本自动化”阶段,而蓝鲸智云团队已经完全经历了前四个阶段的洗礼,正在积极地拥抱智能化运维带来的福利。

为了给运维行业提供更好的服务,蓝鲸智云团队从2016年3月启动开放计划,并且不断加大开放力度,甚至是开源。目前已经开放了社区版 V3,其功能特性可以让运维同仁直接进入“调度自动化”的阶段,通过提升自身能力,低成本地构建运维工具,自建运营系统。

2016年12月16日,腾讯游戏蓝鲸产品中心总监党受辉发布了“蓝鲸智云”品牌的宏大愿景「改变中国运维行业」。未来,蓝鲸将继续建设和维护社区版,打造蓝鲸开发者社区、SaaS 市场 、脚本社区等丰富的运维生态。

运维行业是一片蓝海,蓝鲸智云团队希望能和优秀的企业一起合作,为合作伙伴提供技术支持,蓝鲸将更专注于技术研究,持续输出更多的产品,一起为运维行业服务。

说明:蓝鲸智云体系信息会不断更新,具体特性以可用的蓝鲸智云软件的功能为准。

本文档是否对您有帮助?