新一代智能业务运维平台5.0,为IT运维管理蓝图建设增速提效
云智慧 2021年3月31日 产品动态

全栈智能业务运维解决方案服务商云智慧近日发布新一代智能业务运维平台5.0版本,旨在通过先进的实时大数据处理和机器学习技术,为企业现有运维管理工具和管理体系赋予更强的统一数据管控能力和智能化数据分析能力,在保障业务连续性的同时,提升业务与IT管理质量和效率。

当前,国家对数字化转型高度重视。今年全国两会频繁提及“数字化”,政府工作报告也提出加快数字化发展,打造数字经济新优势,协同推进数字产业化和产业数字化转型。随着数字化浪潮的来袭,IT系统建设越来越成为企业发展中至关重要的一环,保障业务健康运行的运维系统也变得更加重要。

当运维拥有海量设备且高度复杂的云数据中心环境时,企业为了支持业务系统快速上线、灵活伸缩以及更高的SLA要求,运维人员将面临比以往更大的运维压力。云智慧智能业务运维平台通过引入前期的咨询规划与落地的运维平台系统,为用户构建一整套涉及组织、流程、技术、文化等多因素的保障体系。本次发布的新一代智能业务运维平台在原有的基础上进一步增强了运维监控能力和算法能力,同时提升了面向事件的统一运维管控能力,主要更新功能如下:

全局集中监控,灵活关联对象

1. 信息统一监控:支持对业务及服务器、数据库、中间件等离散的系统资源统一纳管并集中展示,同时对业务调用链路、系统架构拓扑中的逻辑关系进行可视化展示;

2. 指标灵活配置:监控中心指标体系对接配置中心CMDB,依托CMDB模型(同类对象集合)对离散的指标进行梳理,同时支持针对单个对象进行指标自定义;

3. 多维指标定义:对于多序列指标数据,支持在指标体系中生成具有多维度属性的指标,深层次挖掘指标数据的监控价值与意义;

4. 对象深度关联:将不同对象的数据进行关联,帮助快速进行故障定位。

云智慧

提升算法能力,支撑丰富场景

1. 算法统一管理:支持算法管理并添加算法服务,对平台集成的算法集中管理,为应用场景的算法使用进行统一分配,以支撑丰富的应用场景;

2. 算法与算法模型服务化:通过标准、通用的API接口,为上层应用或者产品提供统一算法以及算法模型服务;

3. 算法模型对比调优:针对上层应用所调用的算法模型,算法中心不仅支持查看模型运行结果,还支持同一条数据模型的算法调参以及模型对比,帮助客户优化模型,找到最优解;

4. 算法泛型拓展:将算法调优的结果发布为泛型,无需更新代码即可进行新特征算法泛型对接。

云智慧

统一告警管理,事件全局管控

1. 告警管理:事件中心能够将监控系统的告警消息统一到一个平台管理;

2. 告警抑制:基于智能算法对海量、持续的冗余消息进行告警压缩和告警合并,降低其对运维工作的干扰,提升运维工作效率;

3. 根因推荐:采用机器学习算法识别导致当今大多数事件以及中断的应用、服务、中间件、数据库和基础架构上的问题,推荐可能造成故障的原因,帮助运维人员实时查明事故和停机的根本原因,保证业务的SLA;

4. 事件协作处置:告警产生后,通过多种方式推送给系统管理员进行处理与反馈,值班人员及管理员可在统一监控平台上完成事件全生命周期的协作处理;

5. 指标序列分析:指标支持传统的固定阈值的方式、同环比、预测性异常检测、实时异常检测,根据不同指标特征选择适配不同的监控方式,分析问题发生原因;

6. 对接服务管理:将告警事件与流程深度关联,基于告警事件快速生成工单,形成统一闭环,实现告警事件的快速响应与解决;

7. 故障自愈:与自动化工具对接,通过特定的自动化脚本完成故障的自动修复,减少运维人员重复的工作劳动。

云智慧