行业背景

云智慧

电力行业信息化的建设,从传统架构向云架构转型过程中,存在很长时间两者共存的情况,传统IT架构和云架构两种架构导致运维工具差异大,对运维人员也带来了更大的挑战,现有运维技术手段过多依赖人工手动方式,如各个运维专业的日常核心运维手段是半自动定时巡检,不具备24/7小时的常态化运维监控、报警和处置能力,运维人员更多是救火队员角色,造成问题处理效率低,前端用户体验差。

具体体现为:

1. 云上、云下业务运维工具众多,但各工具的监控指标和告警都相对独立,未进行有效整合;

2. 系统调用关系不清晰,无监控指标体系标准,缺乏指标分类分级管理,当系统发生故障无法进行有效的关联分析;

3. 缺少自动检测、故障预判以及预警功能,问题往往是由用户或运营团队发现,缺乏运维主动性;

4. 缺少系统运行健康态势的全景展示,无法直观了解IT资源和系统运行状态。

方案介绍

云智慧

云智慧电力行业一体化监控智能运维解决方案为:

1. 对用户现有监控工具,如拨测监控、应用性能监控、网络质量监控、基础设施监控、综合网管、运行日志等数据进行采集;

2. 对应用系统的梳理,并完善业务系统的逻辑组件之间的访问关系;

3. 建设运维数据统一管理平台,对运维数据进行清洗并存储,对指标数据分层、分类,选取可以反映系统运行质量的关键指标。从应用指标-> 逻辑组件指标-> 网络服务指标->基础设施指标->日志的穿透式下钻,实现同一时间切片视角的指标关联分析,快速发现问题并定位问题;

4. 通过对关键指标数据的机器学习和建模,定义指标的正常区间,当指标发生偏离进行告警并进行算法辅助的异常分析;

5. 通过对指标的分层监控,选取关键指标绘制IT健康性能大屏,直观展现IT状态。

云智慧

方案价值

云智慧

解决方案集合多层次监控数据,形成“多纵一横”的穿透式下钻分析。

1. 通过对各层级监控工具运维数据采集,并进行数据聚合,构建统一运维数据中台,为智能运维场景实现提供数据平台基础;

2.建设监控指标体系标准,实现了从应用层-->服务层-->JVM层-->主机层-->网络层的穿透式下钻能力。通过指标关联分析,缩短问题定位时间,为业务系统持续稳定运行提供保障;

云智慧

3. 提供清晰的应用健康态势展示能力,形成“多纵一横”服务调用监控视图。将指标、告警在依赖关系图中展示,实现排查故障“一张图”,快速分析影响应用性能的原因,辅助根因定位。

云智慧

典型客户

云智慧
云智慧

国网电商

联系您的售前顾问,获取更多解决方案

立即体验