通过REST API、Agent主动采集、URL回调等多种方式将监控系统的告警消息统一到一个平台上管理。
基于智能算法对海量的、持续的冗余消息进行告警压缩和告警合并,抑制告警消息的数量,减少告警消息的频率。
采用机器学习算法识别导致当前大多数事件以及中断的应用、服务、中间件、数据库以及基础架构上的问题,推荐可能造成故障的原因。
通过多种方式将事件推送给负责人处理。处理人可以在统一的平台上完成事件的发现、查看、接手、转派、处理、改进、归档等生命周期管理操作。
支持固定阈值、同环比、预测性异常检测、实时异常检测,根据不同指标特征选择适配不同的监控方式,分析问题发生的原因。
对接自动化作业产品,通过自动化脚本完成故障的自动修复,例如:重启机器、清理磁盘释放空间等。
支持接入多种监控告警系统,实现离散告警消息的统一管理。适配各种类型的监控告警系统和告警源,开箱即用。
与智能分析产品深度融合,通过智能分析产品提供的工程化算法能力实现基于智能分析算法的海量文本消息的告警合并、故障的异常检测与根因分析。
支持手机短信、电子邮件、电话语音、企业微信、App推送、URL回调等多种通知方式,确保问题事件通知能够被即时送达。
与ITSM工具轻松对接,将告警事件与流程深度关联,基于告警事件快速生成工单,实现告警事件的快速响应与解决。
与自动化工具对接,通过特定的自动化脚本完成故障的自动修复,实现告警事件的自愈。
人均每天接收消息数量
平均故障修复时间MTTR
智能告警抑制率
平均故障接手时间MTTA
故障漏报率
故障错报率
跨平台统一告警
支持接入多种监控告警系统和告警源,实现离散告警消息的统一管理,开箱即用。
与ITSM工具整合
与ITSM工具对接,将告警事件与流程深度关联,基于告警事件快速生成工单,实现告警事件的快速响应与解决。
事件协作处置
支持短信、邮件、钉钉等渠道将事件推送给负责人处理。处理人可以在统一的平台上完成事件的查看、接手、转派、处理、改进、归档等生命周期管理操作。
只需30秒,立即体验智能告警监控服务