背景分析

云智慧

近年来,随着企业业务的飞速发展,尤其是“线上业务”版图的逐步开拓,传统的系统级监控手段已经无法应对其“交易并发量级大”、“交易链路涉及系统多”的现状。并导致如下具体问题:

1. 生产问题发现不及时:由于系统间服务调用关系不透明,以及传统“总量监控”的模式,造成交易链路中“问题服务”的影响无法第一时间进行预警与通知,运营监控存在一定滞后性。

2. 排查问题工作量大:由于系统级监控手段的限制,以及各系统日志标准不统一,生产问题的解决需调用大量“开发”与“运维”资源,且沟通成本较高。

3. 解决问题效率低:由于各系统间日志没有统一的串联标识,以及记录标准不同,导致无法快速定位“问题服务”。

为解决上述问题,亟需一套业务交易全链路追踪解决方案,通过可视化的方式监控交易全链路,实现快速发现问题、定位问题、辅助解决问题,更直观、科学的方式对产生的日志进行实时监控分析。

方案介绍

云智慧

全链路追踪的设计思想早期都是来自Google Dapper的论文“Dapper, a Large-Scale Distributed Systems Tracing Infrastructure”,实现收集更多的复杂分布式系统的行为信息。OpenTracing提供了开放式分布式追踪规范的一致性,而本方案基于OpenTracing标准,对业务交易日志进行分析和关联,实现业务交易全链路监控。

依托云智慧DOCP数字化智能运维平台构建的交易全链路业务监控系统,为客户提供智能化的交易全链路追踪方案。通过本方案实现交易统一的数据采集、数据处理、分析建模,并基于业务模型,实现交易全链路可视化追踪分析。包括通过直观展现交易全链路拓扑,快速定位问题节点,帮助管理人员清晰直观地掌握业务交易的运行情况,实现可视化管理,提升监控管理的效率。

整体实现效果图如下:

云智慧

综上所述,云智慧基于大数据和人工智能算法技术,实现对多源日志的解析,提供一套多场景、易交互、高性能的交易全链路业务监控解决方案。具备如下特点:

1. 日志采集解析:支持整体日志规范标准,具备各系统日志的采集、解析和检索能力;
2. 全链路展现:能够根据提供的日志信息,基于业务模型,完成交易全链路的自动展现,及调用关系识别;
3. 故障定位:能够准确展现交易全链路关系,各节点的执行时间和运行情况,包括响应时间及错误定位,及异常错误、异常交易的警告;
4. 可视化监控:支持大数据等全链路中独立系统的可视化监控,指标包括但不限于每个节点及接口调用的总次数、调用成功率、成功和失败次数;
5. 资源可控:能够满足性能标准,避免对生产系统的资源占用,降低影响。

方案价值

云智慧

云智慧全链路业务追踪方案带来的价值有:

1. 基于日志,无侵入建立业务链追踪;

2. 贴近业务场景,解决业务问题;

3. 业务流转和IT支撑拓扑完全可视化;

4. 缩小工作鸿沟,建立业务与IT工作界面;

5. 具备良好的扩展性,可快速扩容。

典型客户

云智慧
云智慧

太平金科AIOps(智能运维项目)开发采购项目

联系您的售前顾问,获取更多解决方案

立即体验