行业背景

云智慧

随着保险公司业务的发展,系统的规模越来越大(销管系统,出单系统,理赔系统,续保管理系统等数十个系统),应用的构架也越来越复杂,已经形成了规模较大的分布式服务集群和复杂的分布式应用间调用关系,这给运维工作带来了新的挑战。

1.由于无法直观看到整个端到端业务的调用过程,企业需要投入大量人力进行关系调用梳理和故障定位,直接导致了运维成本的增加。

2.随着业务的增长,对系统的性能要求也越来越高。后台服务、数据库、线程等都出现了性能瓶颈,如何快速找到慢SQL,代码等问题并进行优化是提高系统性能的一个难点。

3.运维人员忙于救火,无法及时关注系统的错误,当系统错误达到一定数量时,很容易造成服务奔溃。事故一旦发生,将会对公司造成巨大损失。

方案介绍

云智慧

云智慧的保险应用性能监控方案,是基于新的业务运维背景下解决企业业务及应用性能问题的落地产品,平台从外部用户视角分析应用对业务的影响,关注业务交互质量,强调移动端和浏览器端的真实用户体验以及后端应用性能支撑,实现了端到端的性能问题跟踪与诊断。本方案的总体架构如下图所示:

云智慧

本方案整合前端、应用、后台任务、外部服务、数据库及基础设施技术栈,直观呈现面向服务的业务系统体系架构,用以快速业务性能问题(关键交易、节点状态、调用时间和吞吐率等性能指标),帮助追踪系统各服务的性能瓶颈。

云智慧

综上所述,云智慧保险应用性能监控方案,是面向产品全交付链,平台能够促使企业运营、运维、开发等多个部门人员基于统一视角与层面协同处理业务问题,从而保障促进企业业务快速健康高速增长。

方案价值

云智慧

降低运维成本

1.节省梳理系统调用结构的投入:通过拓扑图了解系统整体的运行状况,及时发现系统问题;通过拓扑图和服务间链路的跟踪实现直观地了解调用情况和每个节点的运行情况,快速了解系统运行状况,减少对系统监控投入的人力成本。

2.节省对问题排查的投入:统计最近系统错误个数,主要针对http错误、sql错误和server错误;对发生次数较多和比较关注的错误进一步跟踪,定位其问题,使问题的排查简单快速,减少运维人员的压力,节省人力成本。

云智慧

优化系统性能

1.优化后台服务性能:对服务访问进行全链路跟踪,并展示调用时间,具体定位到执行缓慢的代码段,帮助后台服务做进一步的优化,定位问题。

2.优化数据库性能:对数据库进行监控,并筛选出慢SQL,统计数据库对后台执行的SQL按照执行次数,平均访问时间排序,并能够展示具体的SQL语句。

3.线程优化:发现定位出现问题的线程或进程,定位哪些进程使用较多内存,并定位到代码段,并进行优化。

云智慧

减少宕机风险

1.及时告警:监控到系统问题后及时进行告警提醒,通知相关人员及时处理问题。

2.系统错误分析:追踪错误所在的代码段,分辨错误原因;对相同错误进行归类,定位错误类型和展示完整的错误信息。

3.系统进一步提升:具备进一步的提升系统的稳定性能力,保证系统的运行。

云智慧

典型客户

云智慧
云智慧

阳光保险集团APM应用性能监控平台项目

云智慧

光大永明人寿APM应用性能监控平台项目

相关产品

云智慧

联系您的售前顾问,获取更多特色案例

立即体验