背景分析

云智慧

混合云融合了公有云和私有云,是近年来云计算的主要模式和发展方向。我们已经知道私有云主要是面向企业用户,出于安全考虑,企业更愿意将数据存放在私有云中,但是同时又希望可以获得公有云的计算资源,在这种情况下混合云被越来越多的采用,它将公有云和私有云进行混合和匹配,以获得最佳的效果,这种个性化的解决方案,达到了既省钱又安全的目的。

云智慧

方案介绍

云智慧

云平台监控包含以下场景:

产品监控、主机监控、及时处理异常、容量监控、站点监控、容器监控、自定义监控。

1. 云产品监控

1)通过基础设施监控工具(DOIM)监控产品的资源使用情况以及进程状态;

2)接入监控指标到专业运维数据库;

3)通过数字化运维事件管理平台进行指标告警;

4)监控云产品运行状态。

2. 主机监控

1)通过基础设施监控工具(DOIM)监控主机性能指标;

2)接入监控指标到专业运维数据库;

3)通过数字化运维事件管理平台进行指标告警。

3. 异常及时处理

1)通过数字化运维事件管理平台进行问题发现、通知;

2)如产生告警事件,根据规则判断告警事件是否产生工单。

a. 如事件可自动处置,则不触发工单系统;

b. 如需人为干预,则触发工单系统,提醒对应角色进行事件处理。

4. 容量监控

1)通过基础设施监控工具(DOIM)对容量指标进行监控;

2)采集监控指标到专业运维数据库;

3)接入数据到数字化运维事件管理平台,对指标进行监控告警;

4)接入数据到可视化平台,对指标进行关联展示,趋势分析;

5)接入数据到算法平台,对指标进行容量预测。

5. 站点监控

1)通过监控宝对站点进行监控;

2)直观展示监控宝服务运行情况。

6. 容器监控

Prometheus-Operator是一套为了方便整合prometheus和kubernetes的开源方案,使用Prometheus-Operator可以非常简单的在kubernetes集群中部署Prometheus服务,用户能够使用简单的声明性配置来配置和管理Prometheus实例,这些配置将响应、创建、配置和管理Prometheus监控实例。

1)通过Prometheus-Operator采集数据到专业运维数据库;

2)采集监控指标到专业运维数据库;

3)接入数据到数字化运维事件管理平台,对指标进行监控告警;

4)接入数据到可视化平台,对指标进行关联展示,趋势分析;

5)接入数据到算法平台,对指标进行容量预测。

7. 自定义监控

自定义监控项采集的监控数据上报到云监控,云监控对其提供监控图表和报警功能。

1)如遇到在已有监控指标中不包含需要的监控项,则通过脚本采集;

2)采用基础设施监控工具(DOIM)或者自定义脚本的方式采集指标,同步数据到专业运维数据库;

3)将指标存储后做指标分析、告警以及指标展示。

方案价值

云智慧

1. 提供查看目标云产品中指定资源的运行状态和各个指标的使用情况,根据监控项设置的报警规则,当符合报警规则时,云监控自动发送报警通知;

2. 通过监控云服务器的CPU使用率、内存使用率、磁盘使用率等基础指标,确保主机的正常使用;

3. 在监控数据达到报警阈值时发送报警通知,让用户及时获取异常通知,查询异常原因,并对异常进行处理;

4. 对带宽、连接数、磁盘使用率等监控项设置报警规则后,便于用户及时了解云产品现状。在业务量变大后,用户可以及时收到报警通知,对云产品进行扩容;

5. 站点监控功能目前仅提供对协议HTTP(HTTPS)、ICMP、TCP、UDP、DNS、SMTP、POP3、FTP的监控设置,可探测您站点的可用性、响应时间和丢包率,让用户了解站点的可用性并在站点异常时及时处理;

6. 监控项不能满足需求,可以根据用户所需自定义监控项。

云智慧

云智慧

联系您的售前顾问,获取更多解决方案

立即体验