和记娱乐官网(OLM)案例分享
客户:某电信行业
执行团队:和记娱乐官网成都分公司
应用:APM(应用性能管理) NPM(网络性能管理)
客户背景
某电信公司电渠负担着重要的电子渠道日常业务处理,不断在完善管理及监控系统,到目前为止现有的监控系统对与下面这些问题尚有处理能力的不足,需要通过技术手段提高。
1、对于url接口类的监控,只能监控到整个url的状况,对于像电小二、ECP这种使用一个url包含多个业务接口的设计,不能分析处理消息体,无法监控单个业务接口;只能发现网络问题,不能分析业务异常。
2、无法串联业务链,监控立足点是接口、代码而不是业务
3、前后端独立,遇到问题后前后端无法快速串联反应。
4、不能获取到具体业务接口状态,导致告警不能实时反映客户故障,无法分析。
5、告警内容不明确,运维及开发无法快速准确定位故障。
客户环境
总体方案的部署分为APM和NPM两个子模块部署。APM通过在移动终端的APP中绑定SDK的方式获取用户操作和业务交互消息;NPM通过旁路镜像的方式分析到达业务处理服务器上的业务交互消息;NPM和APM通过业务标记将移动终端到业务处理服务器之间的所有消息串联起来。客户可通过WEB客户端报表服务器查看数据。
解决方案
1、通过SDK实时捕获前端应用消息。支持电小二高峰期用户量及业务请求量.
2、旁路获取后端业务流量,实时处理电小二及ECP业务消息,无丢包。
3、能够将同一业务的前后端业务消息串联起来,并以业务的视角统一展示。
4、 监控内容包括二三层网络性能、http层服务性能以及业务性能。
5、 能够监控单个接口的响应时间、错误情况、业务失败情况并对接口级别的错误和失败进行详细区分。
6、能够监控多个接口组合成的业务,判断业务健康状况。
7、通过分析业务失败原因、连接情况、异常率,对于业务处理逻辑提出建议,优化客户业务系统。业务告警:使用阀值告警或者基线告警。从业务角度出发,追踪业务故障点并在业务故障变化时新增告警,在业务故障维持时进行告警抑制,避免频繁通知。告警内容能够定位到故障接口、故障原因以及故障值,方便运维人员快速排障;告警方式为系统告警(短信 邮件) 人工告警(电话)结合。
客户评价
xx电渠部门的副总经理这样评价和记娱乐官网:"自从电子渠道部门成立以来,我们一直想客观的了解有多少笔业务是通过电子渠道销售的,他们办理业务的效率是否足够的高,我们的app还有哪些地方需要改进,和记娱乐官网不但帮我们直观地了解所有上述的问题,而且还能和记娱乐官网提供一套实时的性能管理方法,快速定位性能瓶颈,为我们提升了app的质量以及用户的满意度。"
数据库/中间件 | 全系列性能管理 | 大数据分析
北京 | 上海 | 广州 | 成都 | 安码龙
4008-906-960