大规模微服务下如何进行故障排查和应用运维

随着微服务数量的爆炸性增长,如何直观了解服务架构全貌、梳理各个服务上下游依赖、快速定位故障和异常都成为新的挑战。

服务架构无法全面把握
痛点描述
微服务的数量不断增加,通过人工和文档的形式都很难梳理整体的应用调用关系和拓扑结构。
方案描述
通过 APM 提供的全链路拓扑分析,用户可以清晰地了解应用服务间调用层级关系,直观了解快速系统架构。
快速定位异常
痛点描述
一次业务请求中调用后端诸多微服务,当业务出现错误时,需要逐一排查各个微服务是否出现错误。
方案描述
通过调用链监控用户可以查询到业务调用的全部链路以及在哪次调用中出现错误和异常,简化排查流程。
服务依赖关系无从确认
痛点描述
随着微服务不断迭代,服务间的依赖关系不断调整,导致难以确认依赖关系,无法确认变更的影响范围。
方案描述
根据链路拓扑可以确认服务间的依赖关系,识别上下游依赖,并通过监控数据潜在的故障点和性能瓶颈。
异构系统如何全局监控
痛点描述
在业务发展过程中不可避免的出现多语言异构技术栈,通常各个技术栈都有各自的监控方案,应该如何进行融合。
方案描述
在业务发展过程中不可避免的出现多语言异构技术栈,通常各个技术栈都有各自的监控方案,应该如何进行融合。
产品全景
核心优势
开源兼容
可兼容 Skywalking、Zipkin、Jaeger 等主流开源方案的数据推送
全息排查
将业务 ID、业务日志、调用链互相打通,快速定位上下文,加快问题排查速度
无侵入接入
无需进行任何代码修改,即可接入 APM
异构融合
支持 Java、Go、Python、C#、NodeJS 等诸多异构技术栈的统一监控
核心功能
全局拓扑
自动化拓扑发现应用以及中间件之间的全局调用拓关系
调用链追踪
调用链追踪记录单个业务在全链路的调用详情,包括代码执行情况、数据库调用等
性能监控
支持 JVM、数据库、慢 SQL、缓存中间件性能监控等监控
日志关联
无侵入、不需要应用程序修改代码即可完成日志系统和 APM 的关联
慢响应分析
提供判定慢响应的功能,可以准确识别出系统中出现的慢响应请求
关键业务
支持关键事务入口和拓扑的可视化,帮助用户分析业务依赖关系
客户案例

电话咨询

0571-89852939

工作日 9:30-18:00

在线咨询

架构师咨询