大规模微服务下如何进行故障排查和应用运维?

随着微服务数量的爆炸性增长,如何直观了解服务架构全貌、梳理各个服务上下游依赖、快速定位故障和异常都成为新的挑战。

服务架构无法全面把握
痛点描述
微服务的数量不断增加,通过人工和文档的形式都很难梳理整体的应用调用关系和拓扑结构。
方案描述
通过 APM 提供的全链路拓扑分析,用户可以清晰地了解应用服务间调用层级关系,直观了解快速系统架构。
快速定位异常
痛点描述
一次业务请求中调用后端诸多微服务,当业务出现错误时,需要逐一排查各个微服务是否出现错误。
方案描述
通过调用链监控用户,可以查询到业务调用的全部链路以及在哪次调用中出现错误和异常,简化排查流程。
服务依赖关系无从确认
痛点描述
随着微服务不断迭代,服务间的依赖关系不断调整,导致难以确认依赖关系,无法确认变更的影响范围。
方案描述
根据链路拓扑可以确认服务间的依赖关系,识别上下游依赖,并监控数据潜在的故障点和性能瓶颈。
异构系统如何全局监控
痛点描述
在业务发展过程中不可避免的出现多语言异构技术栈,通常各个技术栈都有各自的监控方案,如何进行融合成为挑战。
方案描述
通过兼容 OpenTrcing 标准,APM 支持 Java、Go、Python、C# 等诸多异构技术栈的统一监控。
产品全景
核心优势
开源兼容
可兼容 Skywalking、Zipkin、Jaeger 等主流开源方案的数据推送
全息排查
将业务 ID、业务日志、调用链互相打通,快速定位上下文,加快问题排查速度
无侵入接入
无需进行任何代码修改,即可接入 APM
异构融合
支持 Java、Go、Python、C#、NodeJS 等诸多异构技术栈的统一监控
核心功能
全局拓扑
自动化拓扑发现应用以及中间件之间的全局调用拓关系
调用链追踪
调用链追踪记录单个业务在全链路的调用详情,包括代码执行情况、数据库调用等
性能监控
支持 JVM、数据库、慢 SQL、缓存中间件性能等监控
日志关联
无侵入、不需要应用程序修改代码即可完成日志系统和 APM 的关联
慢响应分析
提供判定慢响应的功能,可以准确识别出系统中出现的慢响应请求
关键业务
支持关键事务入口和拓扑的可视化,帮助用户分析业务依赖关系
客户案例

电话咨询

0571-89852939

工作日 9:30-18:00

在线咨询

架构师咨询