快速入门

Trace

Trace Search

一般出现线上问题,会有一个比较明确的时间段或者是某个明确的服务,如果是某台机器出现异常,也会有一个明确的IP,所以在 Trace 调用链路支持以下几种查询条件:

- 服务名
- 请求的api
- 发生时间
    - 开始时间
    - 结束时间
- Trace的耗时
- ipv4
- 错误类型
    - Redis
    - MySQL
    - Memcache
    - API

Trace List

搜索结果包含,Trace是否异常、总耗时、服务占比、调用组件汇总、发生时间

Trace Waterfall

  • 单条Trace详情以瀑布图的形式展示,详情页面会列出,本次调用中涉及到的关联服务、外部调用、中间件依赖、存储等详细信息
  • 包含错误的调用,会以红色标示
  • 点击单个 span ,会展示出本次span的详细信息

Trace span detail

  • 调用详情,如调用方式如 Http、db等,是否包含 error 信息
  • 相对耗时
  • 发生的IP
  • 具体错误提示

API拓扑

API TOPO

当收到报警时,如果是某个具体的API出现故障,可以通过查看该API的拓扑图来定位问题

  • 首先看该节点是否异常,点击该节点,可以打开该节点的信息面板,查看平均响应长、错误数
    • 如果有错误,则点击错误,查看右侧面板的错误Trace列表,查看对应的具体错误信息
    • 如果没有错误,则可以查看正常Trace,辅助定位问题
  • 其次查看该节点后面所依赖的接口/中间件/存储,是否有 danger 模式的接口,如果包含异常,可以点开查看具体的异常数据
  • 再次可以点击节点间线条,查看对应的 网络延迟数据,来定位问题

模块拓扑

Module TOPO

当需要从全局来定位问题时,可以打开模块全局视图,查看哪些前置服务、后端依赖服务有问题。

模块类型:

  • 应用模块
  • 特定服务模块
  • 综合接口模块
  • DB模块
  • 中间件模块

模块状态有四种颜色表示:

  • 蓝色:正常(normal)
  • 黄色:异常(warning)
  • 红色:严重警告(danger)
  • 灰色:丢失(missing)

点击对应模块,可以查看该模块的各项数据包括事件、接口、负责人

Module detail

模块详情页面左侧有一个 事件列表 ,该列表可以列出选定时间段内,关于模块的所有事件。 右侧有一个 接口 列表,该列表可以列出选定时间段内的所有接口情况,包括采样调用数量、错误数、错误率、平均耗时、健康分支。 点击接口列表中的接口,可以跳转到 API拓扑图 降维查看接口的拓扑。

results matching ""

    No results matching ""