Spring Cloud Sleuth + Zipkin实现分布式链路跟踪

MichaelHsu

2019-01-24

关注关注

Spring Cloud Sleuth为SpringCloud应用实现了一种分布式链路跟踪解决方案，通过Sleuth可以很清楚了解到一个服务请求经过了哪些服务，每个服务处理花费了多长时间。

Sleuth术语

Span

Span是基本的工作单元。Span包括一个64位的唯一ID，一个64位trace码，描述信息，时间戳事件，key-value 注解(tags)，span处理者的ID（通常为IP）。

每个trace中会调用若干个服务，为了记录调用了哪些服务，以及每次调用的消耗时间等信息，在每次调用服务时，埋入一个调用记录，称为一个span。

Trace

包含一系列的span，它们组成了一个树型结构。

从客户发起请求（request）抵达被追踪系统的边界开始，到被追踪系统向客户返回响应（response）为止的过程，称为一个 trace。

Annotation

用于及时记录存在的事件。常用的Annotation如下：

cs - Client Sent：客户端发送一个请求，表示span的开始

sr - Server Received：服务端接收请求并开始处理它。(sr-cs)等于网络的延迟

ss - Server Sent：服务端处理请求完成，开始返回结果给服务端。(ss-sr)表示服务端处理请求的时间

cr - Client Received：客户端完成接收返回结果，此时span结束。(cr-sr)表示客户端接收服务端数据的时间

Sleuth的用途：

耗时分析: 通过Sleuth可以很方便的了解到每个采样请求的耗时，从而分析出哪些服务调用比较耗时;

可视化错误: 对于程序未捕捉的异常，可以通过集成Zipkin服务界面上看到;

链路优化: 对于调用比较频繁的服务，可以针对这些服务实施一些优化措施。

Spring Cloud Sleuth 可以结合Zipkin，将信息发送到Zipkin，利用Zipkin的存储来存储信息，利用Zipkin UI来展示数据。

Zipkin是Twitter的一个开源项目，它基于Google Dapper实现，它致力于收集服务的定时数据，以解决微服务架构中的延迟问题，包括数据的收集、存储、查找和展现。

Zipkin原理：基本思路是在服务调用的请求和响应中加入ID，标明上下游请求的关系。利用这些信息，可以可视化地分析服务调用链路和服务间的依赖关系。

Zipkin提供了可插拔数据存储方式：In-Memory（默认）、MySql、Cassandra 以及 Elasticsearch。

Zipkin主要由4个核心组件构成：

Collector：收集器组件，它主要用于处理从外部系统发送过来的跟踪信息，将这些信息转换为Zipkin内部处理的Span格式，以支持后续的存储、分析、展示等功能。

Storage：存储组件，它主要对处理收集器接收到的跟踪信息，默认会将这些信息存储在内存中，我们也可以修改此存储策略，通过使用其他存储组件将跟踪信息存储到数据库中。

RESTful API：API组件，它主要用来提供外部访问接口。比如给客户端展示跟踪信息，或是外接系统访问以实现监控等。

Web UI：UI组件，基于API组件实现的上层应用。通过UI组件用户可以方便而又直观地查询和分析跟踪信息。

Zipkin分为两端，一个是Zipkin服务端，一个是Zipkin客户端，客户端也就是微服务应用。客户端会配置服务端的URL地址，一旦发生服务间的调用时，会被配置在微服务里面的Sleuth监听器监听，并生成相应的Trace和Span信息发送给服务端。发送的方式主要有两种，一种是HTTP报文的方式，另一种是消息总线的方式如RabbitMQ。

Zipkin服务端：

使用Spring Boot 2.x版本后，官方直接提供了编译好的jar包来给我们使用，比如本范例使用的jar包是zipkin-server-2.9.4-exec.jar

到 https://dl.bintray.com/openzipkin/maven/io/zipkin/java/zipkin-server/ 下载相应的jar包。

执行 java -jar zipkin-server-2.9.4-exec.jar 命令启动Zipkin Server，端口默认是9411

在浏览器访问 http://localhost:9411，显示效果如下图：

Spring Cloud Sleuth + Zipkin实现分布式链路跟踪
Zipkin客户端：

在pom.xml文件添加以下依赖：

<dependency>
	<groupId>org.springframework.cloud</groupId>
	<artifactId>spring-cloud-starter-sleuth</artifactId>
</dependency>
<dependency>
	<groupId>org.springframework.cloud</groupId>
	<artifactId>spring-cloud-starter-zipkin</artifactId>
</dependency>

在application.properties文件添加以下配置：

#设置采样比例为1.0。默认是0.1
spring.sleuth.sampler.probability=1.0

#Zipkin服务器的地址
spring.zipkin.base-url=http://localhost:9411/

启动注册中心和各个微服务应用，注册中心的主界面最终如下：

Spring Cloud Sleuth + Zipkin实现分布式链路跟踪

访问微服务URL后，在Zipkin Server即可查看到服务的调用关系：

Spring Cloud Sleuth + Zipkin实现分布式链路跟踪
Zipkin Server改用Mysql存储数据：

到 https://github.com/openzipkin/zipkin/tree/master/zipkin-storage 下载mysql的建表脚本

手动创建一个名为zipkin的数据库，执行建表脚本

执行以下命令启动zipkin-server：

java -jar zipkin-server-2.9.4-exec.jar --STORAGE_TYPE=mysql --MYSQL_HOST=localhost --MYSQL_TCP_PORT=3306 --MYSQL_USER=root --MYSQL_PASS=root

zipkin 分布式架构

MichaelHsu

0 关注 0 粉丝 0 动态

关注关注

跟我学SpringCloud | 第十一篇：使用Spring Cloud Sleuth和Zipkin进行分布式链路跟踪

在分布式服务架构中，需要对分布式服务进行治理——在分布式服务协同向用户提供服务时，每个请求都被哪些服务处理？在遇到问题时，在调用哪个服务上发生了问题？在分析性能时，调用各个服务都花了多长时间？哪些调用可以并行执行？……为此，分布式服务平台就需要提供这样一种

summerZBH 2020-05-26

docker zipkin 链路监控

bin/kafka-topics.sh --create --zookeeper zookeeper:2181 --replication-factor 1 --partitions 1 --topic zipkin

yangyutong00 2020-04-16

Dubbo + Zipkin + Brave 实现全链路追踪

利用zipkin可以对dubbo进行调用链监控，可以查到调用链中的dubbo服务的性能，并且dubbo提供了SPI的接口，能很容易完成并自定义相应的filter去监控dubbo服务。Zipkin是一个致力于收集分布式服务的时间数据的分布式跟踪系统。Zipk

wcf00 2018-10-23