Dubbo日志链路追踪TraceId选型

Dubbo日志链路追踪TraceId选型,第1张

开发排查系统问题用得最多的手段就是查看系统日志,但是在分布式环境下使用日志定位问题还是比较麻烦,需要借助 全链路追踪ID 把上下文串联起来,本文主要分享基于 Spring Boot + Dubbo 框架下 日志链路追踪ID 的实现方案选型思路。

 

目前大多数分布式追踪系统的思想模型都来自 Google's Dapper 论文

全链路追踪的核心思想:

 

这是 SkyWalking 的一个日志插件塌型启,通过这个插件可以在日志中输出

traceId

配置依赖 ,在 pom 文件中添加以下内容

 

配置日志模板 ,修改 logback-spring.xml 文件中 Appender 元租洞素的 encoder 为以下内容

 

 

Sleuth 是 Spring Cloud 的组件之一,它为 Spring Cloud 实现了一种分布式追踪解决方案,兼容Zipkin,HTrace与其他日志追踪系统

配置父依赖 ,在 pom 文件中添加以下内容管理版本号

 

配置依赖 ,在 pom 文件中添加以下内容

 

适配dubbo ,要让 sleuth 支持 dubbo 框架,需要增加以下两个步骤:

首先添加 dubbo 的插件依赖

配置 dubbo 过滤器

 

配置日志模板 ,修改 logback-spring.xml 文件中 Appender 元素的 encoder 为以下内容

 

 

使用 Logback 的 MDC 机制,在日志模板中加入 traceId 标识,取值方式为 %X{traceId}

 

解决 traceId 跨线程丢失问题

由于 MDC 内部使用的是 ThreadLocal 所以只有本线程才有效,子线程和下游的服务 MDC 里的值会丢失;

需要解决 Spring 的各种线程池与异步方法的父团如子线程间传递。

解决思路 :重写一个 MDCAdapter 使用阿里的 TransmittableThreadLocal 替换原来的 ThreadLocal 对象,解决各种线程池( ExecutorService / ForkJoinPool / TimerTask )父子进程传值问题。

 

解决 traceId 跨进程丢失问题

dubbo服务 使用 org.apache.dubbo.rpc.Filter 创建一个过滤器进行 traceId 传递

 

 

1 Dubbo出现的背景

随着互联网的发展,网站应用的规模不断扩大,常规的垂直应用架构已无法应对,分布式服务架构以及流动计算架构势在必行,亟需一个治理系统确保架构有条不紊的演进。

· 我们传统的网站结构为单一应用架构,也就是把所有的功能都放在一个项目工程里贺并,部署在一台服务器上。

· 当访问量越来越大,我们需要通过不断添加服务器的方式来应对越来越大的访问量,或是将应用拆分成几个不相干的应用部署在不同的服务器上。

· 随着用户数的增加及业务的发展,拆分的应用越来越多,应用之间的交互及数据传输不可避免,则将核心业务抽取出来,作为独立的服务,逐渐形成稳定的服务中心,使前端应用能更快速的响应多变的市场需求。

· 当服务越来越多,容量的评估,小服务资源的浪费等问题逐渐显现,此时需增加一个调度中心基于访问压力实时管理集群容量,提高集群利用率。

2 系统发展进化理论

系统发展经历过两个阶段:

· 集中式系统

就是把所有的程序、功能、模块集中到一个项目中,部署在一台服务器上,从而对外提供服务。

· 分布式系统

分布:在一定范围内分散开

分布式系统就是把所有的程序、功能拆分成不同的子系统,部署在多台不同的服务器上,这些子系统相互协作共同对外提供服务,对于用户而言并不知道后台是如何交互的,使用上和集中式系统一样。

3 认识集群及分布式

· 什么是集群?

就是将相同的程序、功能部署在两台或是多台服务器上,这些服务器对外提供的功能是完全一样的,集群就是通过不同横向扩展增加服务器的方式,以提高服务的能力。

· 什么是分布式?

就是将两个或多个程序、功能分别运行在两台或多台主机服务器上,这些服务对外提供的功能并不一样,它们通过相互协作最终完成某一服务或是功能。

简单来讲:如果码运两台服务器部署的程序完全一样则是集群,不一样就是分布式;分布式中的每一个节点都可以做成集群,而集群并不一定就是分布式。

4 Dubbo简介

Dubbo是一个分布式、高性能、透明化的RPC服务架构,提供服务自动注册、自动发现等高效服务治理方案。

Dubbo是阿里巴巴公司开源的一个高性能优秀的。

Dubbo官方网站:http://dubbo.io/

5 认识RPC(Remote Procedure Call)

如果有两台服务器A和B,一个应用部署在A服务器上,一个应用部署在B服务器上,如果A想要调用B应用提供的方法,由于它们不在同一台机器上,也就是它们不在一个JVM内存空间,无法直接调用,需要通过网络进行调用,那么这个调用过程就叫做RPC。

6 Dubbo架构

Provider: 暴露服务的服务提供方。

Consumer: 调用远程服务的服务消费方。

Registry: 服务注册与发现的注册中心。(常见Zookeeper作为注册中心)

Monitor: 统计服务的调用次数和调用时间的监控中心。

调用流程

0.服务容器负责启动,加载,运行服务提供者

1.服务提供者在启动时,向注册中心注册自己提供的服务。

2.服务消费者在启动时,向注册中心订阅自己所需的服务。

3.注册中心返回服务提供者地址列表给消费者,如果有变更,注册中心将基于长连接推送变更数据给消费者。

4.服务消费者,从提供者地址列表中,基于软负载均衡算法,选一台提供者进行调用,如果调用失败,再选禅模迹另一台调用。

5.服务消费者和提供者,在内存中累计调用次数和调用时间,定时每分钟发送一次统计数据到监控中心。

7 Dubbo程序开发

项目结构:

主要分三大模块:

dubbo-api : 存放公共接口;

dubbo-consumer : 调用远程服务;

dubbo-provider : 提供远程服务。

环境准备:

安装启动Zookeeper。

7.1 dubbo-api 接口层开发

· Api层开发Person接口

7.2 配置POM.xml文件

· DubboDemo父级目录配置pom.xml全局文件,所加载资源适用于所有子级工程。

7.3 dubbo-provider 服务提供者开发

7.3.1 Person接口实现类PersonImpl开发

7.3.2 applicationContext.xml配置文件

7.3.3 provider简单测试

· provider工程目录下新建Main类

7.4 dubbo-consumer 服务请求者开发

7.4.1 applicationContext.xml配置文件

7.4.2 consumer简单测试

· 请求Zookeeper进行服务端资源访问

运行结果:

8 IDEA使用过程中出现问题

从eclipse切换到IDEA,使用过程中遇见问题:

编译出现问题:

Cannot start process, the working directory 'F:hellohello' does not exist

解决方法:

选择Run-Edit configurations。然后点击Application左边的向下箭头,在Configuration下会显示出Working directory,删除或者设置成合适dircotry就可以。


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/tougao/12288829.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-05-24
下一篇 2023-05-24

发表评论

登录后才能评论

评论列表(0条)

保存