通用算法在linux上的使用如下:采集信息的功能由内核来完成,因此需要存储过程(写 *** 作)尽可能的耗时小,保证对处理events的影响尽可能小。读数据都是基于用户空间完成,因此对性能要求相对低些。linux内核提供的ring-buffer创建了一个环形、双向页面列表,包括一个头指针和尾指针,写基于尾指针,读基于头指针。当ring-buffer写满时,有可能writers会覆盖头指针指向的页面内容,这将会导致读 *** 作数据异常。基于上述原因,该算法提供一个独立的reader页面,该页面完全独立于双向链表,这样readers就不用担心读数据时会被writers将数据破坏。这种实现唯一的缺点是当一个reader页面处理完需要从链表中重新load一个页面时,必须要将处理完的空page插到尾指针之后,同时将当前的head page移除掉作为新的reader page,并将head page在链表上向前移动,这个过程需要依赖锁来保证安全。
Rostedt的算法中提出的ring-buffer结构如下图,H代表Header-flagged pointer:
当存在多个writer时,writer A可以被其他的writer B打断,只要A能保证在B开始前完成其写入动作。该功能可有一种称为interrupts stack机制来实现,当一个wirter初始化时,在尾指针之后预留空间来处理写入事件,当完成时更新尾指针位置,同时引入另一个指针commit指针,用来标记 最近的写入完成指针。在一个空的ring-buffer中,reader page\tail page\commit page有可能指向同一处。
为了消除写过程的锁依赖,提出了 cmpxchg() 原子 *** 作如下:
算法还假设双向链表的指针是4字节对齐,预留低2bit给flags:
-HEADER --- 指针指向当前的head page
-UPDATE --- 指针指向的page正在被写入数据,或者,即将被设为head page
当reader page消费完成时,当前的head page需要从ring-buffer中脱落下来变成新的reader page。通过在next指针中使用HEADER bit,readers可以使用cmxchg()来要求HEADER flag被标记,保证页面内容未被修改过。当writers将flag设置为UPDATE或者清除时,表示该页面内容已被修改过,cmxchg()比较失败,这样reader会重新查找一个新的head page,从而避免使用锁。
当writers更新一个新的tail page时,需要检查next 指针的HEADER flag。如果被设置,需要更新为UPDATE,表示该页面正在被writers使用,并会导致cmpxchg()检查失败,需要剥离一个新的head page为reader page。这种状态也意味着环接近写满状态,仅剩一个页面用来写数据。
参考文献:
skywalking是一款优秀的apm应用性能监控软件,属于Apache开源平台顶级项目,以java语言开发。它以jvm虚拟机agent方式随应用一块启动,通过无侵入自动代码埋点来实现应用接口的性能监控。
由于agent代理和监控的业务应用在一块启动,为尽可能地减小对原有业务应用的影响(内存占用、线程cpu资源使用等),skywalking agent的埋点数据收集以及上报,是以队列+异步线程的方式实现。当skywalking server端出现故障,内存队列被占满,新的收集数据将直接丢弃,不会继续往队列里添加,以避免占用过多内存资源对原有业务产生影响。通常情况下,保持agent默认参数配置即可,无需额外修改。针对一些需求特别的场景,用户可以通过参数自行定义,以便最大限度降低agent对原有业务的影响。
关于skywalking agent的队列模型-- 无锁环状队列。可以参考文章:https://www.jianshu.com/p/93845a3b4b42,这里不再赘述。
skywalking agent本地缓存队列由两部分组成: 缓存通道*通道队列
其中,
缓存通道大小:buffer.channel_size=${SW_BUFFER_CHANNEL_SIZE:5}
缓存队列大小:buffer.buffer_size=${SW_BUFFER_BUFFER_SIZE:300}
上面所列参数,等号左侧为k ey值,右侧为value值,其中value值中大写字符为环境变量,冒号:后面数字为默认值。即agent的默认缓存通道为5,默认每个通道对应队列大小为300。
我们可以通过以下两种方式实现默认参数的覆盖。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)