在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
本篇文章我们将从Kafka的客户端缓冲机制开始,一直分析到内存缓冲造成的频繁GC问题,最后谈谈Kafka设计者实现的缓冲池机制,希望解决大多数人对Kafka缓冲机制的疑问。
1、Kafka的客户端缓冲机制
在客户端发送消息给kafka服务器的时候,一定是有一个内存缓冲机制的。也就是说,消息会先写入一个内存缓冲中,然后直到多条消息组成了一个Batch,才会一次网络通信把Batch发送过去。
2、内存缓冲造成的频繁GC问题
这种内存缓冲机制的本意,其实就是把多条消息组成一个Batch,一次网络请求就是一个Batch或者多个Batch。这样每次网络请求都可以发送很多数据过去,避免了一条消息一次网络请求。从而提升了吞吐量,即单位时间内发送的数据量。
但是问题来了,大家可以思考一下,一个Batch中的数据,会取出来然后封装在底层的网络包里,通过网络发送出去到达Kafka服务器。这个Batch里的数据都发送过去了,现在Batch里的数据应该怎么处理?这些Batch里的数据此时可还在客户端的JVM的内存里啊!那么此时从代码实现层面,一定会尝试避免任何变量去引用这些Batch对应的数据,然后尝试触发JVM自动回收掉这些内存垃圾。
这样不断的让JVM回收垃圾,就可以不断的清理掉已经发送成功的Batch了,然后就可以不断的腾出来新的内存空间让后面新的数据来使用。这种想法很好,但是实际线上运行的时候一定会有问题,最大的问题,就是JVM GC问题。JVM GC在回收内存垃圾的时候,他会有一个“Stop the World”的过程,也就是垃圾回收线程运行的时候,会导致其他工作线程短暂的停顿,这样可以便于他自己安安静静的回收内存垃圾。
这个也很容易想明白,毕竟你要是在回收内存垃圾的时候,你的工作线程还在不断的往内存里写数据,制造更多的内存垃圾,那你让人家JVM怎么回收垃圾?这就好比在大马路上,如果地上有很多垃圾,现在要把垃圾都扫干净,最好的办法是什么?大家都让开,把马路空出来,然后清洁工就是把垃圾清理干净。但是如果清洁工在清扫垃圾的时候,结果一帮人在旁边不停的嗑瓜子扔瓜子壳,吃西瓜扔西瓜皮,不停的制造垃圾,你觉得清洁工内心啥感受?当然是很愤慨了,照这么搞,地上的垃圾永远的都搞不干净了!
现在JVM GC是越来越先进,从CMS垃圾回收器到G1垃圾回收器,核心的目标之一就是不断的缩减垃圾回收的时候,导致其他工作线程停顿的时间。所以现在越是新款的垃圾回收器导致工作线程停顿的时间越短,但是再怎么短,他也还是存在啊!而如何尽可能在自己的设计上避免JVM频繁的GC就是一个非常考验水平的事儿了。
3、Kafka设计者实现的缓冲池机制
在Kafka客户端内部,对这个问题实现了一个非常优秀的机制,就是缓冲池的机制。每个Batch底层都对应一块内存空间,这个内存空间就是专门用来存放写入进去的消息的。然后当一个Batch被发送到了kafka服务器,这个Batch的数据不再需要了,就意味着这个Batch的内存空间不再使用了。此时这个Batch底层的内存空间不要交给JVM去垃圾回收,而是把这块内存空间给放入一个缓冲池里。这个缓冲池里放了很多块内存空间,下次如果你又有一个新的Batch了,那么不就可以直接从这个缓冲池里获取一块内存空间就ok了?然后如果一个Batch发送出去了之后,再把内存空间给人家还回来不就好了?以此类推,循环往复。
以上就是小编对Kafka缓冲机制的内容讲解,希望能给大家一些帮助。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
无服务器计算是什么?有什么优势?
无服务器计算是一种云服务,根据资料了解,无服务器计算将是云计算下一个风口,它的出现将改变管理复杂软件以及开发者部署的方式,将对企业交付应用程序带来巨大的影响。那什么是无服务器计算呢?他有什么优势呢?
7821
2019-06-12 17:32:08
做运维提升难吗?运维如何快速提升自己?
做运维提升难吗?严格意义上来讲,没有什么工作的提升是不难的。做运维需要的是多方面的能力,但都不需要太精,因此运维入门门槛比较低但后期提升难。那么运维如何快速提升自己呢?一方面需要继续深入学习Linux基础运维、Devops与云计算运维、网络安全等等专业知识,另一方面在工作中应该多总结多思考积累经验。
8219
2019-09-06 12:33:12
运维安全的主要工作是干什么?
互联网的三大技术岗位分别是研发、测试和运维。在许多人看来,运维好像并没有那么重要,然而运维安全其实是企业安全保障的基石,不同于其他的技术环节,运维安全环节出现问题往往会比较严重,因此运维的重要性早已不言而喻。那么运维安全的主要工作是什么?主要是终端的运行维护,包括客户端故障排除、硬件故障修复、应用系统软件客户端安装、终端安全防护等方面的内容。
22480
2019-09-11 15:41:09
零基础Linux培训课程有哪些内容?
零基础Linux培训课程有哪些内容?Linux培训主要学习网络基础,计算机网络、云计算网络,配备有企业级项目实战:IP地址配置与DNS解析;Linux基础,包括Linux操作系统及Linux高级管理;云数据中心主机CPU资源利用率实时统计、分析系统。
4981
2020-05-13 11:23:12
Linux用户相关操作命令有哪些?都是什么作用?
Linux用户相关操作命令有哪些?都是什么作用?涉及的用户相关操作命令有创建(添加)用户、为用户设置密码、切换用户、修改用户信息、添加和删除附加组信息、删除用户等内容,今天我们一起来学习一下
2888
2022-03-18 11:06:56