在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
Kafka的优势有哪些?经常应用在哪些场景?Kafka的优势比较多如多生产者无缝地支持多个生产者、多消费者、基于磁盘的数据存储、具有伸缩性、高性能轻松处理巨大的消息流。多用于开发消息系统,网站活动追踪、日志聚合、流处理等方面。今天我们一起来学习Kafka的相关知识吧!
一、Kafka的优势有哪些?
1. 多生产者
可以无缝地支持多个生产者,不论客户端在使用单个主题还是多个主题。
2. 多消费者
支持多个消费者从一个单独的消息流上读取数据,且消费者之间互不影响。
3. 基于磁盘的数据存储
支持消费者非实时地读取消息,由于消息被提交到磁盘,根据设置的规则进行保存。当消费者发生异常时候意外离线,由于有持久化的数据保证可以实现联机后从上次中断的地方继续处理消息。
4. 伸缩性
用户在开发阶段可以先试用单个broker,再扩展到包含3个broker的小型开发集群,然后随着数据量不断增长,部署到生产环境的集群可能包含上百个broker。
5. 高性能
Kafka可以轻松处理巨大的消息流,在处理大量数据的同时还能保证亚秒级的消息延迟。
二、Kafka使用场景有哪些?
1. 消息
kafka更好的替换传统的消息系统,消息系统被用于各种场景,与大多数消息系统比较kafka有更好的吞吐量内置分区,副本和故障转移,这有利于处理大规模的消息。
根据我们的经验消息往往用于较低的吞吐量,但需要低的端到端延迟并需要提供强大的耐用性的保证。在这一领域的kafka比得上传统的消息系统,如ActiveMQ或RabbitMQ等。
2. 网站活动追踪
kafka原本的使用场景是用户的活动追踪,网站的活动(网页游览,搜索或其他用户的操作信息)发布到不同的话题中心,这些消息可实时处理实时监测也可加载到Hadoop或离线处理数据仓库。
3. 指标
kafka也常常用于监测数据,分布式应用程序生成的统计数据集中聚合。
4. 日志聚合
许多人使用Kafka作为日志聚合解决方案的替代品。日志聚合通常从服务器中收集物理日志文件,并将它们放在中央位置(可能是文件服务器或HDFS)进行处理。Kafka抽象出文件的细节,并将日志或事件数据更清晰地抽象为消息流。这允许更低延迟的处理并更容易支持多个数据源和分布式数据消费。
5. 流处理
kafka中消息处理一般包含多个阶段。其中原始输入数据是从kafka主题消费的,然后汇总,丰富,或者以其他的方式处理转化为新主题,例如,一个推荐新闻文章,文章内容可能从“articles”主题获取;然后进一步处理内容,得到一个处理后的新内容,最后推荐给用户。这种处理是基于单个主题的实时数据流。从0.10.0.0开始,轻量,但功能强大的流处理,就可以这样进行数据处理了。
除了Kafka Streams还有ApacheStorm和Apache Samza可选择。
6. 事件采集
事件采集是一种应用程序的设计风格,其中状态的变化根据时间的顺序记录下来,kafka支持这种非常大的存储日志数据的场景。
7. 提交日志
kafka可以作为一种分布式的外部日志,可帮助节点之间复制数据,并作为失败的节点来恢复数据重新同步,kafka的日志压缩功能很好的支持这种用法,这种用法类似于Apacha BookKeeper项目。
Kafka是大数据开发过程中必备的知识点之一,想要系统的了解大数据知识图谱可以联系老师领取学习路线哦!
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
为什么大数据和云计算备受关注,大数据与云计算的关系
互联网技术不断突破与革新,大数据和云计算的概念现在已经成为互联网的热门词汇。为什么大数据和云计算这样备受关注呢?他们之间有什么关系?相信很多小伙伴也存在这样的疑问。
7619
2019-06-12 17:36:02
2020年云计算大数据课程学习大纲
本文将为大家分享2020年云计算大数据课程的一份学习大纲,本课程从大数据基础增强开始, 内容精准聚焦大数据开发过程中必备的离线数据分析、实时数据分析和内存数据计算等重要内容,涵盖了大数据体系中几乎所有的核心技术。如果大家对云计算大数据感兴趣的话,不妨来看看,对自己的学习规划也是有一定帮助的。
5591
2020-04-28 17:34:28
零基础小白的大数据入门手册
零基础小白的大数据入门手册,学大数据前,大家可能听过不少说大数据难学、入行做好心理准备的。大家听完也很动摇很犹豫,怀疑自己能不能学好大数据。这其实完全没有必要,觉得一个东西难,百分之八十的原因是你不了解它。对于零基础小白而言想学大数据,首先了解下大致学习路径有个框架,知道学习的方向。
4038
2020-06-15 17:33:18
哪个大数据培训学校比较好?值得推荐?
随着大数据应用的落地和普及,大数据行业因其较高的薪资和良好的发展前景,吸引了越来越多人的喜爱。而对于许多想要进入大数据行业的学习者来说,参加大数据培训是最快捷的方式。那么,哪个大数据培训学校比较好?值得推荐呢?其实没有惟一的答案,但是我们可以一起来看看判断一家培训机构是否靠谱的方法。
5643
2020-07-30 16:07:12
博学谷狂野大数据学习多长时间?
狂野大数核心课程以全程直播方式授课,共计330小时,如果每天能保证4小时的高效学习效率,需要学习3个月左右,因为每个人的学习情况不一样学习周期会有所差别。
2824
2022-09-16 15:31:26