kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),有如下特性:
1. 通過(guò)O(1)的磁盤數(shù)據(jù)結(jié)構(gòu)提供消息的持久化,這種結(jié)構(gòu)對(duì)于即使數(shù)以TB的消息存儲(chǔ)也能夠保持長(zhǎng)時(shí)間的穩(wěn)定性能。
2 .高吞吐量:即使是非常普通的硬件kafka也可以支持每秒數(shù)十萬(wàn)的消息。
3 .支持通過(guò)kafka服務(wù)器和消費(fèi)機(jī)集群來(lái)分區(qū)消息。
4 .支持Hadoop并行數(shù)據(jù)加載。
本篇屬于大數(shù)據(jù)技術(shù)-> kafka 系列的開篇,本文從以下幾個(gè)基礎(chǔ)層面概述Kafka的知識(shí)點(diǎn),后續(xù)在針對(duì)于單個(gè)的技術(shù)點(diǎn)擴(kuò)展每篇博文。
Kafka背景介紹
Kafka基本架構(gòu)組件
Kafka設(shè)計(jì)原理
Kafka用途
一:Kafka背景介紹
Kafka是一種高吞吐量的,分布式,快速、可擴(kuò)展的,分區(qū)和可復(fù)制,基于發(fā)布/訂閱模式的消息系統(tǒng),由Linkedin開發(fā),之后成為Apache項(xiàng)目的一部分。使用Scala語(yǔ)言編寫,目前已被廣泛應(yīng)用于各行業(yè)各類型的數(shù)據(jù)管道和消息系統(tǒng)中。
kafka的設(shè)計(jì)目的是提供一個(gè)發(fā)布訂閱解決方案,它可以處理消費(fèi)者規(guī)模的網(wǎng)站中的所有動(dòng)作流數(shù)據(jù)。 這種動(dòng)作(網(wǎng)頁(yè)瀏覽,搜索和其他用戶的行動(dòng))是在現(xiàn)代網(wǎng)絡(luò)上的許多社會(huì)功能的一個(gè)關(guān)鍵因素。 這些數(shù)據(jù)通常是由于吞吐量的要求而通過(guò)處理日志和日志聚合來(lái)解決。