1. 程式人生 > >分散式釋出訂閱訊息系統 Kafka

分散式釋出訂閱訊息系統 Kafka

kafka是一種高吞吐量的分散式釋出訂閱訊息系統,她有如下特性:

  • 通過O(1)的磁碟資料結構提供訊息的持久化,這種結構對於即使數以TB的訊息儲存也能夠保持長時間的穩定效能。

  • 高吞吐量:即使是非常普通的硬體kafka也可以支援每秒數十萬的訊息。

  • 支援通過kafka伺服器和消費機叢集來分割槽訊息。

  • 支援Hadoop並行資料載入。

卡夫卡的目的是提供一個釋出訂閱解決方案,它可以處理消費者規模的網站中的所有動作流資料。 這種動作(網頁瀏覽,搜尋和其他使用者的行動)是在現代網路上的許多社會功能的一個關鍵因素。 這些資料通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。 對於像Hadoop的一樣的日誌資料和離線分析系統,但又要求實時處理的限制,這是一個可行的解決方案。kafka的目的是通過Hadoop的並行載入機制來統一線上和離線的訊息處理,也是為了通過叢集機來提供實時的消費。

Git 地址:

http://git-wip-us.apache.org/repos/asf/kafka.git
1