Kafka 與 Flume

阿新 • • 發佈：2017-10-26

index 取數設計復制轉移 pen 做了流式推薦

https://www.ibm.com/developerworks/cn/opensource/os-cn-kafka/index.html

Kafka 與 Flume 很多功能確實是重復的。以下是評估兩個系統的一些建議：

Kafka 是一個通用型系統。你可以有許多的生產者和消費者分享多個主題。相反地，Flume 被設計成特定用途的工作，特定地向 HDFS 和 HBase 發送出去。Flume 為了更好地為 HDFS 服務而做了特定的優化，並且與 Hadoop 的安全體系整合在了一起。基於這樣的結論，Hadoop 開發商 Cloudera 推薦如果數據需要被多個應用程序消費的話，推薦使用 Kafka，如果數據只是面向 Hadoop 的，可以使用 Flume。
Flume 擁有許多配置的來源 (sources) 和存儲池 (sinks)。然後，Kafka 擁有的是非常小的生產者和消費者環境體系，Kafka 社區並不是非常支持這樣。如果你的數據來源已經確定，不需要額外的編碼，那你可以使用 Flume 提供的 sources 和 sinks，反之，如果你需要準備自己的生產者和消費者，那你需要使用 Kafka。
Flume 可以在攔截器裏面實時處理數據。這個特性對於過濾數據非常有用。Kafka 需要一個外部系統幫助處理數據。
無論是 Kafka 或是 Flume，兩個系統都可以保證不丟失數據。然後，Flume 不會復制事件。相應地，即使我們正在使用一個可以信賴的文件通道，如果 Flume agent 所在的這個節點宕機了，你會失去所有的事件訪問能力直到你修復這個受損的節點。使用 Kafka 的管道特性不會有這樣的問題。
Flume 和 Kafka 可以一起工作的。如果你需要把流式數據從 Kafka 轉移到 Hadoop，可以使用 Flume 代理 (agent)，將 kafka 當作一個來源 (source)，這樣可以從 Kafka 讀取數據到 Hadoop。你不需要去開發自己的消費者，你可以使用 Flume 與 Hadoop、HBase 相結合的特性，使用 Cloudera Manager 平臺監控消費者，並且通過增加過濾器的方式處理數據。

Kafka 與 Flume

index 取數設計復制轉移 pen 做了流式推薦 https://www.ibm.com/developerworks/cn/opensource/os-cn-kafka/index.html Kafka 與 Flume 很多功能確實是重復的。以下是評估

kafka與flume的整合例項

一、整體步驟： 1.首先安裝kafka，配置flume。建立kafka的topic（利用zookeeper進行管理，所以首先要安裝zookeeper） 2.將檔案放置在flume的source目錄下，啟動flume。將檔案讀取到指定的kafka的topic中。 3.啟動的kafka的co

Kafka與Flume的異同點

Kafka和flume作為資料採集通道的區別：將資料從某一個數據源匯入HDFS或者HBase，Kafka是一個半成品，需要自己完成消費者程式的編寫，而flume只需要改配置就可以導資料進入HDFS或者HBase，相當於Flume自身包含了消費者程式，不需要程式

kafka與flume 的應用（實戰）

版本號：RedHat6.5 JDK1.8 flume-1.6.0 kafka_2.11-0.8.2.11.flume安裝2.kafka安裝3.Flume和Kafka整合在conf目錄新建flume-kafka.conf檔案：touch /usr/local/fl

【採集層】Kafka 與 Flume 如何選擇

採集層主要可以使用Flume, Kafka兩種技術。 Flume：Flume 是管道流方式，提供了很多的預設實現，讓使用者通過引數部署，及擴充套件API. Kafka：Kafka是一個可持久化的分散式的訊息佇列。 Kafka 是一個非常通用的系統。你可以

kafka與flume的連線、kafka的python開發

kafka與flume的連線：修改flume的配置檔案，將sinks的配置修改為：看flume的官網： http://flume.apache.org/FlumeUserGuide.html#kafka-sink #定義gent的source channel sinksa5.sour

大資料系列之分散式釋出訂閱訊息系統Kafka（四）Kafka與Flume的3種整合

前面我們已經介紹了Flume，現在我們將Kafka與Flume整合先看一下Flume的結構組成：我們可以發現，將Flume與Kafka進行整合無非3種情況，Flume作為生產者——Sink輸出到Kafka，Flume作為消費者——Source接

大數據入門第二十四天——SparkStreaming（2）與flume、kafka整合

RM ESS 依賴 mep sock flume-ng bject 整合 master 前一篇中數據源采用的是從一個socket中拿數據，有點屬於“旁門左道”，正經的是從kafka等消息隊列中拿數據！主要支持的source，由官網得知如下：

Flume 、Kafka 與SparkStreaming 整合程式設計

Flume 、Kafka 與SparkStreaming 整合程式設計一、 Kafka 與SparkStreaming 整合程式設計 1、程式 pull方式，可靠Recerver ，工作常

Linux下基於Hadoop的大資料環境搭建步驟詳解（Hadoop，Hive，Zookeeper，Kafka，Flume，Hbase，Spark等安裝與配置）

Linux下基於Hadoop的大資料環境搭建步驟詳解（Hadoop，Hive，Zookeeper，Kafka，Flume，Hbase，Spark等安裝與配置）系統說明搭建步驟詳述一、節點基礎配置二、H

Flume、Kafka與Storm實現日誌處理

1. ZooKeeper 安裝參考 2. Kafka 2.1 解壓安裝 # 確保scala已經安裝好，本文安裝的是2.11.7 tar -xf kafka_2.11-0.9.0.1.tgz cd kafka_2.11-0.9.0.1 mkdi

KafKa+Zookeeper+Flume部署腳本

tns 企鵝 aaa 源碼腳本 nsa data- aaaaa cst 喜歡學習的朋友可以收藏願意了解框架技術或者源碼的朋友直接加求求（企鵝）：2042849237KafKa+Zookeeper+Flume部署腳本

spark與flume整合

kcon text org http clas appname spl storage ket spark-streaming與flume整合 push package cn.my.sparkStream import org.apache.spark.SparkCo

開源數據采集組件比較: scribe、chukwa、kafka、flume

方案來源接口場景 hadoop集群取數據數據源配置角色 thrift 針對每天TB級的數據采集，一般而言，這些系統需要具有以下特征：構建應用系統和分析系統的橋梁，並將它們之間的關聯解耦；支持近實時的在線分析系統和類似於Hadoop之類的離線分析系統；具有

淺談開源Kafka與騰訊雲cKafka

升級容錯無奈資源利用率傳統功能 group 會計如何選擇今天下午參加了騰訊雲+社區組織的kafka公開課，收獲良多。正巧在工作中也遇到過kafka的問題，今天聽完之後產生了非常多的感想。無奈篇幅有限，本人又文筆愚鈍，所以今天的分享主要提及對我感觸最深的內容。分

linux後臺永久啟動Kafka、Flume命令(測試通過）

命令如下：（配置好環境變數，普通使用者狀態下：“$”代表普通使用者，“#”代表root使用者） 1 後臺啟動Kafka: $ nohup kafka-server-start.sh /home/espai/kafka/config/server.properties 1>/dev

kafka的配置,kafka和flume的配置

參考文件:　　https://files.cnblogs.com/files/han-guang-xue/kafka.zip 其中實現如圖的效果詳細步驟如下: #han01.confa1.sources=r1 a1.channels=c1 a1.sinks=k1 a1.sources.r1.t

從0到1搭建基於Kafka、Flume和Hive的海量資料分析系統(一)資料收集應用

大資料時代，一大技術特徵是對海量資料採集、儲存和分析的多元件解決方案。而其中對來自於感測器、APP的SDK和各類網際網路應用的原生日誌資料的採集儲存則是基本中的基本。本系列文章將從0到1，概述一下搭建基於Kafka、Flume、Zookeeper、HDFS、Hive的海量資料分析系統的框架、核心應用和關鍵模組

kafka與storm整合

kafka與storm的整合步驟採用官方storm-kafka-client方式進行整合一引入pom依賴 <properties> <project.build.sourceEncoding>UTF-8</

Kafka，Flume，OpenStack，Hive大資料雲端計算必學技術

OpenStack專案是一個開源的雲端計算平臺,旨在實現很簡單,大規模可伸縮,功能豐富。來自世界各地雲端計算開發人員和技術人員共同建立OpenStack專案。OpenStack通過一組相關的服務提供一個基礎設施即服務(IaaS)解決方案。每個服務提供了一個應用程式程式設計介面(API),促進了這

Kafka 與 Flume

相關推薦