flume，kafka區別、協同與詳解

阿新 • • 發佈：2019-06-07

簡介

socket模式

簡單資料處理

開發公司

Flume

日誌採集系統

（管道流方式，提供了很多的預設實現，讓使用者通過引數部署，及擴充套件API.）

可以單獨執行linux命令，作為client將輸出寫入hdfs （例如tail命令）來監聽日誌
可作為server監聽埠，同時作為client將收到資訊寫入hdfs

可編寫Interceptor，對資料進行攔截，對密碼進行MD5加密再寫入hdfs

Cloudera

Kafka

訊息中介軟體（一個可持久化的分散式的訊息佇列）

作為雙server系統，1個server用於獲取資料、另一個用於監聽接入的client的消費資料請求
kafka和JMS（Java Message Service）實現(activeMQ)不同的是:即使訊息被消費,訊息仍然不會被立即刪除

流處理系統，也就是作為一個快取（資料量大的時候會儲存到本地硬碟，不單單是記憶體），生產訊息太多了，消費不過來，就先存著。

Flume最早是Cloudera提供的日誌收集系統，目前是Apache下的一個孵化專案

Kafka是知名社交網路公司LinkedIn於2010年12月份開源的分散式訊息系統，主要由Scala語言開發，於2012年成為Apache頂級專案，目前被廣泛應用在包括Twitter，Netffix和Tumblr等在內的大型網際網路站點上。

使用命令：

建立接收server

Flume

flume-ng agent -c conf -f flume-demo-hdfs.conf --name agent1 -Dflume.root.logger=INFO,Console

根據conf檔案配置來配置：

agent1.sources = source1
agent1.sinks = sink1
agent1.channels = channel1
 
agent1.sources.source1.type = exec
agent1.sources.source1.command = tail -f /var/log/1.log
 
agent1.sinks.sink1.type = hdfs
agent1.sinks.sink1.hdfs.path = hdfs://<namenode_server_ip>:8020/flume/test/data
agent1.sinks.sink1.hdfs.filePrefix = events-
agent1.sinks.sink1.hdfs.fileType = DataStream
agent1.sinks.sink1.hdfs.writeFormat = Text
agent1.sinks.sink1.hdfs.roundUnit = minute
 
agent1.channels.channel1.type = memory
agent1.channels.channel1.capacity = 100
agent1.channels.channel1.transactionCapacity = 100
 
agent1.sources.source1.channels = channel1
agent1.sinks.sink1.channel = channel1

Kafka

建立topic：
kafka-topics --create --zookeeper zookp-server-2:2181 --replication-factor 1 --partitions 1 --topic test2
建立訊息生產者並逐行輸入訊息（開啟後可以用鍵盤輸入，按回車即傳送訊息。注意somehost不能為localhost）：
kafka-console-producer --broker-list somehost:9092 --topic test2
建立消費者並持續接收訊息：
kafka-console-consumer --bootstrap-server somehost:9092 --topic test2 --from-beginning  --zookeeper zookp-server-2:2181

其他命令詳解：Kafka 學習筆記之 Kafka0.11之console-producer/console-consumer: — kafka命令大全 —

Flume也可以開啟埠來監聽，其配置檔案為：

agent1.sources = source1
agent1.sinks = sink1
agent1.channels = channel1
 
agent1.sources.source1.type = netcat
agent1.sources.source1.bind = 0.0.0.0
agent1.sources.source1.port = 9999
 
agent1.sinks.sink1.type = logger
 
agent1.channels.channel1.type = memory
agent1.channels.channel1.capacity = 1000
agent1.channels.channel1.transactionCapacity = 100
 
agent1.sources.source1.channels = channel1
agent1.sinks.sink1.channel = channel1

啟動命令為：

flume-ng agent -c conf -f conf/flume-demo-logger.conf --name agent1 -Dflume.root.logger=INFO,Console

Kafka 是一個非常通用的系統。你可以有許多生產者和很多的消費者共享多個主題Topics。相比之下,Flume是一個專用工具被設計為旨在往HDFS,HBase傳送資料。它對HDFS有特殊的優化，並且集成了Hadoop的安全特性。如果資料被多個系統消費的話，使用kafka；如果資料被設計給Hadoop使用，使用Flume。
Flume可以使用攔截器實時處理資料。這些對資料遮蔽或者過量是很有用的。Kafka需要外部的流處理系統才能做到。
Kafka和Flume都是可靠的系統,通過適當的配置能保證零資料丟失。然而，Flume不支援副本事件。於是，如果Flume代理的一個節點奔潰了，即使使用了可靠的檔案管道方式，你也將丟失這些事件直到你恢復這些磁碟。如果你需要一個高可靠行的管道，那麼使用Kafka是個更好的選擇。
相對於日誌採集：日誌採集。線上資料一般主要是落地檔案或者通過socket傳輸給另外一個系統。這種情況下，你很難推動線上應用或服務去修改介面，直接向kafka裡寫資料。這時候你可能就需要flume這樣的系統幫你去做傳輸。

多系統聯動詳解：Flume+Kafka+Storm+Redis構建大資料實時處理系

flume，kafka區別、協同與詳解

簡介 socket模式簡單資料處理開發公

DAO層，Service層，Controller層、View層詳解

1、Dao層 Dao層主要是做資料持久層的工作，負責與資料庫進行聯絡的一些任務都封裝在此，Dao層的設計首先是設計Dao的介面，然後在Spring的配置檔案中定義此介面的實現類，然後就可在模組中呼叫此介面來進行資料業務的處理，而不用關心此介面的具體實現類是哪個類，顯得結構非常清晰，Dao層的資料

順序表和連結串列的優缺點（區別、特點）詳解

順序表和連結串列由於儲存結構上的差異，導致它們具有不同的特點，適用於不同的場景。本節就來分析它們的特點，讓讀者明白 "在什麼樣的場景中使用哪種儲存結構" 更能有效解決問題。通過系統地學習順序表和連結串列我們知道，雖然它們同屬於線性表，但資料的儲存結構有本質的不同：順序表儲存資料，需預先申請一整塊足夠

Java8 運算子(進位制與轉換、原碼，反碼和補碼、位運算詳解、運算子的優先順序)

進位制 binary: 1 -> 10 -> 11 -> 100 每次從後面進一位 octal: 7-> 10 八進位制是0-7之間，底數為8的計算 hexadecimal：A

#20 ifconfig、route、netstat、ip、ss命令詳解與修改主機名與網卡配置文件

ifconfig、route、netstat、ip、ss命令詳解與修改主機名與網卡配置文件網絡的結構：硬件：計算機、互聯設備、網絡設備軟件：操作系統、協議、應用程序、數據庫網絡的功能：資源共享：目的數據通信：手段網絡通信模型 ISO/OSI：應用層

03 -1 pandas 中 DataFrame理解與建立、索引、運算的詳解以及例項

DataFrame DataFrame是一個【表格型】的資料結構，可以看做是【由Series組成的字典】（共用同一個索引）。DataFrame由按一定順序排列的多列資料組成。設計初衷是將Series的使用場景從一維拓展到多維。DataFrame既有行索引，也有列索引。行索引

vue學習筆記1——vue相關概念：為什麼要用框架？框架與庫的區別、MVC與MVVM的概念

Vue是最火的一個框架，React是最流行的一個框架（React可以開發網站和手機app；Vue也是可以進行PC和APP端開發） Vue、Angular、React並稱為前端三大框架，Vue只關注檢視層，並且便於和第三方庫進行整合。 1，為什麼要用框架？

Scala可變陣列與不可變陣列的區別、可變集合與不可變集合的區別、Array與ArrayBuffer的區別、List與ListBuffer的區別

不可變陣列與可變陣列的區別 Array與ArrayBuffer的區別 Array為不可變陣列，ArrayBuffer為可變陣列，兩則的區別比較好理解：不可變指的是長度不可變。Array不能新增或刪除元素，沒有+=和-=方法；而ArrayBuffer可以新增或刪除元素。注意點：Ar

C++位操作與、或、非、異或、取反詳解

一、按位邏輯運算子 1，按位取反~ 如：~(10)結果位(01) ~var不會改變var的值，如果要改var值，可以為var=~var; 2，按位與& 有0得0，全1出1 var&=300等價於var=var&300 3，按位或| 有1出1，全

JVM效能調優監控工具jps、jstack、jmap、jhat、jstat、hprof使用詳解，以及例子

現實企業級Java開發中，有時候我們會碰到下面這些問題： OutOfMemoryError，記憶體不足記憶體洩露執行緒死鎖鎖爭用（Lock Contention） Java程序消耗CPU過高 ...... 這

C#之基礎篇①（VS快捷鍵、WriteLine()與Write()區別、ReadKey()與ReadLine()區別、double,float,decimal區別）

今天我們來分享一下VS視訊中第一講內容，這篇內容主要分享的是VS工具的使用以及簡單的資訊顯示、變數宣告。一、導圖類：二、程式碼類 2.1、顯示資訊 Console.WriteLine("************

指標與陣列概念、指標陣列、陣列指標詳解

指標與陣列指標可以與變數結合，也可以與陣列結合使用。指標陣列和陣列指標是兩個截然不同的概念，指標陣列是一種陣列，該陣列存放的是一組變數的地址。陣列指標是一個指標，表示該指標是指向陣列的指標。 1.指向陣列元素的指標 int a[5]={1,2,3,4,5}; int *p=a; //

Electron 3.0.0 釋出，升級 Chrome、Node 與 V8

Electron 3.0.0 釋出了，Electron 是 GitHub 釋出的跨平臺桌面應用開發工具，支援 Web 技術開發桌面應用，其本身是基於 C++ 開發的，GUI 核心來自於 Chrome，而 JavaScript 引擎使用 V8。此版本主要更新內容包括：新

裝箱和拆箱的區別與詳解

深入剖析Java中的裝箱和拆箱　　自動裝箱和拆箱問題是Java中一個老生常談的問題了，今天我們就來一些看一下裝箱和拆箱中的若干問題。本文先講述裝箱和拆箱最基本的東西，再來看一下面試筆試中經常遇到的與裝箱、拆箱相關的問題。　　以下是本文的目錄大綱：

ArrayList 與LinkedList的資料結構區別與詳解

ArrayLIst 與LinkedList 的區別 1.首先ArrayList 是查詢快，增刪慢； 2.LinkedList 是查詢慢，增刪快；至於原因下文中已經說明，他們兩個都是執行緒不安全的。 ArrayList的說明增刪慢從ArrayList開始說起，首先Arra

實現螢幕切換、滑動-ViewPager詳解（二）之--------PagerTitleStrip與PagerTabStrip新增標題欄

PagerTabStrip 1.PagerTabStrip概述：（API解釋） PagerTabStrip是ViewPager的一個關於當前頁面、上一個頁面和下一個頁面的一個非互動的指示器。它經常作為ViewPager控制元件的一個子控制元件被被新增

lock Mutex Monitor 之間的區別與詳解, .net 多執行緒同步非同步操作,鎖

Framework為我們提供了三個加鎖的機制，分別是Monitor類、Lock關鍵字和Mutex類。　　總體而言，lock和monitor可以鎖定物件，也可以鎖定函式；而mutex一般用於鎖定函式，並保證不同執行緒間同步呼叫函式，而不會受執行緒優先順序影響。使用lo

爬蟲原理與會話保持（cookies、session）詳解--python實現

一、爬蟲原理我們知道網際網路是由大量計算機和網路構成的複雜系統，我們可以將其形象的比喻成一張蜘蛛網。網路的節點是計算機，計算機中儲存著大量的資料。爬蟲程式就是通過網路去採集指定計算機中資料的工具。一般來說，我們採集的資料大多是網頁上的資料，

關係型資料庫和非關係型資料庫區別、oracle與mysql的區別

一、關係型資料庫關係型資料庫，是指採用了關係模型來組織資料的資料庫。關係模型是在1970年由IBM的研究員E.F.Codd博士首先提出的，在之後的幾十年中，關係模型的概念得到了充分的發展並逐漸成為主流資料庫結構的主流模型。簡單來說，關係模型指的

Javascript中call和apply的區別與詳解

轉自：http://www.7old.com/jiaocheng/show-1412.html在js中call和apply它們的作用都是將函式繫結到另外一個物件上去執行，兩者僅在定義引數方式有所區別,下面我來給大家介紹一下call和apply用法。在web前端開發過程中

flume，kafka區別、協同與詳解

相關推薦