1. 程式人生 > >大資料實時分析架構

大資料實時分析架構

flume+kafka+flink+hbase 實時分析架構##

  • 整體架構

各個業務系統的訊息源多種多樣,使用 flume 作為訊息的採集端,有一定的擴充套件性,採集的訊息發往hdfs直接儲存和訊息管道進行實時計算。中間傳輸層採用Kakfa,能夠支撐海量資料的資料傳遞。將訊息持久化到磁碟中,並對訊息建立了備份保證了資料的安全。Kafka在保證了較高的處理速度的同時,又能保證資料處理的低延遲和資料的零丟失。計算框架多采用高吞吐的SparkStreaming,還擁有Spark生態圈豐富的元件,最後將處理好的資料寫入Hbase方便即時查詢。
實時查詢架構 計算框架中新興的 flink 很多方面會表現的更為優秀,之後專案也會採用它來取代sparkStream。

  • dome
    後續補充