Kafka Streams：它是適合您的流處理引擎嗎？

阿新 • • 發佈：2018-12-27

在這篇文章中，我們將詳細討論流媒體訪問模式以及HDF 3.3和即將釋出的HDP 3.1版本中Kafka Streams支援的增加。

在新增Kafka Streams支援之前，HDP和HDF支援兩個流處理引擎：帶有Storm的Spark Structured Streaming和Streaming Analytics Manager（SAM）。很自然，這會產生以下問題：為什麼要在平臺上新增第三個流處理引擎？

通過選擇使用Spark結構化流式傳輸或SAM與Storm支援，客戶可以選擇根據其非功能性需求和用例選擇正確的流處理引擎。但是，這些引擎都沒有解決我們從客戶那裡看到的以下型別的要求：

輕量級庫，用於構建基於事件的微服務，Kafka作為訊息傳遞/事件主幹。
應用程式執行時不應該需要群集。
迎合那些希望以程式設計方式使用簡單API為不太複雜的用例構建流應用程式的應用程式開發人員。
對於一次性語義的要求，其中資料管道僅由Kafka組成。

Kafka Streams解決了這些要求。通過新增Kafka Streams，客戶現在可以根據自己的需求和用例選擇正確的流處理引擎。下表提供了一些一般指導原則/比較。

上表中包含大量資訊。那麼，Kafka Streams何時成為您流處理需求的理想選擇？考慮以下：

您的流處理應用程式由Kafka到Kafka管道組成。

您不需要/想要另一個叢集進行流處理。
您希望在流上執行常見的流處理功能，如過濾，連線，聚合，豐富，以便簡化流處理應用程式。
您的目標使用者是具有Java開發背景的開發人員。
您的用例是關於構建輕量級微服務，簡單的ETL和流分析應用程式。

這三個支援的流引擎中的每一個都使用一組集中的平臺服務，提供安全性（身份驗證/授權），審計，治理，模式管理和監視功能。

下一步是什麼？

在下面的文章中，我們將演示使用與Schema Registry，Atlas和Ranger整合的Kafka Streams，使用虛構的用例構建一組微服務應用程式。

Kafka Streams：它是適合您的流處理引擎嗎？

在這篇文章中，我們將詳細討論流媒體訪問模式以及HDF 3.3和即將釋出的HDP 3.1版本中Kafka Streams支援的增加。在新增Kafka Streams支援之前，HDP和HDF支援兩個流處理引擎：帶有Storm的Spark Structured Streaming和Stream

微服務架構--它適合您的軟體開發嗎?

微服務體系架構提供了一系列技術好處，這些好處有助於軟體專案的開發速度和產品質量，同時也有助於整體業務敏捷性”– Mark Emeis, CA技術公司軟體技術高階總監自從“微服務”這個術語出現以來，它在軟體開發方面已經取得了進展。微服務，又名微服務體系結構，是面向服務體系結

最簡單流處理引擎——Kafka Streams簡介

Kafka在0.10.0.0版本以前的定位是分散式，分割槽化的，帶備份機制的日誌提交服務。而kafka在這之前也沒有提供資料處理的顧服務。大家的流處理計算主要是還是依賴於Storm，Spark Streaming，Flink等流式處理框架。 Storm，Spark Streaming，Flink流處理

商業智慧與業務分析：BI適合您的資料戰略

傳統上，企業將資料戰略集中在商業智慧（BI）上，但預測和規範分析平臺的興起，部分歸功於機器學習和人工智慧，正在改變這個方程式。即使是商業智慧本身也在不斷髮展，這也是以前業務分析平臺獨有的功能。分析師和顧問同意，理解商業智慧和其他分析平臺之間的區別，

最佳實踐：Pulsar 為批流處理提供融合儲存

非常榮幸有機會和大家分享一下 Apache Pulsar 怎樣為批流處理提供融合的儲存。希望今天的分享對做大資料處理的同學能有幫助和啟發。這次分享，主要分為四個部分： * 介紹與其他訊息系統相比， Apache Pulsar 的獨特優勢 * 分析批流處理中的儲存需求 * 講述 Apache Pulsar

NiFi流處理引擎

AttributeRollingWindow 1.3.0 AttributesToJSON 1.3.0 Base64EncodeContent 1.3.0 CaptureChangeMySQL 1.3.0 CompareFuzzyHash 1.3.0 CompressContent 1.3.0 Connec

Esper複雜事件流處理引擎 --告警關聯分析

Esper 釋出了2.2.0準備分析一下，以便應用到告警關聯分析 --------------------------------------------------- Esper是一個事件流處理（Event Stream Processing，ESP）和複雜事件處理（Co

Spark Streaming，Flink，Storm，Kafka Streams，Samza：如何選擇流處理框架

![](https://img2020.cnblogs.com/blog/1089984/202006/1089984-20200610080225004-690722209.png) 根據最新的統計顯示，僅在過去的兩年中，當今世界上90％的資料都是在新產生的，每天建立2.5萬億位元組的資料，並且隨著新裝

[翻譯]Kafka Streams簡介: 讓流處理變得更簡單

看到一篇不錯的譯文，再推送一撥 Introducing Kafka Streams: Stream Processing Made Simple 這是Jay Kreps在三月寫的一篇文章，用來介紹Kafka Streams。當時Kafka Streams

Oracle-4 - ：超級適合初學者的入門級筆記：plsql，基本語法，記錄類型，循環，遊標，異常處理，存儲過程，存儲函數，觸發器

個人就會逗號 n) 循環結構 less 寫上所有 targe 初學者可以從查詢到現在的pl/sql的內容都可以在我這裏的筆記中找到，希望能幫到大家，視頻資源在資源，我自己的全套筆記在筆記在pl/sql中可以繼續使用的sql關鍵字有：update delet

Flume+Kafka+Storm+Redis構建大數據實時處理系統：實時統計網站PV、UV+展示

大數據實時計算 Storm [TOC] 1 大數據處理的常用方法前面在我的另一篇文章中《大數據采集、清洗、處理：使用MapReduce進行離線數據分析完整案例》中已經有提及到，這裏依然給出下面的圖示：前面給出的那篇文章是基於MapReduce的離線數據分析案例，其通過對網站產生的用戶訪問

基於Flume+Kafka+Spark Streaming打造實時流處理項目實戰課程

大數據本課程從實時數據產生和流向的各個環節出發，通過集成主流的分布式日誌收集框架Flume、分布式消息隊列Kafka、分布式列式數據庫HBase、及當前最火爆的Spark Streaming打造實時流處理項目實戰，讓你掌握實時處理的整套處理流程，達到大數據中級研發工程師的水平！下載地址:百度網盤下載

大數據爭論：批處理與流處理的C位之戰

數據管理 sha 區別 mark spark 連續錘子常用兩種數據無疑是當今數字經濟中的新貨幣，但要跟上企業數據變化和遞增的業務信息需求，仍然是非常艱難。這也就解釋了公司將數據從傳統基礎構架中遷移至雲中，以衡量數據驅動決策的原因。這可確保公司寶貴資源——數據——受到

Spark Streaming實時流處理筆記（6）—— Kafka 和 Flume的整合

1 整體架構 2 Flume 配置 https://flume.apache.org/releases/content/1.6.0/FlumeUserGuide.html 啟動kafka kafka-server-start.sh $KAFKA_HOME/config/se

Spark Streaming實時流處理筆記（5）—— Kafka API 程式設計

1 新建 Maven工程 pom檔案 <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLo

Spark Streaming實時流處理筆記（4）—— 分散式訊息佇列Kafka

1 Kafka概述和訊息系統類似 1.1 訊息中介軟體生產者和消費者 1.2 Kafka 架構和概念 producer:生產者（生產饅頭） consumer：消費者（吃饅頭） broker:籃子 topic : 主題，給饅頭帶一個標籤，（

java1.8實戰學習（二）——總結：流處理、行為引數化、並行與共享

上一篇：java1.8實戰學習（一）下一篇：java1.8實戰學習（三）我們繼續來看預設方法在加入所有這些新玩意兒改進Java 的時候， Java 8 設計者發現的一個現實問題就是現有的介面也在改進。比如， Collections.sort方法真的應該屬於Lis

java1.8實戰學習（一）——總結：流處理、行為引數化、並行與共享

筆者這段時間在學習java8的新特性，發現有好多新的特點，特寫此部落格用於梳理記錄學習，不用每次都抱著pdf《java8實戰》去看，也供大家參考下一篇：java1.8實戰學習（二）知識點概括總結了Java的主要變化（Lambda表示式、方法引用、流和預設方法），併為學習後面的內

大資料求索(9): log4j + flume + kafka + spark streaming實時日誌流處理實戰

大資料求索(9): log4j + flume + kafka + spark streaming實時日誌流處理實戰一、實時流處理 1.1 實時計算跟實時系統類似（能在嚴格的時間限制內響應請求的系統），例如在股票交易中，市場資料瞬息萬變，決策通常需要秒級甚至毫秒級。通俗來

《Kafka Stream》調研：一種輕量級流計算模式

Confluent Inc（原LinkedIn Kafka作者離職後創業公司）在6月份預告推出Kafka Stream，Kafka Stream會在Kafka 0.10版本中推出。對於流計算，已經有Storm、Spark，Samza，包括最近新起的Flink，Kafka為什麼再自己做一套流計算呢？Kafka

Kafka Streams：它是適合您的流處理引擎嗎？

下一步是什麼？

相關推薦