1. 程式人生 > >Spark Streaming和Storm的區別和聯絡

Spark Streaming和Storm的區別和聯絡

Spark Streaming和Storm區別和聯絡

Spark Streaming和Storm都是將流資料分成一個個小塊的批資料(batch)。

處理模型、延遲

Strom:處理的是每次傳入的事件。秒內延遲。(最小100ms)
Spark Streaming:處理的是某個時間段視窗內的事件流。秒級延遲。(0.5~2s)

容錯、資料保證

Strom:每個單獨的記錄都會被跟蹤。恢復時,意味著狀態可能被錯誤滴更新兩次。
Spark Streaming:只是在批處理級別進行跟蹤。

適用場景

Strom:實時性要求高,毫秒級延遲,不需要有狀態計算。
Spark Streaming:秒級延遲,比Strom吞吐量大,需要有狀態計算