kafkaspot在ack機制下如何保證記憶體不溢

阿新 • • 發佈：2019-02-10

http://www.cnblogs.com/intsmaze/p/5947078.html
storm框架中的kafkaspout類實現的是BaseRichSpout，它裡面已經重寫了fail和ack方法，所以我們的bolt必須實現ack機制，就可以保證訊息的重新發送；如果不實現ack機制，那麼kafkaspout就無法得到訊息的處理響應，就會在超時以後再次傳送訊息，導致訊息的重複傳送。但是回想一下我們自己寫一個spout類實現BaseRichSpout並讓他具備訊息重發，那麼我們是會在我們的spout類裡面定義一個map集合，並以msgId作為key。複製程式碼

public class MySpout extends BaseRichSpout {
    private static 
 final long serialVersionUID = 5028304756439810609L;
    // key:messageId,Data
    private HashMap<String, String> waitAck = new HashMap<String, String>();
    private SpoutOutputCollector collector;
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new 
 Fields("sentence"));
    }
    public void open(Map conf, TopologyContext context, SpoutOutputCollector collector) {
        this.collector = collector;
    }
    public void nextTuple() {
        String sentence = "the cow jumped over the moon";
        String messageId = UUID.randomUUID().toString().replaceAll("-", "");
        waitAck.put(messageId, sentence);
        // 
指定messageId，開啟ackfail機制
        collector.emit(new Values(sentence), messageId);
    }
    @Override
    public void ack(Object msgId) {
        System.out.println("訊息處理成功:" + msgId);
        System.out.println("刪除快取中的資料...");
        waitAck.remove(msgId);
    }
    @Override
    public void fail(Object msgId) {
        System.out.println("訊息處理失敗:" + msgId);
        System.out.println("重新發送失敗的資訊...");
        //重發如果不開啟ackfail機制，那麼spout的map物件中的該資料不會被刪除的,而且下游
        collector.emit(new Values(waitAck.get(msgId)),msgId);
    }
}

那麼kafkaspout會不會也是這樣還儲存這已傳送未收到bolt響應的訊息呢？如果這樣，如果訊息處理不斷失敗，不斷重發，訊息不斷積累在kafkaspout節點上，kafkaspout端會不就會出現記憶體溢位？其實並沒有，回想kafka的原理，Kafka會為每一個consumergroup保留一些metadata資訊–當前消費的訊息的position，也即offset。這個offset由consumer控制。正常情況下consumer會在消費完一條訊息後線性增加這個offset。當然，consumer也可將offset設成一個較小的值，重新消費一些訊息。也就是說，kafkaspot在消費kafka的資料是，通過offset讀取到訊息併發送給bolt後，kafkaspot只是儲存者當前的offset值。 當失敗或成功根據msgId查詢offset值，然後再去kafka消費該資料來確保訊息的重新發送。 那麼雖然offset資料小，但是當offset的資料量上去了還是會記憶體溢位的？ 其實並沒有，kafkaspout發現快取的資料超過限制了，會把某端的資料清理掉的。 kafkaspot中傳送資料的程式碼

collector.emit(tup, new KafkaMessageId(_partition, toEmit.offset));

可以看到msgID裡面包裝了offset引數。它不快取已經發送出去的資料資訊。當他接收到來至bolt的響應後，會從接收到的msgId中得到offset。以下是從原始碼中折取的關鍵程式碼：複製程式碼

public void ack(Object msgId) {
     KafkaMessageId id = (KafkaMessageId) msgId;
     PartitionManager m = _coordinator.getManager(id.partition);
     if (m != null) {
          m.ack(id.offset);
     }
 }
 m.ack(id.offset);
 public void ack(Long offset) {
     _pending.remove(offset);//處理成功移除offset
     numberAcked++;
 }



 public void fail(Object msgId) {
     KafkaMessageId id = (KafkaMessageId) msgId;
     PartitionManager m = _coordinator.getManager(id.partition);
     if (m != null) {
         m.fail(id.offset);
      }
  }
  m.fail(id.offset);
  public void fail(Long offset) {
 　　　　failed.add(offset);//處理失敗新增offset
        numberFailed++;
   }
    
    SortedSet<Long> _pending = new TreeSet<Long>();
    SortedSet<Long> failed = new TreeSet<Long>();

關於kafkaspot的原始碼解析大家可以看這邊部落格：http://www.cnblogs.com/cruze/p/4241181.html

原始碼解析中涉及了很多kafka的概念，所以僅僅理解kafka的概念想完全理解kafkaspot原始碼是很難的，如果不理解kafka概念，那麼就只需要在理解storm的ack機制上明白kafkaspot做了上面的兩件事就可以了。

kafkaspot在ack機制下如何保證記憶體不溢

http://www.cnblogs.com/intsmaze/p/5947078.html storm框架中的kafkaspout類實現的是BaseRichSpout，它裡面已經重寫了fail和ack方法，所以我們的bolt必須實現ack機制，就可以保證訊息的重新發送；如

關於在 Linux 下多個不相干的程序互斥訪問同一片共享記憶體的問題

這裡的“不相干”，定義為：這幾個程序沒有父子關係，也沒有 Server/Client 關係這一片共享記憶體一開始不存在，第一個要訪問它的程序負責新建也沒有額外的 daemon 程序能管理這事情看上去這是一個很簡單的問題，實際上不簡單。有兩大問題：程序在持有互斥鎖的

.NET下的記憶體分配機制

對於任何物件的產生，都伴隨著記憶體空間的分配，那麼本文將初步介紹一下.NET下，是如何進行記憶體分配的。 1.概述 CLR支援兩種基本型別：值型別和引用型別。因此，還是把MSDN這張經典檢視拿出來做個鋪墊。關於具體每種分類都有哪些型別，

深入詳解保護模式下的記憶體分頁機制

以下是Intel文件中關於分頁機制的詳細描述：IA-32 Memory Models When employing the processor’s memory management facilities, programs do not — 使用處理器記憶體管理設施時程式不會 directly

在火狐和chrome不同的自動填充密碼機制下實現根據密碼框是否有內容來新增不同類的功能

setTimeout(function () { $('#pass').focus();//用以解決firefox不主動觸發focus之前自動填充密碼不觸發focus事件的問題。 $('.reg-text').each(fun

unity5打包機制下，一種資源打ab和資源管理的方案

remove 自己 return game tor 基礎 resource mea easyn unity5打包機制下，一種資源打ab和資源管理的方案。1.打ab: 　　1.設置平臺　　2.清楚所有資源的assetbundlename: 　　　　string[] abN

IE6下position:fixed不支持問題及其解決方式

div 網頁 this margin otto ima hack 一段奇葩 IE6有諸多奇葩，不支持position:fixed就是當中之中的一個。所以在做一些比方固定在頂部或者底部或者固定元素的效果時須要考慮兼容IE6的這個問題。解決方式是用Ie6的hack。

將windows上面的項目拷貝到Linux環境下報錯不能夠找到對應的表com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Table 'puyang.ServiceType' doesn't exist

exce 服務 inux 區分大小 blog alt logs 就會將一模一樣的項目從win遷移到到linux上報錯: 一開始還是以為是linux不能識別hql語句，查找資料發現是因為Liunx服務器上mysql是區分大小寫的，而本地是不區分的如：代碼是這樣寫的@En

解決LNMP環境下連接不上mysql的問題

mysqlLNMP環境下遠程連接mysql數據庫一、為了安全起見，lnmp環境是禁止遠程連接的，他會刪除iptables裏面的3306端口的防火墻規則一、如果是phpmydmin 那要把權限裏要遠程連接的用戶主機改成 * 參考：https://bbs.vpser.net/thread-3135-1-1.h

VMware虛擬機下Ubuntu連不上網解決

更改 style 依次 win isp ping bsp height vmnet 虛擬機：VMware? Workstation 12 Pro Ubuntu: 14.04 問題描述：電腦從公司拿到家打開Ubuntu之後，打開自帶Firefox瀏覽器，顯示連接不上網，終端下

mac下mysqldump找不到命令

出現 $path rmi port 找不到添加找到路徑 .net 之所以會出現MySQL或者mysqldump這樣的命令找不到，我們可以打開/usr/bin文件夾，發現bin目錄中並沒有mysql打頭的UEF文件，而在/usr/local/mysql/bi

Mac 下處理myql 不能遠程登錄和本地登錄問題

關於Laravel5.2在php5.3.6X和在php7.1.10下的內存溢出

bug src 編譯安裝內存溢出 lar 也不會 eight 內存泄露 images php5.3.6X是編譯安裝,在debug模式下,頻繁報出內存泄露警告 php7.1.10下則不會有此錯誤. 順便提下:測試發現ThinkPHP也不會有該內存泄露警告! 希

3.6 C++繼承機制下的構造函數

需要類的構造函數 color view ice 如果 itl 不難 tor 參考：http://www.weixueyuan.net/view/6363.html 總結：　　在codingbook類中新增了一個language成員變量，為此必須重新設計新的構造函數。在本

3.8 C++繼承機制下的析構函數

right clas const source color ner fix wrap 派生類的構造函數參考：http://www.weixueyuan.net/view/6365.html 總結：　　構造函數的執行順序是按照繼承順序自頂向下的，從基類到派生類，而析構函數

保證Service不被Kill的解決方案

req som .html ppp 真機測試其中清理工具 reat 清理 1、Service設置成START_STICKY（onStartCommand方法中），kill 後會被重啟（等待5秒左右），重傳Intent，保持與重啟前一樣 2、通過 startForegro

windows下使用gvim不支持python3.6問題解決

一個下使用環境變量配置安裝 clas 配置 ini vim配置不支持在用戶目錄下C:\Users\Administrator\新建vim配置文件夾vimfiles，然後該文件下建立一個文件vimrc vimrc內容： set pythonthreedll=pyth

CMD下出現 . 點不是內部或外部命令，也不是可運行的程序或批處理文件

light alt 技術分享 class src 命令 png roo div 在cmd下鍵入命令，不識別點 >./bin/mysql -u root -p ‘.‘ 不是內部或外部命令，也不是可運行的程序或批處理文件。然後把斜杠變成反斜杠就OK了。完畢！

php 刪除數組指定元素,下標還不亂

指定 array set unset clas gpo 就會刪除 div $arr是目標數組 $offset是要刪除的元素的key 1是指刪除的長度 array_splice($arr, $offset, 1); 之前用的unset,但是比如刪除的是

即使被拖庫，也可以保證密碼不泄露-加鹽

常用隨著 src 意義解決方案為什麽算法簡單的 hash 在前一篇文章《設計安全的賬號系統的正確姿勢》中，主要提出了一些設計的方法和思路，並沒有給出一個更加具體的，可以實施的安全加密方案。經過我仔細的思考並了解了目前一些方案後，我設計了一個自認為還比較安全的安全加

kafkaspot在ack機制下如何保證記憶體不溢

相關推薦