剖析nsq訊息佇列(三) 訊息傳輸的可靠性和持久化[二]diskqueue

上一篇主要說了一下nsq是如何保證訊息被消費端成功消費，大概提了一下訊息的持久化,--mem-queue-size 設定為 0，所有的訊息將會儲存到磁碟。
總有人說nsq的持久化問題，消除疑慮的方法就是閱讀原碼做benchmark測試，個人感覺nsq還是很靠譜的。
nsq自己實現了一個先進先出的訊息檔案佇列go-diskqueue是把訊息儲存到本地檔案內，很值得分析一下他的實現過程。

整體處理邏輯

go-diskqueue 會啟動一個gorouting進行讀寫資料也就是方法ioLoop
會根據你設定的引數來進行資料的讀寫，流程圖如下

這個圖畫的也不是特別的準確 ioLoop 用的是 select

並不是if else 當有多個條件為true時，會隨機選一個進行執行

nsq 生成的資料大致如下：

xxxx.diskqueue.meta.dat 元資料儲存了未讀訊息的長度，讀取和存入資料的編號和讀取位置
xxxx.diskqueue.編號.dat 訊息儲存的檔案，每一個訊息的儲存：4Byte訊息的長度+訊息

引數說明

一些主要的引數和約束說明
這些引數的使用在後面的處理邏輯中會提到

// diskQueue implements a filesystem backed FIFO queue
type diskQueue struct {
    // run-time state (also persisted to disk)
    // 讀取資料的位置    
    readPos      int64
    // 寫入資料的位置
    writePos     int64
    // 讀取檔案的編號    
    readFileNum  int64
    // 寫入檔案的編號
    writeFileNum int64
    // 未處理的訊息總數    
    depth        int64

    // instantiation time metadata
    // 每個檔案的大小限制    
    maxBytesPerFile int64 // currently this cannot change once created
    // 每條訊息的最小大小限制    
    minMsgSize      int32
    // 每條訊息的最大大小限制    
    maxMsgSize      int32
    // 快取訊息有多少條後進行寫入    
    syncEvery       int64         // number of writes per fsync
    // 自動寫入訊息檔案的時間間隔    
    syncTimeout     time.Duration // duration of time per fsync
    exitFlag        int32
    needSync        bool

    // keeps track of the position where we have read
    // (but not yet sent over readChan)
    // 下一條訊息的位置    
    nextReadPos     int64
    // 下一條訊息的檔案編號    
    nextReadFileNum int64

    // 讀取的檔案
    readFile  *os.File
    // 寫入的檔案    
    writeFile *os.File
    // 讀取的buffer    
    reader    *bufio.Reader
    // 寫入的buffer    
    writeBuf  bytes.Buffer

    // exposed via ReadChan()
    // 讀取資料的channel    
    readChan chan []byte

    //.....
}

資料

元資料

讀寫資料資訊的元資料儲存在xxxxx.diskqueue.meta.data檔案內主要用到程式碼裡的欄位如下
未處理的訊息總數 depth
讀取檔案的編號 readFileNum 讀取資料的位置 readPos
寫入檔案的編號 writeFileNum 寫入資料的位置 writePos
真實資料如下

15
0,22
3,24

儲存元資料資訊

func (d *diskQueue) persistMetaData() error {
    // ...
    fileName := d.metaDataFileName()
    tmpFileName := fmt.Sprintf("%s.%d.tmp", fileName, rand.Int())
    // write to tmp file
    f, err = os.OpenFile(tmpFileName, os.O_RDWR|os.O_CREATE, 0600)
    // 元資料資訊
    _, err = fmt.Fprintf(f, "%d\n%d,%d\n%d,%d\n",
        atomic.LoadInt64(&d.depth),
        d.readFileNum, d.readPos,
        d.writeFileNum, d.writePos)
    // 儲存
    f.Sync()
    f.Close()
    // atomically rename
    return os.Rename(tmpFileName, fileName)
}

得到元資料資訊

func (d *diskQueue) retrieveMetaData() error {
    // ...
    fileName := d.metaDataFileName()
    f, err = os.OpenFile(fileName, os.O_RDONLY, 0600)
    // 讀取資料並賦值
    var depth int64
    _, err = fmt.Fscanf(f, "%d\n%d,%d\n%d,%d\n",
        &depth,
        &d.readFileNum, &d.readPos,
        &d.writeFileNum, &d.writePos)
    //...
    atomic.StoreInt64(&d.depth, depth)
    d.nextReadFileNum = d.readFileNum
    d.nextReadPos = d.readPos
    return nil
}

訊息資料

寫入一條資料

ioLoop 中發現有資料寫入時,會呼叫writeOne方法，把訊息儲存到檔案內

        select {
        // ...
        case dataWrite := <-d.writeChan:
            count++
            d.writeResponseChan <- d.writeOne(dataWrite)
        // ...

func (d *diskQueue) writeOne(data []byte) error {
    var err error

    if d.writeFile == nil {
        curFileName := d.fileName(d.writeFileNum)
        d.writeFile, err = os.OpenFile(curFileName, os.O_RDWR|os.O_CREATE, 0600)
        // ...
        if d.writePos > 0 {
            _, err = d.writeFile.Seek(d.writePos, 0)
            // ...
        }
    }

    dataLen := int32(len(data))
    // 判斷訊息的長度是否合法
    if dataLen < d.minMsgSize || dataLen > d.maxMsgSize {
        return fmt.Errorf("invalid message write size (%d) maxMsgSize=%d", dataLen, d.maxMsgSize)
    }
    d.writeBuf.Reset()
    // 寫入4位元組的訊息長度,以大端序儲存
    err = binary.Write(&d.writeBuf, binary.BigEndian, dataLen)
    if err != nil {
        return err
    }
    // 寫入訊息
    _, err = d.writeBuf.Write(data)
    if err != nil {
        return err
    }

    // 寫入到檔案
    _, err = d.writeFile.Write(d.writeBuf.Bytes())
    // ...
    // 計算寫入位置，訊息數量加1
    totalBytes := int64(4 + dataLen)
    d.writePos += totalBytes
    atomic.AddInt64(&d.depth, 1)
    // 如果寫入位置大於 單個檔案的最大限制， 則持久化檔案到硬碟
    if d.writePos > d.maxBytesPerFile {
        d.writeFileNum++
        d.writePos = 0

        // sync every time we start writing to a new file
        err = d.sync()
        // ...
    }
    return err
}

寫入完訊息後，會判斷當前的檔案大小是否已經已於maxBytesPerFile如果大，就持久化檔案到硬碟，然後重新開啟一個新編號檔案，進行寫入。

什麼時候持久化檔案到硬碟

呼叫sync()方法會持久化檔案到硬碟，然後重新開啟一個新編號檔案，進行寫入。
有幾個地方呼叫會呼叫這個方法：

一個寫入檔案的條數達到了syncEvery的值時，也就是初始化時設定的最大的條數。會呼叫sync()
syncTimeout 初始化時設定的同步時間間隔，如果這個時間間隔到了，並且寫入的檔案條數>0的時候，會呼叫sync()
還有就是上面說過的writeOne方法，寫入完訊息後，會判斷當前的檔案大小是否已經已於maxBytesPerFile如果大，會呼叫sync()
當讀取檔案時，把整個檔案讀取完時，會刪除這個檔案並且會把needSync 設定為true，ioLoop 會呼叫sync()
還有就是Close的時候，會呼叫sync()

func (d *diskQueue) sync() error {
    if d.writeFile != nil {
        // 把資料 flash到硬碟，關閉檔案並設定為 nil
        err := d.writeFile.Sync()
        if err != nil {
            d.writeFile.Close()
            d.writeFile = nil
            return err
        }
    }
    // 儲存元資料資訊
    err := d.persistMetaData()
    // ...
    d.needSync = false
    return nil
}

讀取一條資料

元資料儲存著讀取檔案的編號 readFileNum 和讀取資料的位置 readPos
並且diskQueue暴露出了一個方法來，通過channel來讀取資料

func (d *diskQueue) ReadChan() chan []byte {
    return d.readChan
}

ioLoop裡，當發現讀取位置小於寫入位置或者讀檔案編號小於寫檔案編號，並且下一個讀取位置等於當前位置時才會讀取一條資料，然後放在一個外部全域性變數 dataRead 裡，並把讀取的channel 賦值監聽 r = d.readChan，當外部有人讀取了訊息，則進行moveForward操作

func (d *diskQueue) ioLoop() {
    var dataRead []byte
    var err error
    var count int64
    var r chan []byte
    for {
        // ...
        if (d.readFileNum < d.writeFileNum) || (d.readPos < d.writePos) {
            if d.nextReadPos == d.readPos {
                dataRead, err = d.readOne()
                if err != nil {
                    d.handleReadError()
                    continue
                }
            }
            r = d.readChan
        } else {
            r = nil
        }

        select {
        // ...
        case r <- dataRead:
            count++
            // moveForward sets needSync flag if a file is removed
            d.moveForward()
        // ...
        }
    }

// ...
}

readOne 從檔案裡讀取一條訊息，4個bit的大小，然後讀取具體的訊息。如果讀取位置大於最大檔案限制，則close。在moveForward裡會進行刪除操作

func (d *diskQueue) readOne() ([]byte, error) {
    var err error
    var msgSize int32
    // 如果readFile是nil，開啟一個新的
    if d.readFile == nil {
        curFileName := d.fileName(d.readFileNum)
        d.readFile, err = os.OpenFile(curFileName, os.O_RDONLY, 0600)
        // ...
        d.reader = bufio.NewReader(d.readFile)
    }
    err = binary.Read(d.reader, binary.BigEndian, &msgSize)
    // ...
    readBuf := make([]byte, msgSize)
    _, err = io.ReadFull(d.reader, readBuf)
    totalBytes := int64(4 + msgSize)
    // ...
    d.nextReadPos = d.readPos + totalBytes
    d.nextReadFileNum = d.readFileNum
    // 如果讀取位置大於最大檔案限制，則close。在moveForward裡會進行刪除操作
    if d.nextReadPos > d.maxBytesPerFile {
        if d.readFile != nil {
            d.readFile.Close()
            d.readFile = nil
        }
        d.nextReadFileNum++
        d.nextReadPos = 0
    }
    return readBuf, nil
}

moveForward方法會檢視讀取的編號，如果發現下一個編號和當前的編號不同時，則刪除舊的檔案。

func (d *diskQueue) moveForward() {
    oldReadFileNum := d.readFileNum
    d.readFileNum = d.nextReadFileNum
    d.readPos = d.nextReadPos
    depth := atomic.AddInt64(&d.depth, -1)

    // see if we need to clean up the old file
    if oldReadFileNum != d.nextReadFileNum {
        // sync every time we start reading from a new file
        d.needSync = true

        fn := d.fileName(oldReadFileNum)
        err := os.Remove(fn)
        // ...
    }
    d.checkTailCorruption(depth)
 
 
              
           
              
              
            
            相關推薦
			   
            
            
            
 

    

    
    剖析nsq訊息佇列(三) 訊息傳輸的可靠性和持久化[二]diskqueue
      上一篇主要說了一下nsq是如何保證訊息被消費端成功消費，大概提了一下訊息的持久化,--mem-queue-size 設定為 0，所有的訊息將會儲存到磁碟。
總有人說nsq的持久化問題，消除疑慮的方法就是閱讀原碼做benchmark測試，個人感覺nsq還是很靠譜的。
nsq自己實現了一個先進先出的訊息檔案佇列g 

  
 

    

    
    nsq (三) 訊息傳輸的可靠性和持久化[一]
      上兩篇帖子主要說了一下nsq的拓撲結構，如何進行故障處理和橫向擴充套件,保證了客戶端和服務端的長連線，連線保持了，就要傳輸資料了，nsq如何保證訊息被訂閱者消費，如何保證訊息不丟失，就是今天要闡述的內容。
 
nsq topic、channel、和消費我客戶端的結構如上圖，一個topic下有多個channel 

  
 

    

    
    剖析nsq訊息佇列(四) 訊息的負載處理
      剖析nsq訊息佇列-目錄
實際應用中，一部分服務叢集可能會同時訂閱同一個topic,並且處於同一個channel下。當nsqd有訊息需要傳送給訂閱客戶端去處理時，發給哪個客戶端是需要考慮的，也就是我要說的訊息的負載。
 
如果不考慮負載情況，把隨機的把訊息傳送到某一個客服端去處理訊息，如果機器的效能不同，可能 

  
 

    

    
    SpringBoot的RabbitMQ訊息佇列: 三、第二模式"Work queues"
      
                
    上一節的兩個工程，一個負責傳送，一個負責接收，也就是一一對於的關係。
     只要訊息發出了，接收者就處理；當接收效率較低時，就會出現接收者處理不過來，我們就可能會處理不過來，於是我們就可能多配置接受者。這個模式就是"Work queues",它的結構如下

   

  
 

    

    
    MQ訊息佇列三（SpringBoot 整合rocketMq）
      
                一. JMS規範

在瞭解rocketMq之前先了解一下jms規範，rocketmq雖然不完全基於jms規範，但是他參考了jms規範和 CORBA Notification 規範等，可以說是青出於藍而勝於藍。

JMS即Java訊息服務（Java Message Servic 

  
 

    

    
    訊息佇列：Ubuntu16.04安裝和Web頁面管理RabbitMQ（樓主親測、真實有效）
       
 
  
  
 RabbitMQ 
 總來來說，RabbitMQ的安裝還是有一些難度的。不同的方式，安裝的方法也是完全不一樣，還要解決蠻多依賴。加上現在有些網站，極其不負責，很多博文都沒有經過測試檢驗就直接發出來的。樓主來親測一下，希望能對大家有好的幫助。 
 一、安裝前的準備 
 要確保，你有Erla 

  
 

    

    
    「訊息佇列」訊息佇列概述與AMQP協議
       
 
 
 轉載請註明出處：https://blog.csdn.net/jinixin/article/details/83552185 
   
   
 前面幾篇文章中談了rpc服務, rpc可用於程序間通訊, 使應用得以解耦, 而程序間通訊還可使用訊息佇列來完成. 
 本篇文章就簡 

  
 

    

    
    訊息佇列MQ技術的介紹和原理
      
                訊息佇列技術是分散式應用間交換資訊的一種技術。訊息佇列可駐留在記憶體或磁碟上,佇列儲存訊息直到它們被應用程式讀走。通過訊息佇列，應用程式可獨立地執行--它們不需要知道彼此的位置、或在繼續執行前不需要等待接收程式接收此訊息。
 

訊息中介軟體概述

   訊息佇列技術是分散式 

  
 

    

    
    RabbitMQ訊息佇列（一基本概念和常用命令）
      
                

常用命令

/etc/init.d/rabbitmq-server start|stop|restart|reload

rabbitmqctl  add_vhost  vhostname  ##建立vhost

rabbitmqctl   delete_vhost  v 

  
 

    

    
    常用訊息佇列對比、選擇參考和訊息佇列認知
       
 
 目錄： 
 1、訊息佇列之常用協議 
 1.1、AMQP 
 1.2、MQTT協議 
 1.3、STOMP協議 
 1.4、XMPP協議 
 2、訊息佇列之模型 
 3、訊息佇列的組成模組 
 4、常用訊息佇列介紹 
 4.1、RabbitMQ 
 4.2、ActiveMQ 
 4.3、Rocket 

  
 

    

    
    Spring整合訊息佇列RabbitMQ(訊息失敗處理)
      

1. RabbitMQ簡介

1.1. RabbitMQ

RabbitMQ是由Erlang(愛立信公司)語言開發，實現Advanced Message Queuing Protocol (AMQP高階訊息佇列協議)的訊息中介軟體。訊息中介軟體主要用於元件之間的解耦，訊息的傳送者無需知道訊息使用者的存在， 

  
 

    

    
    使用jedis實現Redis訊息佇列(MQ)的釋出(publish)和訊息監聽(subscribe)
      
								
								            
						
                
前言：
本文基於jedis 2.9.0.jar、commons-pool2-2.4.2.jar以及json-20160810.jar
其中jedis連線池需要依賴commons-pool2包，json 

  
 

    

    
    修改單個訊息佇列中訊息的最大個數
      
								
								            
							
							
							front:~ # cat /proc/sys/fs/mqueue/msg_max
10
front:~ # cat /proc/sys/fs/mqueue/msg_max
10
front:~ # v 

  
 

    

    
    使用PeekMessage獲取訊息佇列上訊息
      
                在做一個板卡的檢查程式時候，使用公司提供的驅動包來Enable板卡中斷，產生的中斷以Message方式傳送，但是使用者視窗不能及時獲取到Message。這時候需要系統停下當前工作，去訊息佇列上面Peek一下Message,程式碼如下：

 MSG  msg;
while (P 

  
 

    

    
    （二）RabbitMQ訊息佇列-RabbitMQ訊息佇列架構與基本概念
      
							
							
							沒錯我還是沒有講怎麼安裝和寫一個HelloWord，不過快了，這一章我們先了解下RabbitMQ的基本概念。

RabbitMQ架構

說是架構其實更像是應用場景下的架構（自己畫的有點醜，勿嫌棄）



從圖中可以看出RabbitMQ主要由Exchange和Qu 

  
 

    

    
    分散式訊息佇列ActiveMQ訊息模型（二）
      
                在ActiveMQ中，一共支援4種訊息型別，分別是TextMessage訊息型別、BytesMessage訊息型別、ObjectMessage訊息型別，還有一種MapMessage訊息型別。

（1）       TextMessage訊息型別

TextMessage訊息是 

  
 

    

    
    為什麼使用訊息佇列？訊息佇列有什麼優點和缺點？Kafka、ActiveMQ、RabbitMQ、RocketMQ 都有什麼優點和缺點？
       
面試題

為什麼使用訊息佇列？
訊息佇列有什麼優點和缺點？
Kafka、ActiveMQ、RabbitMQ、RocketMQ 都有什麼區別，以及適合哪些場景？

面試官心理分析
其實面試官主要是想看看：

第一，你知不知道你們系統裡為什麼要用訊息佇列這個東西？
不少候選人，說自己專案裡用了 Redis、M 

  
 

    

    
    redis(三)：redis事務和持久化
      
                1. redis事務

1.1. redis資料庫相關特性

redis資料庫：redis總共有16個數據庫，編號分別為0-15，可以選擇資料庫：select 0，第一個資料庫。

移動key：move keyName 2，將keyName移動到第三個資料庫。

檢視型別：t 

  
 

    

    
    剖析nsq訊息佇列(一) 簡介及去中心化實現原理
      分散式訊息佇列nsq，簡單易用，去中心化的設計使nsq更健壯，nsq充分利用了go語言的goroutine和channel來實現的訊息處理，程式碼量也不大，讀不了多久就沒了。後期的文章我會把nsq的原始碼分析給大家看。
主要的分析路線如下

分析nsq的整體框架結構，分析如何做到的無中心化分散式拓撲結構，如何 

  
 

    

    
    剖析nsq訊息佇列(二) 去中心化原始碼解析
      在上一篇帖子剖析nsq訊息佇列(一) 簡介及去中心化實現原理中，我介紹了nsq的兩種使用方式，一種是直接連線，還有一種是通過nslookup來實現去中心化的方式使用，並大概說了一下實現原理，沒有什麼難理解的東西，這篇帖子我把nsq實現去中心化的原始碼和其中的業物邏輯展示給大家看一下。
nsqd和nsqlook