Python 轉化成 PB 格式資料

阿新 • • 發佈：2018-12-24

一、概述

Protocol Buffers 是 Google 公司開發的一種輕便高效的結構化資料儲存格式，可以用於結構化資料序列化，或者說序列化。它很適合做資料儲存或 RPC 資料交換格式。可用於通訊協議、資料儲存等領域的語言無關、平臺無關、可擴充套件的序列化結構資料格式。

Protocol Buffers 簡稱為 protobuf 或 pb，下面是使用 python 解析 pb。

二、安裝

下載目標語言的編譯器：下載地址
安裝：

$ ./configure  
$ make  
$ sudo make install

驗證安裝：protoc --version

，顯示當前版本：libprotoc x.x.x
安裝 Python 的 protobuf 庫：pip install protobuf

三、使用

3.1 編譯 proto 檔案

Protobuf 語義清晰，無需類似 XML 解析器的東西（因為 Protobuf 編譯器會將 .proto 檔案編譯生成對應的資料訪問類以對 Protobuf 資料進行序列化、反序列化操作）。

protoc --python_out=./ ./檔名.proto

這時會在當前目錄生成一個與檔名同名的目錄，該目錄下會有一個 .py 檔案。這個檔案會用作模組、解析規則去解析 pb 的源資料。

3.2 解析 pb 的資料

from test_pb import Test # 從剛才編譯出來的 py 檔案中 import 解析的類
message = Test()
with open('test.pb', 'rb') as fb:
    pb_content = fb.read() # 如果檔案很大，則要分批讀取
    # pb_content 是二進位制的pb資料，如果是檔案，則需要用 open 方法讀取資料
    message.ParseFromString(pd_content)
print message

3.3 寫入資料

from test_pb import Test # 從剛才編譯出來的 py 檔案中 import 解析的類
message = Test()
message.name = 'hello world' # 賦值
with open('test.pb', 'wb') as fb:
    # 序列化，寫入檔案
    fb.write(person.SerializeToString())

3.4 probuf 轉 dict

當 probuf 的資料包含中文時，解析後對於閱讀十分不友好。同時如果想要把 probuf 物件轉化成 dict 進行後續操作的話。可以試試第三方庫：protobuf-to-dict，這個庫可以很方便的把 probuf 的資料轉化成 dict。示例程式碼如下：

from protobuf_to_dict import protobuf_to_dict
my_message = MyMessage()
# pb_my_message is a protobuf string
my_message.ParseFromString(pb_my_message)
protobuf_to_dict(my_message)
# 輸出：{'message': 'Hello'}

3.5 更多

這篇文章只是使用 python 簡單的解析、序列化。更多細節以及原理推薦閱讀Google Protocol Buffer 的使用和原理

四、錯誤

google.protobuf.message.DecodeError: Truncated message.：首先要保證 pb source 為二進位制的資料，否則會出現各種非預期錯誤

五、參考

ProtoBuf 與 Python 結合使用初步

Python 轉化成 PB 格式資料

一、概述

二、安裝

三、使用

3.1 編譯 proto 檔案

3.2 解析 pb 的資料

3.3 寫入資料

3.4 probuf 轉 dict

3.5 更多

四、錯誤

五、參考

Python 轉化成 PB 格式資料

Python 轉化成 PB 格式數據

將查詢出來的資料集轉化成JSON格式的類

TensorFlow 自定義模型導出：將 .ckpt 格式轉化為 .pb 格式

Form表單轉化成Json格式

如何將視訊MP4檔案轉化成AVI格式？

Python程式設計：JSON格式資料的儲存與讀取

在excl中加入一列並批量匯入mysql資料庫（先轉化成Dataframe格式）

講講如何將圖片格式轉化成base64格式的

將String轉化成HTML格式

Python爬取Json格式資料並讀寫（改中文編碼）

Python 讀入 .Mat格式資料的方式

python處理CSV檔案格式資料

陣列／字典轉化成JSON格式

jtl轉化成CSV格式的聚合報告

python requests傳送json格式資料

java中String字串轉化成list格式

Python查詢MySQL資料，並提取mysql欄位名轉化成DataFrame

spark1.6使用：讀取本地外部資料，把RDD轉化成DataFrame，儲存為parquet格式,讀取csv格式

Java程式碼 json格式資料轉化成xml jsonToXml

Python 轉化成 PB 格式資料

一、概述

二、安裝

三、使用

3.1 編譯 proto 檔案

3.2 解析 pb 的資料

3.3 寫入資料

3.4 probuf 轉 dict

3.5 更多

四、錯誤

五、參考

相關推薦