Python bytes 反斜槓轉義問題解決方法
阿新 • • 發佈:2020-12-24
一、問題
因為前文提到工作中需要使用 Go 調 Python 指令碼執行加解密,但是 Go 那邊執行命令列輸出的是 str 型別。因此需要轉回 bytes 進行解密,但是發現轉回 bytes 和原來的不一樣。下面以一個小例子做演示。
old_bytes = b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee" # 這是bytes型別 old_str = str(old_bytes) # 這是str型別 new_bytes = bytes(old_str, encoding="utf-8") # 這是bytes型別 print(new_bytes) print(new_bytes == old_bytes)
輸出:
b'b"=\\x1di\\xab\\xc1~)]9H\\xdf\\x0c\\x7f`f&\'\\xfbooX}kX\\x0e~D\\x9d\\x88\\x83\\x0f\\xb8\\xe7\\xf6\\x0f+\\x97\\xfc8+\\xe5\\xd4\\xb9uC\\xc0\\xcdh\\xa2S=|\\xb5\\xf9\\xc59\\xc0R#\\xfaGR\\xddMa\\x8e\\x9cS\\xf9\\xcdq\\xbd\\xb8_\\x94\\xa2\\x8e\\x13I\\xbc\\x0e\\xcf\\x82\\xeeG\\x85\\xafBj\\xe9\\x0e\\xd7\\xd9\\x0fj\\x15\\x06IY\\xaf\\xde\\xee"' False
可以看到,bytes 經過 str 強制型別轉換之後再轉回 bytes,會發現和原來的不一樣。結果多了 b'
,以及 \
變成了 \\
。
二、解決方法
使用切片截掉開頭的 b'
,使用 codecs.escape_decode
來進行反斜槓轉換。
old_bytes = b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee" # 這是bytes型別 old_str = str(old_bytes) # 這是str型別 new_bytes = bytes(old_str[2:-1], encoding="utf-8") # 這是bytes型別 import codecs original = codecs.escape_decode(new_bytes, "hex-escape") print(old_bytes, original) print(original[0] == old_bytes)
輸出:
b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee" (b"=\x1di\xab\xc1~)]9H\xdf\x0c\x7f`f&'\xfbooX}kX\x0e~D\x9d\x88\x83\x0f\xb8\xe7\xf6\x0f+\x97\xfc8+\xe5\xd4\xb9uC\xc0\xcdh\xa2S=|\xb5\xf9\xc59\xc0R#\xfaGR\xddMa\x8e\x9cS\xf9\xcdq\xbd\xb8_\x94\xa2\x8e\x13I\xbc\x0e\xcf\x82\xeeG\x85\xafBj\xe9\x0e\xd7\xd9\x0fj\x15\x06IY\xaf\xde\xee", 273)
True
發現成功轉換回原來的 bytes 內容。