python去除刪除資料中\u0000\u0001等unicode字串的程式碼
阿新 • • 發佈:2020-03-09
py檔案為utf-8格式
#!/usr/bin/env python # -*- coding:utf-8 -*- a = "system\u0000" b = re.sub(u'\u0000',"",a) print(b) ## b="system"
補充知識:Python中,如何將反斜槓u型別(\uXXXX)的字串,轉換為對應的unicode的字元
【背景】
類似於:
\u3232\u6674 的字串,轉換為對應的unicode字元。
【解決過程】
對應的,可以通過Python的decode函式去解碼,其中自定原始字串位unicode-ecape,就可以了。
完整的python程式碼演示為:
#!/usr/bin/python #coding: utf-8 slashUStr = "\\u0063\\u0072\\u0069\\u0066\\u0061\\u006E\\u0020\\u5728\\u8DEF\\u4E0A"; #crifan 在路上 decodedUniChars = slashUStr.decode("unicode-escape") print "decodedUniChars=",decodedUniChars; #decodedUniChars= crifan 在路上
以上這篇python去除刪除資料中\u0000\u0001等unicode字串的程式碼就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。