1. 程式人生 > >Python 3 正則表示式對中文的匹配

Python 3 正則表示式對中文的匹配

import re

s='中文匹配7.14 3000 '.encode('utf-8')
s=s.decode('utf8')
m =re.findall(u"[\u4e00-\u9fa5]+",s)
print(m)

搜了半天網上的都是Python2的程式碼,根本不能執行,浪費半天時間,

[\u4e00-\u9fa5]+
中文正則表示式

看了出錯cannot use a string pattern on a bytes-like object

原來型別str和byte不是同一型別無法匹配

稍微改了一下2次編碼整成同一型別,成功匹配。

轉碼帶u的字元

s.decode('unicode_escape')