1. 程式人生 > >【python】在特徵工程處理資料時遇到的坑

【python】在特徵工程處理資料時遇到的坑

一,string中判斷是否是純英文

要判斷一個string中是否是純英文,就使用了string.isalpha()函式來判斷。

但是在python3.6版本中當string為純中文時函式isalpha()也會返回true。

>>> a = "hello"
>>> a.isalpha()
True
>>> b = "你好啊"
>>> b.isalpha()
True

解決:通過逐個遍歷字串來確定是不是純英文的,如下所示:

if(all(c in string.ascii_letters or c == " " for c in kw)):
    return True

all函式全部為true時才為真,對應的有any函式,一個為真即為真。