1. 程式人生 > 實用技巧 >P5 字典特徵資料抽取

P5 字典特徵資料抽取

https://www.bilibili.com/video/BV184411Q7Ng?p=5

註解:

  1. 把一句英文轉變成了一個二維陣列。

註解:

  1. 計算機理解不了英文文章,只能理解資料。

特徵抽取的示例程式碼:

"""
演示字典的特徵抽取,
DictVectorizer是一個類的名字
"""
from sklearn.feature_extraction import DictVectorizer


def dictvec():
    """
    字典資料抽取
    :return:
    加入引數sparse=False可以把轉換成的資料轉換成陣列
    
""" dict=DictVectorizer(sparse=False) #例項化 sparse=False data=dict.fit_transform([{'city':'北京','temperature':100},{'city':'上海','temperature':60},{'city':'深圳','temperature':30}]) # 呼叫fit_transform就是把字串資料轉化成特徵,返回的是個data print(data) #print(dict.get_feature_names()) return None if
__name__=="__main__": dictvec()

上面的字典資料特徵抽取的結果:

註解:

  1. 上面的結果是沒有加引數dict=DictVectorizer()。
  2. 下面的結果是加了引數的結果,dict=DictVectorizer(sparse=False)
  3. (1,3) 60.0意思是:第2行第4列的資料是60.0
"""
演示字典的特徵抽取,
DictVectorizer是一個類的名字
"""
from sklearn.feature_extraction import DictVectorizer


def dictvec():
    """
    字典資料抽取
    :
return: 加入引數sparse=False可以把轉換成的資料轉換成陣列 """ dict=DictVectorizer(sparse=False) #例項化 sparse=False data=dict.fit_transform([{'city':'北京','temperature':100},{'city':'上海','temperature':60},{'city':'深圳','temperature':30}]) # 呼叫fit_transform就是把字串資料轉化成特徵,返回的是個data #print(data) print(dict.get_feature_names()) return None if __name__=="__main__": dictvec()

執行結果:

C:\Users\TJ\AppData\Local\Programs\Python\Python37\python.exe D:/qcc/python/mnist/feature_abstract.py
['city=上海', 'city=北京', 'city=深圳', 'temperature']

Process finished with exit code 0

['city=上海', 'city=北京', 'city=深圳', 'temperature']