P5 字典特徵資料抽取
阿新 • • 發佈:2020-12-30
https://www.bilibili.com/video/BV184411Q7Ng?p=5
註解:
- 把一句英文轉變成了一個二維陣列。
註解:
- 計算機理解不了英文文章,只能理解資料。
特徵抽取的示例程式碼:
""" 演示字典的特徵抽取, DictVectorizer是一個類的名字 """ from sklearn.feature_extraction import DictVectorizer def dictvec(): """ 字典資料抽取 :return: 加入引數sparse=False可以把轉換成的資料轉換成陣列""" dict=DictVectorizer(sparse=False) #例項化 sparse=False data=dict.fit_transform([{'city':'北京','temperature':100},{'city':'上海','temperature':60},{'city':'深圳','temperature':30}]) # 呼叫fit_transform就是把字串資料轉化成特徵,返回的是個data print(data) #print(dict.get_feature_names()) return None if__name__=="__main__": dictvec()
上面的字典資料特徵抽取的結果:
註解:
- 上面的結果是沒有加引數dict=DictVectorizer()。
- 下面的結果是加了引數的結果,dict=DictVectorizer(sparse=False)
- (1,3) 60.0意思是:第2行第4列的資料是60.0
""" 演示字典的特徵抽取, DictVectorizer是一個類的名字 """ from sklearn.feature_extraction import DictVectorizer def dictvec(): """ 字典資料抽取 :return: 加入引數sparse=False可以把轉換成的資料轉換成陣列 """ dict=DictVectorizer(sparse=False) #例項化 sparse=False data=dict.fit_transform([{'city':'北京','temperature':100},{'city':'上海','temperature':60},{'city':'深圳','temperature':30}]) # 呼叫fit_transform就是把字串資料轉化成特徵,返回的是個data #print(data) print(dict.get_feature_names()) return None if __name__=="__main__": dictvec()
執行結果:
C:\Users\TJ\AppData\Local\Programs\Python\Python37\python.exe D:/qcc/python/mnist/feature_abstract.py
['city=上海', 'city=北京', 'city=深圳', 'temperature']
Process finished with exit code 0
['city=上海', 'city=北京', 'city=深圳', 'temperature']