NLP與KNN(鄰近演算法)自然語言處理
阿新 • • 發佈:2019-02-10
import jieba
str='我要今天天氣'
res=''.join(jieba.cut(str))
print(res)
一、首先匯入Jieba中文分詞
二、演示
什麼是自然語言處理
自然語言
我們要對自然語言進行理解,其實就是我們日常使用的語言(書面文字和語音視訊等)。簡言之,漢語、日語、韓語、英語、法語等語言都屬於此範疇。而自然語言處理是對自然語言處理的一種技術,就是通過我們的語音文字與計算機進行通訊,我們稱之為“人機互動”。
自然語言處理
自然語言處理(英語:Natural Language Processing,簡稱NLP)是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言;自然語言認知則是指讓電腦“懂”人類的語言。自然語言生成系統把計算機資料轉化為自然語言。自然語言理解系統把自然語言轉化為計算機程式更易於處理的形式。
KNN的案例
# coding=utf-8 import numpy as np from numpy import * #建立資料來源 返回資料集和類標籤 def creat_dataset(): datasets= array([[8,4,2],[7,1,1],[1,4,4],[3,0,5]])#資料集 labels=['非常熱','很熱','一般熱','熱'] #類標籤 return datasets,labels if __name__ == "__main__": datasets,labels=creat_dataset() print("資料集:\n",datasets,'\n 類標籤\n',labels)
資料集:
[[8 4 2]
[7 1 1]
[1 4 4]
[3 0 5]]
類標籤
['非常熱', '很熱', '一般熱', '熱']