1. 程式人生 > >NLP與KNN(鄰近演算法)自然語言處理

NLP與KNN(鄰近演算法)自然語言處理

import jieba
str='我要今天天氣'
res=''.join(jieba.cut(str))
print(res)

一、首先匯入Jieba中文分詞
在這裡插入圖片描述二、演示
在這裡插入圖片描述

什麼是自然語言處理

自然語言

我們要對自然語言進行理解,其實就是我們日常使用的語言(書面文字和語音視訊等)。簡言之,漢語、日語、韓語、英語、法語等語言都屬於此範疇。而自然語言處理是對自然語言處理的一種技術,就是通過我們的語音文字與計算機進行通訊,我們稱之為“人機互動”。

自然語言處理

自然語言處理(英語:Natural Language Processing,簡稱NLP)是人工智慧和語言學領域的分支學科。此領域探討如何處理及運用自然語言;自然語言認知則是指讓電腦“懂”人類的語言。自然語言生成系統把計算機資料轉化為自然語言。自然語言理解系統把自然語言轉化為計算機程式更易於處理的形式。

KNN的案例


# coding=utf-8

import numpy as np
from numpy import *

#建立資料來源 返回資料集和類標籤
def creat_dataset():
    datasets= array([[8,4,2],[7,1,1],[1,4,4],[3,0,5]])#資料集
    labels=['非常熱','很熱','一般熱','熱'] #類標籤
    return datasets,labels

if __name__ == "__main__":
     datasets,labels=creat_dataset()
     print("資料集:\n",datasets,'\n 類標籤\n',labels)
資料集:
 [[8 4 2]
 [7 1 1]
 [1 4 4]
 [3 0 5]] 
 類標籤
 ['非常熱', '很熱', '一般熱', '熱']