1. 程式人生 > >構建商品評價的分類器

構建商品評價的分類器

這一 http 興趣 count word net 分類 block csdn

技術分享圖片
技術分享圖片

接下來,開始構建分類器:

技術分享圖片

生成的WordCount是一個字典.鍵值對的形式
這裏的鍵是某一個單詞,對應的值是該單詞的個數

圖像化查看一下原始數據

技術分享圖片

,這裏我們取出第一個商品的評價
抽取評價數量最多的商品,這裏叫做Vulli Sophie

技術分享圖片

根據評分進行分組可視化

技術分享圖片

技術分享圖片

說明,我們要構建我們的情感分類器,我們可以從上圖中看見,評分有1,2,3,4,5,但是3代表的是中立,即不喜歡不討厭.這一部分我們可以把它去掉,因為我們的情感分類器只是需要判斷某一評價是正面還是負面,

正面:4,5分的評價 負面:1,2分的評價 去掉3分的評價

技術分享圖片

技術分享圖片

過一會兒,我們的模型就訓練好了

得到模型之後,就可以開始測試我們的模型

技術分享圖片

技術分享圖片

技術分享圖片

預測評估
技術分享圖片

根據概率列排序

技術分享圖片

查看最高評價的語句

技術分享圖片

查看最差評價;

技術分享圖片

有興趣的小夥伴可以嘗試翻譯一下,看到底是不是好差評價呢

構建商品評價的分類器