1. 程式人生 > >Text Mining and Analytics(2)

Text Mining and Analytics(2)

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述
IDF stands for inverse document frequency
TF:it’ll convert the raw count of a word in the document into some weight
that reflects our belief about how important this word in the document.

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述

這裡寫圖片描述
|d1|: the document length of the total counts of words
b: this is a parameter to control length normalization

這裡寫圖片描述

這裡寫圖片描述