1. 程式人生 > >word embeddding和keras中的embedding

word embeddding和keras中的embedding

  訓練好的詞向量模型被儲存下來,該模型的本質就是一個m*n的矩陣,m代表訓練語料中詞的個數,n代表訓練時我們設定的詞向量維度。當我們訓練好模型後再次呼叫時,就可以從該模型中直接獲取到對應詞的詞向量。

 

  通過上面我們可以拿到每個詞的詞向量,但是我們任務處理時一般是對句子或文字進行操作。當我們拿到一個詞向量後,那麼一個句子或一個文字就可以用詞表示成矩陣(假設一個句子有5個詞,詞向量維度是64,那麼該矩陣就是5*64),然後可以用CNN或RNN(LSTM)模型將該矩陣編碼成一個一維向量,並保留大多數文字資訊。然後將該向量作為深度神經網路分類器的輸入,即可得到最終的結果。

 

 

轉載:https://www.jianshu.com/p/b2c33d7e56a5