word2vec 中的數學原理詳解

阿新 • • 發佈：2018-12-31

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包，它簡單、高效，因此引起了很多人的關注。由於 word2vec 的作者 Tomas Mikolov 在兩篇相關的論文 [3,4] 中並沒有談及太多演算法細節，因而在一定程度上增加了這個工具包的神祕感。一些按捺不住的人於是選擇了通過解剖原始碼的方式來一窺究竟。

第一次接觸 word2vec 是 2013 年的 10 月份，當時讀了復旦大學鄭驍慶老師發表的論文[7]，其主要工作是將 SENNA 的那套演算法（[8]）搬到中文場景。覺得挺有意思，於是做了一個實現（可參見[20]），但苦於其中字向量的訓練時間太長，便選擇使用 word2vec 來提供字向量，沒想到中文分詞效果還不錯，立馬對 word2vec 刮目相看了一把，好奇心也隨之增長。

後來，陸陸續續看到了 word2vec 的一些具體應用，而 Tomas Mikolov 團隊本身也將其推廣到了句子和文件（[6]），因此覺得確實有必要對 word2vec 裡的演算法原理做個瞭解，以便對他們的後續研究進行追蹤。於是，沉下心來，仔細讀了一回程式碼，算是基本搞明白裡面的做法了。第一個感覺就是，“明明是個很簡單的淺層結構，為什麼會被那麼多人沸沸揚揚地說成是 Deep Learning 呢？”

解剖 word2vec 原始碼的過程中，除了演算法層面的收穫，其實程式設計技巧方面的收穫也頗多。既然花了功夫來讀程式碼，還是把理解到的東西整理成文，給有需要的朋友提供點參考吧。

在整理本文的過程中, 和深度學習群的群友@北流浪子（[15,16]）進行了多次有益的討論，在此表示感謝。另外，也參考了其他人的一些資料，都列在參考文獻了，在此對他們的工作也一併表示感謝。

word2vec 中的數學原理詳解

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包，它簡單、高效，因此引起了很多人的關注。由於 word2vec 的作者 Tomas Mikolov 在兩篇相關的論文 [3,4] 中並沒有談及太多演算法細節，因而

word2vec 中的數學原理詳解（五）基於 Negative Sampling 的模型

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包，它簡單、高效，因此引起了很多人的關注。由於 word2vec 的作者 Tomas

word2vec 中的數學原理詳解（二）預備知識

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包，它簡單、高效，因此引起了很多人的關注。由於 word2vec 的作者 Tomas

word2vec 中的數學原理詳解（六）若干原始碼細節

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包，它簡單、高效，因此引起了很多人的關注。由於 word2vec 的作者 Tomas

word2vec 中的數學原理詳解（三）背景知識

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包，它簡單、高效，因此引起了很多人的關注。由於 word2vec 的作者 Tomas

word2vec 中的數學原理詳解（四）基於 Hierarchical Softmax 的模型

word2vec 是 Google 於 2013 年開源推出的一個用於獲取 word vector 的工具包，它簡單、高效，因此引起了很多人的關注。由於 word2vec 的作者 Tomas

影象處理中的數學原理詳解17——卷積定理及其證明

http://blog.csdn.net/baimafujinji/article/details/484672251.4.5 卷積定理及其證明卷積定理是傅立葉變換滿足的一個重要性質。卷積定理指出，

影象處理中的數學原理詳解11——線性空間

全文目錄請見http://blog.csdn.net/baimafujinji/article/details/484672252.3 泛函與抽象空間牛頓說：“把簡單的問題看得複雜，可以發現新領域；把複雜的問題看得簡單，可以發現新規律。”而從歷史的角度來看，一個學科的發展也

影象處理中的數學原理詳解（Part1 總綱）

數字影象處理技術的研究與開發對數學基礎的要求很高，一些不斷湧現的新方法中，眼花繚亂的數學推導令很多期待深入研究的人望而卻步。一個正規理工科學生大致已經具備了包括微積分、線性代數、概率論在內的數學基礎。但

影象處理中的數學原理詳解（Part8） ——傅立葉變換的來龍去脈

全文目錄請見http://blog.csdn.net/baimafujinji/article/details/48467225千呼萬喚始出來，我們前面已經做了很多很多的準備，終於可以揭開傅立葉變換的面

android中wifi原理詳解(轉)

二：Wifi模組的初始化:：在 SystemServer 啟動的時候，會生成一個ConnectivityService的例項， try { Log.i(TAG, "Starting Connectivity Service."); ServiceManager.addService(Con

SynchronousQueue中TransferQueue原理詳解

SynchronousQueue中分為TransferQueue（公平模式）和TransferStack（非公平模式）下面我們先分析一下TransferQueue 當新建一個TransferQueue時 1 TransferQueue() { 2 QNode h = ne

android中wifi原理詳解轉

二：Wifi模組的初始化:：在 SystemServer 啟動的時候，會生成一個ConnectivityService的例項，try {Log.i(TAG, "Starting Connectivity Service.");ServiceManager.addService(

String類在記憶體中實現原理詳解

（1） == 比較引用型別比較的是地址值是否相同 equals:比較引用型別預設也是比較地址值是否相同，而String類重寫了equals()方法，比較的是內容是否相同。（2）區分下面兩種語句在記憶體中的實現： <span style="font-size:14

js中幾種實用的跨域方法原理詳解

自身標簽 cdc 返回屬性和方法插入實用封裝判斷這裏說的js跨域是指通過js在不同的域之間進行數據傳輸或通信，比如用ajax向一個不同的域請求數據，或者通過js獲取頁面中不同域的框架中(iframe)的數據。只要協議、域名、端口有任何一個不同，都被當作是不同

Mysql中MVCC的使用及原理詳解

準備測試環境：Mysql 5.7.20-log 資料庫預設隔離級別：RR（Repeatable Read，可重複讀），MVCC主要適用於Mysql的RC,RR隔離級別建立一張儲存引擎為testmvcc的表，sql為: CREATE TABLE testmvcc ( id int

Python Web開發中，WSGI協議的作用和實現原理詳解

首先理解下面三個概念： WSGI：全稱是Web Server Gateway Interface，WSGI不是伺服器，python模組，框架，API或者任何軟體，只是一種規範，描述web server如何與web application通訊的規範。 uwsgi：與WSGI一樣是一種協議，是uWSGI伺服器

JS 中幾種實用的跨域方法原理詳解

這裡說的js跨域是指通過js在不同的域之間進行資料傳輸或通訊，比如用ajax向一個不同的域請求資料，或者通過js獲取頁面中不同域的框架中(iframe)的資料。只要協議、域名、埠有任何一個不同，都被當作是不同的域。下表給出了相對http://store.company.com/dir/page

區塊鏈中的RESTFUL鏈碼呼叫API原理詳解

本文適合於熟悉開源區塊鏈技術Hyperledger Fabric，以及希望更高效地使用華為雲區塊鏈服務的讀者。當然，也歡迎任何對區塊鏈技術有興趣的讀者閱讀本文，相信讀者們都能從中受益。 2018年2月1日華為雲釋出企業級區塊鏈開放平臺區塊鏈服務BCS（Blockchain Service），是基於開源區塊

區塊鏈中的RESTFUL鏈碼調用API原理詳解

ada 應用公測 code 組織結構 col eve awd 遠程本文適合於熟悉開源區塊鏈技術Hyperledger Fabric，以及希望更高效地使用華為雲區塊鏈服務的讀者。當然，也歡迎任何對區塊鏈技術有興趣的讀者閱讀本文，相信讀者們都能從中受益。 2018年2月1日