1. Abstract

2. Introduction

詞嵌入是當下NLP領域的熱點之一，諸多用於訓練詞的密集向量表示的非監督學習方法已經被相繼提出，併成功用於句法分析、主題建模以及文字分類等領域
目前所有詞嵌入構建的基本思想都是，利用大型單語語料庫中的同現統計

（co-occurrence statistics ），以及相似詞彙必定出現在相似文字環境中的分散式假設，將相似的向量表示分配給相似的詞彙
但是如何定義“相似”，或者說嵌入模型應該捕捉詞語之間什麼樣的關係仍不明確。例如有些人將真實相似性（轎車-汽車）與關聯性（車-公路）加以區分，有些人認為應重點關注語義（唱歌-詠唱）和語法（sing-singing）相似度。總而言之，也就是將相似度衡量的兩個軸劃分為了語義/語法軸，相似/關聯軸。

$X$	$X_{i*}$	$sim(i,j)=X_{i}·X_{j}$
詞嵌入矩陣	第 $i$ 個詞的嵌入向量	詞 $i$ 和詞 $j$ 的相似度

將 $XX^T$ 做個特徵分解： $X^TX=QΛQ^T$ ， $Λ$ 為對角元素是 $X^TX$ 特徵值的正對角矩陣， $Q$ 是相應特徵向量構成的正交矩陣。定義一個線性變換矩陣 $W=Q\sqrtΛ$ ，令 $X'=XW$ ，則 $M(X')=M_2(X)$ 。更一般的，

$n$ 階相似度	引數 $α$	線性變換矩 $W_α$	$n$ 階相似度矩 $M_n$
$n≥1$	$α=(n-1)/2$