深度學習-詞嵌入

阿新 • • 發佈：2021-10-10

1、onehot 缺點：詞之間沒有關聯，泛化性差

2、高維特徵表示：每詞由300維的特徵表示，能夠獲取詞之間的相似性關係。更好。

學習詞嵌入，可以遷移學習，可以小樣本在訓練集中找相似特徵的進行歸納。

一般詞嵌入，使用雙向ＲＮＮ　

詞嵌入，找網上模型然後少量訓練標記進行遷移學習，可以使用比1-hot更低維的進行表示。

3、詞嵌入的特性：依據相似性可以匹配詞，cos衡量相似性（餘弦距離），

t_SNE 高維對映到二維視覺化

4、嵌入矩陣，實踐中不會用1-hot矩陣乘法，因為維度太高，所以用其他矩陣來代替。

5、學習詞嵌入

可以任意選擇視窗大小進行預測。

CBOW模型，周圍詞預測中間詞。正負10距有很多單詞，導致最終預測效果不是很好。

word2vec（詞嵌入）:計算高效，skip-gram中間詞利用softmax 預測周圍詞(視窗大小為2)。

Fake Task，word2vec模型的最終目的並不是建模，而是通過訓練資料來學習隱層的引數，而隱層的引數實際就是word vectors，就是說將中心詞和上下文詞成組輸入，(input word, output word)，然後最大化他們的概率，從而學習隱層引數，而隱層的引數就是最終要獲取的詞向量。

缺點：softmax耗費很大，因為有個求和操作。

負取樣：

作用：減少softmax的複雜度。

步驟：

兩詞匹配，負取樣就是在詞典中隨機一個詞（有更好的做法），距離不正負10的距離內，匹配標記為0；

K的選擇，小資料5-20，大資料2-5；

利用logistic迴歸進行訓練，每次訓練集之訓練k+1個樣本，複雜度從大量的詞典長度降低到k+1；

根據經驗，英文3/4次方的分佈對整體是比較好的。

深度學習-詞嵌入

1、onehot 缺點：詞之間沒有關聯，泛化性差 2、高維特徵表示：每詞由300維的特徵表示，能夠獲取詞之間的相似性關係。更好。

【乾貨】Entity Embeddings : 利用深度學習訓練結構化資料的實體嵌入

【導讀】本文是資料科學家Rutger Ruizendaal撰寫的一篇技術部落格，文章提出深度學習在非結構資料中有不錯的表現，當前通過實體嵌入也可以使之在結構化資料中大放異彩。具體講解了如何利用深度學習訓練結構

使用實體嵌入的結構化資料進行深度學習

嵌入（embedding）的想法來自於NLP(word2vec) 在這篇文章中，我們將討論機器學習中的兩個問題:第一個問題是關於深度學習如何在影象和文字上表現良好，並且我們如何在表格資料中使用它。第二個問題是你在構建機器學習

深度學習入門之Pytorch 資料增強的實現

資料增強卷積神經網路非常容易出現過擬合的問題，而資料增強的方法是對抗過擬合問題的一個重要方法。

人工智慧深度學習入門練習之（23）TensorFlow – 高階API

前面章節都是低階API的介紹，有助於我們理解TensorFlow的基礎知識。為方便開發人員，TensorFlow提供了高階API，包括以下模組：

Ubuntu k80深度學習環境搭建

英偉達驅動安裝英偉達驅動下載：https://www.nvidia.cn/Download/driverResults.aspx/135493/cn/

深度學習“四大名著”釋出！Python、TensorFlow、機器學習、深度學習四件套！

Python 程式設計師深度學習的“四大名著”：這四本書著實很不錯！我們都知道現在機器學習、深度學習的資料太多了，面對海量資源，往往陷入到“無從下手”的困惑出境。而且並非所有的書籍都是優質資源，浪費大量的時

深度學習論文翻譯解析（八）：Rich feature hierarchies for accurate object detection and semantic segmentation

論文標題：Rich feature hierarchies for accurate object detection and semantic segmentation 　　標題翻譯：豐富的特徵層次結構，可實現準確的目標檢測和語義分割

深度學習論文翻譯解析（九）：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition

論文標題：Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition　　　　　　標題翻譯：用於視覺識別的深度卷積神經網路中的空間金字塔池

深度學習面試題35：RNN梯度消失問題(vanishing gradient)

目錄　　梯度消失原因之一：啟用函式　　梯度消失原因之二：初始化權重　　不同損失函式下RNN的梯度消失程度對比

PyTorch 深度學習實踐 - 基礎篇

反向傳播 In PyTorch, Tensor is the important component in constructing dynamic computational graph. It contains data and grad, which storage the value of node and gradient w.r.t (with respect to) loss