閱讀論文時的一些常見問題(持續更新)

阿新 • • 發佈：2022-02-04

池化層在NLP應用
MLM是什麼
多層感知器-MLP
全連線層到底用來幹什麼？
因子分解機
token和span
整理一下tensor的型別
深度學習中Attention與全連線層的區別何在？
張量操作
詞嵌入維度，如何選擇？
word2vec實現

池化層在NLP應用

想看CS224N NLP with Deep Learning（十一）：NLP中的CNN
池化的作用則是對特徵進行“總結”,即對特徵進行壓縮，提取主要特徵。NLP中最常用的池化操作是max-over-time Pooling，即用特徵在所有時間步的最大值來代表特徵，還可參考此

MLM是什麼

實際上就是掩碼語言模型(Masked Language Model),比如大家常說的Bert、GPT、EMLo等都是屬於MLM，只是掩碼的種類不同而已。MLM的做法就是隨機遮蔽輸入序列的一些token，然後僅僅通過上下文來預測被遮蔽token的原單詞表id。

參考一、參考二

多層感知器-MLP

見此

全連線層到底用來幹什麼？

首先最常見的功能就是轉變維度，即輸出符合要維度，此外全連線層出現在後幾層還可能是用來對前面的特徵做加權和，以此獲得更多的資訊提取特徵，實現分類(CNN中是這樣的)，但是一層全連線層沒法解決非線性問題，如果有兩層以上就可以了，比如前饋層(兩個全連線層)。此外相比於self-attention全連線層的權重更多以位置為基準
在神經網路中通常還會與softmax中進行結合，全連線層將權重矩陣與輸入向量相乘再加上偏置，將n個的實數對映為K個的實數（分數）；Softmax將K個的實數對映為K個0~1的實數（概率），同時保證它們之和為1。

因子分解機

見此

token和span

參考

整理一下tensor的型別

參考此

深度學習中Attention與全連線層的區別何在？

見此

張量操作

見此

詞嵌入維度，如何選擇？

可以參考蘇神的這篇部落格：關於維度公式“n > 8.33 log N”的可用性分析

word2vec實現

可以參考wmathor大佬的這篇部落格：Word2Vec 的 PyTorch 實現（乞丐版）

本文來自部落格園，作者：xingye_z，轉載請註明原文連結：https://www.cnblogs.com/xyzhrrr/p/15863339.html

閱讀論文時的一些常見問題(持續更新)

目錄池化層在NLP應用MLM是什麼多層感知器-MLP全連線層到底用來幹什麼？因子分解機token和span整理一下tensor的型別深度學習中Attention與全連線層的區別何在？張量操作詞嵌入維度，如何選擇？word2vec實現

PyTorch 寫程式碼時的一些坑(持續更新)

1. nn.Module.cuda() 和 Tensor.cuda() 無論是對於模型還是資料，cuda() 都能實現從CPU到GPU的記憶體遷移，但是他們的作用效果有所不同。

收集一些Android常見但不容易發現原因的錯誤，持續更新

收集一些Android常見但不容易發現原因的錯誤，持續更新錯誤提示：Expected class or package（找不到類或者包）典型的錯誤寫法：NotificationCompat.Builder builder = new NotificationCompat().Builder(MainActivi

Nodejs 一些細節（持續更新）

原文地址：https://blog.spiritling.cn/posts/15cfe434/ nodejs 路徑以及 path 相關 process.cwd()、__dirname、__filename

相容低版本IE瀏覽器的一些心得體會（持續更新）

前言：近期工作中，突然被要求改別人的程式碼，其中有一項就是相容IE低版本瀏覽器，所以優雅降級吧。

jmeter常見錯誤(持續更新)

1. jmeter java.net.NoRouteToHostException: Cannot assign requested address (Address not available) 壓測過程中出現此錯誤,發現網路連線正常,伺服器也是正常,網上查是客戶端(jmeter機器)埠用盡.因為socket埠釋放

應急一些小技巧（持續更新）

（目前經驗較少，基本都是與windows相關，寫的也比較亂。之後慢慢補充）勒索病毒事件排查順序

膝上型電腦使用常見問題，持續更新

1.解決文字框亂碼簡單說一下，進入這個頁面（在自己的輸入法裡面的管理語言設定中），然後點選如圖，出現

MySQL常見錯誤及排查（持續更新中）

錯誤一： java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near \'LIMIT

CentOS 常見操作命令整理（持續更新）

docker 檢視本機核心版本 uname -r 跟新yum版本 sudo yum update 檢視已安裝的docker列表 yum list installed | grep docker

Python2.0中一些函式在3.0中的改動（持續更新）

技術標籤：學習筆記python reload函式在Python2.0中，可以直接的使用reload函式，但是在Python3.0中需要引入模組imp:

一些可能會用到的深度學習技巧函式(持續更新)

技術標籤：小技巧深度學習&神經網路NLP&影象目錄部分載入引數部分載入引數

Qt5的一些古怪問題（持續更新，遇到了就記錄下來）

技術標籤：Qt5qt5 Qt5的一些古怪問題編譯QObject時出現undefined reference to ‘vtable for XXX’

Python的一些報錯記錄（持續更新）

技術標籤：Pythonpythonbug 1. IndexError: list index out of range2. " re.error: missing ), unterminated subpattern at position 1 "3. 檔案編碼格式報錯4. Anaconda Prompt中安裝包5. No su

VUE、JS之記錄一些工作中遇到的小問題，持續更新~

開個帖記錄一些工作中遇到的問題吧，很多都是因為沒有注意到，或者基礎薄弱導致的~

UI自動化框架遇到的一些question（持續更新）

框架：pytest + selenium + poium （基於python語言） 1、多條測試用例基於登入之後才能做後續操作

持續更新一些前端小知識點總結

<div style=\"height:100px;width:100px;overflow:auto;\"></div>

論文中遇到的深度學習名詞解釋（持續更新）

在看論文時經常會有一些專業名詞不知道具體的解釋，baidu/bing搜尋後也對概念拿捏的不是很準確，因此記錄下wiki/一些外國論壇內比較清晰的解釋，方便自己回顧的同時也希望能幫助到有需要的小夥伴呀～

對比學習論文(持續更新)

最近老闆讓我去讀對比學習的論文，我斷斷續續讀了一些。在這裡對讀到的文章做一下整理，因為考試和假期這些論文也是比較久之前讀的了，難免有所不足，請見諒。

除錯時windbg命令的一些知識~不斷更新

將自己在工作中的記錄的一些windbg的命令記錄下來，方便查閱，此頁面會不斷更新：

閱讀論文時的一些常見問題(持續更新)

池化層在NLP應用

MLM是什麼

多層感知器-MLP

全連線層到底用來幹什麼？

因子分解機

token和span

整理一下tensor的型別

深度學習中Attention與全連線層的區別何在？

張量操作

詞嵌入維度，如何選擇？

word2vec實現

相關推薦