動手學深度學習 | 語言模型 | 53

阿新 • • 發佈：2021-09-27

語言模型
程式碼
QA

語言模型

一隻猴子打字，就算是打到宇宙毀滅，他也打不出莎士比亞的文章。

語言模型的核心是估計聯合概率\(p(x_1,...,x_t)\),序列模型的核心其實也就是預測整個文字序列出現的概率。

我們使用一個最簡單的計數模型來進行建模。

一元只有一個變數，也就是自己，那麼就可以認為每個變數都是獨立的..

這是一個很現實的問題，就是序列太長不能被一次讀入記憶體中應該如何處理？

兩種方式：隨機取樣 & 順序分割槽

隨機取樣就是隨機丟棄前面k個數據，k屬於\([0,num_step-1]\)。

隨機取樣的話，每一個batch的子序列之間都可以認為是獨立的。

隨機取樣的話，相鄰的兩個batch的子序列是連續的。

程式碼

程式碼展示的是時序序列的語言模型是如何讀取資料以及生成mini_batch的。

QA

在文字預處理中，所構建的詞彙表把文字對映成數字，文字資料量越大，對映的數字也就越大，這些數字還需要做預處理嗎？例如歸一化處理等，是否模型有影響？

這些數字使用做成embedding層用的，它不會真的作為一個數字傳給RNN模型，這些數字在這些地方只是一個id，後面會具體介紹這些數字具體是如何使用的。

語言sequence sample（token是word）的時間跨度T大概設成多少比較好？如果是中文的話一般又是多少？

這個東西取決於你一句話有多長，取決於你是想對一句話建模還是對一段話建模。這個T取16，32，64，128，長一點512也是有的。沐神認為32是一個不錯的選項，當然越長計算量越大，收斂也會變得慢，當然不是所有模型都能夠去處理很長的序列。

動手學深度學習 | 語言模型 | 53

目錄語言模型程式碼QA 語言模型一隻猴子打字，就算是打到宇宙毀滅，他也打不出莎士比亞的文章。

動手學深度學習 | 模型選擇+過擬合和欠擬合 | 09

目錄模型選擇過擬合和欠擬合QA 模型選擇我們其實關心的是泛化誤差，並不太關心訓練誤差。

動手學深度學習基礎

第一次作業：深度學習基礎 1. 影象處理基本練習展示不同通道上的影象 # 展示三通道影象

《動手學深度學習》mxnet版/第三章學習筆記

第三章從單層神經網路延伸到多層神經網路，並通過多層感知機引入深度學習模型

《動手學深度學習》mxnet版/第五章學習筆記

第五章描述卷積神經網路中卷積層和池化層的工作原理，並解釋填充、步幅、輸入通道和輸出通道的含義

《動手學深度學習》mxnet版/第四章學習筆記

第四章概括深度學習計算的各個重要組成部分，如模型構造、引數的訪問和初始化等，自定義層，讀取、儲存和使用GPU

《動手學深度學習Pytorch版》之AlexNet預測結果展示

技術標籤：Pytorch深度學習python深度學習《動手學深度學習Pytorch版》https://github.com/ShusenTang/Dive-into-DL-PyTorch 為了檢視預測結果，在原Demo上加了預測顯示程式碼。注意：

《動手學深度學習》(TF2.0版)第二章

技術標籤：深度不學習第二章 import tensorflow as tf print(tf.__version__) 檢視TF的版本 2.2資料操作

動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

技術標籤：深度學習深度學習神經網路機器學習人工智慧python 動手學深度學習影象分類例項-多層感知機(三) 多層感知機的簡潔實現

動手學深度學習 | 目錄 | 00

動手學深度學習 | 資料操作+資料預處理 | 02

目錄資料操作資料操作實現資料預處理實現QA 資料操作圖片是三維的： w*h*channel

動手學深度學習 | 線性代數 | 03

目錄線性代數線性代數實現按特定軸求和QA 線性代數其實我們不需要太多線性代數的知識，但是還是稍微講一下作為一個數學上的入門。

動手學深度學習 | Softmax迴歸+損失函式+圖片分類資料集 | 07

目錄Softmax迴歸損失函式圖片分類資料集Softmax迴歸從零開始實現Softmax迴歸簡潔實現QA

動手學深度學習 | 多層感知機+程式碼實現 | 08

目錄感知機多層感知機多層感知機從零開始實現多層感知機簡潔實現QA 感知機

動手學深度學習 | 使用和購買GPU | 15

目錄使用GPU購買GPU整機配置QA 使用GPU 其實如果沒有錢買GPU的話，使用Google Colab也是一個不錯的選擇，大概是10 dollar一個月。

動手學深度學習 | 預測房價競賽總結 | 16

目錄競賽總結QA 競賽總結我們講知識，也不可能所有東西都cover到，讓大家競賽不是讓大家去學某個特定的知識，而是說大家遇到一個問題，怎麼去找一個解決方案。這一次的解決方案和下一次的會不一樣，但是問題是你

動手學深度學習 | 網路中的網路NiN | 24

目錄NiN程式碼QA NiN NiN Network in Network，網路中的網路，這個網路現在用的不多，幾乎很少被用到，但是它裡面提出了比較重要的一些概念，在後面很多網路中都會持續的被用到。

動手學深度學習安裝環節

以下均在linux中執行，建議學習的同學都選擇ununtu18.0以上版本OS。 1.minicanda的安裝：

動手學深度學習 | 批量歸一化 | 26

目錄批量歸一化程式碼QA 批量歸一化現在卷積神經網基本都是要使用到BN層的。BN層的思想不新，但是這個特定的層確實是最近幾年才出來的，而且大家會發現效果很好。而且當大家要把網路做深的時候，這就是一個不可避

動手學深度學習 | 殘差網路 ResNet | 27

目錄ResNet程式碼QA ResNet 如果說CNN只要你連線一個網路的話，那麼只要連線ResNet就可以了。ResNet是一個很簡單的，也是一個很好用的網路。

動手學深度學習 | 語言模型 | 53

語言模型

程式碼

QA

相關推薦