為什麼GAN不能處理離散的資料?

阿新 • • 發佈：2018-12-09

最近我們小組的一個任務是要學習兩個分佈資料之間的對映關係,我們的資料形式是 $D_1=\{a_1,a_2,...,a_n\},D_2=\{b_1,b_2,...b_m\}$ ,其中 $a_i,b_j$ 分別是 $d$ 維的資料,我們想到了用GAN來學習這兩個分佈之間的對映關係,後來發現效果不太好,迭代一次該模型就對真樣本資料和假樣本資料傻傻分不清,真假概率都為0.5,後來查詢到GAN原來不適合處理離散的資料樣本,所以來寫個筆記記錄一下:

為什麼GAN不適合處理文字資料

1. 文字資料相比較圖片資料來說是離散的，因為對於文字來說，通常需要將一個詞對映為一個高維的向量，最終預測的輸出是一個one-hot向量，假設softmax的輸出是（0.2， 0.3， 0.1，0.2，0.15，0.05）那麼變為onehot是（0，1，0，0，0，0），如果softmax輸出是（0.2， 0.25， 0.2， 0.1，0.15，0.1 ），one-hot仍然是（0， 1， 0， 0， 0， 0），所以對於生成器來說，G輸出了不同的結果但是D給出了同樣的判別結果，並不能將梯度更新資訊很好的傳遞到G中去，所以D最終輸出的判別沒有意義。

2. 另外就是GAN的損失函式是JS散度，JS散度不適合衡量不想交分佈之間的距離。

（WGAN雖然使用wassertein距離代替了JS散度，但是在生成文字上能力還是有限，GAN在生成文字上的應用有seq-GAN,和強化學習結合的產物）

為什麼GAN不能處理離散的資料?

CNTK API文件翻譯(20)——GAN處理MSIST資料基礎

為什麼GAN不能處理離散的資料?

python資料預處理：資料離散化

機器學習小組知識點27：資料預處理之資料離散化（Data Discretization）

資料預處理之資料離散化

acm資料預處理 —— 離散化的兩種方法

python 將dataframe的某一列離散資料轉換為數值資料

處理coco資料集-語義分割

Excel生成批量SQL語句，處理大量資料的好辦法

java在處理基本資料型別加減乘除操作注意

03 -2 numpy與pandas中isnull()、notnull()、dropna()、fillna()處理丟失資料的理解與例項

時間格式的處理和資料填充和分頁---laravel

還不會處理時間資料？看這篇就夠了

pytorch：實現簡單的GAN（MNIST資料集）

Highcharts中處理座標軸資料過多的問題

spring mvc(4)處理模型資料

R語言處理日期資料

python資料處理----常用資料檔案的處理

處理海量資料的方法與思路

Xamarin Essentials教程資料處理傳輸資料

為什麼GAN不能處理離散的資料?

相關推薦