單層lstm的偽孿生網路 計算 句子的相似度
阿新 • • 發佈:2019-02-17
基礎版本實驗:選用final hidden states, [h1, h2, |h1-h2|, h1.*h2], 以1:2構造正負例, 參考dssm(原文是1:4)
資料是4w的pair對
訓練曲線如下圖:
最終任務測試集上的準確率(和本任務中dssm的準確率做對比), 如下圖所示:
本任務lstm singe (正:負 = 1:2) | 本任務lstm singe (正:負 = 1:4) | 本任務lstm singe (正:負 = 1:10) | 本任務lstm singe (正:負 = 1:30) | 本任務Dssm(正:負 = 1:4) |
top1ACC:0.811159 | top1ACC:0.832618 | top1ACC:0.793991 | top1ACC:0.611588 | top1ACC:0.802575 |
另外我們在本任務中的另一個測試集上也做了對比:
本任務lstm singe (正:負 = 1:4) | 本任務Dssm(正:負 = 1:4) |
top1ACC:0.629000 | top1ACC:0.617667 |
- 結論:
1. Dssm正負例比例1:4應該是多次實驗的結果,正負例比例過於不均衡,會減弱準確率;
- 說明:
1. 本任採用測試集均為專案中的真實資料標註測試集,具有實際說明效應。
- 改進計劃:
模型為初始版本,仍然還在改進中:
1. loss function: margin loss
2. 負例構造
3. lstm結構
4. NN層