1. 程式人生 > >單層lstm的偽孿生網路 計算 句子的相似度

單層lstm的偽孿生網路 計算 句子的相似度

基礎版本實驗:選用final hidden states, [h1, h2, |h1-h2|, h1.*h2], 以1:2構造正負例, 參考dssm(原文是1:4)

single lstm 孿生網路

資料是4w的pair對

訓練曲線如下圖:

最終任務測試集上的準確率(和本任務中dssm的準確率做對比), 如下圖所示:

本任務lstm singe (正:負 = 1:2) 本任務lstm singe (正:負 = 1:4) 本任務lstm singe (正:負 = 1:10) 本任務lstm singe (正:負 = 1:30) 本任務Dssm(正:負 = 1:4)
top1ACC:0.811159 top1ACC:0.832618 top1ACC:0.793991 top1ACC:0.611588 top1ACC:0.802575

另外我們在本任務中的另一個測試集上也做了對比:

本任務lstm singe (正:負 = 1:4) 本任務Dssm(正:負 = 1:4)
top1ACC:0.629000 top1ACC:0.617667
  • 結論:

1. Dssm正負例比例1:4應該是多次實驗的結果,正負例比例過於不均衡,會減弱準確率;

  • 說明:

1. 本任採用測試集均為專案中的真實資料標註測試集,具有實際說明效應。

  • 改進計劃:

模型為初始版本,仍然還在改進中:

1. loss function: margin loss

2. 負例構造

3. lstm結構

4. NN層