Phrase-Based & Neural Unsupervised Machine Translation

阿新 • • 發佈：2019-01-04

Phrase-Based & Neural Unsupervised Machine Translation

論文：Phrase-Based & Neural Unsupervised Machine Translation
程式碼：Github
這篇Paper是EMNLP 2018的best paper，用於實現無監督機器翻譯，不過無監督機器翻譯的思想早就有研究者提出來了，這篇paper是在前人的基礎上做了一些優化改進，使得模型更加容易訓練，效果也有所提升。作者提出了兩個模型，一個是NMT（神經機器翻譯）模型，另一個是PBSMT（基於短語的統計機器翻譯）模型。
作者的工作主要體現在以下兩個方面：

對於一些相近的語言，作者提出了一種更加簡單高效的初始化方法
作者總結了無監督機器翻譯的三個原則，並把他們應用到PBSMT，發現效果比NMT還要好。
結合NMT和PBSMT效果可以得到進一步提升

無監督機器翻譯的三個關鍵點

初始化

對於機器翻譯問題的病態性，模型初始化是一種自然先驗，代表了我們期待的解空間的分佈。許多模型採用雙語字典，得到逐個詞翻譯的結果，並以此作為初始化。這樣會導致最終翻譯的結果不可避免的具有源語言的語法特性。

語言模型

通過在單一語種上訓練的語言模型，可以讓模型學習到每一種語言中的句子該如何使用。可以提升句子的合理度，通順度。

迭代反向翻譯(Iterative Back-translation)

這裡的思路就有點像CV裡面的cycleGAN了，先把源語言翻譯成目標語言，然後在翻譯回來。把一個無監督問題變為了一個有監督問題。

作者提出的無監督機器翻譯方法

符號介紹： $S$ 表示源句子空間， $T$ 表示目標句子空間。 $P_s$ 表是源語言的語言模型， $P_t$ 表示目標語言的語言模型。 $P_{s\rightarrow t}$ 表示源語言到目標語言的翻譯模型，反之亦然。作者方法思路如下：

思路框架很簡單：

訓練語言模型：訓練 $P_s$ , $P_t$ ，使得對於任意一個句子，都可以給出其出現的概率。語言模型其實就是判斷句子合理程度的一個方式
初始化翻譯模型：根據語言模型初始化翻譯模型。

迭代優化：通過Back-translation, 逐步迭代優化模型。

Phrase-Based & Neural Unsupervised Machine Translation

Phrase-Based & Neural Unsupervised Machine Translation 論文：Phrase-Based & Neural Unsupervised Machine Translation 程式碼：Github

論文筆記-Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

mach default rap lin -s rnn alias for wrap 針對機器翻譯，提出 RNN encoder-decoder. encoder與decoder是兩個RNN，它們放在一起進行參數學習，最大化條件似然函數。網絡結構：註意輸入語句與

論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

contain feature 比較 san date res 離散 edi post 針對交叉（高階）特征學習提出的DeepFM是一個end-to-end模型，不需要像wide&deep那樣在wide端人工構造特征。網絡結構： sparse feature

論文筆記-Neural Machine Translation by Jointly Learning to Align and Translate

tps idt 個人理解 att date eight default con ati 提出attention機制，用於機器翻譯。背景：基於RNN的機器翻譯基本思路是首先對語言x進行編碼encoder，然後解碼decoder為語言y。encoder和decoder可

NEURAL MACHINE TRANSLATION

NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE ABSTRACT 1 INTRODUCTION 3 LEARNING TO ALIGN AND TRANSLATE

Paper Summary: Neural Machine Translation

一、 Sequence to Sequence Learning with Neural Networks - [email protected] 1、提出背景：（1）雖然DNN可以解決現實生活中的很多問題，但是在解決機器翻譯過程中，主要的問題是其輸入和輸出的長度一致。

斯坦福大學-自然語言處理與深度學習（CS224n）筆記第十課神經機器翻譯（neural machine translation）與attention模型

本課概要 1、機器翻譯（MT） 2、帶attention的序列模型 3、序列模型解碼器（decoder）一、機器翻譯（MT）機器翻譯是一個十分經典的語言理解的測試，涉及語言分析（language analysis）與語言生成（language generat

The Real Problems with Neural Machine Translation

TLDR: No! Your Machine Translation Model is not "prophesying", but let's look at the six major issues with neural machine translation (NMT). So I saw a Twi

How to Develop a Neural Machine Translation System from Scratch

Tweet Share Share Google Plus Develop a Deep Learning Model to Automatically Translate from Germ

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction 論文閱讀總結

Abstract Learning sophisticated feature interactions behind user behaviors is critical in maximizing CTR for recommender systems. Despite great

Amazon Translate – Neural Machine Translation

“At Isentia, we built our media intelligence software in a single language. To expand our capabilities and address the diverse language needs

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction簡介與程式碼實現

論文簡介 Abstract 對於一個基於CTR預估的推薦系統，最重要的是學習到使用者點選行為背後隱含的特徵組合。在不同的推薦場景中，低階組合特徵或者高階組合特徵可能都會對最終的CTR產生影響。但是現存的方法總是忽視了高階或低階組合特徵的聯絡，或者要求專門的特徵工程，因此作者建立了

Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

摘要：在本文中，我們提出了一種新的神經網路模型，稱為RNN編碼器 - 解碼器，由兩個遞迴神經網路（RNN）組成。一個RNN編碼器將特徵編碼為一個固定長度的向量，另一個解碼器解碼這個向量為另一個符號序列。聯合訓練所提出的模型的編碼器和解碼器以最大化給定源序列的目標序列的條件概率

【Machine Translation】僅由單語數據生成雙語詞典

多層感知機 img facebook 學習 sls data 上下文 algorithm inline Word translation without parallel data 考慮在只有單語數據的情況下，如何生成雙語詞典。基於假設：相似的上下文中的單詞具有相似的

Structural Features for Predicting the Linguistic Quality of Text: Applications to Machine Translation, Automatic Summarization and Human-Authored Tex

abstract句子結構是文字語言質量的關鍵，我們記錄了以下實驗結果：句法短語統計和其他結構特徵對文字方面的預測能力。手工評估的句子fluency流利度用於機器翻譯評估和文字摘要質量的評估是黃金準則。我們發現和短語長度相關的結構特徵是弱特徵，但是與fluency強相關，基於整個結構特徵的分類器可以在句子flu

Phrase-Based & Neural Unsupervised Machine Translation

Phrase-Based & Neural Unsupervised Machine Translation

無監督機器翻譯的三個關鍵點

初始化

語言模型

迭代反向翻譯(Iterative Back-translation)

作者提出的無監督機器翻譯方法

Phrase-Based & Neural Unsupervised Machine Translation

論文筆記-Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

論文筆記-Neural Machine Translation by Jointly Learning to Align and Translate

NEURAL MACHINE TRANSLATION

Paper Summary: Neural Machine Translation

斯坦福大學-自然語言處理與深度學習（CS224n）筆記第十課神經機器翻譯（neural machine translation）與attention模型

The Real Problems with Neural Machine Translation

How to Develop a Neural Machine Translation System from Scratch

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction 論文閱讀總結

Amazon Translate – Neural Machine Translation

DeepFM: A Factorization-Machine based Neural Network for CTR Prediction簡介與程式碼實現

Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

【Machine Translation】僅由單語數據生成雙語詞典

Structural Features for Predicting the Linguistic Quality of Text: Applications to Machine Translation, Automatic Summarization and Human-Authored Tex

natural language processing blog: machine translation

Cheat Sheets for AI, Neural Networks, Machine Learning, Deep Learning & Big Data

Machine Learning：Neural Network---Representation

Machine learning for improved image-based wavefront sensing

machine learning 之 Neural Network 1

Phrase-Based & Neural Unsupervised Machine Translation

Phrase-Based & Neural Unsupervised Machine Translation

無監督機器翻譯的三個關鍵點

初始化

語言模型

迭代反向翻譯(Iterative Back-translation)

作者提出的無監督機器翻譯方法

相關推薦