De-Confounded Variational Encoder-Decoder for LogicalTable-to-Text Generation

阿新 • • 發佈：2021-10-31

介紹

資料到文字的生成方法指的是從非文字的輸入中生成描述性文字的任務。輸入種類不同，任務可以定義地更加明確，比如摘要資訊生成文字，資訊框生成文字，圖生成文字。

在這些任務中，我們關注邏輯表到文字的生成任務，這項任務旨在從表格生成流暢的但是邏輯正確的文字。而邏輯推理是一種高階的智慧，這對現實中的文字生成系統時比較困難的。現實中的句子往往表達的是邏輯推理資訊，這些資訊在表格中並不會顯式地出現。所以，資料驅動的模型往往生成語義流暢但是邏輯不正確的文字。最近的關於這項任務的研究主要在預使用像GPT-2一樣的預訓練模型，它們相比於沒有預訓練的模型表現出了更加優秀的效果。

然而，預訓練語言模型能否正確捕捉到邏輯資訊還存在爭議，因為預訓練語言模型比如BERT經常會使用虛假的統計資訊來進行推理。一個潛在的挑戰不是在於是否使用預訓練模型，而是表格與文字之間的表層虛假關聯比因果相關性更容易捕捉。比如，我們觀察了一個在與GPT-2相關的模型生成了“The al-bum was released in the United States 2 time”，然而實際上應該是在英國而不是美國。在訓練階段，模型可能可以通過表層的相關性減少損失，而沒有關注選擇的實體。因此，在推理階段，模型可能會產生錯誤的預測。

在這篇文章中，我們從因果推理的角度來看待邏輯表到文字的生成，並提出了一個解混雜的變分編碼器-解碼器（DCVED），首先，給定表格-句子對\((x, y)\)，我們假設混淆因子\(Z_c\)存在於一個不可觀測的空間，並且產生了表層的相關性（比如“美國”和“英國”）。我們基於變分推斷來評估潛在空間的\(Z_c\)，並且使用皮埃爾的do運算來學習目標\(p(y|do(x))\)，而不是\(p(y|x)\)。然後，我們提出了一個後向預測的流程來確保潛在混淆因子\(Z_c\)可以預測沒有使用的實體但是卻恰好與選擇的實體語法相似。我們也考慮將選擇的實體作為我們混淆結構模型的中介。最後，因為我們變分模型可以生成多種備選句子，我們訓練了一個表格-文字選擇器來尋找針對表格的最佳文字。一系列的擴充套件實驗說明我們的模型在兩個邏輯表到文字的資料集上的邏輯保真度達到了新的SOTA效果。

我們這篇工作的主要貢獻如下：

我們提出使用變分推斷來評估潛在空間的混淆因子，並且讓黑箱預測的潛在變數變得有意義。
我們提出了一個生成然後選擇的正規化，它聯合地考慮淺層和邏輯層面的保真度，可以看作是強化學習的一種替代方法。
實驗說明了我們的模型無論是否預訓練，都在兩個邏輯表格-文字的資料集上得到了SOTA的效果。

背景

在介紹我們的模型之前，我們簡要的介紹一下VAE，這是一個生成模型，可以從一個連續空間生成高維的樣例。在概率模型框架中，資料\(x\)的概率可以這樣計算：

\[p(x) = \int p(x, z) dz = \int p(z)p(x|z) dz \] 一個人沒有夢想，和鹹魚有什麼區別！

De-Confounded Variational Encoder-Decoder for LogicalTable-to-Text Generation

原文地址介紹資料到文字的生成方法指的是從非文字的輸入中生成描述性文字的任務。輸入種類不同，任務可以定義地更加明確，比如摘要資訊生成文字，資訊框生成文字，圖生成文字。

DART: Open-Domain Structured Data Record to Text Generation 翻譯

原文連結介紹從結構化資料中自動生成文字描述提高了知識庫對普通使用者的可訪問性。這些應用包括向非專家解釋資料記錄，撰寫體育新聞，總結多個文件中的資訊，並生成對話迴應。

論文閱讀筆記：《SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation》

【Bug解決】yum提示Another app is currently holding the yum lock； waiting for it to exit...

技術標籤：Bug解決dockerlinuxcentos 問題描述：今天想在虛擬機器上重新安裝docker 然後使用到yum命令報錯：

[Linux/CENTOS]YUM提示: Another app is currently holding the yum lock; waiting for it to exit...

1 問題描述使用yum安裝Nginx的安裝依賴元件： yum -y install gcc gcc-c++ automake autoconf libtool make

從Encoder-Decoder模型入手，探索語境偏移解決之道

摘要：在本文中，我們展示了CLAS，一個全神經網路組成，端到端的上下文ASR模型，通過對映所有的上下文短語，來融合上下文資訊。在實驗評估中，我們發現提出的CLAS模型超過了標準的shallow fusion偏置方法。

Delphi 系統[9]關鍵字和保留字 for、to、downto、do、while、repeat、until

Delphi 系統[9]關鍵字和保留字 for、to、downto、do、while、repeat、until 1、定義： for..to（或downto）do組合使用，構成for迴圈語句。

Flume 問題 org.apache.flume.ChannelFullException: Space for commit to queue couldn't be acquired. Unable to deliver event. Exception follows

參考連結：https://chengyanan.blog.csdn.net/article/details/108510878?utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-3.no_search_link&depth_1-utm_source=distribut

理解Encoder-Decoder 和 Seq2Seq的關係

本問參考自原文連線 1 什麼是 Encoder-Decoder ？ Encoder-Decoder 模型主要是 NLP 領域裡的概念。它並不特值某種具體的演算法，而是一類演算法的統稱。Encoder-Decoder 算是一個通用的框架，在這個框架下可以使用不

【684】關於encoder-decoder網路 - 特徵融合

深度特徵融合---高低層（多尺度）特徵融合 U-Net中的skip connection 在很多工作中，融合不同尺度的特徵是提高分割效能的一個重要手段。低層特徵解析度更高（low-level information），包含更多位置、細節資訊，但

boost::bind 不能處理函式過載 (error: no matching function for call to 'bind')

前言最近任務多、工期緊，沒有時間更新部落格，就水一期吧。雖然是水，也不能太失水準，剛好最近工作中遇到一個 boost::bind 的問題，花費了半天時間來定位解決，就說說它吧。

關於表格的文字生成：Table-to-Text

我研究了3個例子：北京大學的wiki2bio、谷歌的ToTTo、微軟的WIKITABLETEXT 北京大學的wiki2bio

DDRG翻譯.Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection

摘要由於場景文字的多樣性和複雜性，任意形狀文字檢測是一項具有挑戰性的任務。在本文中，我們提出了一種新穎的統一關係推理圖網路用於任意形狀的文字檢測。在我們的方法中，一個獨創的區域性圖構建了文字

ERROR 1118 (42000): Row size too large (＞ 8126). Changing some columns to TEXT or BLOB may help. In

技術標籤：筆記 ERROR 1118 (42000): Row size too large (> 8126). Changing some columns to TEXT or BLOB may help. In current row format, BLOB prefix of 0 bytes is stored inline.解決方案：進入mya

各大廠的語音識別Speech To Text API使用體驗

最近發現有聲讀物能極大促進我的睡眠，但每個前面都有一段開場語，想把它剪掉，但是有多個開場語，所以就要用到語音識別判斷一下再剪。

mysqldump: Got error: 1044: Access denied for user 'root'@'%' to database 'hhh' when using LOCK TABLES

錯誤原因：mysqldump 命令執行時，需要四種許可權，分別是：select,show view,trigger,lock table。但是因為沒有lock table的許可權，導致上述錯誤發生。

報錯--->java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near 'delect from testd

報錯--->java.sql.SQLSyntaxErrorException: You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for the right syntax to use near \'delect from testdb.

kubernetes：關於建立pod中結點始終處於creating狀態的問題解決（Error syncing pod, skipping: failed to "StartContainer" for "POD" with ErrImagePull: "image pull failed for registry.access.redhat.com

通過以下程式碼獲得certificates，注意，必須對於master結點和兩個node結點機器上都需要獲取

Navicat 1142 SELECT command denied to user 'sx'@'xxx' for table 'user'

Navicat 1142 SELECT command denied to user \'sx\'@\'xxx\' for table \'user\' 使用Navicat使用sx使用者連線資料庫時或者連線為使用者sx開放的資料庫travel_agency時，Navicat視窗彈出上述問題

NHibernate.HibernateException:“Unable to locate persister for the entity named 'Domain.Entity.LeaseUser'. - The mapping for 'Domain.Entity.LeaseUser' was not added to the NHibernate co

在使用NHiberanter，建立一個session上下文，進行語句執行時，出現了標題所示錯誤。控制檯呼叫程式碼如下：

De-Confounded Variational Encoder-Decoder for LogicalTable-to-Text Generation

介紹

背景

相關推薦