Discriminative Information Retrieval for Question Answering Sentence Selection論文筆記

阿新 • • 發佈：2018-12-21

原文下載地址

摘要

該演算法提出場景：text-based QA，即給定一段文字說明，提出問題，從文字說明中找出相應答案作答。

text-based QA演算法的主要步驟包含三個：1）獲取可能包含答案的段落；2)候選段落的重排；3）提取資訊選擇答案

本文的演算法主要是解決第一個步驟

演算法

演算法主要框架：

預處理：將文字說明切成一句一句，每句都作為第一步的候選集，設

，假設query為q,得分函式為F(q,p)，IR系統（即上述三個步驟的第一步）的目標是檢索出前k個p，目標函式為：

（1）

設為query q的特徵，為候選集p的特徵，是由和合成的(query, candidate)對的特徵：

（2）

訓練權重向量，使得優化目標為：，轉為：（3），這樣相當於將query q提取特徵後，先進行query expansion再採用點積與獲選集計算相似度得分。下邊將如何提取特徵

特徵

特徵向量f中的一個項表示為“（KEY = value，weight）”，並且特徵向量可以被視為一組這樣的元組，寫f（KEY = value）= weight表示特徵作為關聯陣列的關鍵，θX是訓練模型中特徵X的權重θ。

1.問題特徵

:問題詞，如問題是how many，則（QWORD=how many, 1）新增到特徵向量中；

：詞彙答案型別（LAT），如果query有問題詞：“what”或“which”這個問題的LAT被定義為問題詞之後的第一個名詞短語（NP）。例如，“What is the city of brotherly love?”，該元組為（LAT = city，1）

：所有的命名實體，如：(NE-PERSON=Margaret Thatcher,1)

：tf-idf ，如

2.段落特徵（即候選句特徵）

：詞袋，段落中任何不同的x都會產生一個特徵

：命名實體型別。如果段落包含人名，則將生成（NETYPE = PERSON，1特徵

特徵向量演算法

1.合成

首先要實現公式2，對任何的query特徵向量fQ（q）= {（ki = vi，wi）}，（wi≤1）和，定義兩個操作：

ki=kj表示ki和kj的值相同。

C定義：

2.對映

定義：，，

則上式公式（3）中的t(theta)(q)得到表達

至此，通過(query, candidate)對進行訓練獲取theta值即可

Discriminative Information Retrieval for Question Answering Sentence Selection論文筆記

原文下載地址摘要該演算法提出場景：text-based QA，即給定一段文字說明，提出問題，從文字說明中找出相應答案作答。 text-based QA演算法的主要步驟包含三個：1）獲取可能包含答案的段落；2)候選段落的重排；3）提取資訊選擇答案本文的演算法主要是解決第一個步驟

論文閱讀 | Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction

Multi-Cast Attention Networks for Retrieval-based Question Answering and Response Prediction （KDD 2018） 1.主要特點：通常，一個句子應用一次attention，然後學習最終表

《A Discriminative Feature Learning Approach for Deep Face Recognition》論文筆記

1. 論文思想在這篇文章中尉人臉識別提出了一種損失函式，叫做center loss，在網路中加入該損失函式之後可以使得網路學習每類特徵的中心，懲罰每類的特徵與中心之間的距離。並且該損失函式是可訓練的，並且在CNN中容易優化。那麼，將center loss與softmax相結合會增加

《Learning both Weights and Connections for Efficient Neural Networks》論文筆記

1. 論文思想深度神經網路在計算與儲存上都是密集的，這就妨礙了其在嵌入式裝置上的運用。為了解決該問題，便需要對模型進行剪枝。在本文中按照網路量級的排序，使得通過只學習重要的網路連線在不影響精度的情況下減少儲存與計算量。論文中的方法分為三步：首先，使用常規方法訓練模型；使用剪枝策略進

Semantic Parsing on Freebase from Question-Answer Pairs【論文筆記】

參考：https://zhuanlan.zhihu.com/p/25759682 原文：https://cs.stanford.edu/~pliang/papers/freebase-emnlp2013.pdf 一、摘要作者訓練了一個可擴充套件到Freebase的語義解析器，由於

CVPR 2018 MCCT:《Multi-Cue Correlation Filters for Roubust Visual Tracking》論文筆記

理解出錯之處望不吝指正。本文模型叫MCCT，使用多個獨立的基於DCF的expert進行跟蹤，在每一幀中選擇當前最優的expert，將其結果作為當前幀的跟蹤結果。文中使用了7個expert，每個expert使用不同的特徵。針對某一幀，

FaceNet: A Unified Embedding for Face Recognition and Clustering 論文筆記

0 摘要儘管有一些研究已經在人臉識別領域取得了重大進展，但大規模地實施人臉驗證和識別仍然是一個嚴峻的挑戰。在本文中，我們提出了FaceNet，它可以將人臉影象對映到歐幾里得空間（人臉影象->空間向量），兩個空間向量之間的距離代表了兩張人臉

ECO: Efficient Convolution Operators for Tracking視訊目標跟蹤論文筆記（PPT版）

論文標題：ECO: Efficient Convolution Operators for Tracking 作者：Martin Danelljan 等發表會議：CVPR 2017（目前的狀態為已

Reading notes 《A survey on question answering technology from an information retrival perspective》

語料庫 aud 解析 nal rspec -o log notes alua concise adj 簡潔的 audio fragment 音頻片段 revivial n 復興 condense v.壓縮; 精簡;（使）冷凝;（使）凝結; formulation n 公式

Exploring Models and Data for Image Question Answering 論文翻譯

這項工作旨在解決基於影象的問答（QA）與新模型和資料集的問題。在我們的工作中，我們建議使用神經網路和視覺語義嵌入，而不需要諸如物件檢測和影象分割之類的中間階段來預測關於影象的簡單問題的答案。我們的模型比現有影象質量保證資料集上的唯一公佈結果好1.8倍。我們還提出了一種問題生成演算法，該演算法將

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記】

Information Extraction over Structured Data:Question Answering with Freebase 一、摘要

Learning to Rank for Information Retrieval

Learning to Rank for Information Retrieval(LETOR) 是Microsoft的一個資訊檢索相關度排序的資料集，有 Supervised ranking Semi-supervised ranking Rank aggregation Lis

論文解讀：A Focused Dynamic Attention Model for Visual Question Answering

這是關於VQA問題的第四篇系列文章。本篇文章將介紹論文：主要思想；模型方法；主要貢獻。有興趣可以檢視原文：A Focused Dynamic Attention Model for Visual Question Answering。 1，主要思想： Focused Dynami

論文解讀：Stacked Attention Networks for Image Question Answering

這是關於VQA問題的第二篇系列文章，這篇文章在vqa領域是一篇比較有影響的文章。本篇文章將介紹論文：主要思想；模型方法；主要貢獻。有興趣可以檢視原文：Stacked Attention Networks for Image Question Answering。原論文中附有作者原始碼。

論文解讀：Where To Look: Focus Regions for Visual Question Answering

可能要很久時間開始關注vqa問題，vqa問題就是影象的問答問題，即對影象提問，併產生答案。關於影象問答綜述性文章推薦：Visual Question Answering: Datasets, Algorithms, and Future Challenges。今天開始可能要跟大家分析關於

論文筆記 Learning Visual Knowledge Memory Networks for Visual Question Answering （CVPR2018)

這篇文章的一個出發點也是希望VQA裡面的視覺內容與人的結構化知識相聯絡起來，提出了一種visual knowledge memory network (VKMN)來將結構化知識與視覺特徵融合進端對端的學習框架。在經典VQA 資料集VQA v1.0與v2.0上在與知識推理相關的問題

論文筆記 Multiomdal Learning and Reasoning for Visual Question Answering (NIPS 2017)

文章的主要貢獻點如下：值得學習的是，文章的寫作挺好的。文章的一個主要思想就是modular neural network，通過學習關於question與image的多模態(multimodal)與多方面(multifaceted)的表徵，在VQA1.與VQA2.0上取得不錯效果。

論文筆記：IRGAN：A Minimax Game for Unifying Generative and Discriminative Information

2017 SIGIR 簡單介紹 IRGAN將GAN用在資訊檢索（Information Retrieval）領域，通過GAN的思想將生成檢索模型和判別檢索模型統一起來，對於生成器採用了基於策略梯度的強化學習來訓練，在三種典型的IR任務上（四個資料集）得到了更顯著的效果。生成式和判別式的檢索模型生成式檢索模

視覺場景理解論文閱讀筆記:Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering

一、文章相關資料3.發表時間:2018二、閱讀筆記1.論文思想文章提出一種自上而下與自下而上相結合的注意力模型方法，應用於視覺場景理解和視覺問答系統的相關問題。其中基於自下而上的關注模型（一般使用Faster R-CNN）用於提取影象中的興趣區域，獲取物件特徵

【論文閱讀筆記】Embedding Electronic Health Records for Clinical Information Retrieval

本文是2018.11.13釋出於Arxiv上的一篇文章，作者Xing Wei, MSc1, Carsten Eickhoff, PhD。本文提出一種醫學資訊檢索的方法。由於醫學資訊檢索的標記資料

Discriminative Information Retrieval for Question Answering Sentence Selection論文筆記

摘要

演算法

特徵

1.問題特徵

2.段落特徵（即候選句特徵）

特徵向量演算法

1.合成

2.對映

相關推薦