【論文筆記-Stereo】Pyramid Stereo Matching Network

阿新 • • 發佈：2019-01-07

論文思想

使用ResNet提取特徵
用dilated convolution增大感受野
用Pyramid pooling module，提取各個scale的特徵，使之包含global的context資訊
用feature volume shift構建volume
用stacked hourglass 3D CNN（encoder-decoder）來處理cost volume，在訓練過程中使用不同層級的hourglass的輸出算加權loss
end-to-end stereo estimation
在KITTI上取得了當時最好的結果

筆記

結構

architecture

cost_volume

disparity_learning

這裡寫圖片描述

視差計算（迴歸方法）

DIsparity regression

d_{p r e d} = \sum_{i}^{d_{m a x}} d_{i} * σ (d_{i})

與MC_CNN，Content-CNN不同，此時的d是連續值。

損失函式

smooth_l1_loss, 在目標檢測中常被使用，對outlier的魯棒性更強。（outlier容易造成梯度爆炸，把MSE>1的部分改為l1,梯度由（x-t）變為+-1）

【論文筆記-Stereo】Pyramid Stereo Matching Network

論文思想使用ResNet提取特徵用dilated convolution增大感受野用Pyramid pooling module，提取各個scale的特徵，使之包含global的context資訊用feature volume shift構

【論文筆記1】RNN在影象壓縮領域的運用——Variable Rate Image Compression with Recurrent Neural Networks

一、引言隨著網際網路的發展，網路圖片的數量越來越多，而使用者對網頁載入的速度要求越來越高。為了滿足使用者對網頁載入快速性、舒適性的服務需求，如何將影象以更低的位元組數儲存（儲存空間的節省意味著更快的傳輸速度）並給使用者一個低解析度的thumbnails（縮圖）的previ

【論文筆記2】影象壓縮神經網路在Kodak資料集上首次超越JPEG——Full Resolution Image Compression with Recurrent Neural Networks

一、引言這篇論文提出了一種基於神經網路的全解析度的有損影象壓縮方法，在變壓縮比的情況下無需重複訓練，所以說整個網路只需要訓練一次。論文的內容主要包括如下三個部分：（1）提出了三種影象壓縮框架，分別是基於LSTM的RNN網路、基於關聯LSTM（associative

【論文筆記02】Text Understanding with the Attention Sum Reader Network

1 問題及資料集 1.1 問題給定較長一段話的context和一個較短的問題，以及一些candidate answers，訓練出可以準確預測正確答案的模型，本模型主要針對命名實體和常用名詞這兩種詞性的單詞進行填空。 1.2資料集（1）CNN&Dail

【論文筆記07】End-To-End Memory Networks

1 背景（1）在記憶網路中，主要由4個模組組成：I、G、O、R，前面也提到I和G模組其實並沒有進行多複雜的操作，只是將原始文字進行向量表示後直接儲存在記憶槽中。而主要工作集中在O和R模組，O用來選擇與問題相關的記憶，R用來回答，而這兩部分都需要監督，也就是需要

【論文筆記09】Teaching Machines to Read and Comprehend

本文主要做出了兩個大的貢獻：給出了閱讀理解資料集的構造方法，並開源了兩個閱讀理解資料集；提出了三種神經網路模型作為baseline，以方便後面的研究者進行相關的研究。 1 資料構造主要是從新聞網站中抓取新聞作為文章，新聞的摘要去掉一個實體詞成為quer

【論文筆記4】深入理解行人重識別網路的Loss

打完天池比賽後，可能由於長時間的持續輸出，精神上有些疲憊感，於是選擇去幹一些不是很費腦力的活兒，比如繼續充充電，看些論文補充一些理論知識。這兩天看了幾篇羅老師部落格裡總結的Person Re-Identification這塊的論文，包括羅老師自己發的兩篇論文。幾篇論文中都用到

【論文筆記系列】AutoML：A Survey of State-of-the-art （上）

之前已經發過一篇文章來介紹我寫的AutoML綜述，最近把文章內容做了更新，所以這篇稍微細緻地介紹一下。由於篇幅有限，下面介紹的方法中涉及到的細節感興趣的可以移步到論文中檢視。論文地址：https://arxiv.org/abs/1908.00709 1. Introduction 以往的模型都是靠大佬們

【論文筆記】T Test

nor thum pan n-1 統計學 for nes 其它 align 用來算兩組數的差別大小只要是一種叫做p-value的就是說假如你測定一個實驗的p-value是5%也就是說你有95%的信心確定這個實驗它是正確的在正規的實驗裏只有當p-value小於5%的時候

Reading Wikipedia to Answer Open-Domain Questions【論文筆記】

一、摘要這篇文章主要是介紹使用維基百科作為唯一的知識庫來解決開放域問答。大規模機器閱讀任務的主要挑戰是文件檢索（查詢相關文章）和機器閱讀理解（從文章中確定答案片段）。作者的方法將基於bigram hashing 和TF-IDF匹配的搜尋元件與經過訓練以檢測維基百科段落中的答案的多層

Semantic Parsing via Staged Query Graph Generation: Question Answering with Knowledge Base【論文筆記】

一、摘要我們對知識庫問答提出一個新穎的語義解析框架。我們定義了一個類似於知識庫子圖的查詢圖，可以直接對映為邏輯形式。語義解析被簡化為查詢圖生成，被表述為分階段搜尋問題。與傳統方法不同，我們的方法在早期就利用知識庫來修剪搜尋空間，從而簡化語義匹配問題。通過應用實體鏈指系統和深度卷

Question Answering over Freebase with Multi-Column Convolutional Neural Networks【論文筆記】

一、概要通過知識庫回答自然語言問題是一個重要的具有挑戰性的任務。大多數目前的系統依賴於手工特徵和規則。本篇論文，我們介紹了MCCNNs，從三個不同層面（答案路徑，答案型別，答案上下文）來理解問題。同時，在知識庫中我們共同學習實體和關係的低維詞向量。問答對用於訓練模型以對候選答案

Context-Aware Basic Level Concepts Detection in Folksonomies【論文筆記】

一、概要這篇論文討論了在 folksonomies中探索隱含語義的問題。在 folksonomies中，使用者建立和管理標籤來標註web資源。使用者建立的標籤的集合是潛在的語義資源。做了大量研究來抽取概念，甚至概念層次 (本體)，這是知識表示的重要組成部分。沒有用於發現人類可接受和令人滿意

Question Answering with Subgraph Embeddings【論文筆記】

一、摘要這篇論文提出一個系統，在大範圍主題的知識庫中，學習使用較少的手工特徵來回答問題。我們的模型學習單詞和知識庫組成的低維詞向量。這些表示用於根據候選答案對自然語言問題打分。使用成對的問題和對應答案的結構化表示，和成對的問題釋義來訓練系統，在最近的文獻基準中產生有競爭力的結果。 &n

Information Extraction over Structured Data: Question Answering with Freebase【論文筆記】

Information Extraction over Structured Data:Question Answering with Freebase 一、摘要

Semantic Parsing on Freebase from Question-Answer Pairs【論文筆記】

參考：https://zhuanlan.zhihu.com/p/25759682 原文：https://cs.stanford.edu/~pliang/papers/freebase-emnlp2013.pdf 一、摘要作者訓練了一個可擴充套件到Freebase的語義解析器，由於

vggface2人臉識別資料集【論文筆記】VGGFace2——一個能夠用於識別不同姿態和年齡人臉的資料集

原【論文筆記】VGGFace2——一個能夠用於識別不同姿態和年齡人臉的資料集 2018年01月10日 14:53:31 有來有去-CV 閱讀數：6701

【論文筆記】使用多流密集網路的密度感知單影象去雨

使用多流密集網路的密度感知單影象去雨《Density-aware Single Image De-reaining using a Multi-stream Dense Network》 0 概要這裡提出一種密度感知多路稠密連線神經網路演算法，DID-MDN，來雨量

【論文筆記】用形狀做擋風玻璃上的雨滴檢測《Detection Of Raindrop With Various Shapes On A Windshield》

《Detection of Raindrop with Various Shapes on a Windshield》 1 介紹 2 雨滴檢測方法在白天和夜晚使用不同的演算法。通過整幅影象的強度水平判斷是白天還是夜晚。 2.1 白天的雨滴檢測方法這個方法假設

【論文筆記】光流在視訊行為識別中的作用

0. 引言在做視訊行為識別時，特別是基於two-stream框架時，常常會引入光流圖作為雙流網路其中一支的輸入。這是很常用，且在各資料集上已被證明有效的做法。但是，關於光流在行為識別中到底起到了什麼作用其實並沒有明確的研究。通常我們認為光流代表了視訊的m

【論文筆記-Stereo】Pyramid Stereo Matching Network

論文思想

筆記

結構

視差計算（迴歸方法）

損失函式

相關推薦