SegNet-論文筆記-理解

阿新 • • 發佈：2019-01-09

核心技術:
總體結構:
這裡寫圖片描述
感覺其實和FCN思路十分相似,只是Encoder,Decoder(Upsampling)使用的技術不一致.此外SegNet的編碼器部分使用的是VGG16的前13層卷積網路,每個編碼器層都對應一個解碼器層,最終解碼器的輸出被送入soft-max分類器以獨立的為每個畫素產生類概率.
每個編碼器由數個藍色層(卷積層,批歸一化層,RELU層)以及一個Pooling層(2x2視窗,步進2,最大池化)組成,輸出相當於係數為2的下采樣.由於最大池化和子取樣的疊加，導致邊界細節損失增大，因此必須在編碼特徵圖中在sub-sampling之前捕獲和儲存邊界資訊.為了高效，文中只儲存了max-pooling indices.

突出貢獻:
分割的精度略好於FCN,總體效率也比FCN略高,

SegNet-論文筆記-理解

核心技術: 總體結構: 感覺其實和FCN思路十分相似,只是Encoder,Decoder(Upsampling)使用的技術不一致.此外SegNet的編碼器部分使用的是VGG16的

《Deformable Convolutional Networks》論文簡單理解筆記

作者：起名什麼的最煩啦連結：https://zhuanlan.zhihu.com/p/27965213 來源：知乎著作權歸作者所有。商業轉載請聯絡作者獲得授權，非商業轉載請註明出處。 CNN由於固定的幾何結構，導致對幾何形變的建模受到限制。為了解決或減輕這個問題，這篇論文的工作

【ICCV 2017論文筆記】我們應當如何理解視訊中的人類行為？

搬運自我的知乎專欄：https://zhuanlan.zhihu.com/wzmsltw 。歡迎大家關注。最近ICCV 2017公佈了論文錄用的情況，我照例掃了一遍論文列表尋找感興趣的文章。“What Actions are Needed for Understa

【論文筆記4】深入理解行人重識別網路的Loss

打完天池比賽後，可能由於長時間的持續輸出，精神上有些疲憊感，於是選擇去幹一些不是很費腦力的活兒，比如繼續充充電，看些論文補充一些理論知識。這兩天看了幾篇羅老師部落格裡總結的Person Re-Identification這塊的論文，包括羅老師自己發的兩篇論文。幾篇論文中都用到

論文筆記：目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

exploit orm dom ons tail red 最好早期形式化基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一

論文筆記之 SST: Single-Stream Temporal Action Proposals

ron 我們裁剪只需要 lock proposal 數據 function 性能 SST: Single-Stream Temporal Action Proposals 2017-06-11 14:28:00 　　本文提出一種時間維度上的 proposal

Selective Search for Object Recognition 論文筆記【圖片目標分割】

line 單個介紹 images 分層什麽但是如果抽樣這篇筆記，僅僅是對選擇性算法介紹一下原理性知識，不對公式進行推倒. 前言：這篇論文介紹的是，如果快速的找到的可能是物體目標的區域，不像使用傳統的滑動窗口來暴力進行區域識別.這裏是使用算法從多個維度對找

Deep Learning論文筆記之（二）Sparse Filtering稀疏濾波

structure 分布的確 tlab bolt 期望有一個尋找 mean Deep Learning論文筆記之（二）Sparse Filtering稀疏濾波自己平時看了一些論文，但老感覺看完過後就會慢慢的淡忘，某一天重新拾起來的時候又好像沒有

Semi-supervised Segmentation of Optic Cup in Retinal Fundus Images Using Variational Autoencoder 論文筆記

str 很好流程 Coding 測試 eat www tin nal MICCAI 2017年論文 Overview：視杯視盤精確分割後，就可以計算杯盤比了，杯盤比是青光眼疾病的主要manifestation。以往的方法往往采用監督學習的方法，這樣需要大量的精確像素

論文筆記之：Collaborative Deep Reinforcement Learning for Joint Object Search

region format es2017 join sid col str bottom respond Collaborative Deep Reinforcement Learning for Joint Object Search CVPR 2017 Motiva

論文筆記-Learning Phrase Representations using RNN Encoder–Decoder for Statistical Machine Translation

mach default rap lin -s rnn alias for wrap 針對機器翻譯，提出 RNN encoder-decoder. encoder與decoder是兩個RNN，它們放在一起進行參數學習，最大化條件似然函數。網絡結構：註意輸入語句與

論文筆記-Sequence to Sequence Learning with Neural Networks

map tran between work down all 9.png ever onf 大體思想和RNN encoder-decoder是一樣的，只是用來LSTM來實現。 paper提到三個important point： 1）encoder和decoder的LSTM

論文筆記-Deep Interest Network for Click-Through Rate Prediction

圖片 res 興趣 log through deep pre 出發 amp 重點：認為不同的廣告會觸發用戶的興趣點不同導致user embedding隨之改變。 DIN網絡結構如下圖右邊 DIN的出發點：認為不同的廣告會觸發用戶的興趣點不同導致user embedd

論文筆記-DeepFM: A Factorization-Machine based Neural Network for CTR Prediction

contain feature 比較 san date res 離散 edi post 針對交叉（高階）特征學習提出的DeepFM是一個end-to-end模型，不需要像wide&deep那樣在wide端人工構造特征。網絡結構： sparse feature

論文筆記-Item2Vec- Neural Item Embedding for Collaborative Filtering

href resource 數據 per con doc 訂單優化 div 將word2vec思想拓展到序列item的2vec方法並運用到推薦系統中，實質上可以認為是一種cf 在word2vec中，doc中的word是具有序列關系的，優化目標類似在max對數似然函數

論文筆記-Neural Machine Translation by Jointly Learning to Align and Translate

tps idt 個人理解 att date eight default con ati 提出attention機制，用於機器翻譯。背景：基於RNN的機器翻譯基本思路是首先對語言x進行編碼encoder，然後解碼decoder為語言y。encoder和decoder可

論文筆記-Wide & Deep Learning for Recommender Systems

wiki body pos ear recommend sys con 損失函數 wrapper 本文提出的W&D是針對rank環節的模型。網絡結構：本文提出的W&D是針對rank環節的模型。網絡結構： wide是簡單的線性模型，但

論文筆記-Personal Recommendation Using Deep Recurrent Neural Networks in NetEase

use clas max onf 一位 url base 輸入 ont 思路：利用RNN對用戶瀏覽順序建模，利用FNN模擬CF，兩個網絡聯合學習 RNN網絡結構：輸出層的state表示用戶瀏覽的某一頁面，可以看做是一個one-hot表示，state0到3是依次瀏覽的

論文筆記-Joint Deep Modeling of Users and Items Using Reviews for Recommendation

一個 solved default view http ati onf 評分分享基本思路：利用用戶和商品的評論構建CNN預測評分。網絡結構： user review網絡與 item review網絡結構一致，僅就前者進行說明從user review tex

【論文筆記】T Test

nor thum pan n-1 統計學 for nes 其它 align 用來算兩組數的差別大小只要是一種叫做p-value的就是說假如你測定一個實驗的p-value是5%也就是說你有95%的信心確定這個實驗它是正確的在正規的實驗裏只有當p-value小於5%的時候