1. 程式人生 > >【論文筆記】Text-Recognition_簡略版_201606

【論文筆記】Text-Recognition_簡略版_201606

【1】Shi B, Wang X, Lv P, et al. Robust Scene Text Recognition with Automatic Rectification[J]. arXiv preprint arXiv:1603.03915, 2016.

framework

上圖即為本篇論文的系統框架:包括 Spatial Transformer Network (STN ) 以及 Sequence Recognition Network (SRN ) 兩個網路結構。其中, STN 通過 Thin-Plate-Spline 變換,能夠將透射變換或者彎曲的文字圖片對齊到一個正規的、更易讀的圖片;SRN 能夠直接將輸入的文字圖片識別為一個文字序列。

這個系統是一個端到端的文字識別系統,在訓練過程中也不需要額外標記字串的關鍵點、字元位置等。同時,由於 STNSRN 這兩個網路的共同作用,該系統在自然場景的文字識別方面取得了 state-of-the-art 的結果,特別是對於那些有著各種形變的字元圖片。