Ai challenger 2017 image caption小結

阿新 • • 發佈：2017-12-23

oss 提升適合 pytorch 改進 ack https 修改 bottom

參加了今年的ai challenger 的image caption比賽，最終很幸運的獲得了第二名。這裏小結一下。

技術分享圖片

Pytorch 越來越火了。。前五名有三個pytoch，兩個tensorflow 關於哪個learning frame work 更適合圖像nlp相關的應用我覺得用戶用腳投票使用程度說明一切。
最佳的caption利器當屬微軟的
Bottom-Up and Top-Down Attention for Image Captioning and Visual Question Answering
? ?
來自 <https://arxiv.org/abs/1707.07998>

前五名除了我都使用這個思路，因此我的單模型效果(show attention and tell)是相對最差的。。
強化學習非常重要
其它選手都通過強化學習大大提升了客觀分數，但是僅僅優化類似cider這樣的指標的強化學習可能會使得句子通順度弱於優化cross entropy可能是這個原因我的主觀流暢性打分最高..
調參和一些細節是至關重要的
1. 比如lstm hidden size 大部分選手可能使用512 而有的選手使用2048 提升明顯
我使用light gbm 進行gbdt rerank將cider提升了10個點這裏為 lightgbm 打

call， 194w樣本，52維特征，5交叉驗證regression 只需要3分鐘， lamdamart 排序只需要5分鐘。
這裏開源了本次比賽我使用的代碼，歡迎contribute，特別是對強化學習的修改及改進，很遺憾盡管我也實現了scst但是沒有達到理想效果幾個指標只有meteor提升，其余指標下降。

https://github.com/chenghuige/image-caption-ai-challenger2017

? ?

技術分享圖片

? ?

Ai challenger 2017 image caption小結

oss 提升適合 pytorch 改進 ack https 修改 bottom 參加了今年的ai challenger 的image caption比賽，最終很幸運的獲得了第二名。這裏小結一下。 Pytorch 越來越火了。。前五名有三個pytoch

【小白學AI】影象標註Image Caption

Image Caption - im2txt 踩過的坑學習Image Caption的同學在開始實踐專案時，可以在github上找到一大堆不同的Image Caption Project，有很多專案也都對應的有其實現版本的論文，都很好。但是有一點不太好

image caption項目調研及實踐

one challenge 比較相同版本實現維數安裝方法 mach image caption, 或者說叫image story teller，就是用一句話把一張圖片的內容描述出來。比較先進的是以下這篇論文所描述的方法： Vinyals, Oriol, et a

2017年informix小結

性能分析 dba informix 資深 2017年informix小結，相關內容已經脫敏，需要腳本源碼，請和我聯系。# w01 - OS基本信息及負載情況IBM Informix Dynamic Server Version 11.50.FC9W3 -- On-Line -- Up 5

2017國賽小結

高職信息安全比賽5月17日，福州平潭島，在這裏經歷了自我作為帶隊老師以來，團隊成績最差、隊員發揮最渣的一次比賽。比賽成績是三等獎倒數第二名，由於裁判組並未公布具體分數，我估計我們的分數大概在380分左右，其中第一階段230左右，第二階段150左右，第三階段0分，每個階段全面失利，比預想的要差好多。第一階段

2017.10 有感而發(小結)

不用能夠還要走了嵌入式產品學習技術人意願幸福　　2017-10-02 一年一度的國慶節，今年由於某些原因，沒有回家，看來要等到過年才回家了。這樣就一整年沒有回老家了。也不知道父母心裏的真實想法是怎麽想的。說是太麻煩就不用回來了，我也順水推舟的說，那我就不

2017 CCPC Final小結 By JSB @ Reconquista

不出打表美好 ffi 普通分析 oca 沒有 case Statistics TYPE: Onsite Contest NAME: 2017 - CCPC - Final PLAT: pc^2 TIME: 2017/12/03 09:00-14:00 LOCA: H

人工智能 | 解讀斯坦福大學《AI Index 2017年度報告》（一）

技術指數狀況 log 報告對話發布動態學術 AI Index（直譯：人工智能指數）是一個追蹤 AI 動態和進展非營利性的項目，由斯坦福大學創立，是“斯坦福的100年人工智能學習歷程”項目之一，旨在研究過去百年來的 AI 總體狀況，目標是促進基於數據的 AI 的

自適應註意力機制在Image Caption中的應用

bcd 情報 cpc gpl ice ive 放大 pcf contex 在碎片化閱讀充斥眼球的時代，越來越少的人會去關註每篇論文背後的探索和思考。在這個欄目裏，你會快速 get 每篇精選論文的亮點和痛點，時刻緊跟 AI 前沿成果。點擊本文底部的「閱讀原文」即刻

對Image caption的一些理解(看圖說話)

1. 背景在計算機視覺中，影象分類和目標檢測任務是比較成熟的領域，已經應用到實際的產品領域。而“看圖說話”要實現的功能是，給定一張影象，計算機能告訴我們圖片的內容，顯然，這會使一個比較複雜的任務，因為它涉及到了如下的子任務： 1）檢測影象中的目標； 2）目標的屬性，比如

CVPR 2017部分論文小結

語義分割與物體識別 One-Shot Video Object Segmentation 本文處理了視訊物體分割的問題。本文提出模型OSVOS，利用第一幀標註的圖片來實現整個視訊序列中該物體的分割。所有幀都均為獨立處理，但結果卻很穩定連貫，並達到state-of-the-art。

AI資訊--2017年資訊彙總

九個研究方向持續學習（Continual learning）可解讀的決策（Explainable decisions）安全飛地（Secure enclaves）對抗學習（Adversarial learning）在保密資料上共享學習（Shared

Image Caption（三）一些補充

構建LSTM模型： #定義一個LSTM_cell lstm_cell = rnn.BasicLSTMCell( hidden_size, forget_bias = 1.0,

Image Caption（一）論文及理解

準備開始讀一下Image Caption，先記錄一下對論文的理解，一些公式沒有記錄下來，在論文中可查。目錄 1.Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Transla

image caption筆記（四）：Image Captioning with Semantic Attention

文章來自cvpr2016 image caption常見的方法包括top-down和bottom-up。Top-down直接做影象到文字的端到端學習，而bottom-up先抽取出一些關鍵詞，

image caption筆記（三）：《Show, Attend and Tell_Neural Image Caption》

一、基本思想文章在NIC的基礎上加入了attention機制二、模型結構對LSTM部分做出的改動，其餘與NIC相同。 &nbs

Image Caption論文合輯2

Guiding Long-Short Term Memory for Image Caption Generation (ICCV 2015) From Captions to Visual Concepts and Back (CVPR 2015) &nb

image caption解讀系列（二）：《Knowing When to Look: Adaptive Attention via A Visual Sentinel for Image Capt》

本文主要是在這篇部落格的基礎上結合程式碼進行分析。文章依然採用了encoder-decoder的框架。作者認為decoder的時候非視覺詞多依賴的是語義資訊而不是視覺資訊。而且，在生成caption的過程中，非視覺詞的梯度會誤導或者降低視覺資訊的有效性。因此，本文提出

image caption解讀系列（二）：《Show, Attend and Tell_Neural Image Caption》

一、相關工作二、基本思想文章在NIC的基礎上加入了attention機制三、模型結構對LSTM部分做出的改動，其餘與NIC相同。四、程式碼分析 (0)預處理首先是把資料中長度大於2

Image Caption任務綜述

　引言　　Image Caption是一個融合計算機視覺、自然語言處理和機器學習的綜合問題，它類似於翻譯一副圖片為一段描述文字。該任務對於人類來說非常容易，但是對於機器卻非常具有挑戰性，它不僅需要利用模型去理解圖片的內容並且還需要用自然語言去表達它們之間的

Ai challenger 2017 image caption小結

相關推薦