keras 2.x python3看圖說話模型一步一步的搭建
阿新 • • 發佈:2018-12-22
outline
感想
我最近找到了一篇比較好的看圖說話模型的入門教程,地址為:https://fairyonice.github.io/Develop_an_image_captioning_deep_learning_model_using_Flickr_8K_data.html
原文是python2.7的,我這裡改成了python3.x的,如果你使用的是python3,參考我的就行了,原論文用python3來寫有錯誤。
然後這篇部落格提供了很多樣例,並且做了很多視覺化,一步一步跟著jupyter的來,相信讀者就能理解模型的全過程。
說明
我這裡直接嵌入了jupyter notebook,如果讀者看不見jupyter,請看瀏覽器是否攔截,這裡給出chrome解除攔截的方法:
圖片源於:https://blog.csdn.net/nima1994/article/details/79630087
dataset
用的資料集是Flickr_8k,只有1GB多,比COCO小得多,很適合寫看圖說話模型的教程,下載地址為:
Flickr8k:https://forms.illinois.edu/sec/1713398
jupyter
reference
Python3中dict.keys()轉換成list型別
TyperError with prepro.py, "float() argument must be a string or number, not ‘map’ "
DataFrame排序sort的問題
jupyter notebook載入到csdn裡