如何用Python和深度神經網路尋找近似圖片？

阿新 • • 發佈：2019-02-02

640?wx_fmt=png&wxfrom=5&wx_lazy=1

給你10萬張圖片，讓你從中找出與某張圖片最為近似的10張，你會怎麼做？不要輕言放棄，也不用一張張瀏覽。使用Python，你也可以輕鬆搞定這個任務。

（由於微信公眾號外部連結的限制，文中的部分連結可能無法正確開啟。如有需要，請點選文末的“閱讀原文”按鈕，訪問可以正常顯示外鏈的版本。）

疑問

《如何用Python和深度神經網路識別影象？》一文寫完後，我收到了不少讀者的反饋。其中一個很普遍的疑問是：

識別相同或相似的影象，有什麼好的方法麼？

我雖然樂於幫助讀者解決問題，但實話實說，一開始不太理解這種需求。

我文章裡的樣例圖片（哆啦a夢和瓦力），都是從網路蒐集來的。如果你需要從網上找到跟某張圖片近似的影象，可以使用Google的“以圖搜圖”功能啊。

0?wx_fmt=jpeg

很快，我突然醒悟過來。

這種需求，往往不是為了從網際網路上大海撈針，尋找近似圖片。而是在一個私有海量圖片集合中，找到近似影象。

這種圖片集合，也許是你團隊的科研資料。例如你研究鳥類。某天瀏覽野外拍攝裝置傳回來的影象時，突然發現一個新奇品種。

0?wx_fmt=png

你於是很想搞清楚這種鳥類的出現時間、生活狀態等。這就需要從大量圖片裡，找到與其近似的圖片（最有可能是拍到了同一種鳥）。

這種圖片集合，也許是社會安全資料。例如你在反恐部門，系統突然發現某個疑似恐怖分子出現在敏感區域。這傢伙每一次現身，都伴隨著惡性刑事案件的發生，給人民群眾的生命財產安全帶來嚴重威脅。

0?wx_fmt=png

這時候無論對其衣著、外貌還是交通工具的相似度搜索，就顯得至關重要了。

上述例子中，因為你都沒有把影象上傳到網際網路，Google的“以圖搜圖”引擎功能再強大，也無能為力。

好吧，解決這個問題，很有意義。

下一個問題自然是：這種需求，解決起來複雜嗎？

是不是需要跨過很高的技術門檻才能實現？是不是需要花大量經費僱傭專家才能完成？

本文，我為你展示如何用10幾行Python程式碼，解決這個問題。

資料

為了講解的方便，我們依然採用《如何用Python和深度神經網路識別影象？》一文中使用過的哆啦a夢和瓦力圖片集合。

我給你準備好了119張哆啦a夢的照片，和80張瓦力的照片。圖片已經上傳到了這個Github專案。

請點選這個連結，下載壓縮包。然後在本地解壓。作為咱們的演示目錄。

解壓後，你會看到目錄下有個image資料夾，其中包含兩個子目錄，分別是doraemon和walle。

0?wx_fmt=jpeg

doraemon的目錄下，都是各式各樣的藍胖子圖片。

0?wx_fmt=jpeg

瓦力目錄下的圖片是這個樣子的：

0?wx_fmt=jpeg

資料已經有了，下面我們來準備一下環境配置。

環境

本文中，我們需要使用到蘋果公司的機器學習框架TuriCreate。

請注意TuriCreate釋出時間不久，目前支援的作業系統列表如下：

0?wx_fmt=jpeg

這就意味著，如果你用的作業系統是Windows 7及以下版本，那麼目前TuriCreate還不支援。如需使用，有兩種辦法：

第一種，請升級到Windows 10，並且使用WSL。關於如何使用WSL，我幫你找到了一箇中文教程。請按照教程一步步完成安裝。

0?wx_fmt=jpeg

第二種，採用虛擬機器。推薦採用Virtualbox虛擬機器，開源免費。同樣地，我也幫你找到了很詳盡的Virtualbox安裝Ubuntu Linux的中文教程。你可以參照它安裝好Linux。

0?wx_fmt=png

解決了系統相容性問題，下面我們在TuriCreate支援的系統中，安裝Python整合執行環境Anaconda。

請到這個網址下載最新版的Anaconda。下拉頁面，找到下載位置。根據你目前使用的系統，網站會自動推薦給你適合的版本下載。我使用的是macOS，下載檔案格式為pkg。

0?wx_fmt=png

下載頁面區左側是Python 3.6版，右側是2.7版。請選擇2.7版本。

雙擊下載後的pkg檔案，根據中文提示一步步安裝即可。

0?wx_fmt=jpeg

裝好Anaconda後，我們安裝TuriCreate。

請到你的“終端”下面，進入咱們剛剛下載解壓後的樣例目錄。

執行以下命令，我們來建立一個Anaconda虛擬環境，名字叫做turi。如果你之前跟隨我在《如何用Python和深度神經網路識別影象？》一文中創立過這個虛擬環境，此處請跳過。

conda create -n turi python=2.7 anaconda

然後，我們啟用turi虛擬環境。

source activate turi

在這個環境中，我們安裝（或者升級到）最新版的TuriCreate。

pip install -U turicreate

安裝完畢後，執行：

jupyter notebook

0?wx_fmt=jpeg

這樣就進入到了Jupyter筆記本環境。我們新建一個Python 2筆記本。

0?wx_fmt=jpeg

瀏覽器裡出現了一個空白筆記本。

0?wx_fmt=jpeg

點選左上角筆記本名稱，修改為有意義的筆記本名“demo-python-image-similarity”。

0?wx_fmt=jpeg

準備工作完畢，下面我們就可以開始編寫程式了。

程式碼

首先，我們讀入TuriCreate軟體包。

import turicreate as tc

我們指定影象所在的資料夾image。讓TuriCreate讀取所有的影象檔案，並且儲存到data資料框。

data  = tc.image_analysis.load_images('./image/')

我們來看看，data資料框的內容：

data

0?wx_fmt=png

data包含兩列資訊，第一列是圖片的地址，第二列是圖片的長寬描述。

下面我們要求TuriCreate給資料框中每一行新增一個行號。這將作為圖片的標記，好在後面查詢圖片時使用。

data = data.add_row_number()

再看看此時的data資料框內容：

data

0?wx_fmt=png

我們來看看資料框裡面的這些資訊對應的圖片。

data.explore()

TuriCreate會彈出一個頁面，給我們展示資料框裡面的內容。

0?wx_fmt=png

把滑鼠懸停在某張縮圖上面，就可以看到對應清晰大圖。

第一張圖片，是哆啦a夢：

0?wx_fmt=png

第二張圖片，是瓦力：

0?wx_fmt=png

下面，是重頭戲。我們讓TuriCreate根據輸入的圖片集合，建立影象相似度判別模型。

model = tc.image_similarity.create(data)

這個語句執行起來，可能需要一些時間。如果你是第一次使用TuriCreate，它可能還需要從網上下載一些資料。請耐心等待。

Resizing images...
Performing feature extraction on resized images...
Completed 199/199

注意這裡的提示，TuriCreate自動幫我們做了圖片尺寸調整等預處理工作，並且對每一張圖片，都做了特徵提取。

經過或長或短的等待，模型已經成功建立。

下面，我們來嘗試給模型一張圖片，讓TuriCreate幫我們從目前的圖片集合裡，挑出最為相似的10張來。

為了方便，我們就選擇第一張圖片作為查詢輸入。

我們利用show()函式展示一下這張圖片。

tc.Image(data[0]['path']).show()

0?wx_fmt=png

確認無誤，還是那張哆啦a夢。

下面我們來查詢，我們讓模型尋找出與這張圖片最相似的10張。

similar_images = model.query(data[0:1], k=10)

很快，系統提示我們，已經找到了。

0?wx_fmt=png

我們把結果儲存在了similar_images變數裡面，下面我們來看看其中都有哪些圖片。

similar_images

0?wx_fmt=png

返回的結果一共有10行。跟我們的要求一致。

每一行資料，包含4列。分別是：

查詢圖片的標記
獲得結果的標記
結果圖片與查詢圖片的距離
結果圖片與查詢圖片近似程度排序值

有了這些資訊，我們就可以檢視到底哪些圖片與輸入查詢圖片最為相似了。

注意其中的第一張結果圖片，其實就是我們的輸入圖片本身。考慮它沒有意義。

我們提取全部結果圖片的標記（索引）值，忽略掉第一張（自身）。

similar_image_index = similar_images['reference_label'][1:]

剩餘9張圖片的標記都在結果中：

similar_image_index

dtype: int
Rows: 9
[194, 158, 110, 185, 5, 15, 79, 91, 53]

下面我們希望TuriCreate能夠視覺化幫我們展示這9張圖片的內容。

我們要把上面9張圖片的標記在所有圖片的索引列表中過濾出來：

filtered_index = data['id'].apply(lambda x : x in similar_image_index)

看看過濾後的索引結果：

filtered_index

dtype: int
Rows: 199
[0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, ... ]

你可以自己數一數，其中標為1的那些圖片位置，和我們儲存在similar_image_index中的數字是否一致。

驗證完畢以後，請執行以下語句。我們再次呼叫TuriCreate的explore()函式，展現相似度查詢結果圖片。

data[filtered_index].explore()

系統會彈出以下對話方塊：

0?wx_fmt=png

我們可以看到，全部查詢結果圖片中，只出現了哆啦a夢。瓦力的圖片，一張都沒有出現。

近似圖片查詢成功！

隨著本文操作樣例資料後，你不妨換用自己的資料，來動手嘗試一番。

原理

展示瞭如何用10幾行Python程式碼幫你查詢相似圖形後，我們來聊聊這種強大、簡潔背後的原理。

如果你對原理不感興趣，請跳過這一部分，看“小結”。

雖然我們剛剛只是用了一條語句構建模型：

model = tc.image_similarity.create(data)

然而實際上，TuriCreate在後臺為我們做了很多事情。

首先，它呼叫了一個非常複雜的，在龐大資料集上訓練好的模型。

0?wx_fmt=png

《如何用Python和深度神經網路識別影象？》一文中，我們介紹過，這個模型就是上圖中的最後一行。它的名字叫做Resnet-50，足足有50層，訓練的圖片數以百萬計，訓練時長也很久。

這裡，機智的你一定會問個問題：那些數以百萬計的預訓練圖片裡面，是否有哆啦a夢和瓦力呢？

沒有。

那就怪了，不是嗎？

如果這個複雜的模型之前根本就沒有見過哆啦a夢和瓦力，那它怎麼知道如何區分它們呢？又怎麼能夠判別兩張哆啦a夢之間的差別，就一定比哆啦a夢和瓦力之間更小呢？

《如何用Python和深度神經網路識別影象？》一文裡，我已經提示給你一個關鍵詞：遷移學習（transfer learning）。

這裡咱們就不深入技術細節了。我只給你在概念層次講解一下。

還記得這張描述計算機視覺（卷積神經網路）的示意圖嗎？

0?wx_fmt=png

在全連線層（Fully Connected Layer）之前，你可能進行了多次的卷積、抽樣、卷積、抽樣……這些中間層次，幫我們描繪了圖片的一些基本特徵，例如邊緣大概是個什麼形狀，某個區塊主要的顏色是哪些等。

到了全連線層，你只剩下了一組資料，這組資料可能很長，它抽取了你輸入資料的全部特徵。

0?wx_fmt=png

如果你的輸入是一隻貓，此時的全連線層裡就描述了這隻貓的各種資訊，例如毛髮顏色、面部組成部分排列方式、邊緣的形狀……

這個模型可以幫你提取貓的特徵，但它並不知道“貓”的概念是什麼。

你自然可以用它幫你提取一條狗的特徵。

同理，哆啦a夢的照片，與貓咪的照片一樣，都是二維圖片，都是用不同顏色分層。

0?wx_fmt=png

那用其他圖片訓練的模型，能否提取哆啦a夢照片裡的特徵呢？

0?wx_fmt=png

當然也可以！

使用遷移學習的關鍵，在於凍結中間過程的全部訓練結果，直接把一幅圖，利用在其他圖片集合上訓練的模型，轉化為一個特徵描述結果。

後面的工作，只把這個最後的特徵描述（全連線層），用來處理分類和相似度計算。

前面的好幾十層引數迭代訓練，統統都被省卻了。

0?wx_fmt=png

難怪可以利用這麼小的資料集獲得如此高的準確度；也難怪可以在這麼短的時間裡，就獲得整合後的模型結果。

把在某種任務上積累下的經驗與認知，遷移到另一種近似的新任務上，這種能力就叫做遷移學習。

0?wx_fmt=png

比起機器來，人的遷移學習能力更為強大。

雨果獎作者郝景芳在最近的一篇文章裡，描述了人的這種強大學習能力：

小孩子可以快速學習，進行小資料學習，而且可以得到「類」的概念。小孩子輕易分得清「鴨子」這個概念，和每一隻具體不同的鴨子，有什麼不同。前者是抽象的「類」，後者是具體的東西。小孩子不需要看多少張鴨子的照片，就能得到「鴨子」這個抽象「類」的概念。
用成語來描述，大概就是“觸類旁通”吧。

如果人類不善於遷移學習，把生活中的所有事物，全都當成新的東西從頭學起，那後果簡直不堪設想。對比我們一生中所能處理的資訊總量，這種認知負荷將是無法承受的。

回到我們的問題裡，如果模型可以幫我們把每一張圖片，都變成全連線層上的那一長串數字（特徵），那麼我們分辨這些圖片的相似程度，就變得太簡單了。因為這變成了一個簡單的空間向量距離問題。

0?wx_fmt=png

處理這種簡單的數值計算，我們人類可能覺得很繁瑣。但是計算機算起來，那就很歡快了。

根據距離大小排序，找出其中最小的幾個向量，它們描述的圖片，就被模型判定為相似度最高的。

小結

在《如何用Python和深度神經網路識別影象？》一文的基礎上，本文進一步介紹了以下內容：

如何利用TuriCreate快速構建圖片相似度模型；
如何查詢與某張圖片最為相似的k張圖片；
如何視覺化展示查詢圖片集合結果；
TuriCreate圖形分類與相似度計算背後的原理；
遷移學習的基礎概念。

如果你沒有讀過《如何用Python和深度神經網路識別影象？》，強烈建議你讀一讀。閱讀過程可以幫助你更好地理解基於深度神經網路的計算機視覺工作原理。

討論

你之前遭遇過大海撈針，尋找近似圖片的工作嗎？你是如何處理的？使用過哪些好的工具與方法？與本文相比較，它們的優勢有哪些？歡迎留言，把你的經驗和思考分享給大家，我們一起交流討論。

如果你對我的文章感興趣，歡迎點贊，並且微信關注和置頂我的公眾號“玉樹芝蘭”(nkwangshuyi)。

如果本文可能對你身邊的親友有幫助，也歡迎你把本文通過微博或朋友圈分享給他們。讓他們一起參與到我們的討論中來。

如果喜歡我的文章，請微信掃描下方二維碼，關注並置頂我的公眾號“玉樹芝蘭”。

0?wx_fmt=jpeg

如果你希望支援我繼續輸出更多的優質內容，歡迎微信識別下方的讚賞碼，打賞本文。感謝支援！

0?wx_fmt=png

歡迎微信掃碼加入我的“知識星球”圈子。第一時間分享給你我的發現和思考，優先解答你的疑問。

0?wx_fmt=jpeg

如何用Python和深度神經網路尋找近似圖片？

給你10萬張圖片，讓你從中找出與某張圖片最為近似的10張，你會怎麼做？不要輕言放棄，也不用一張張

如何用Python和深度神經網路識別影象？

來源：王樹義科學網部落格概要：只需要10幾行Python程式碼，你就能自己構建機器視覺模型，對圖

如何用Python和深度神經網路發現即將流失的客戶？

想不想了解如何用Python快速搭建深度神經網路，完成資料分類任務？本文一步步為你展示這一過程，

如何利用Python和深度神經網路鎖定即將流失的客戶？業績過十萬！

煩惱作為一名資料分析師，你來到這家跨國銀行工作已經半年了。今天上午，老闆把你叫到辦公室，面色凝重。你心裡直打鼓，以為自己捅了什麼簍子。幸好老闆的話讓你很快打消了顧慮。客戶主要分佈在法國、德國和西班牙。你手裡掌握的資訊，包括他們的年齡、性別、信用、辦卡資訊等。客戶是否已流失的資

Python和深度神經網路識別影象

進化的作用，讓人類對影象的處理非常高效。這裡，我給你展示一張照片。如果我這樣問你：你能否分辨出圖片中哪個是貓，哪個是狗？你可能立即會覺得自己遭受到了莫大的侮辱。並且大聲質問我：你覺得我智商有問題嗎？！息怒。換一個問法：你能否把自己分辨貓狗圖片的方法，描述成嚴格的規則，教給計算

使用python實現深度神經網路 1

深度學習基本概念一、實驗介紹 1.1 實驗內容深度學習並沒有你想象的那麼難，本課程將會一邊講解深度學習中的基本理論，一邊通過動手使用python實現一個簡單的深度神經網路去驗證這些理論，讓你從原理上真正入門深度學習。本次實驗將會帶大家學習深度學習中的一些最基本的概念，本次實驗很重要，理解這

使用python實現深度神經網路 3

快速計算梯度的魔法--反向傳播演算法一、實驗介紹1.1 實驗內容第一次實驗最後我們說了，我們已經學習了深度學習中的模型model（神經網路）、衡量模型效能的損失函式和使損失函式減小的學習演算法learn（梯度下降演算法），還了解了訓練資料data的一些概念。但是還沒有解決梯度下降演算法中如何求損失函式梯度的問

使用python實現深度神經網路 5

深度學習一、實驗介紹 1.1 實驗內容上次實驗我們使用淺層神經網路達到了0.9的驗證集準確率，本次實驗我們將增加神經網路的深度，進行真正的深度學習。 1.2 實驗知識點梯度消失問題交叉熵損失函式 1.3 實驗環境 python 2.7numpy 1.12.1

用spark訓練深度神經網路

SparkNet: Training Deep Network in Spark 這篇論文是 Berkeley 大學 Michael I. Jordan 組的 ICLR2016(under review) 的最新論文，有興趣可以看看原文和原始碼：paper，github

[Python人工智慧] 四.神經網路和深度學習入門知識

從本篇文章開始，作者正式開始研究Python深度學習、神經網路及人工智慧相關知識。前三篇文章講解了神經網路基礎概念、Theano庫的安裝過程及基礎用法、theano實現迴歸神經網路、theano實現分類神經網路，這篇文章又回到基礎知識，結合莫煩大神的視訊學習，講解機器學習基礎

AlphaGo論文的譯文，用深度神經網路和樹搜尋征服圍棋：Mastering the game of Go with deep neural networks and tree search

前言：圍棋的英文是 the game of Go，標題翻譯為：《用深度神經網路和樹搜尋征服圍棋》。譯者簡介：大三，211，電腦科學與技術專業，平均分92分，專業第一。為了更好地翻譯此文，譯者查看了很多資料。譯者翻譯此論文已盡全力，不足之處希望讀者指出

迴圈神經網路教程第四部分-用Python和Theano實現GRU/LSTM迴圈神經網路

作者：徐志強連結：https://zhuanlan.zhihu.com/p/22371429 來源：知乎著作權歸作者所有。商業轉載請聯絡作者獲得授權，非商業轉載請註明出處。本篇教程的程式碼在Github上。這裡是迴圈神經網路教程的最後一部分，前幾部分別是：本篇中我們將學習LSTM（長短項記憶）網路和G