雜湊編碼學習（一）

阿新 • • 發佈：2019-01-22

在資訊檢索中，我們給定一個query，要從訓練集中檢索出和它匹配的資訊，一種簡單的方法是計算該query與訓練集中的每個樣本的歐氏距離，然後對所有樣本的歐氏距離進行升序排序，取出前k個近鄰，從而得到搜尋的結果。通常情況下，訓練集中樣本的個數非常大，並且每個樣本的維度也不低，計算歐氏距離所需要的時間和空間複雜度都比較高，為了能實時地得到搜尋的結果，必須要想出一個方案，用來減少計算複雜度。
我們知道，計算機非常擅長邏輯運算，而乘法運算的計算複雜度相對要高很多，計算歐氏距離需要用到乘法和加法運算，故其計算複雜度比較高。鑑於計算機的這一特性，我們自然而然想到通過把原始的樣本向量對映成二值向量，然後計算二值向量之間的漢明距離（Hamming distance），從而得到搜尋結果。在資訊理論中，兩個等長字串之間的漢明距離是兩個字串對應位置的不同字元的個數。對於兩個向量a和b，計算它們的漢明距離只需用按位異或運算和加法運算即可，即：
HD(a,b) = sum(a xor b)
在matlab中，按位異或運算可以直接呼叫bitxor()函式。
在這篇博文中，筆者主要介紹iterative quantization(ITQ)演算法（原始碼連結：[hashing-baseline-for-image-retrieval](https://github.com/willard-yuan/hashing-baseline-for-image-retrieval)）。ITQ演算法的主要思想是，對訓練樣本集X，其中X的每行表示一個樣本，對其進行歸一化處理，使得X的每一列的均值都為零，也就是座標原點位於所有樣本的中心，然後用PCA或者CCA方法，對X進行降維（如圖1），對降維之後的樣本，再進行旋轉（如圖2），使得所有旋轉後的樣本距離黑色的正方形的頂點的距離最小。
![圖1 用PCA降維後的樣本](https://img-blog.csdn.net/20160826154524267)
![圖2 旋轉後的樣本](https://img-blog.csdn.net/20160826154641785)
參考文獻：Iterative Quantization: A Procrustean Approach to Learning Binary Codes

雜湊編碼學習（一）

在資訊檢索中，我們給定一個query，要從訓練集中檢索出和它匹配的資訊，一種簡單的方法是計算該query與訓練集中的每個樣本的歐氏距離，然後對所有樣本的歐氏距離進行升序排序，取出前k個近鄰，從而得到搜尋的結果。通常情況下，訓練集中樣本的個數非常大，並且每個樣本的

Node個人學習（一）----模塊

需要區別 class 當前個人一個 min export ava 1、自定義模塊與系統模塊的引入方式區別：----自定義模塊需要加“./”來聲明它不是一個系統模塊 const mod1=require("系統模塊.js"); const mod1=require(

MySQL學習（一）ODBC 安裝

oca local new cmd 密碼服務關閉 mysql 系統寫前說明初次接觸MySQL，都說MySQL各種好。我也來學習學習。之前只有SQLServer2008的經驗，其實也只是皮毛。因為SQLServer還是比較容易上手的。也不麻煩。但是自己

vue基礎學習（一）

time tle eight pla use logs new dial for 01-01 vue使用雛形　　　　 <div id="box"> {{msg}} </div> <sc

java學習（一）環境搭建、hello world的demo

環境變量網上類庫 .com java開發 www cnblogs rgs .class 　　本程序媛搞前端的，上班偶有空閑，不妨來學習學習，不然怎麽包養小白臉，走上人生巔峰？　　說實話，每個語言都相通，有了javascript的基礎，並且有了兩三年跟java打交道的經

【Cloud Foundry】Could Foundry學習（一）——Could Foundry淺談

art lock mod out isp ted 組成 .com pop 在閱讀的過程中有不論什麽問題。歡迎一起交流郵箱：[email protected]/* */ QQ：1494713801 Cloud Foundry是VMware

Android中關於JNI 的學習（一）對於JNIEnv的一些認識

else size 初步 jint 使用包括 pri jnienv 就會一個簡單的樣例讓我們初步地了解JNI的作用，可是關於JNI中的一些概念還是須要了解清楚，才可以更好的去利用它來實現我們想要做的事情。那麽C++和Java之間的是怎樣通過JNI來進行互相調用的呢

.Net MVC的學習（一）

後綴 fonts mvc 存在 eth 大致例如 pre gb2 　　套種間作，也挺有意思的——近來學習感悟。DRP學習的同一時候，折騰了點曾經不曾學習可是卻非常多次耳聞過的東西——Asp.Net中的MVC架構模式。一、是什麽？　　　　MVC，即（Model-

Python學習（一）

ubun 安裝目錄 tle setup extract reat 常用插件增加網址 Python學習（一）一：開發工具安裝　　1,pycharm下載：Linux版本　　2，破解：在help-register下-service輸入：　　　　 http://elpo

Web Service學習（一）

內存 res 特性 response 屬性表高性能 fas str ima 1、WebMethod特性包含哪些屬性，都有什麽用？ 1、BufferResponse屬性該屬性表明是否啟用對Web Service方法響應的緩沖。當設置為true時，Web Service

Python基礎學習（一）

func exe function 學習 typeerror exit invalid min eas #Default Argument Values & in keyworddef ask_ok(prompt, retres=4, reminder=‘pleas

Django學習（一）---基本配置及創建項目、應用

cut 維護 onf response settings 通過學習 clu render 安裝：在Django官網下載最新版Django然後通過pip安裝即可一、創建項目進入文件夾，打開cmd窗口，輸入django-admin startproject myblog(

機器學習（一）

無限 size mage 計算機博客對數 png 表示獲得對學習的定義學習經驗E 完成任務T 績效指標P 對於某類任務T和性能度量P，如果一個計算機程序在完成T上以P來衡量完成的好壞，並隨著經驗E而自我完善，那麽我們稱這個計算機程序在從經驗E中學習

Linux服務器學習（一）

-1 修改感覺 img size 地址 mage 第一次 spa 一、首先連接服務器　　下載一個windows下連接linux的ssh工具，我這裏用的putty。一次填入HostName（主機名，可以是服務器域名也可以是對應的ip）、Port（端口號默認為22）、Co

CSS3總結學習（一）：CSS3用戶界面

interface 繪制如果位置 nbsp 瀏覽器 none ble adding 在CSS3中，新的用戶界面屬性有很多，本文重點介紹resize,box-sizing,offset。瀏覽器支持，如下圖，圖片源於W3school 1.CSS Resizing 在cs

Spring 源碼學習（一）

pla 註入 websocket web前端 tex 異常 messaging ping 完整設計伊始 Spring 是為解決企業級應用開發的復雜性而設計，她可以做很多事。但歸根到底支撐Spring的僅僅是少許的基本理念，而所有地這些的基本理念都能可以追溯到一個

[linux][MongoDB] mongodb學習（一）：MongoDB安裝、管理工具、

ole ont mon mkdir man 管理工具 tar end 認證參考原文：http://www.cnblogs.com/kaituorensheng/p/5118226.html linux安裝完美實現！ 1. mongoDB安裝、啟動、關閉　　1.1

算法學習（一）（插入排序算法）

-1 color pri 最小 inpu range col pre arr 1.Maximum of array 說明：給定一組數組，進行排序，得到最大值和最小值。 1 input data: 2 1 3 5 7 9 11 ... 295 297 299 300 298

[轉]JMeter學習（一）工具簡單介紹

正在包含定義寫入文件線程組 element 層級工作臺 roc 一、JMeter 介紹 Apache JMeter是100%純JAVA桌面應用程序，被設計為用於測試客戶端/服務端結構的軟件(例如web應用程序)。它可以用來測試靜態和動態資源的性能，例如：

Guice源碼學習（一）基本原理

val args 就會 figure 但是 imp 屬性 div develop Guice是Google開發的一個開源輕量級的依賴註入框架，運行速度快，使用簡單。項目地址：https://github.com/google/guice/ 最新的版本是4.1，本文基於

雜湊編碼學習（一）

相關推薦