1. 程式人生 > >Distant Domain Transfer Learning遠域遷移學習--通過人臉識別飛機!

Distant Domain Transfer Learning遠域遷移學習--通過人臉識別飛機!

論文地址:
http://www.ntu.edu.sg/home/sinnopan/publications/[AAAI17]Distant Domain Transfer Learning.pdf

從標題就可以看出,這是一個想法很牛掰的方法,當然實際也很牛掰。現今很多遷移學習方法都是假設源域和目標域之間存在某些相似性,這樣才能夠進行遷移,而這篇文章提出了一種方法,叫做:Selective Learning Algorithm,這種方法即使源域和目標域毫無關係,比如源域使用人臉影象,目標域中是飛機影象,都可以完成遷移。Amazing!這怎麼可能呢?不過換一種思路的話是可行的,論文基於一種傳遞和推斷的思想,怎麼個傳遞和推斷呢?我們假設源域和目標域分別是兩個不同的點,要從源域走到目標域,怎麼走呢?雖然源域和目標域完全不同,隔得很遠,但是我們可以通過中間的點,一步一步走到源域,而這中間的點,又被叫做中間域(媒介域)。
 
好了,大體的思想我們知道了,是通過傳遞來實現的,現在我們回到遷移中來,要從源域通過多箇中間域,最終對目標域進行任務判別,那麼需要從中間域中找出與源域相似的特徵,又與目標域相似的特徵,這樣才可以將三者結合起來。因為源域可能與目標域差的實在太遠了,而中間域裡可能包含了很多對目標域有用的資料,我們要用到的中間域可能很多,所以中間域(這裡把所以的中間域看成一個集合,就叫中間域,裡面包含了很多域的資料)中的特徵也很多,那怎麼選擇滿足要求的特徵呢?同時,如果我們找到了這些特徵,但是這些特徵僅是與源域、目標域相似而已,而我們最終的目的是通過這些特徵能夠對目標任務進行判定,那麼我們還需要從特徵中選擇出具有邊資訊(side information)的特徵用於判別目標任務,其中邊資訊可以理解為具有指向性的資訊。是的,這樣看起來就初步完善了,論文的主要的兩大步驟也是這兩點:

  • 樣本(特徵)選擇
  • 合併邊資訊

樣本自動選擇

在論文中,作者假設源域是有標籤的,目標域有一小部分有標籤,而中間域是沒有標籤的。然後,SLA的框架如下:

那怎麼從中間域中選出對目標域有用、同時又與源域相關(源域和中間域的區別就在於源域有標籤可用)的資料或特徵呢?這裡,作者用到了自編碼器(無監督–聯想到中間域是無標籤的),自編碼器分為編碼器和反編碼器(其中反編碼過程又叫做重構過程),輸入資料通過編碼對映為隱藏特徵: h =

f e ( x ) h=f_e(x) ,然後反編碼器通過重構誤差,又將 h
h
儘可能的解碼: x = f d ( h ) x'=f_d(h) ,讓x’接近原始資料x。經過這麼一個過程,中間的特徵h就可以認為是原始資料x的一種特徵提取,並且是具有魯棒性的高層級特徵。

好,自編碼器我們大概知道個是什麼鳥回事了,那這和樣本自動選擇有什麼關係呢?是這樣的,作者認為,如果同一個自編碼器在源域和目標域資料上都取得較小的重構誤差,那麼這個源域資料就類似於目標域資料,或者是對目標域來說是有用的,也可以這麼理解,在重構誤差都較小的情況下,源域通過編碼器(一對引數)得到的特徵h與目標域通過同一個編碼器(一樣的引數)得到的特徵可以看為是相近的。另外中間域和目標域也是那麼個回事。OK,通過這樣就可以選出源域中對目標域有用的資料了—通過重構誤差判斷,然後通過在源域、目標域、中間域上同時最小化損失函式來完成這一過程,其中損失函式又由上面提到的重構誤差組成:

J 1 ( f e , f d , v S , v T ) = 1 n S i = 1 n S v S i ( x S ) i x S i 2 2 + 1 n I i = 1 n I v I i ( x I ) i x I i 2 2 + 1 n T i = 1 n T v T i ( x T ) i x T i 2 2 + R ( v S , v I ) \mathcal{J}_1(f_e,f_d,v_S,v_T)= \frac{1}{n_S}\sum_{i=1}^{n_S} v_S^i||(x'_S)^i-x_S^i||_2^2 + \frac{1}{n_I}\sum_{i=1}^{n_I} v_I^i||(x'_I)^i-x_I^i||_2^2 + \frac{1}{n_T}\sum_{i=1}^{n_T} v_T^i||(x'_T)^i-x_T^i||_2^2 + R(v_S,v_I)

其中 f e f d f_e、f_d 對應於自編碼器的編碼器(encoder)引數和反編碼器(decoder)引數, v S v I v_S、v_I 分別為源域和中間域的選擇指示向量,表示第幾個樣本為選中,選中的用1表示,不選的用0表示。而 R ( v S , v I ) R(v_S,v_I) 是關於 v S v I v_S、v_I 的一個正則化項,用於避免 v S v I v_S、v_I 中全部為0的情況,其中 R ( v S , v I ) R(v_S,v_I) 如下:

R ( v S , v I ) = λ S n S i = 1 n S v S i λ I n I i = 1 n I v I i R(v_S,v_I) = - \frac{\lambda_S}{n_S}\sum_{i=1}^{n_S} v_S^i - -\frac{\lambda_I}{n_I}\sum_{i=1}^{n_I} v_I^i

相關推薦

Distant Domain Transfer Learning遷移學習--通過人臉識別飛機

論文地址: http://www.ntu.edu.sg/home/sinnopan/publications/[AAAI17]Distant Domain Transfer Learning.pdf 從標題就可以看出,這是一個想法很牛掰的方法,當然實際也很牛掰。現今很多遷移學習方法都是假

Source-Selection-Free Transfer Learning自動選擇

論文地址:https://www.ijcai.org/Proceedings/11/Papers/392.pdf 簡介 當訓練集中帶標籤資料很少,無法訓練出一個較好的分類模型時,我們就會希望通過遷移學習能夠從其他的輔助域中遷移出有利於目標任務的知識來輔助建立目標分類器,現有的大多數遷

機器學習人臉識別概述

https://mp.weixin.qq.com/s/a4aPycxfIe_qNIP_vrIZ5w 一、人臉檢測演算法要解決以下幾個核心問題: 人臉可能出現在影象中的任何一個位置  人臉可能有不同的大小  人臉在影象中可能有不同的視角和姿態

深度學習人臉識別

IDL內部分享的人臉識別技術。 深度學習是機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網路,它模仿人腦的機制來解釋資料。 卷積神經網路(CNN) 區域性連線 傳統的神經網路是全連線,即一層的神經元與上一層的所有神經元都建立連線,這樣導致

深度學習人臉識別中的應用 —— 優圖祖母模型的「進化」

原作者: 騰訊優圖 | 來自: 機器之心 序言——「弱弱」的人工智慧 說到人工智慧(Artificial Intelligence, AI)人們總是很容易和全知、全能這樣的詞聯絡起來。大量關於人工智慧的科幻電影更給人工智慧蒙上一層神祕的色彩。強如《黑客帝國》、《機械公敵》中的AI要翻

深度學習人臉識別Facenet_cvpr2015

一、主要思想: embedding對映關係:將特徵從原來的特徵空間對映到一個新的特徵空間上,新的特徵就稱原來的特徵嵌入,卷積末端全連線層輸出為的特徵對映到一個超球面上,使其特徵二範數歸一化。 通過 CNN人臉影象特徵對映到歐式空間的特徵向量上,計算不同圖片人臉特徵

基於深度學習人臉識別技術綜述

簡介:人臉識別是計算機視覺研究領域的一個熱點,同時人臉識別的研究領域非常廣泛。因此,本技術綜述限定於:一,在LFW資料集上(Labeled Faces in the Wild)獲得優秀結果的方法; 二,是採用深度學習的方法。 前言 LFW資料集(Labeled Fa

基於深度學習人臉識別AI技術謎與思(十四)--臉型識別

所有圖片源自網路,無意冒犯,如覺不適,通知後立即刪除。 本文在頭條號和百家號同步首發 前言 2017年12月25日,百度大腦人臉模組再一次升級,由原來的1.6.9.0升級為2.0.0.0,自此之後,我們的人臉識別就採用最新的版本了。大公司時刻充滿了焦慮感和

基於深度學習人臉識別綜述

本文轉載自 https://xraft.github.io/2018/03/21/FaceRecognition/ (作者:Caleb Ge (葛政)),如有侵權請告知刪除。 (下文中的“我”均為原文作者) 另附有查詢的其他參考連結: 論文介紹方面連結: 1、https://

手把手教你開發基於深度學習人臉識別【考勤/簽到】系統

人臉識別介紹 人臉識別技術是一項非接觸式、使用者友好、非配合型的計算機視覺識別技術。隨著機器學習、深度學習等技術的發展,人臉識別的應用正日趨完善和成熟。本文將介紹人臉識別技術如何用於考勤/簽到系統。 本文將主要從以下幾個方面闡述: 平臺環境需求涉及的技術點人臉識

深度學習人臉識別中的應用 ——優圖祖母模型的“進化”

序言——“弱弱”的人工智慧 說到人工智慧(Artificial Intelligence, AI)人們總是很容易和全知、全能這樣的詞聯絡起來。大量關於AI的科幻電影更給人工智慧蒙上一層神祕的色彩。強如《黑客帝國》、《機械公敵》中的AI要翻身做主人統治全人類。稍弱點的《機械姬

基於深度學習人臉識別系統,識別率高達99.7%

 基於深度學習的人臉識別 人臉定位和crop 特徵提取和相似度對比 餘弦距離:0.74451 ,準確率相當高了 歡迎大家加入我們的QQ群,看下面

度量學習人臉識別演算法總結

特徵臉Eigenface: Eigenface(特徵臉)在人臉識別歷史上應該是具有里程碑式意義的,其被認為是第一種有效的人臉識別演算法。1987年 Sirovich and Kirby 為了減少人臉影象的表示(降維)採用了主成分分析法(Principle Component Ana

深度學習人臉識別系列(4)__vgg人臉識別模型測試

# -*- coding: utf-8 -*- #想要加中文註釋就必須將字元編碼格式設定為utf8 #作者:郭開 import numpy as np import os import cv2 import cv2.cv as cv from skimage import transform as tf

LBP 和深度學習人臉識別

最近讀了一篇關於LBP和DBN的文章,感覺思路挺好的,如有不當之處望指正!!!!! 這是一篇在非限制條件下,基於深度學習的人臉識別演算法。,將LBP紋理特徵作為深度網路的輸入,通過逐層貪婪訓練網路,獲

專注於機器學習,深度學習人臉識別領域。

劍指offer是比較經典的面試題目,我決定在牛客網上做一下,把沒做好的題記錄下來。 1.請實現一個函式,將一個字串中的空格替換成“%20”。例如,當字串為We Are Happy.則經過替換之後的字串為We%20Are%20Happy。 class So

厲害了,利用深度學習開發人臉識別老闆探測器(附原始碼)

原來知乎也會犯這樣問題: 原文地址: http://www.techug.com/hironsan-bosssensor?utm_source=tuicool&utm_medium=referral 知乎地址:只是題目不一樣 https://zhuanlan.zhi

深度學習人臉識別系列(3)__利用caffe訓練深度學習模型

name: "VGG_FACE_16_layers" layer {   top: "data_1"   top: "label_1"   name: "data_1"   type: "Data"   data_param {     source: "/media/gk/9ec75485-26b1-471

深度學習人臉識別系列(3)__基於VGGNet的人臉識別系統

作者:wjmishuai 1.引言 本文中介紹的人臉識別系統是基於這兩篇論文: 第一篇論文介紹了海量資料集下的圖片檢索方法。第二篇文章將這種思想應用到人臉識別系統中,實現基於深度學習的人臉識別。 2.關於深度學習的簡要介紹     現階段為止,對

深度學習人臉識別領域的應用

       這是CVPR2012的一篇工作,利用CDBN來做層次特徵學習,來處理unrestricted face verification問題。由於人臉的特殊性,CDBN除了直接在灰度影象上訓練,同時在LBP影象上訓練(取了59維的 Uniform LBP Feature),按文中觀點,CDBN可以用來