1. 程式人生 > >20年前的吳恩達,藏在一個數據集裡

20年前的吳恩達,藏在一個數據集裡

乾明 嶽排槐 發自 凹非寺
量子位 出品 | 公眾號 QbitAI

640?wx_fmt=png

快看看這是誰?!

如果你真沒認出來,那我們公佈答案:

青澀の安德魯。

今天這張照片火了。連正主吳恩達都在推特上轉發了這張黑白照片。吳恩達回憶說,這張照片拍攝於大概20年前~

640?wx_fmt=png

這其實不是一張普通的照片。

早在一個月前,一位研究機器學習和AI的教授Ricardo Araujo,在備課研究一個數據集時,發現了藏在資料集裡的吳恩達照片。

這個資料集就是CMU Face Images。

誕生於1997年的這套資料集,其中包括640張人臉黑白照片,包括多個不同維度。吳恩達只是其中一個“模特”。

640?wx_fmt=png

為了仔細觀摩吳恩達在人工智慧歷史程序中的一點微小貢獻,量子位趕緊下載了這個資料集,其中有上百張各種吳恩達的青澀照。

我們還做成了動圖,一起來看下。

預備備,五、六、七,走……

普通的:

640?wx_fmt=gif

生氣的(標註了angry,但看不太出來):

640?wx_fmt=gif

戴墨鏡的:

640?wx_fmt=gif

1997年,吳恩達剛剛在CMU獲得計算機學士學位。隨後一年,他在MIT獲得碩士學位。2002年,吳恩達在伯克利獲得博士學位。

隨後,吳恩達加入斯坦福大學,逐漸成為人工智慧領域影響力最大的老師之一。2011年他加入Google,創辦谷歌大腦和深度學習專案。2014年,他加入百度出任首席科學家。2017年,吳恩達離職創業。

資料集的貢獻

雖然在現在看來,這個資料集有點“粗糙”,但在當時,已經是非常珍貴的一份機器學習資源了。

根據維基百科的介紹,這是最早能夠應用到機器學習中的資料集之一。

這個資料集的作者,是CMU的教授Tom Mitchell,被譽為“機器學習教父”,李開復、陸奇都是他的學生。

在製作這份資料集的時候,他就已經是CMU的教授了。

640?wx_fmt=jpeg

資料集被製作出來的那一年,也就是1997年,他出版了一本教材,名字叫做《機器學習》(Machine Learning),被稱為是機器學習領域的奠基之作、第一代機器學習的聖經、入門機器學習的必讀教材之一。

這本書的中文版在2008年出版。

資料集,也自然被放到了其中,作為教材中的一個案例,供大家參考學習。

640?wx_fmt=png

1999年,Mitchell成為 CMU 的 E. Fredkin 教授。2006年,在CMU電腦科學學院成立機器學習系,並擔任系主任。

2009年,被授予CMU 的最高教職University Professor職位 ,2010年入選美國工程院院士,2016 年當選美國人文與科學院(AAAS)院士。

在電腦科學領域,Mitchell教授發表了130多篇論文,其中不乏《Science》、《Nature 》等世界頂級學術期刊。

2018年10月,Mitchell教授被任命為CMU電腦科學學院的臨時院長。

此外,根據資料集介紹頁面,這份資料集被兩篇論文直接引用了,而且這兩篇論文都非常厲害。

640?wx_fmt=png

其中一篇論文,是在2000年發表的。作者之一就是吳恩達的導師,邁克爾·喬丹。

640?wx_fmt=png

這篇論文,他們提出了在最大似然和貝葉斯框架下學習混合樹模型的有效演算法。並利用資料集進行了驗證。

另外一篇論文,2003年被NIPS收錄,正式發表於2004年,第一作者是前滴滴研究院院長、飛步科技的創始人何曉飛。

640?wx_fmt=png

在這篇論文中,他們提出了保局投影(LPP)的演算法,並利用資料集進行了證明。被引用了4000多次。這也是最早中標NIPS的中國籍學者論文。

但是,量子位仔細研究後發現,這兩篇論文雖然使用了人臉資料,但跟這份資料集並沒有關係……

不管怎樣,當年打造這樣的一份資料集,並不是一件容易的事情,也非常難得。

新·資料集

現在,隨著技術的發展,以及人們收集資料的手段大幅度提高,現在的人臉識別資料集也變得更加完善。

其中一個比較有代表性的,是香港中文大學湯曉鷗團隊在2016年開放的CalebA人臉資料集。

640?wx_fmt=png

資料集中包含10,177個名人身份的202,599張人臉圖片,規模是CMU1997年資料集的300多倍。

而且原來的圖片,只是找學生拍了一些黑白的資料集,圖片最大的也不過是128*120。現在這個資料集不僅都是名人圖片,還配有“高清大圖”。

而且,每張圖片都做好了特徵標記,包含人臉bbox標註框、5個人臉特徵點座標以及40個屬性標記。

640?wx_fmt=png

廣泛適用於人臉屬性標識訓練、人臉檢測訓練以及landmark標記等與人臉相關的計算機視覺訓練的各種任務。

數字化的你

在CMU Face Images這個資料集裡,圖片的儲存格式為:.pgm

pgm是一個縮寫,全稱:Portable Gray Map。這是一種灰度影象格式,與常見的jpg格式相比,pgm不對資料進行壓縮,因而體積較大。

640?wx_fmt=png

 吳恩達圖片實際很小

上面我們提到的各種吳恩達青澀照,最大解析度是128×120,大小為43KB。如果儲存為jpg格式,大小能縮小到4KB。

(上面的展示都是經過放大的版本。

由於不對資料進行壓縮,pgm的圖片格式非常直觀,直接拖動一張這樣的圖片到瀏覽器裡,你就能看到一個數字化的“吳恩達”。

就是這個樣子:

640?wx_fmt=png

後面還有很多很多數字。一直往下拉,感受是這個樣子的。

640?wx_fmt=gif

裡面的數值代表灰度。灰度的最大值是255。

其實,這就是計算機看圖的方式。

上面提到的湯曉鷗老師,出版了一本《人工智慧基礎(高中版)》。書中有一小節,介紹了計算機眼中的影象。

如果將一幅影象放大,我們可以看到它是由一個個的小格子組成的,每個小格子是一個色塊。如果我們用不同的數字來表示不同的顏色,影象就可以表示為一個由數字組成的矩形陣列,成為矩陣(matrix),這樣就可以在計算機中儲存。

彩色影象有三個通道。矩陣可以看作是高度為1的三階張量,因此灰度影象只有一個通道。

640?wx_fmt=jpeg

那麼計算機又怎麼才能認出“吳恩達”以及他的表情呢?

也只在這本書裡,簡單介紹瞭如何利用卷積提取影象特徵。我們也簡單做個引用。

首先我們利用卷積運算從影象中提取出邊緣特徵,接下來,我們將圖片劃分成若干區域,並對邊緣特徵按照方向和幅度進行統計,並形成直方圖。最後我們所有區域內的直方圖拼接起來,就形成了特徵向量。

640?wx_fmt=jpeg

就醬。

One More Thing

最後,再奉獻一個動圖:

640?wx_fmt=gif

週末快樂~

如果你對這個資料集感興趣,在量子位公眾號(ID:QbitAI)對話介面,回覆:“青澀”兩個字,就能獲得下載地址。

年度評選申請

640?wx_fmt=jpeg

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話介面回覆關鍵字“交流群”,獲取入群方式;


此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。


進專業群請在量子位公眾號(QbitAI)對話介面回覆關鍵字“專業群”,獲取入群方式。(專業群稽核較嚴,敬請諒解)

活動策劃招聘

量子位正在招聘活動策劃,將負責不同領域維度的線上線下相關活動策劃、執行。歡迎聰明靠譜的小夥伴加入,並希望你能有一些活動策劃或運營的相關經驗。相關細節,請在量子位公眾號(QbitAI)對話介面,回覆“招聘”兩個字。

640?wx_fmt=jpeg

量子位 QbitAI · 頭條號簽約作者

վ'ᴗ' ի 追蹤AI技術和產品新動態