1. 程式人生 > >一個時代的終結:ImageNet 競賽 2017 是最後一屆

一個時代的終結:ImageNet 競賽 2017 是最後一屆

2017 年 7 月 26 日,將標誌著一個時代的終結。 那一天,與計算機視覺頂會 CVPR 2017 同期舉行的 Workshop——“超越 ILSVRC”(Beyond ImageNet Large Scale Visual Recogition Challenge),將宣佈計算機視覺乃至整個人工智慧發展史上的里程碑——IamgeNet 大規模視覺識別挑戰賽將於 2017 年正式結束,此後將專注於目前尚未解決的問題及以後發展方向。 根據“超越 ILSVRC” Workshop 官網介紹,這堂研討會的內容主要包括以下 4 點: 發表 2017 年 ILSVRC 的結果 評估 ILSVRC 2017 影象、視訊物體識別、分類的當前最佳結果 探討這與當前在計算機視覺產業中應用的最優技術的關係 受邀講者(目前確定的有加州大學伯克利分校的 Jitendra Malik,以及斯坦福大學教授、目前谷歌雲首席科學家李飛飛)發表講話,論述在他們看來從認知視覺到機器人視覺等領域存在的挑戰 ImageNet:
深度學習
熱潮的關鍵推動者之一 ImageNet 可以說是計算機視覺研究人員進行大規模物體識別和檢測時,最先想到的視覺大資料來源。ImageNet 資料集最初由斯坦福大學李飛飛等人在 CVPR 2009 的一篇論文中推出,並被用於替代 PASCAL 資料集(後者在資料規模和多樣性上都不如 ImageNet)和 LabelMe 資料集(在標準化上不如 ImageNet)。 ImageNet 從 Caltech101(2004 年一個專注於影象分類的資料集,也是李飛飛開創的)。ImageNet 不但是計算機視覺發展的重要推動者,也是這一波深度學習熱潮的關鍵驅動力之一。 截至 2016 年,ImageNet 中含有超過 1500 萬由人手工註釋的圖片網址,也就是帶標籤的圖片,標籤說明了圖片中的內容,超過 2.2 萬個類別。其中,至少有 100 萬張裡面提供了邊框(bounding box)。
ImageNet 資料集中“獵狐犬”的部分示例 從 2010 年以來,ImageNet 每年都會舉辦一次軟體競賽,也即 ImageNet 大規模視覺識別挑戰賽(ILSVRC),參賽程式會相互比試,看誰能以最高的正確率對物體和場景進行分類和檢測,不僅牽動著產學研三界的心,也是各團隊、巨頭展示實力的競技場。 從 2010 年以來,每年的 ILSVRC 都主要包括以下 3 項,後來逐漸增多: 影象分類:演算法產生影象中存在的物件類別列表 單物體定位:演算法生成一個影象中含有的物體類別的列表,以及軸對齊的邊框,邊框指示每個物體類別的每個例項的位置和比例 物體檢測:演算法生成影象中含有的物體類別的列表,以及每個物體類別中每個例項的邊框,邊框表示這些例項的位置和比例。 2012 年,Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 創造了一個“大型的深度卷積
神經網路
”,也即現在眾所周知的 AlexNet,贏得了當年的 ILSVRC。這是史上第一次有模型在 ImageNet 資料集表現如此出色。論文中提出的方法,比如資料增強和 dropout,直到現在也在使用,那篇論文“ImageNet Classification with Deep Convolutional Networks”,迄今被引用約 7000 次,被業內普遍視為行業最重要的論文之一,真正展示了 CNN 的優點,並且以破紀錄的比賽成績實打實地做支撐。 2012 年是 CNN 首次實現 Top 5 誤差率 15.4% 的一年,當時的次優項誤差率為 26.2%。這個表現震驚了整個計算機視覺界。可以說,是自那時起,CNN 才成了家喻戶曉的名字。 ImageNet 歷屆冠軍及技術回顧:

中國團隊在 ImageNet 競賽中的亮眼表現 2016 年的 ILSVRC,來自中國的團隊大放異彩: CUImage(商湯和港中文),Trimps-Soushen(公安部三所),CUvideo(商湯和港中文),HikVision(海康威視),SenseCUSceneParsing(商湯和香港城市大學),NUIST(南京資訊工程大學)包攬了各個專案的冠軍。 從下圖中可見,無論的影象分類、物體檢測、物體識別,計算機的正確率都已經遠遠超越人類。可以說,計算機視覺在感知方面的問題已經得到了很好的解決。 那麼,計算機視覺的未來的重點將是什麼,ImageNet 競賽之後,又會出現什麼呢? 超越 ILSVRC:側重影象學習和理解的 WebVision 競賽 WebVision 資料集是通過蘇黎世科技大學計算機視覺實驗室的網路資料團隊收集的。這一資料集的開發得到了谷歌研究院蘇黎世分部的支援。 WebVision 資料集使用與 2012 年 ImageNet 競賽相同的 1000 個類別,涵蓋了直接從網路收集到的 240 萬張現代影象(包括谷歌影象搜尋中獲得的 100 萬張,以及來自 Flickr 的 140 萬張影象)和元資料。 在 CVPR 2017 上,也會舉辦 WebVision Challenge,這一比賽更加註重對影象和視訊資料的學習和理解,它有可能會成為未來的 ImageNet 競賽嗎? 摘要 我們提出 2017 年 WebVision 競賽,這是一項公開的影象識別挑戰賽,旨在基於網頁影象進行深度學習,而無需人手工對例項進行標註。此前的計算機視覺挑戰賽,如 ILSVRC、Places2 和 PASCAL VOC,通過提供大量的註釋資料,用於模型設計和標準化的基準測試,為計算機視覺的發展發揮了關鍵作用。為了延續它們的精神,我們在本屆 CVPR 2017 舉辦研討會,進行一項基於大規模網路影象資料集的公開競賽。WebVision 資料集包含從網際網路上用爬蟲收集的 240 多萬的網路影象,方法是使用從 ILSVRC 2012 基準中的 1000 個語義概念生成的查詢(query)。元資訊(Meta information)也包含在內。 此外,WebVision 資料集也提供檢驗資料集和測試資料集,這些資料集中的資料都帶有人手工標註的標籤,從而便於演算法的開發。2017 年 WebVision  挑戰賽分為兩類,一是在 WebVision 測試資料集上進行影象分類,以及在 PASCAL VOC 2012 資料集上進行遷移學習。在本文中,我們描述了資料收集和註釋的細節,突出了 WebVision 資料集的特點,並介紹了相關評估指標。 編譯來源: 超越 ILSRVC 研討會介紹:http://image-net.org/challenges/beyond_ilsvrc WebVision Challenge 介紹:http://www.vision.ee.ethz.ch/webvision/about.html WebVision Challenge 論文:https://arxiv.org/pdf/1705.05640.pdf

相關推薦

一個時代終結ImageNet 競賽 2017最後

2017 年 7 月 26 日,將標誌著一個時代的終結。 那一天,與計算機視覺頂會 CVPR 2017 同期舉行的 Workshop——“超越 ILSVRC”(Beyond ImageNet Large Scale Visual Recogition Challeng

Windows XP時代終結假設你還在用它怎麽辦

eas window 停止 問題 電腦 日子 系統 是你 計算 2014 年 4 月 8 日。是Windows XP退休的日子。4 月 8 日過後,Windows XP 的安全性更新將停止了。 我們一直在談論離開 Windows XP 的重要性

大宗商品交易平臺解決期貨的最後公裏”

商品 實現 交易平臺 互聯 產品 時代 方式 我們 最大的 由於客觀市場的限制,正處於期貨與現貨脫軌的時代,大宗商品交易平臺就是為了解決這最後“一公裏”,實現期貨與現貨的接軌。期貨與現貨完全不同,現貨是實實在在可以交易的商品,期貨則是以某種大眾產品及金融資產為標的標準化可交

小坑UITableView分組後最後根分割線不顯示

如圖用section分隔開後每個section最後的cell的分割線不見了。 分隔的方法是:單獨把一個section作為分隔塊使用,即:section 0,有cell 2;section 1,沒有cell,headView高12;section 2,有ce

一個時代終結為什麼是時候放棄ITOM四大巨頭了?這對IT領導者來說意味著什麼?

關注嘉為科技,獲取運維新知 2018年7月,Broadcom宣佈了收購CA Technologies的計劃,收購額近190億美元。雖然分析師對於晶片製造商收購企業級軟體公司這件事是否值得還在進行激烈辯論,但CA收購案無疑預示著250億美元ITOM軟體市場的重大轉變。 在長達二十多年的時間裡, BM

當當被收購預示著一個時代終結

當當今年3月9日,天津天海投資發展公司宣布了重大資產重組的消息,將收購當當網的相關股權。而4月11日晚間,天海投資發布公告稱,初步作價75億元收購當當科文100%股權及北京當當100%股權,交易完成後,當當董事長俞渝和CEO李國慶合計直接持有公司16.49%股份。 看到當當如今被“賣身”的消息,還真讓我這

小技巧去掉每一行最後一個li的外邊框/是否准許使用者調整文字域的大小

去掉每一行最後一個li的外邊框 1.給每個li起類名單獨去掉;(不建議使用) 2.將ul稍微多設定一點寬度,在ul的父容器中設定正常寬度、高度,並寫overflow:hidden; 3.ul無父元素時可給li寫margin-left:-value;在ul中寫overflow:hidden

一個應用時代崛起見證PWA書寫歷史

iOS 上的“超級小程式”蘋果在春天正式推送的 iOS 11.3 帶來了不少重要更新,大家比較熟悉的就是電池管理和關閉降頻功能,不過對於很多關注前端技術和 Web App 的使用者應該注意到了,蘋果 iOS 11.3 已經悄悄加入了對“漸進式 Web 應用”(PWA)這一系列新技術的基本支援。這可能是促進行業

python字串面試題找出一個字串中第一個字母和最後一個字元是第一次重複,中間沒有重複且最長的子串

1.給出任意一個字串,列印一個最長子串字串及其長度,如果有相同長度的子字串,都要一起打印出來,該子字串滿足以下條件, 第一個字母和最後一個字元是第一次重複 這個子字串的中間字母沒有重複 這個子字串是滿足條件裡面的最長的 如: adsasadmasd 中滿足條件的是dmasd   im

現場丨2017中國計算機大會(CNCC2017)之李飛飛演講ImageNet之後,計算機視覺何去何從?

今天,我就想和大家來分享實驗室的思考和一些比較新的工作。 由於我在國外生活的時間比較長,我可能說英文比說中文要好一點兒。所以,我就要用英文來做這個演講,偶爾會插一些中文詞。謝謝大家。 今天我的主題演講主要是關於計算機視覺。 要聊這個話題,首先,讓我們先從5.4億年前說起。 那個時候,地球基本

習題5-7 使用函式求餘弦函式的近似值(15 分) 本題要求實現一個函式,用下列公式求cos(x)的近似值,精確到最後項的絕對值小於e

/*習題5-7 使用函式求餘弦函式的近似值(15 分) 本題要求實現一個函式,用下列公式求cos(x)的近似值,精確到最後一項的絕對值小於e: 函式介面定義: double funcos( double e, double x ); 其中使用者傳入的引數為誤差上限e和自變數x

當你輸入信用卡號碼的時候,有沒有擔心輸錯了而造成損失呢?其實可以不必這麼擔心,因為並不是一個隨便的信用卡號碼都是合法的,它必須通過Luhn演算法來驗證通過。 該校驗的過程1、從卡號最後一位數字開始,逆

import java.util.Scanner; /** * 當你輸入信用卡號碼的時候,有沒有擔心輸錯了而造成損失呢?其實可以不必這麼擔心, * 因為並不是一個隨便的信用卡號碼都是合法的,它必須通過Luhn演算法來驗證通過。 該校驗的過程: 1、從卡號最後一位數字

優維DevOps系列沙龍全回顧DevOps+SRE落地實踐+DevOps最後

devops sre 優維科技 5月6日,優維科技和數人雲聯合主辦的DevOps&SRE系列活動《DevOps&SRE 超越傳統運維之道》在深圳順利舉行。優維科技CEO王津銀、數人雲CEO王璞、騰訊SNG運維負責人梁定安分別分享了《DevOps與傳統的融合落地實踐及案例分享》《SR

不談OI高二(13)最後次班班有歌聲

決賽 .com get 視頻 真的 html 沒有 .html 歌聲 最後一次班班有歌聲了…… 自己因為搞oi並沒有參加,只是決賽的時候幕後放了放背景視頻…… 不管怎麽說,我們班唱的很棒啊,全部人都很棒! 說真的我為我們班驕傲 視頻: https://v.qq.com/x/

消息SQL Server 2017(vNext)的第三個公開的CTP(社區技術預覽版)發布了

start spn system 看到了 一個 get creat 社區 目前 今天看到了一個新聞,跟大家分享一下,有興趣的可以去嘗試一下。 SQL Server 2017 CTP3於5月23日發布了,詳細版本號是6.7.55.0。 大家可以去安裝試試。在下載頁面,目前是S

無人機的下一個時代,將由“群”定義

美國空軍 無人機 下一代 生物學 螺旋槳 當你想到無人機的時候你會覺得它是什麽樣子的?一個單獨的遙控玩具,有螺旋槳,還是一架大型無人機?很快,這些圖像可能會有很大的不同:無人機變得越來越小,制造成本低,可以自己放大,並且可以集中數百個甚至數千個的群體,像一群鳥一樣飛翔。它們被稱為群體,將它

【Java並發編程】之十四圖文講述同步的另一個重要功能內存可見性

integer sdn 技術 訪問 span 另一個 edi int tro 轉載請註明出處:http://blog.csdn.net/ns_code/article/details/17288243 加鎖(synchronized同步)的功能不僅僅局限於互斥

17歲輟學少年“藍鯨”遊戲最後想換錢留給父母

http .html 診斷 四川省 ask 不同 安全 都市 治療 今年5月25日晚,一個報警電話打進了四川川南某縣公安局。電話那頭聲音虛弱,這是一個求救電話:“我參與了藍鯨死亡遊戲,快來救救我……”民警快速行動,最終挽救了這位年僅17歲的少年。 這位17歲的少年已連續了耍

字體美化神器MacType v1.2017.628

all 等價 下使用 文件 根據 stat 進行 class entry MacType,字體渲染工具,字體美化神器!它是種字體渲染引擎,通過接管Windows系統GDI字體渲染,使文字顯示得更清晰、更有立體感,實現比Mac系統更華麗的字體渲染效果,讓 Windows 字體

查詢一個最後天的總用戶數,數據庫中沒有保存最好天的數據,就查詢本月數據庫已存有的最後天的數據

數據庫 ont har rom to_char popu lec 最大 track select total_user from a_user_no where date_time=(select max(date_time) from a_user_no whe