1. 程式人生 > >資料標註-人工智慧高速路上的基石

資料標註-人工智慧高速路上的基石

中國科學技術大學博士袁嵐峰在不久前的文章中把中國科技在世界的地位大致分為五類。

我們本文中只引用第四類。

“如今世界科技的第四個格局:雙頭格局,一般是中美兩國遠遠高於其他國家。典型的例子有兩個,網際網路和人工智慧。這兩個都是普遍被認為對於未來非常重要,最有想象空間的,值得我們仔細分析”。

前四個格局有興趣的朋友可以自行搜尋全文,這裡因為篇幅原因不做更多引用。

在這裡我們可以從一個科技工作者口中瞭解到一個這樣的事實:網際網路與人工智慧在當今世界科技格局中,中國和美國是兩國獨大。同時,這兩個領域又是未來領域。

為什麼說是未來領域,網際網路的未來趨勢已經被時間很好的證明。從1969年美國的阿帕網以來,網際網路用了不到50年就徹底顛覆了過去幾百年來人們的生活習慣。

在這裡我們重要強調的是比網際網路年輕許多的人工智慧。說到人工智慧,首先我們先談談什麼是人工智慧。
資料標註-人工智慧高速路上的基石
百度百科中是這麼定義人工智慧的:人工智慧(Artificial Intelligence),英文縮寫為AI。它是研究、開發用於模擬、延伸和擴充套件人的智慧的理論、方法、技術及應用系統的一門新的技術科學。

字面的意思有些生澀,那我們通過舉例來對AI進行一個簡單的解釋。

有天,我們開車在路上,突然出現了刮擦的交通事故,用現在的方式,我們需要:

  1. 發簡訊
  2. 打電話
  3. 報保險
  4. 定損

如果換做AI來幫我們簡化這個流程呢?
在不久的未來,我們手機裡可能都會有一款車輛定損APP,當出現交通事故的時候,我們只需要開啟APP,掃描一下破損區域,機器就會自動識別出來我們破損區域是屬於什麼汽車部件,是什麼型別的損傷,自動定損,同時將定損結果反饋給相關保險公司,保險公司根據AI上傳的定損結果,自動劃賬到車主相關銀行賬號,可能整個流程不會超過1分鐘。
資料標註-人工智慧高速路上的基石


事實上,簡單來說就是我們把我們的理解和判斷,教給機器,讓機器代替我們進行判斷。
但是我們這裡要說的是隨著深度學習的不斷突破,未來的AI一定會越來越聰明。但是它的出現並不是為了取代人類,而是能讓人們極大限度的解放生產力。生產力的巨大提升,會改變未來的生產關係,會改變未來時代。
隨著一系列技術上的突破,人工智慧在世界科技領域已經漸漸的駛進了高速車道。

中國老子有一句名言是:“九層之臺,起於累土”。

意思就是再高的樓臺都是由一筐一筐土堆積而成的,這就特別的強調了基礎的重要性。同樣,人工智慧的發展離不開資料標註,資料標註在人工智慧的高速路上,作為基石,成為了眾多重要環節之中的重中之重。
為什麼說

資料標註是人工智慧眾多重要環節的重中之重呢?這我們得從上篇中,人工智慧的定義開始說起。
要想實現人工智慧,我們需要把我們人類的理解和判斷教給計算機,讓計算機擁有我們人類般的識別能力。但是,讓計算機如何能識別人類的語言呢?

資料標註就是這樣出現了,資料標註就是我們人類用計算機能識別的方法,把需要計算機識別和分辨的圖片打上特徵,讓計算機不斷的識別這些特徵圖片,從而最終實現計算機能夠自主識別。
資料標註-人工智慧高速路上的基石
通俗點來講,比如我們想讓計算機知道什麼是汽車,那麼我們就得在有汽車的圖片中,把汽車用專業的標註工具標註出來。這裡的被標註軟體處理過的汽車就是圖片中的特徵,計算機通過不斷的識別這些特徵圖片。最終結果就是,計算機通過大量的特徵圖片的學習,最終能夠自主的識別特徵物品。
所以說,如果人工智慧是一個天賦異稟的孩子,那麼資料標註就是它的啟蒙老師,在傳授的過程中,老師講的越細緻,越有耐心,那麼孩子成長的也就越穩健。同樣,換個角度,如果說人工智慧是一條高速公路,那麼資料標註就是高速公路的基石,基石越穩固,質量越過硬,那麼就會使用起來就會越放心,越長久。

像馬雲先生在2018世界人工智慧大會上所說一樣:蒸汽機釋放了人的體力,但是蒸汽機並不是模仿人的體力,汽車比人跑得快,但是汽車並不是模仿人的雙腿。

未來的計算會釋放人的腦力,但是計算機不是按照人腦一樣去思考,計算機機器必須要有自己的方式去思考。
那麼如何能讓計算機形成一套自主的思考體系呢?這是一個複雜的過程,但是不論是多複雜的架構,資料標註永遠是體系中的養分,通過不斷的改變標註內容來適應不斷強大的計算機。

瞭解更多內容請進入:http://www.awkvector.com/