普通人如何站在時代風口學好AI？這是我看過最好的答案

阿新 • • 發佈：2020-10-23

摘要：當前，資料、演算法、算力的發展突破正推動AI應用的逐步落地。

AI是什麼？

根據維基百科的定義，人工智慧是一種新的通用目的技術（GPT， General Purpose Technology），它橫跨整個人類經濟的多種用途，具有巨大技術性互補和溢位效應。

簡而言之，AI是21世紀的一種基礎技術，它會應用在我們日常生活的方方面面。

AI的歷史、現在和未來

早期，受到20世紀數學哲學的影響，誕生出兩種流派的人工智慧。

基於形式主義（認為所有數學分支都可以公理化的）和邏輯主義（一切數學都是建立在數理邏輯的基礎之上）的符號主義的人工智慧，以及基於構造主義的連線主義和行為主義人工智慧。

早期的流派都認為自己提出的理論有很大的潛力，可以解決很多問題。但在經過一系列探索後，科學愛家發現AI並沒有想象中的簡單。

之後，AI經歷了起起落落的發展階段。直到2006年，深度學習之父Geoffrey Hinton 和他的學生Ruslan Salakhutdinov在《科學》上發表了一篇文章，提出了深層網路訓練中梯度消失問題的解決方案，至此開啟了深度學習在學術界和工業界的浪潮。

2012年，Geoffry Hinton又帶著團隊參加了ImageNet ILSVRC挑戰賽，以驚人的優勢獲勝（錯誤率比第二名低了足足 10%），這次的比賽結果以及相應的論文拉開了深度學習的熱潮。

而深度學習之所以會從2006年後大放異彩，很大一部分的原因是資料、算力的發展，當時的資料集ImageNet的資料量很大，再加上使用GPU訓練深度學習網路，這兩個突破奠定了深度學習的崛起。

如今，GPU的算力也越來越強，現在的AI發展又是如何呢？

AI應用落地的三駕馬車

當前，資料、演算法、算力的發展突破正推動AI應用的逐步落地。

1、資料資源豐富

隨著物聯網基礎設施及智慧手機、可穿戴裝置的普及，我們每個人時刻都在產生大量資料。據IDC釋出《資料時代2025》的報告顯示，全球每年產生的資料將從2018年的33ZB增長到175ZB，相當於每天產生491EB的資料。

另一方面，大資料等技術，降低了資料處理和儲存的成本，資料作為人工智慧時代的“石油”，驅動著AI的發展。

2、演算法持續突破

在傳統深度學習CNN/RNN系列模型之後，強化學習、對抗網路演算法模型不斷湧現。AI演算法逐步逼近人類水平。

自然語言處理(NLP)方面，2018年Google推出的BERT開啟了NLP的元年，如今BERT在資料集上的兩個指標（GLUE基準：80.4％，MultiNLI準確度：86.7%）全面超越人類。

計算機視覺方面，影象分類的演算法很早之前就已超越了人類；動作識別目前精讀相對較低，停留在52.5%；人臉識別的某些資料集也已經超越了人類。

語音語義識別方面，中文語音識別準確率達到新高度，中文語音識別字錯率（CER）達到3.71%，與人類專業的速記員水平相當。

3、AI晶片釋放巨大算力

AI晶片市場細化，推理與訓練、雲側與端側分離，效能持續提升，突破摩爾定律瓶頸，釋放ZB級資料分析算力。

NVIDIA的Tesla V100，作為AI訓練通用晶片，效能遠超上一代P100的10+倍；

Google的TUP3.0是2.0效能的8倍左右；

華為也推出了適用於推理場景的昇騰310以及適用於模型訓練的昇騰910。

從早期的CPU、GPU到現在的TPU、ASIC，進入到細分領域後，各種AI專用晶片會層出不窮，效能不斷提升，功耗不斷降低。

未來，AI是否會超越人類？

當前，一些演算法在某些資料集上的準確率已經高於人類，很多人會問：AI是否會超越人類？

如圖，首先並不是人類社會的所有問題都是數學問題，有很多問題是不能用數學來描述，黃色圈子內是可以用數學解決的問題。

由此引出了第一個問題：世界上是否所有數學問題都有明確的答案？

答案是有些數學問題是無解的。

第二個問題：如果有明確的答案，是否可以通過有限步驟的計算得到答案？

這就是數學的可計算問題，經過驗證，並不是所有數學問題都是可以計算。

接下來是第三個問題：對於那些有可能在有限步驟計算出來的數學問題，能否有一種假想的機械（圖靈機），讓它不斷運動，最後當機器停下來的時候，那個數學問題就解決了？

結果是隻有部分問題是圖靈機能夠解決的。

回答完上面三個問題後，再回看上面那張圖，藍色圈子裡面的一個小圓是AI可以解決的問題，最後的小點才是AI已經找到解決方法的問題，只佔據非常小的一部分。

所以，我們可以說，在AI已經找到解決方法的問題上，它可能超越了人類，但是在更多的問題上，它是沒辦法超越的。

那麼在某些領域裡，AI的準確率既然高於人類，比如影象識別，它可以完全替代人類嗎？

如上圖所示，左邊是正常的原圖，中間是干擾資料，讓AI預測的是加了干擾資料的右圖。我們可以很清楚的辨別左右兩組圖完全沒有區別，但是AI演算法做不到，它會把右邊的三張圖片都判斷為鴕鳥。

再來看另一組AI犯錯的案例，上面是一些噪點和花紋的資料，但AI有99.6%的概率會將這些圖片識別成某種類別的物體。在我們普通人來看，AI有時候會犯一些非常愚蠢的錯誤。

這時候再回答“未來，AI是否會超越人類？”的問題，答案就是：AI能解決的只是人類社會中很小的一部分問題，即使它能解決，並在統計意義上得到一個還不錯的準確率，但它有時還是會犯很愚蠢的錯誤，AI的預測結果並不是完全可信的，AI不會超越人類，它應該成為人類的工具，使人類社會的生產效率進一步提高。

人工智慧入門的三大難點

最後談談高校學生，或者是普通開發者學習AI可能會碰到的一些問題，主要有以下三個難點：

一是要學習的基礎知識太多，做AI開發涉及到Python程式設計知識、Linux知識，視覺方面要學影象處理、OpenCV等，同時還要有一定的數學基礎。

二是沒有GPU機器，自己買GPU做AI訓練，成本非常高。

三是碰到問題找不到人進行交流，尤其是非計算機專業的同學學AI會比較難，因為做AI開發不像傳統的軟體開發那樣有非常多的書籍資料和社群可以交流，很多人只能在GitHub上找一些資料來解決學AI過程中的一些問題，能交流的人和圈子都會更少一點。

結語：

幸運的是，華為雲提供了一站式AI開發平臺ModelArts，可以低門檻、低成本的上手AI，並且提供ModelArts社群、《ModelArts人工智慧應用開發指南》等書籍，解決學習AI過程的以上三個難點。而且在1024程式設計師節這樣喜大普奔的日子裡，華為雲也推出了以“向雲而生”為主題的一系列趣味活動和直播，學AI的同時可以集卡牌、抽盲盒，看直播更有超豪華錦鯉大禮包。

備註：本文整理自華為雲EI影象演算法專家零一老師的直播《開發者如何抓住時代機遇學好AI》，點選可以回看。

點選關注，第一時間瞭解華為雲新鮮技

普通人如何站在時代風口學好AI？這是我看過最好的答案

AI是什麼？

AI的歷史、現在和未來