1. 程式人生 > >我的人工智慧之旅——引子

我的人工智慧之旅——引子

人工智慧

不想人云亦云,於是來刨別家祖墳,一探究竟。

人工智慧,一個熱得不知所措的話題。就跟當年的“雲”一樣,聊得臭大街了,但什麼是雲?就想把你繞暈,其實都在雲裡霧裡。

人工智慧,artificial intelligence,縮寫AI。由於命名的開放性,使得其定義輪廓較為模糊。簡單來說,它是計算機學科的分支之一,是使用計算機模擬和學習人類思維過程和智慧行為的學科。人工智慧已經存在人們身邊很久了。例如,搜尋引擎對結果的排序,輸入法的容錯,相關新聞的推送,垃圾郵件的過濾等等。那麼,如何讓計算機具有人的思維方式呢?

機器學習

機器學習,machine learning,是指,讓程式通過學習經驗(即樣本)E(Experience),完成任務T(Task),並不斷提升任務完成準確率P(Performance)的過程。最著名的例子,alphago VS 李世石,前者通過學習不同棋手間的對弈,在人機對抗中,戰勝圍棋冠軍。機器學習主要分為,監督學習(Supervised Learning)和無監督學習(Unsupervised Learning)。

兩者的區別在於,監督學習的E,為input & result。希望通過給定輸入(input),預估輸出(result)。而無監督學習的E,僅為input。希望將給定的輸入(input),歸為不同的簇集(未知的分類)。

有監督學習

有監督學習,用於處理迴歸(Regression)和分類(Classification)問題。迴歸問題,從座標影象顯示效果來看,可迴歸為連續(Continuous)的線型或面,而分類問題多為離散型(Discrete),星點狀,或存在重疊區域。

例如,圖1,最經典的房價預估問題。統計某一區域內,已成交的房屋面積和對應售價,為該區域內某一面積的房屋預估售價。通過迴歸分析,得到房價與面積的對應關係。

圖1中的+為樣本值,而直線和曲線分別是用不同方法得出的關係函式。從得到的對應關係來看,不同的對應關係(直線或者曲線)所預估的結果也不同。只有通過大量的樣本學習,才能得出較為準確的關係函式。當然了,實際房價也不僅僅與面積有關。

分類問題也較為普遍,最經典的腫瘤疾病判斷問題,例如,圖2。通過腫瘤大小,位置,患者年齡等一系列指標,判定患者是否患有癌症(或者患有何種癌症)。如上圖,不同的座標軸可能代表腫瘤的大小,位置,患者年齡,當然,也可能是其它引數。對應點的顏色則可能代表腫瘤的種類。

無監督學習

無監督學習用於處理聚類(Clustering,或聚簇)問題。即從給定的經驗(樣本集)中,發現和找到規律,將資料分類。而這些分類是事先所不知道的。例如,通過對圖3的學習,獲取類似圖4的聚類方法。

圖3

圖4

無監督學習的應用也很廣泛。例如,對於新聞的自動分類。當你在閱讀某一條“NBA 火箭隊交易”的新聞時,文章尾部的擴充套件閱讀,將會提供類似的新聞。

小結

至此,本文完成了對人工智慧的簡單描述,並瞭解了機器學習的兩種主要方法,以及方法的經典應用場景。此後,將進一步深入細節,瞭解實現。