1. 程式人生 > >機器學習筆記——初識機器學習

機器學習筆記——初識機器學習

  在之前實習時,因為組內一個用ruby寫的工具需要升級使用同時也因為組內前輩都忙於工作沒有時間寫指令碼,所以要求我學習了python並重寫了這個工具,然後根據需求一步一步完善了這個指令碼。現在有機會進入AI小組參與人臉識別系統的設計,所以準備開一篇專欄,系統化記錄自己學習和完成專案的過程。

準備如何掌握機器學習

剛開始用python進行機器學習,python的程式碼積累量不是特別大,只有一個小指令碼和幾個小模組的經驗。同時對機器學習中用到的演算法不是特別瞭解.因此,因此準備通過專案實踐掌握機器學習和如何用機器學習解決問題。在達成這一目標後在對演算法理論進行實際研究。

什麼是機器學習:

機器學習是一門多領域的交叉學科,涵蓋了很多學科(概率論,演算法等數學學科),研究如何讓計算機模擬和學習人的行為,以獲取新的知識與技能,來完善自己的效能。

機器學習的演算法有兩類:監督學習和無監督學習。 監督學習(分類與迴歸)即在機器學習過程中提供對錯提示即訓練集包括輸入與輸出(特徵與目標),從給定訓練集中學習出一個目標函式,通過這個目標函式預測結果即通過演算法讓機器自己減少誤差,常見的監督學習有迴歸分析和統計分類。 非監督學習即歸納性學習:利用K方式建立中心,通過迴圈和遞減來減小誤差,達到分類的目的。

python如何進行有效的機器學習任務:

資料的採集與整理——>定義問題(提取特徵)——>資料理解(描述性統計與視覺化分析資料) ——>資料準備(為構建預測模型進行視覺化) ——>評估演算法(通過對部分典型資料進行分析,改善模型) ——>優化模型(通過調參和整合演算法改善處理結果) ——>結果部署 (完成模型,並執行模型完成結果與結果顯示)