機器學習實戰-讀書筆記
阿新 • • 發佈:2020-08-05
'''
#簡介
1.3機器學習的主要任務 書中基於鳥的四種特徵:體重、翼展、腳蹼、後背顏色 來確定這隻鳥屬於那種類別,這個例子介紹了機器學習如何 解決分類問題,它的主要任務是將例項資料劃分到合適的分類中。機器學習的另一項任務是迴歸,它主要用於預測 數值型資料。大多數人可能見過迴歸的例子---資料擬合曲線; 分類和迴歸都是“監督學習”。 無監督學習,資料沒有類別資訊,也不會給定目標值。在無監督學習中,將資料集合分成由類似的物件組成的多個 類的過程稱為“聚類”;將尋找描述資料統計值的過程稱之為“密度估計”。此外,無監督學習還可以減少資料特徵的 維度,以便我們可以使用二維或三維圖形更加直觀地展示資料資訊 用於執行分類、迴歸、聚類和密度估計的機器學習演算法 監督學習 k-近鄰演算法 線性迴歸 樸素貝葉斯演算法 區域性加權線性迴歸 支援向量機 Ridge迴歸 決策樹 lasso最小回歸係數估計 無監督學習 K-均值 最大期望演算法 DBSCAN Parzen窗設計 1.4如何選擇實際可用的演算法,必須考慮下面兩個問題: 1.使用機器學習演算法的目的,想要演算法完成何種任務,比如預測明天下雨的概率還是對投票者按照興趣分組; 2.需要分析或收集的資料是什麼: 如果目標變數是離散型,如是/否、1/2/3、A/B/C、或紅/黃/黑等則可以選擇分類器演算法; 如果目的變數是連續型的數值,如0.0~100.00、-999~999等則需要選擇迴歸演算法。 如果不想預測目標變數的值,則可以選擇無監督學習演算法,進一步分析需要將資料劃分為離散的組。 如果唯一的需求就是將一堆雜亂資料分組,則使用聚類演算法; 如果還需要估計資料與每個分組的相似程度,則需要使用密度估計演算法。 大多數情況下上面的選擇方法都能幫助讀者選擇恰當的機器學習演算法。 其實最最重要的問題就是資料,我們應該充分了解資料,對資料瞭解的越充分,越容易建立符合實際需求的應用程式。'''
目錄: