機器學習八大算法
阿新 • • 發佈:2018-12-20
易到 多變量 怎樣 監視 傳遞 結果 沒有 很多 指導
機器學習入門知識
機器學習是什麽?
機器學習的定義有很多,我自己的理解是,機器學習是使機器擁有解決實際問題的能力,他能夠根據經驗數據分析現有的問題,進行分類和預測
有監督學習和無監督學習
面對要解決的問題首先分析是分類還是回歸問題,再進一步看看是監督學習的方法好還是無監督學習的方法好,監督學習是事前就將結果進行了標記,在監視的情況下看運行的結果,類似於圈套,對結果是具體的,而無監督學習沒有明確的結果
無監督學習是降維和聚類
有監督學習是線性回歸(單變量、多變量),邏輯回歸(LR),神經網絡,支持向量機(svm),決策樹
下面來一一介紹他們的核心和基本應用
從易到難,由淺入深
監督學習中有個基本的模型EPT三要素,其中E是經驗,P是性能,T是任務
單變量線性回歸:
他的核心思想是以預測值與真實值de誤差平方和作為代價,再利用梯度下降的方法傳遞誤測,更新參數
基本應用:
明確目標,分析問題,加載數據,數據處理(數據壓縮,歸一化),數據標準化,帶入模型,進行訓練,通過代價函數提高性能,通過梯度下降的方法找到參數的最優解,得到模型
用測試集進行測試,看看準確率,指導自己的模型,提高泛化能力
插入知識----機器學習設計
面對一些訓練集和測試集還有交叉驗證集,常常會出現過擬合,欠擬合的問題,針對這些問題怎樣來進行調試
過擬合的產生原因是過於擬合訓練集的數據,於至於模型不能泛化,可以通過以下途徑來解決
1.是正則化,引入參數lamda,減小特征的權重,增加代價
機器學習八大算法