1. 程式人生 > >ML機器學習導論學習筆記

ML機器學習導論學習筆記

重新 零售 增強 不同 未來 人的 參考 force 處理

機器學習的定義:

機器學習(Machine Learning, ML)是一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、算法復雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。

機器學習的應用實例:

  1.學習關聯性

在零售業中,機器學習的應用就是購物籃分析,任務就是發現顧客所購商品之間的關聯性。

  2.分類

    2.1信貸行業,做好風險評估,以及做好銀行貸款問題中的信用評分。還有就是做好預測,通過學習過去的數據,例如收入和存款等,然後預測此客戶的是高風險客戶還是低風險客戶。

    2.2

機器學習在模式識別中也有應用,其中之一就是光學字符識別(optional character recognition,OCR),即從字符圖像識別字符編碼。

    2.3 人臉識別,輸入的是人臉圖像,類是需要識別的人,並且學習程序應當學習人臉圖像與身份之間的關聯性。

    2.4 醫學診斷。輸入的是患者的信息,而類是疾病。

    2.5 語音識別。輸入的是語音,類是可以讀出的詞匯。語音方面的難題就是每個人、每個地域的說話不一樣。這是未來的研究領域。

    2.6 生物測定學,使用人的生理和行為特征來識別或認證人的身份,需要集成來自不同形態的輸入。生理特征的例子是面部圖像、指紋、虹膜和手掌;行為特征的例子是:簽字的力度、嗓音、步態和擊鍵。

    2.7 機器學習還可以進行壓縮,用規則擬合數據,能夠得到比數據更簡單的解釋,需要的存儲空間更少,處理需要的計算更少。

    2.8 離群點檢測,即發現哪些不遵守規則的例外實例。

  3. 回歸

機器學習的應用例子:對機器人的導航,例如現在的自動駕駛汽車導航。

  4. 非監督學習

  在監督學習中,目標是學習從輸入到輸出的映射關系,其中的輸出是正確值已經由指導者提供。

  非監督學習是沒有指導者,單純只有輸入數據,目標是發現輸入的數據中的規律。

    密度估計的概念:

      輸入空間存在某種結構,使得特定的模式比其他的模式更常出現,而我們希望知道哪些常發生,那些不常發生,在統計學中,稱之為密度估計(Density estimation)

    密度估計的方法:聚類———目標是發現輸入數據的蔟和分組。

    聚類的應用之一————圖像壓縮,輸入實例是由RGB值表示的圖像像素。

在文本聚類中,目標是把相似的文檔分組。

  5. 增加學習

  機器學習程序就是應當能夠評估策略的好壞程度,並從以往的動作序列中學習,以便能夠產生策略,這種學習方法稱之為增強學習(Reinforcement learning)算法。

參考書籍:《機器學習導論》

ML機器學習導論學習筆記