機器學習概念
阿新 • • 發佈:2018-08-25
統計分析 定義 task 計算機視覺 計算機程序 數據 通過 size 包含
機器學習概念:
機器學習是一門從數據中研究算法的科學學科。機器學習直白來講,是根據已有的數據,進行算法選擇,並基於算法和數據構建模型,最終對未來進行預測。來看看大佬對機器學習的定義吧,美國卡內基梅隆大學(Carnegie Mellon University)機器學習研究領域的著名教授TomMitchell對機器學習的經典定義如下:
對於某給定的任務T,在合理的性能度量方案P的前提下,某計算機程序可以自主學習任務T的經驗E;隨著提供大量、合適、優質的經驗E,該程序對於任務T的性能會逐步提高。
其中重要的機器學習對象:
- 任務Task T,一個或多個
- 經驗Experience E
- 度量性能Performance P。
我們期望隨著任務的不斷執行,經驗的累積會帶來計算機性能的提升。
機器學習的應用場景:
- 個性化推薦:(電商商品推薦,好友推薦等)個性化指的是根據各種因素來改變用戶體驗和呈現給用戶內容,這些因素可能包含用戶的行為數據和外部因素;推薦常指系統向用戶呈現一個用戶可能感興趣的物品列表。
- 精準營銷:(DMP,基於用戶的歷史行為,給用戶推薦各種產品)從用戶群眾中找出特定的要求的營銷對象。
- 客戶細分:試圖將用戶群體分為不同的組,根據給定的用戶特征進行客戶分組。比如說,用戶分為VIP、高級VIP等,劃分粒度和具體場景有關
- 預測建模及分析:根據已有的數據進行建模,並使用得到的模型預測未來。
機器學習主要領域:
- 計算機視覺(視頻,圖像處理)
- 語音識別(聲音處理)
- 自然語言處理(文本處理)
人工智能、機器學習、深度學習之間的關系?
- 機器學習是人工智能的一個子類;
- 深度學習是機器學習的子類;
- 深度學習是基於傳統的神經網絡算法發展到多隱層的一種算法體現。
機器學習、數據分析、數據挖掘區別與聯系?
- 數據分析:數據分析是指用適當的統計分析方法對收集的大量數據進行分析,並提取有用的信息,以及形成結論,從而對數據進行詳細的研究和概括過程。在實際工作中,數據分析可幫助人們做出判斷;數據分析一般而言可以分為統計分析、探索性數據分析和驗證性數據分析三大類。
- 數據挖掘:一般指從大量的數據中通過算法搜索隱藏於其中的信息的過程。通常通過統計、檢索、機器學習、模式匹配等諸多方法來實現這個過程。
- 機器學習:是數據分析和數據挖掘的一種比較常用、比較好的手段。
機器學習常用框架:
- Python:sciket-learn() http://scikit-learn.org/stable/
- Spark(java、scala、Python、R):http://spark.apache.org/
- TensorFlow
- Mahout:http://mahout.apache.org/
機器學習概念