1. 程式人生 > 實用技巧 >《演算法圖解》總結第3章:while迴圈、遞迴、棧

《演算法圖解》總結第3章:while迴圈、遞迴、棧

人工智慧——機器學習筆記day01(2020.10.14)

1、人工智慧概述 1.1 人工智慧、機器學習、深度學習 機器學習是人工智慧的一個實現途徑 深度學習是機器學習的一個方法發展而來 1.2 人工智慧的分支 分支一:計算機視覺——人臉識別 分支二:語音識別——百度語音識別 分支三:文字挖掘/分類——語音語義識別 分支四:機器翻譯 分支五:機器人 1.3 人工智慧必備三要素
  • 資料
  • 演算法
  • 計算力
1.4 課外補充:CPU和GPU對比 CPU主要用於IO讀寫檔案,GPU主要用於計算 什麼型別的程式適合在GPU上執行? (1)計算密集型程式,需要大量計算 (2)易於並行的程式 2、機器學習工作流程
2.1 什麼是機器學習 機器學習是從資料中自動分析獲得模型,並利用模型對未知資料進行預測 2.2 工作流程 (1)獲取資料 (2)資料基本處理 (3)特徵工程 (4)機器學習(模型訓練) (5)模型評估 2.3 獲取到的資料集介紹 在資料集中一般:
  • 一行資料稱為一個樣本
  • 一列資料稱為一個特徵
  • ​有些資料有目標值(標籤值),有些資料沒有目標值
資料型別構成:
  • 資料型別一:特徵值+目標值(目標值是連續的或離散的)
  • 資料型別二:只有特徵值,沒有目標值
資料分割: 訓練資料:用於訓練,構建模型 測試資料:用於評估模型是否有效 劃分比例: 訓練集:70% 80% 75% 測試集:30% 20% 25% 2.4 特徵工程 包含內容: (1)特徵提取——將資料轉換為計算機能識別的資料型別 (2)特徵預處理——通過一些轉換函式將特徵資料轉換成更加適合演算法模型的特徵資料過程 (3)特徵降維——在某些限定條件下,降低隨機變數(特徵)個數,得到一組”不相關“主變數過程 3、機器學習演算法分類 (1)監督學習——有特徵值、目標值
  • 輸入資料由輸入特徵值和目標值組成
    • 迴歸——函式的輸出可以是一個連續的值(稱為迴歸)
    • 分類——或是輸出的是有限個離散值(稱為分類)
(2)無監督學習——僅有特徵值
  • 輸入資料是由輸入特徵值組成
    • 聚類
(3)半監督學習——有特徵值,但是一部分資料有目標值,一部分沒有 (4)強化學習 動態過程,上一步資料的輸出是下一步資料的輸入 四要素:agent, action, environment, Reward 4、機器學習模型評估 4.1 分類模型評估
  • 準確率:預測正確的數佔樣本總數比例
  • 精確率:正確預測為正佔全部預測為正的比例
  • 召回率:正確預測為正佔全部正樣本的比例
  • F1-score:主要用於評估模型穩健性
  • AUC指標:主要用於評估樣本不均衡的情況
4.2 迴歸模型評估
  • 均方根誤差
  • 相對平方誤差
  • 平均絕對誤差
  • 相對絕對誤差
  • 決定係數
5、擬合 5.1 欠擬合 機器學到的特徵太少了,不能準確識別 5.2 過擬合 機器將某些特殊特徵學到,分類太過 6、機器學習基礎環境安裝與使用 6.1 庫的安裝 pycharm中開啟命令視窗 使用pip install numpy安裝numpy 庫 其他的庫同樣方法安裝