深度學習深理解(八)- 結構化機器學習專案

阿新 • • 發佈：2019-01-03

總結一下今天的學習過程

昨天由於裝雙系統，耽誤了一天，打斷這周暫時學習結束吳恩達老師的前三部分的課程（因為後期兩部分沒有開課）

幸運的是，今天學習比較努力哈哈哈，將計劃兩天的課程今天一天學習完了

機器學習的策略：

收集更多的資料
增加訓練集的多樣性
增加使用梯度下降法的訓練時間
嘗試其他優化演算法：比如Adam演算法等
擴大或者縮小神經網路的規模
嘗試dropout或者L2正則化
修改神經網路的架構：如啟用函式、隱藏單元的數目、層數等

正交化

在訓練集上表現不錯，損失函式最小：4,5
在開發集有很好的表現：1,6
在測試集上有很好的表現：由於過擬合了，需要更大的開發集
在開發集或者測試集上有很好的表現：改變開發集或者改變成本函式

設定一個單實數評估指標

查準率
查全率
FI score：調和平均數

訓練集、開發集、測試集的設定

開發集和測試集來自於統一分佈
使用開發集+單實數評估指標來固定目標
訓練集則會影響逼近的速度
規模：
早起：100~10000:7/3或者6/2/2
現在：100萬：98/1/1
測試集的目的：評估投產系統的效能，足夠大，能以高置信度評估系統整體效能

可避免的偏差、方差、誤差

偏差：訓練集與人類誤差偏大

辦法：

訓練更大的網路
更長時間得網路
更好的優化演算法
改成RNN、CNN
更好的神經網路架構

方差：訓練集中抽取的開發集表現不好

辦法：

正則化：L2正則化、Dropout正則化
資料增強
不同的神經網路架構

誤差：開發集表現不好

辦法：

收集更多的錯誤例子

手動檢測，檢視各個分類造成錯誤的比例
嘗試瞭解訓練集和開發測試集的具體差異
將訓練集變得更像開發集、測試集

擬合程度：測試集表現不好

快速搭建一個深度學習系統

設立開發集合測試集還有評估指標
搭好一個機器學習系統模型，進行訓練、迭代，檢視演算法表現、評估指標表現
進行偏差分析、方差分析、誤差分析、確定下一步優化前進方向
將你要關注的資料分佈作為開發集和測試集

遷移學習

神經網路可以從一個任務中習得知識、或者部分知識、並將這些知識應用到另一個獨立的任務中

做法：將最後一層的輸出以及相關權重w、b刪除。重新生成一層或者幾層輸入輸出，如果資料量大，就將前面的權重一起重新生成

作用：用更少的資料，將一些能力能做其他應用中做的更好、更快，比如：低層次的特徵：邊緣檢測、曲線檢測、陽性物件檢測、結構資訊、圖形形狀資訊、圖形識別、學到的點、線、面等

意義：

在A、B有同樣的型別資料時，比如音訊、影象等，想從任務A中學習並遷移一下知識到到任務B中
A比B資料多
A中的低層次特徵可以幫助B的學習

多工學習：並行的

同時開始學習，試圖讓單個神經網路同時做幾件事情，然後希望是每個任務都能幫助其他所有任務

例如在無人駕駛領域

與softmax不同：softmax是將單個標籤分配給單個樣本

意義：

訓練一組任務，可以共用低層次特徵
每個任務的資料量很接近
你可以訓練一個足夠大的神經網路，同時做好所有工作

端到端的學習

優點：

真的只是讓資料說話

所需手工設計的元件更少

缺點：

需要大量的資料

排除了可能有用的手工設計的元件

訪談：

CS231n課程等一些我現在只能聽聽看看而不知道涵義的名詞

美好的一天，明天加油！

深度學習深理解(八)- 結構化機器學習專案

總結一下今天的學習過程昨天由於裝雙系統，耽誤了一天，打斷這周暫時學習結束吳恩達老師的前三部分的課程（因為後期兩部分沒有開課）幸運的是，今天學習比較努力哈哈哈，將計劃兩天的課程今天一天學習完了機器學習的策略：收集更多的資料增加訓練集的多樣性增加使用梯度下降法的訓練

吳恩達《深度學習-結構化機器學習專案》1--機器學習策略（1）

1. Why ML Strategy為什麼需要機器學習策略，機器學習策略指的是一些分析機器學習問題的方法。讓我們從一個例子開始：假設訓練的分類器準確率為90%，想要提高準確率應該怎麼辦呢？我們有很多選擇可以嘗試，但嘗試錯誤的話往往會浪費大量時間，機器學習策略就是在嘗試之前幫忙

結構化機器學習專案_課程筆記_第一、二週

第一週機器學習策略_1 這一門課主要介紹了在具體專案實踐中會遇到的一些問題以及採取的策略。所擷取的圖片依然來源於吳恩達老師的相關視訊資源。 1. 正交化（Orthogonalization） Andrew建議機器學習的調參過程應保持正交化。上圖所示的機器學習的4個流程，每一步的除

Deep Learning.ai學習筆記_第三門課_結構化機器學習專案

目錄第一週機器學習策略（1）第二週機器學習策略（2）目標：學習一些機器學習優化改進策略，使得搭建的學習模型能夠朝著最有希望的方向前進。第一週機器學習策略（1）搭建機器學習系統的挑戰：嘗試和改變的東西太多，比如超引數。什麼是正交化？

結構化機器學習專案——機器學習（8）

1.ML策略當我們最初得到一個深度神經網路模型時，我們可能希望從很多方面來對它進行優化，例如： Collect more data Collect more diverse training set Train algorithm longer

deeplearning.ai第三課：結構化機器學習專案

1 正交化正交化的含義是在設計系統時，應該使得系統一個元件/引數的變化對另一個元件/引數的影響儘可能小。這樣就可以相對簡單的實驗系統的各個組成部分，可以減小系統的驗證和測試時間。開發一個有監督機器學習系統時，應該依次序完成四件事情：訓練集要對代價函式擬合的很好，

Coursea吳恩達《結構化機器學習專案》課程筆記(1)機器學習策略上篇

轉載自http://blog.csdn.net/column/details/17767.html 結構化機器學習專案 — 機器學習策略（1） 1. 正交化表示在機器學習模型建立的整個流程中，我們需要根據不同部分反映的問題，去做相應的調整，從而更加

結構化機器學習項目

混合驗證 idt 訓練集 inf 部分獨立算法真的第一周 1.2 正交化　　正交化：每一個維度只控制一個功能。　　對於監督學習：1，在訓練集上，達到評估的可接受效果；2，在驗證集上有好的效果；3.在測試集有好的效果；4，系統在實際使用上表現得好。　　在這四個

大資料深度學習下的車輛結構化——明景車輛結構化分析

車輛全特徵結構化識別技術是計算機人工智慧、影象處理、計算機視覺、模式識別等相關技術的綜合應用。目前涉車涉駕案件的快速增長，以及車輛結構化、智慧城市應用的不斷加深，業界迫切希望提取更多元的車輛資訊，除車牌號碼外，還需要車輛的廠牌、車身顏色、車輛品牌、車輛型別、車輛特徵物

如何理解區分"人工智慧"、“機器學習”、“深度學習”三大巨星

都說教育要從娃娃抓起。學習新東西當然也要從基本概念抓起了，近兩年，人工智慧的真的是火遍大街小巷，不過，“人工智慧”也不是一人獨火，他還有兩個形影不離的隊友：“機器學習”與“深度學習”。這三個詞如同天團組合一般，出現在各種地方，有時甚至互為化身。那麼問題來了，人工

機器學習與深度學習系列連載：第一部分機器學習（十八）模型評估

模型評估模型評估中有三個關鍵問題：  如何獲得測試結果？評估方法  如何評估效能優劣？效能度量  如何判斷實質差別？比較檢驗 2. 效能度量(performance measure)是衡量模型泛化能力的評價標準，反映了任務需求（1

寒假學習筆記1：結構化程序設計

控制流程 ram 循環只有一個嚴格學習筆記程序編寫 ont 部分結構化程序設計（structured programming）是進行以模塊功能和處理過程設計為主的詳細設計的基本原則。 - 內容主張使用順序、選擇、循環三種基本結構來嵌套連結成具有復雜層次的“結構

【深度學習】一文讀懂機器學習常用損失函數（Loss Function）

back and 們的 wiki 導出歐氏距離 classes 自變量關於最近太忙已經好久沒有寫博客了，今天整理分享一篇關於損失函數的文章吧，以前對損失函數的理解不夠深入，沒有真正理解每個損失函數的特點以及應用範圍，如果文中有任何錯誤，請各位朋友指教，謝謝~

第四十八篇入門機器學習——超參數問題

顯示 eight nbsp 根據情況下 ima 測試 job 個數 No.1. kNN算法中需要傳入一個參數k，這個參數k的作用之前提到過，它就是指距離待預測數據最近的前k個數據，這個參數k的具體大小應該如何選擇？超參數問題就是描述的這類問題。 No.2. 所

解釋機器學習模型的一些方法（三）——理解復雜的機器學習模型

p s 結果 origin 得出驗證場景這樣的機器發的在這一部分中我們所要展現的技術，可以為非線性、非單調的響應函數生成解釋。我們可以把它們與前兩部分提到的技巧結合起來，增加所有種類模型的可解釋性。實踐者很可能需要使用下列增強解釋性技巧中的一種以上，為他們手中

深度學習，周志華，機器學習，西瓜書，TensorFlow，Google，吳軍，數學之美，李航，統計學習方法，吳恩達，深度學習筆記，pdf下載

1. 機器學習入門經典，李航《統計學習方法》 2. 周志華的《機器學習》pdf 3.《數學之美》吳軍博士著pdf 4. Tensorflow 實戰Google深度學習框架.pdf 5.《TensorFlow實戰》黃文堅高清完整PDF 6. 復旦大

機器學習與深度學習系列連載：第一部分機器學習（五）生成概率模型（Generative Model）

生成概率模型（Generative Model） 1.概率分佈我們還是從分類問題說起：當我們把問題問題看做是一個迴歸問題，分類是class 1 的時候結果是1 分類為class 2的時候結果是-1；測試的時候，結果接近1的是class1

機器學習與深度學習系列連載：第一部分機器學習（九）支援向量機2（Support Vector Machine）

另一種視角定義SVM：hinge Loss +kennel trick SVM 可以理解為就是hingle Loss和kernel 的組合 1. hinge Loss 還是讓我們回到二分類的問題，為了方便起見，我們y=1 看做是一類，y=-1 看做是另一類

機器學習與深度學習系列連載：第一部分機器學習（十一）決策樹2（Decision Tree）

決策樹2 決策樹很容易出現過擬合問題，針對過擬合問題，我們採用以下幾種方法劃分選擇 vs 剪枝剪枝 (pruning) 是決策樹對付“過擬合”的主要手段！基本策略：預剪枝 (pre-pruning): 提前終止某些分支的生長後剪枝 (post-pr

機器學習與深度學習系列連載：第一部分機器學習（十三）半監督學習（semi-supervised learning）

在實際資料收集的過程中，帶標籤的資料遠遠少於未帶標籤的資料。我們據需要用帶label 和不帶label的資料一起進行學習，我們稱作半監督學習。 Transductive learning：沒有標籤的資料是測試資料 Inductive learning：沒有標

深度學習深理解(八)- 結構化機器學習專案

相關推薦