PCA等降維操作與深度學習的不同點的一些思考
深度學習的本質上是將資料從低維空間對映到高維空間,但是並不僅僅有這個作用,拿全連線層舉例,假設輸入資料500維,可以對映到1000維做一個升維操作,也可以降維到256維,但往往經過一個完整的神經網路後,可以將資料對映到高維空間,這樣做的目的就是讓資料變得線性可分。因為線性分類器是非常簡單的分類器,這樣資料對映到高維空間後就能較為容易的分開。其他SVM、核方法、等等也有類似的基本思想。
但是在早期機器學習的研究中涉及到很多降維的方法,例如PCA、CCA、LDA等等,這些降維操作目的是從高維資料中選取較為重要的幾個維度作為新的特徵維度,這樣做的好處是可以去除噪聲。但是這樣看來好像與深度學習等方法的方向完全相反。
其實方法確實不同,但是應用場景不同,早期機器學習的研究過程中,資料量很小,並且還在高維空間,這樣就會有很多的噪聲冗餘成分,這時候就需要做降維操作。但是現在應用深度學習可以擁有足夠大的資料量,這樣可以將資料對映到高維空間使之變的線性可分,運用到高維空間中線性分類器的優勢。
僅為本人的一點思考,歡迎討論。
相關推薦
PCA等降維操作與深度學習的不同點的一些思考
深度學習的本質上是將資料從低維空間對映到高維空間,但是並不僅僅有這個作用,拿全連線層舉例,假設輸入資料500維,可以對映到1000維做一個升維操作,也可以降維到256維,但往往經過一個完整的神經網路後
深度學習的一些思考
本文記錄一些對深度學習的思考總結.意識流寫法,想到哪寫到哪,日後不定期更新補充. 在沒有接觸深度學習的時候,覺得這是個非常高大上的技術,數學基礎要求非常多,上手門檻非常高.我想很多人和我有一樣的想法.這種對深度學習的印象,我想很大一部分來自鋪天蓋地的自媒體的有關AI的報道解讀,造成了一種深度學習,人工智慧非常
吳恩達機器學習 - PCA演算法降維 吳恩達機器學習 - PCA演算法降維
原 吳恩達機器學習 - PCA演算法降維 2018年06月25日 13:08:17 離殤灬孤狼 閱讀數:152 更多
十大統計技術,包括線性迴歸、分類、重取樣、降維、無監督學習等。
統計學習方法的經典研究主題包括: 線性迴歸模型 感知機 k 近鄰法 樸素貝葉斯法 決策樹 Logistic 迴歸與最大熵模型 支援向量機 提升方法 EM 演算法
分享《動手學深度學習(李沐等著)》PDF+源代碼+《神經網絡與深度學習(吳岸城)著》PDF
.com aid 源代碼 inf nbsp 技術 http bubuko pdf 下載:https://pan.baidu.com/s/11O2m_uxSWJGbkXHF2Zh94w 更多資料:https://pan.baidu.com/s/1g4hv05UZ_w92uh9
【Python資料探勘課程】七.PCA降維操作及subplot子圖繪製
這篇文章主要介紹四個知識點,也是我那節課講課的內容。 1.PCA降維操作; 2.Python中Sklearn的PCA擴充套件包; 3.Matplotlib的subplot函式繪製子圖; 4.通過Kmean
吳恩達.深度學習系列-C1神經網路與深度學習-w3-(作業:一個隱藏層進行二維資料分類)
前言 **注意:coursera要求不要在網際網路公佈自己的作業。如果你在學習這個課程,建議你進入課程系統自行完成作業。使用邏輯迴歸作為一個最簡單的類似神經網路來進行影象判別。我覺得程式碼有參考和保留的意義。v 使用一個 2×4×1的網路來對資料進
機器學習(五)PCA資料降維
PCA資料降維 作者:hjimce 一、PCA相關理論 PCA演算法又稱主成分分析,是一種分析、簡化資料集的技術。主成分分析經常用於減少資料集的維數,同時保持資料集中的對方差貢獻最大的特徵。PCA的
機器學習-python編寫主成分分析(PCA)資料降維
程式碼及資料集下載:PCA 在機器學習之前通常需要對資料進行降維處理,有以下原因: 使得資料集更易使用 降低很多演算法的計算開銷 去除噪聲 使得結果易懂 這裡講的降維方法為主成分分析法(PCA),將資料從原來的座標系轉換到新的座標系,新的座標系的選擇是
神經網絡與深度學習
二分 基礎 矩陣 尺寸 訓練 深度學習 sub 樣本 rgb 第二周 神經網絡基礎 2.1 二分分類 二分類:訓練一個分類器,輸入圖片的特征向量x,預測結果的標簽是0還是1 輸入rgb圖片尺寸為64*64,則輸入特征向量(列向量)x為64*64*3 寫法:m個訓練樣本 {
[神經網絡與深度學習(一)]使用神經網絡識別手寫數字
線性 部分 logs 結構 這一 可用 調整 重復 http 1.1 感知器 感知器的輸出為: wj為權重,表示相應輸入對輸出的重要性; threshold為閾值,決定神經元的輸出為0或1。 也可用下式表示: 其中b=-threshold,稱為感知器的偏置
《神經網絡與深度學習》(三) 稀疏編碼
學習方法 深度學習 變體 復雜 鏈接 線性規劃 con images 叠代 轉自:http://www.cnblogs.com/caocan702/p/5666175.html 借鑒前人的文章鏈接 http://blog.csdn.net/zouxy09/article
《神經網絡與深度學習》讀書筆記
1.3 容易 讀書筆記 自動調整 表示 引入 能夠 自動 神經網絡 1.1 感知器 感知器是一種人工神經元.它接受幾個二進制輸出並產生一個二進制輸入.如果引入權重和閾值,那麽感知器的參數可以表示為:,如果再引入偏置(表示激活感知器有多容易的估算),那麽規則可以簡潔表示
【讀書1】【2017】MATLAB與深度學習——多元分類(3)
假設神經網路在給定輸入資料時產生如圖4-11所示的輸出。 Assume that the neural network produced theoutput shown in Figure 4-11 when given the input data. 圖4-11 當使用sigmo
【讀書1】【2017】MATLAB與深度學習——多元分類(2)
這種轉換意味著每個輸出節點都對映到向量中的一個元素,只有該元素對應的節點產生1。 This transformation implies that eachoutput node is mapped to an element of the class vector, which onl
【讀書1】【2017】MATLAB與深度學習——多元分類(1)
多元分類(Multiclass Classification) 本節介紹如何利用神經網路來處理三種或三種以上的分類。 This section introduces how to utilize theneural network to deal with the classific
【讀書1】【2017】MATLAB與深度學習——二元分類(2)
圖4-4 改變分類符號的表示方法Change the class symbolsand the data is classified differently 圖4-4所示的訓練資料是我們用來訓練神經網路的。 The training data shown in Figure 4-4
【讀書1】【2017】MATLAB與深度學習——二元分類(1)
圖4-2 二元分類的訓練資料格式Training data binaryclassification 圖中的前兩個數字分別表示x和y座標,符號表示該資料所屬的類別。 The first two numbers indicate the x and ycoordinates resp
機器學習(四) 機器學習與深度學習的實際應用整理
前言 本文主要是整理備份機器學習與深度學習的實際應用,儘量給出原始作者網站,包括論文、程式碼和github等原始資料。共勉! 實際應用 基於深度神經網路的免費開源的人臉識別系統 openface已經到了0.2.1了,備份一個基
神經網路與深度學習課程筆記(第三、四周)
接著學習吳恩達老師第三、四周的課程。(圖片均來自吳恩達老師課件) 第三週 1. 普通的淺層網路