《Deep Learning》第二章線性代數筆記

阿新 • • 發佈：2018-11-01

第二章線性代數

2.1 名詞

標量（scalar）、向量（vector）、矩陣（matrix）、張量（tensor）

2.2 矩陣和向量相乘

1. 正常矩陣乘法； 2. 向量點積； 3. Hadamard乘積（元素對應乘積）

矩陣乘法服從分配律、結合律，兩個向量的點積滿足交換律，利用兩個向量點積的結果是標量（scalar），標量轉置是自身。

2.3 單位矩陣和逆矩陣

逆矩陣一般作為理論工具使用，計算機由於精度不足，一般不使用逆矩陣。

2.4 線性相關和生成子空間

線性方程組，解的個數：0、1、∞，不存在有限多個解的情況。

線性方程組，只有方陣，且是非奇異的（所有列向量線性無關）才能用逆矩陣求解。

2.5 範數(norm)

將向量對映到非負值的函式（衡量向量到原點的距離），滿足距離三要素。

範數分為x範數和L^x範數，例如L²被稱為歐幾里得範數。

L⁰範數（在數學意義上是不對的）：非零元素數目個數。

L¹範數：常用於資料集中於原點附近；零和非零元素差異非常重要；非零元素數目的替代函式（因為L⁰範數對向量縮放無感知）

L²範數：歐幾里得範數，其平方值常用於衡量向量的大小，可以簡單的通過點積運算。（在原點附近增長的十分緩慢，此時推薦用L¹範數）

L^∞範數：最大範數，最大的元素的絕對值，即||x||_∞=max_i(|x_i|)

Frobenius範數：常用於衡量矩陣的大小，在深度學習中的最常見做法，計算矩陣每個元素的平方和後開方，類似於向量的L²

範數。

2.6 特殊型別的矩陣和向量

單位向量（unit vector）是具有單位範數（unit norm）的向量：||x||₂=1（歐幾里得距離為1）。

如果兩個向量不僅相互正交（點積為0）且範數為1，稱為標準正交（orthonormal）。

正交矩陣（orthogonal matrix）：行向量和列向量分別是標準正交的方陣。

2.7 特徵分解

將矩陣分解為特徵值 λ 和特徵向量的表示形式。（一般只有方陣才有）

可以看作在二維平面上畫出特徵向量後，乘上矩陣A表示這個向量被拉伸了 λ 倍，如下圖：

λ > 0：正定矩陣（positive definite）

λ ≥ 0：半正定矩陣（positive semidefinite）

λ < 0：負定矩陣（negative definite）

2.8 奇異值分解 SVD

這裡書裡講的不是很清楚，推薦一個視訊：https://www.bilibili.com/video/av15971352

博主先在這裡說說自己對SVD的理解：就是

提取矩陣的特徵，按特徵的重要程度從大到小排序，每個特徵的權重就是奇異值，特徵本身就是奇異向量，當保留權重較大的幾個特徵時，能夠很好地還原出原矩陣。

因為非方陣的矩陣無法計算逆矩陣，所以無法進行特徵分解，故提出了奇異值分解（singular value decomposition）。

每個實數矩陣都有一個奇異值分解，但不一定都有特徵值分解。（例如，非方陣的矩陣沒有特徵分解，這時只能用奇異值分解）。

且奇異值分解有著更廣泛的應用（例如特徵降維，矩陣去噪）。

博主對原理的理解：SVD就是分別計算A^TA和AA^T，讓其變成方陣，然後對角化，從對角化後的資訊中提取特徵，經過轉換後作為奇異值，從而復原矩陣A。

2.9 Moore-Penrose偽逆（廣義逆矩陣）

A⁺=VD⁺U^T

U，D和V是矩陣A奇異值分解（SVD）後得到的矩陣，對角矩陣D的偽逆D⁺是其非零元素取倒數之後再轉置得到的。

當矩陣A的列數多於行數（矮胖）時，用偽逆求解線性方程是眾多可能解法中的一種。但是x=A⁺y是方程所有可行解中歐幾里得範數L²最小的一個。

當行數多於列數時，可能沒有解（因為沒有滿秩），在這種情況下，通過偽逆得到的x使得Ax和y的歐幾里得距離||Ax-y||₂最小。

（這部分沒怎麼查資料，暫時不知道其在機器學習中的應用）

2.10 跡運算

沒什麼好說的，對角線元素的和，以下是跡運算的性質：

一個矩陣的轉置不影響跡的大小；

多個矩陣相乘，將最後一個挪到最前面之後，跡是相同的（ Tr(ABC)=Tr(CAB)=Tr(BCA) ）。

標量在跡運算後仍然是它自己。a=Tr(a)；

迴圈置換後矩陣形狀變了，也不影響跡的大小。

2.11 行列式

det(A)等於矩陣特徵值的乘積，用來衡量矩陣參與矩陣乘法後空間擴大或者縮小了多少。

2.12 例項：主成分分析 PCA

關鍵詞：單位範數、L²範數、最優化問題、向量微積分、Frobenius範數……

這塊有點困難，之後補上。

《Deep Learning》第二章線性代數筆記

第二章線性代數 2.1 名詞標量（scalar）、向量（vector）、矩陣（matrix）、張量（tensor） 2.2 矩陣和向量相乘 1. 正常矩陣乘法； 2. 向量點積； 3. Hadamard乘積（元素對應乘積）矩陣乘法服從分配律、結合律，兩個向量的點積滿足交換律，利用兩個向量點積的

深度學習（花書）讀書筆記——第二章-線性代數

第二章-線性代數2.1 標量、向量、矩陣和張量標量(scalar):一個標量就是一個單獨的數,它不同於線性代數中研究的其他大部分物件(通常是多個數的陣列)。向量(vector):一個向量是一列數。這些數是有序排列的。

深度學習"聖經" | 第二章線性代數

深度學習領域聖經，英文原版的三位作者 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 本人僅對中文版深度學習書中，提煉筆記，添加個人理解，該筆記僅作為個人深度學習知識的學習、總結、複習使用。若有錯誤，還望

MIT線性代數筆記-第二十四講

Markov Matrices ⎡⎣⎢.1.2.7.01.99.0.3.3.4⎤⎦⎥[.1.01.3.2.99.3.7.0.4] 馬爾科夫矩陣有兩條性質: 1.所有項大於0(由於項與概率相關) 2.所有列相加為1 要點: 1.λ=1λ=1為一個特徵值

【資料結構基礎筆記】第二章線性表之單鏈表

目錄一、簡要 1、涵蓋內容 2、學習要求二、匯入三、線性連結串列 1、鏈式儲存結構 2、注意點四、單鏈表 1、單鏈表優點 2、單鏈表缺點 3、結點型別描述 4、注意點五、單鏈表的實現 1、連結串列的創立 2、連結串列的操作

線性代數筆記第二天

解線性方程組：克萊姆法則: 方程組有解且唯一；逆矩陣（初等變換）：利用逆矩陣可解線性方程組；當係數行列式D =0時，則方程組無解或有無窮解； &nb

深度學習 Deep Learning UFLDL 最新Tutorial 學習筆記 4：Debugging: Gradient Checking

style inline add tom radi posit math size tutorial 1 Gradient Checking 說明前面我們已經實現了Linear Regression和Logistic Regression。關鍵在於代價函數Cost Fun

線性代數筆記

進一步否則 ace 最重要的 pro text 如何給定它的感覺光聽課效果不是特別好，象征性地記一下關鍵點（也許是。。），用於概念速查、要點回顧。反正不費時間並且也沒明顯壞處。。不涉及細節、沒有系統性。 https://space.bilibili.c

第二章線性表2（鏈接表）

first ppr bound 是否 class nds lang spl ado 3.5.2 鏈接表接口鏈接表可以看成是一組結點序列以及基於結點進行操作的線性結果的抽象，或則說是對鏈表的抽象。鏈接表的接口： 1 package com.datastructure

線性代數筆記8——求解逆矩陣

掃描 tro 二維矩陣 ont 計算技術一起 get rda 　　在第一章中介紹了逆矩陣與奇異矩陣，我們可以通過一個行列式公式計算二維矩陣的逆，那麽更多維矩陣的逆如何求解呢？逆矩陣與方程組　　或許用行列式求逆矩陣的做法有些公式化，實際上可以將求逆矩陣看成解方程組：

線性代數筆記10——矩陣的LU分解

blog 線性方程組能夠向量 alt 過程 http ont 形式　　在線性代數中， LU分解(LU Decomposition)是矩陣分解的一種，可以將一個矩陣分解為一個單位下三角矩陣和一個上三角矩陣的乘積（有時是它們和一個置換矩陣的乘積）。LU分解主要應用在數值分

線性代數筆記14——行空間和左零空間

ali 線性 p s 置換方法一個由於學習圖片　　前面已經介紹了矩陣的零空間和列空間，它們都屬於矩陣的四個基本子空間，基本子空間還包括行空間和左零空間。　　召喚一個矩陣：　　為了找出零空間和列空間，先進行套路運算——轉換為行最簡階梯矩陣：　　三個主元

線性代數筆記18——投影矩陣和最小二乘

一維空間的投影矩陣　　先來看一維空間內向量的投影：　　向量p是b在a上的投影，也稱為b在a上的分量，可以用b乘以a方向的單位向量來計算，現在，我們打算嘗試用更“貼近”線性代數的方式表達。　　因為p趴在a上，所以p實際上是a的一個子空間，可以將它看作a放縮x倍，因此向量p可以用p = xa來表示

線性代數筆記20——行列式和代數餘子式

行列式　　如果有兩個向量<a1, a2>和<b1, b2>，那麼這兩個向量組成的行列式是：　　看起來只是表示一個簡單的計算，僅僅計算了一個數值，但是別忘了，行列式是由向量組成的，它一定會表示向量間的某種關係。　　在《線性代數筆記4——向量3（叉積）》中我們看到，二階行列

線性代數筆記20——行列式和代數余子式

逆矩陣想是質變可能想象不難圖片利用 info 行列式　　如果有兩個向量<a1, a2>和<b1, b2>，那麽這兩個向量組成的行列式是：　　看起來只是表示一個簡單的計算，僅僅計算了一個數值，但是別忘了，行列式是由向量組成的，它一定

吳恩達 deep learning 第二課第二週程式設計 optimization

Optimization Methods Until now, you've always used Gradient Descent to update the parameters and minimize the cost. In this notebook, you will learn

吳恩達 deep learning 第二課第一週程式設計作業一

Initialization Welcome to the first assignment of "Improving Deep Neural Networks". Training your neural network requires specifying an i

On Deep Learning-Based Channel Decoding 論文筆記

摘要我們重新考慮使用深度神經網路對隨機和結構化碼字（例如極性碼字）進行一次性解碼。雖然可以為碼字族和短碼字長度實現最大後驗（MAP）誤位元速率（BER）效能，但我們觀察到（i）結構化碼字更容易學習和（ii）神經網路能夠生成在結構化訓練期間從未見過的碼字，而不是隨機碼字。這些結果提供了一些證據，表明神經

第二章線性表

1,定義線性表是由n個數據元素A1,A2....Ai....An構成的有限序列，其中n代表表長，n=0代表空表。 2,線性表的特點存在唯一的第一個元素（這一點決定了圖不是線性表）存在唯一的

高質量嵌入式Linux C程式設計第二章資料學習筆記

一、什麼是資料型別？資料型別包含兩方面的內容，資料的表示和對資料加工的操作。資料的全部可能表示構成資料型別的值的集合，資料全部合理的操作構成資料型別的操作集合。二、什麼是變數？其值在作用域內可以改變的量稱為變數。一個變數應該有一個自己的名字，在記憶體中佔據

《Deep Learning》第二章 線性代數 筆記

第二章 線性代數

2.1 名詞

2.2 矩陣和向量相乘

2.3 單位矩陣和逆矩陣

2.4 線性相關和生成子空間

2.5 範數(norm)

2.6 特殊型別的矩陣和向量

2.7 特徵分解

2.8 奇異值分解 SVD

2.9 Moore-Penrose偽逆（廣義逆矩陣）

2.10 跡運算

2.11 行列式

2.12 例項：主成分分析 PCA

相關推薦

《Deep Learning》第二章線性代數筆記

第二章線性代數