矩陣求導

阿新 • • 發佈：2022-04-18

https://zhuanlan.zhihu.com/p/137702347

這篇文章講得不錯

好像下面這篇文章也寫得不錯，之後有空再看

https://zhuanlan.zhihu.com/p/24709748

雖然說學過微積分理論上就能推匯出矩陣求導的法則，但是矩陣求導的確是很麻煩，先不提張量相關，簡單的來組合一下就很多可能：

向量對標量求導（Vector-by-scalar）

向量，對標量求導，一般寫為：

常見例子是位移對時間求導，速度對時間求導。

標量對向量求導（Scalar-by-vector）

標量 y 對向量求導寫作：

這裡可能會讓人疑惑，為什麼上面是列向量而這裡則是行向量。

這是矩陣求導可能會比較麻煩的第二個地方，可能有不同的佈局方式：

分子佈局（Numerator Layout）：分子不變，分母轉置
分母佈局（Denominator Layout）：分母不變，分子轉置

當然還有混合佈局。

用分子佈局因為 wikipedia 裡就是這樣做的，而且有些只能有分子佈局表示。

這裡可能會分子佈局可能會有點讓人不習慣，因為比如梯度，我們很經常會把它看成列向量：

但實質上有些地方也把梯度看成/寫成行向量，重要的是比如你在使用的時候根據自己所預設的認為是行向量還是列向量的不同在做不同的操作的時候稍加註意就ok了，比如下面這個式子列向量無所謂，因為是點乘，但是如果看成矩陣之間的乘法當然我們就需要轉置作為列向量的梯度了：

向量對向量求導（Vector-by-vector）

向量對向量求導，同樣分子佈局：

正好是雅克比矩陣:

這是使用分子佈局的好處，否則就是雅克比的轉置了。

這樣的好處是寫下這個式子也很自然：

矩陣對標量求導（Matrix-by-scalar）

標量對矩陣求導（Scalar-by-matrix）

例子

之所以說矩陣求導本質上還是對單個變數求導，來看一個例子，比如：

先來計算 :

, 利用上面的向量對向量求導，使用雅克比矩陣：

同時也可以嘗試使用分母佈局，求出來對應為

計算

wikipedia 上的表格可以用來速查。除此之外還有一個網站可以用來計算矩陣求導：

Matrix Calculuswww.matrixcalculus.org

試一下：

還可以匯出為 Python code 或者 Latex ， cool，再試一個：

增加條件，為對稱矩陣：

looks good, cool!

Delta函式，C++的異常捕捉，以及矩陣求導等一些碎碎唸的概念

1.Delta函式：簡而言之就是除了0處取1其他地方都取0的函式，嚴格來講它並不是函式啊。。

矩陣求導（工具書）

本文主要記錄了常見的矩陣、向量求導的公式，並給出了相關證明一、基本概念與性質

矩陣求導

https://zhuanlan.zhihu.com/p/137702347 這篇文章講得不錯好像下面這篇文章也寫得不錯，之後有空再看

矩陣向量求導

本系列主要參考文獻為維基百科的Matrix Caculas和張賢達的《矩陣分析與應用》。

深度學習中的梯度計算（矩陣向量求導）

0. 標量、向量、矩陣互相求導的形狀標量、向量和矩陣的求導（形狀）標量x (1,)

pytorch中的自定義反向傳播,求導例項

pytorch中自定義backward()函式。在影象處理過程中，我們有時候會使用自己定義的演算法處理影象，這些演算法多是基於numpy或者scipy等包。

Numpy 中的矩陣求逆例項

1. 矩陣求逆 import numpy as np a = np.array([[1,2],[3,4]]) # 初始化一個非奇異矩陣(陣列)

tensorflow求導和梯度計算例項

1. 函式求一階導 import tensorflow as tf tf.enable_eager_execution() tfe=tf.contrib.eager from math import pi

淺談Pytorch中的自動求導函式backward()所需引數的含義

正常來說backward( )函式是要傳入引數的，一直沒弄明白backward需要傳入的引數具體含義，但是沒關係，生命在與折騰，咱們來折騰一下，嘿嘿。

FZU 第十六屆程式設計競賽_重現賽 & FOJ Problem 2314 寶寶會求導題解

FZU 第十六屆程式設計競賽_重現賽 & FOJ Problem 2314 寶寶會求導已知 \$\\displaystyle f(x)={1\\over e^{-x}+1}\$

牛客5月1日問題1 求導

連結：https://ac.nowcoder.com/acm/contest/5389/A來源：牛客網題目描述牛牛今天學習了求導，對函式 f(x) 求導記作 f(x)\'

PAT(Basic Level) 1010 一元多項式求導

1 //錯誤程式碼 2 #include<iostream> 3 4 using namespace std; 5 6 int main(){ 7int a[100];

Ceres求解直接法BA實現自動求導

作者：郭田峰來源：公眾號@3D視覺工坊連結：Ceres求解直接法BA實現自動求導 BA，即Bundle Adjustment，通常譯為光束法平差，束調整，捆綁調整等。但高翔博士覺得這些譯名不如英文名稱來得直觀，所以保留英文名，

Pytorch Autograd (自動求導機制)

Pytorch Autograd (自動求導機制) Introduce Pytorch Autograd庫 (自動求導機制) 是訓練神經網路時，反向誤差傳播(BP)演算法的核心。

1010 一元多項式求導 (25分)

設計函式求一元多項式的導數。（注：xn（n為整數）的一階導數為nxn−1。）

矩陣求逆（LUP分解演算法）

　　原理基於 gaussian jordan elimination 方法，考慮求解如下線性方程組： $$ \\begin{equations}

【小白學PyTorch】20 TF2的eager模式與求導

【新聞】：機器學習煉丹術的粉絲的人工智慧交流群已經建立，目前有目標檢測、醫學影象、時間序列等多個目標為技術學習的分群和水群嘮嗑的總群，歡迎大家加煉丹兄為好友，加入煉丹協會。微信：cyx645016617.

常見函式求導

那如果讓你證明你會嗎？我不會如果用定義會很麻煩，這裡用到的都是反函式，就想到了反函式求導法則

PAT乙級1010.一元多項式求導

設計函式求一元多項式的導數。（注：x^n（n為整數）的一階導數為nx^n-1)xn（n為整數）的一階導數為nxn−1。）n（n為整數）的一階導數為nxn−1。）

資料結構一元多項式求導連結串列_考研資料結構的學習路線

技術標籤：資料結構一元多項式求導連結串列 20考研已經落幕，結局圓滿。之前寫的帖子反響還可以，雖然流量不多，不過也知足了。後來很多學弟私聊我說能不能寫一個專業課的學習路線或者心得，想了想，該寫！算是

矩陣求導

向量對標量求導 （Vector-by-scalar）

標量對向量求導（Scalar-by-vector）

向量對向量求導（Vector-by-vector）

矩陣對標量求導 （Matrix-by-scalar）

標量對矩陣求導（Scalar-by-matrix）

例子

計算

相關推薦

向量對標量求導（Vector-by-scalar）

矩陣對標量求導（Matrix-by-scalar）