1. 程式人生 > >機器學習基石 作業0

機器學習基石 作業0

機器學習基石 作業0


網上沒找到作業0的答案,這是自己做的版本,有一些可能會有錯誤,歡迎討論。

1 Probability and Statistics

在這裡插入圖片描述
用數學歸納法。N=1時滿足,假定N=n滿足,當N=n+1同樣滿足。得證。

在這裡插入圖片描述
10個挑4個正面 C 10

4 ( 1 / 2 ) 4 ( 1 /
2 ) 6 C_{10}^{4}(1/2)^{4}(1/2)^{6}
52張牌挑5個。先從13個裡挑2個數字,這兩種做X和Y時不相同,再計算2種數字的組合方式。 A
13 2 C 4 3 C 4 2 C 52 5 \dfrac{A_{13}^{2}C_{4}^{3}C_{4}^{2}}{C_{52}^{5}}

在這裡插入圖片描述
假設已知第一次正面,那麼三次都是正面的概率是1/4。而提供的是有一個已知正面,那麼三次裡每一次都有可能。即 3 1 / 3 1 / 4 = 1 / 4 3*1/3*1/4 = 1/4
在這裡插入圖片描述
p ( x = 1 x = 1 ) = p ( x = 1 ) p ( x = 1 ) = 1 / 2 1 / 4 1 / 2 1 / 4 + 1 / 2 1 / 8 = 2 / 3 p(x=-1| |x|=1) = \dfrac{p(x=-1)}{p(|x|=1)} = \dfrac{1/2*1/4}{1/2*1/4+1/2*1/8} = 2/3
在這裡插入圖片描述
0.3 0 0.7 0.4

2 Linear Algebra

在這裡插入圖片描述
秩為2
在這裡插入圖片描述
( 1 / 8 5 / 8 3 / 4 1 / 4 1 / 4 1 / 2 3 / 8 3 / 8 1 / 4 ) \begin{pmatrix} 1/8 & -5/8 & 3/4 \\ -1/4 & 1/4 & -1/2 \\ 3/8 & -3/8 & 1/4 \end{pmatrix}
在這裡插入圖片描述
λ 1 = 4         λ 2 = λ 3 = 2 \lambda_{1} = 4 \ \ \ \ \ \ \ \lambda_{2}=\lambda_{3}=2
對應特徵向量 v 1 = [ 1   2   1 ]    v 2 = v 3 = [ 1   1   2 ] v_{1}= [1\ 2 \ -1] \ \ v_{2}=v_{3} = [1 \ 1 \ -2] v 2 v_{2} v 3 v_{3} 只要滿足元素和為0即可,也不用相等
在這裡插入圖片描述
(a) svd分解中 U U V V 都是正交矩陣,直接乘即可。
(b)兩個矩陣相乘得單位陣
在這裡插入圖片描述
(a) x T Z Z T x x^{T}ZZ^{T}x = ( Z T x ) Z T x (Z^{T}x)*{Z^{T}x} 結果的每個元素都非負,得證
(b)對稱矩陣可以用標準正交陣進行分解,在特徵值都為正時結果的每個元素為正。

在這裡插入圖片描述
x T x x \dfrac{x^{T}x}{|x|} x x \dfrac{x}{|x|}
x T x x \dfrac{-x^{T}x}{|x|} x x \dfrac{-x}{|x|}
0 當u與x垂直時

3 Caculus


普通求導
在這裡插入圖片描述
鏈式法則普通求導
在這裡插入圖片描述
普通求梯度和黑塞矩陣
在這裡插入圖片描述
二元泰勒展開 https://zhuanlan.zhihu.com/p/33316479
可以用上(3)中的梯度和黑塞矩陣的結果
在這裡插入圖片描述
求導為0的地方是最小值。因為只有一個矩陣為0的位置,而正無窮與負無窮兩頭對應的結果都是無窮大且值一直大於0。
在這裡插入圖片描述
應該是按矩陣乘法裡的每個分量進行求導然後寫會矩陣形式。略難寫。