1. 程式人生 > >神經網絡基本原理簡明教程-0-Python-Numpy庫的點滴

神經網絡基本原理簡明教程-0-Python-Numpy庫的點滴

nump master all 廣播 per .sh 繪圖 解惑 資源

Python中的Numpy的基本知識

Copyright ? Microsoft Corporation. All rights reserved.
適用於License版權許可

更多微軟人工智能學習資源,請見微軟人工智能教育與學習共建社區

以下列出一些關於Numpy矩陣運算的基本知識和坑點。

首先需要在命令行中安裝Numpy庫和繪圖庫(可選):

pip install numpy
pip install matplotlib

然後在python文件的第一行,加入對它們的引用:

import numpy as np
import matplotlib.pyplot as plt
  • 基本矩陣運算
a=np.array([1,2,3,4,5,6]).reshape(2,3)
b=np.array([1,1,1,1,1,1]).reshape(2,3)

print("a:")
print(a)

print("b:")
print(b)

print("a*b:")
print(a*b)

print("np.multiply(a,b):")
print(np.multiply(a,b))

print("np.dot(a,b.T)")
print(np.dot(a,b.T))

# 以下這個命令會出錯
print(np.dot(a,b))

結果:

a:
[[1 2 3]
 [4 5 6]]
b:
[[1 1 1]
 [1 1 1]]
a*b:
[[1 2 3]
 [4 5 6]]
np.multiply(a,b):
[[1 2 3]
 [4 5 6]]
np.dot(a,b.T)
[[ 6  6]
 [15 15]]

可以看到,a*b和np.multiply(a,b)的作用是一樣的,都是點乘,即兩個矩陣中相對應位置的數值相乘,element wise operation。它的輸出與相乘矩陣的尺寸一致。

而np.dot是標準的矩陣運算,。如果輸入是(3x2)x(2x4),則輸出為3x4。要求a的列數和b的行數一樣才能相乘,所以我們把b轉置了一下,b本身是2行3列,b.T就是3行2列,a是2行3列,結果是2行2列。所以,一定不要被np.dot這個函數名字迷惑了,它不是點乘的意思。

a=np.array([1,2,3])
b=np.array([1,1,1]).reshape(1,3)
print(a.shape)
print(a*b)
a=a.reshape(3,1)
print(a.shape)
print(a*b)

結果:

(3,)
[[1 2 3]]
(3, 1)
[[1 1 1]
 [2 2 2]
 [3 3 3]]

第一次定義a時,是一個1維列向量,shape=(3,),用a*b得到的結果是shape=(1,3)的矩陣[[1 2 3]]。
後來把a.reshape(3,1)3行1列的二維矩陣,雖然表面看起來形式沒變,但是在與b點乘後,得到了一個(3,3)的矩陣。
為了避免一些錯誤,最好在每次矩陣運算前,都把兩個矩陣reshape成一個二維矩陣(或多維矩陣)。

神經網絡中的計算過程

  • w=(3x2)
    w=np.array([1,2,3,4,5,6]).reshape(3,2)
[[1 2]
 [3 4]
 [5 6]]
  • b=(3x1)
    b=np.array([1,2,3]).reshape(3,1)
[[1]
 [2]
 [3]]
  • x=(2x4)(2個特征值,4個樣本)
    x=np.array([2,3,4,5,6,7,8,9]).reshape(2,4)
[[2 3 4 5]
 [6 7 8 9]]
  • c=np.dot(w,x)
[[14 17 20 23]
 [30 37 44 51]
 [46 57 68 79]]
  • z=c+b = np.dot(w,x) + b
    註意:這裏加法有對b的列廣播(自動擴充b為4x3,通過復制b的值為3列)
b=
[[1 1 1 1]
 [2 2 2 2]
 [3 3 3 3]]

z=
[[15 18 21 24]
 [32 39 46 53]
 [49 60 71 82]]
  • y=np.array([6,5,4,3]).reshape(1,4)
    4個樣本的標簽值
[[6 5 4 3]]
  • dz = z - y
    註意:這裏減法有對z的廣播(通過復制y的值為3行)
z=
[[15 18 21 24]
 [32 39 46 53]
 [49 60 71 82]]

y=
[[6 5 4 3]
 [6 5 4 3]
 [6 5 4 3]]

dz=
[[ 9 13 17 21]
 [26 34 42 50]
 [43 55 67 79]]
  • db = dz.sum(axis=1,keepdims=True)/4
    4是樣本數。axis=1, 按列相加,即一行內的所有列元素相加。除以4是廣播。
[[15.]
 [38.]
 [61.]]
  • dw=np.dot(dz,x.T)/4
    x.T是x的轉置。除以4是廣播。 dz=3x4, x.T=4x2, 結果是3x2,正好是w的shape。
[[ 57.5 117.5]
 [143.  295. ]
 [228.5 472.5]]
  • w = w - 0.1*dw
[[ -4.75  -9.75]
 [-11.3  -25.5 ]
 [-17.85 -41.25]]
  • b = b - 0.1*db
[[-0.5]
 [-1.8]
 [-3.1]]

點擊這裏學習更多神經網絡基本課程
點擊這裏提交問題與建議
聯系我們: [email protected]
學習了這麽多,還沒過癮怎麽辦?歡迎加入“微軟 AI 應用開發實戰交流群”,跟大家一起暢談AI,答疑解惑。掃描下方二維碼,回復“申請入群”,即刻邀請你入群。
技術分享圖片

神經網絡基本原理簡明教程-0-Python-Numpy庫的點滴