神經網路實現基本的與或異或邏輯

阿新 • • 發佈：2019-01-01

平時計算機領域的OR AND XOR邏輯問題就不去詳說，大家都有學習過。

基本的邏輯圖如下：

最開始神經網路解決線性可分問題給它帶來了一次小高峰，但是在幾年之後一個學者提出了XOR非線性問題的時候，並且專門寫了一篇論文論述神經網路對非線性問題求解的無能為力直接給當年的神經網路的發展帶來了寒冰時代。直到十幾年後，多層網路的出現，也就是俗稱的MLP(Multiply layer perceptron)才把Neural Network帶來不斷髮展的時期。

我們知道OR或者AND都是線性可分，而XOR卻是非線性可分的，用一幅圖表示：

對於第三個座標是無論如何也無法畫出一條2維座標上的直線把星星和圓圓直接分開的。

接下來我們使用最開始的神經網路程式碼來實現，也就是一個輸入層，然後加上各自的權重後再總體加上偏置得到輸出。

程式碼：

percetron.py

import numpy as np

class Perceptron:
	def __init__(self, N, alpha=0.1):
		self.W = np.random.randn(N + 1) / np.sqrt(N)
		self.alpha = alpha

	def step(self, x):
		return 1 if x > 0 else 0

	def fit(self, X, y, epochs=10):
		X = np.c_[X, np.ones((X.shape[0]))]

		for epoch in np.arange(0, epochs):
			for (x, target) in zip(X, y):
				p = self.step(np.dot(x, self.W))

				if p != target:
					error = p - target
					self.W += -self.alpha * error * x

	def predict(self, X, addBias=True):
		X = np.atleast_2d(X)

		if addBias:
			X = np.c_[X, np.ones((X.shape[0]))]

		return self.step(np.dot(X, self.W))

test.py

from perceptron import Perceptron
import numpy as np

X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_or = np.array([[0], [1], [1], [1]])
y_and = np.array([[0], [0], [0], [1]])
y_xor = np.array([[1], [0], [0], [1]])

print("[INFO] training perceptron....")
p = Perceptron(X.shape[1], alpha=0.1)
p.fit(X, y_or, epochs=20)

print("[INFO] testing perceptron OR...")
for (x, target) in zip(X, y_or):
	pred = p.predict(x)
	print("[INFO] data={}, ground_truth={}, pred={}".format(x, target[0], pred))

print("[INFO] training perceptron AND....")
p = Perceptron(X.shape[1], alpha=0.1)
p.fit(X, y_and, epochs=20)

print("[INFO] testing perceptron AND...")
for (x, target) in zip(X, y_and):
	pred = p.predict(x)
	print("[INFO] data={}, ground_truth={}, pred={}".format(x, target[0], pred))

print("[INFO] training perceptron XOR....")
p = Perceptron(X.shape[1], alpha=0.1)
p.fit(X, y_xor, epochs=200)

print("[INFO] testing perceptron XOR...")
for (x, target) in zip(X, y_xor):
	pred = p.predict(x)
	print("[INFO] data={}, ground_truth={}, pred={}".format(x, target[0], pred))

print("X.shape\n", X.shape)
print("X.shape[0]\n", X.shape[0])
print("X.shape[1]\n", X.shape[1])

result:

可見對於XOR問題，沒有隱藏層存在的情況下，神經網路基本學不到那種分類能力。然後我們改進網路，加入hidden layers，然後看能否解決問題，這裡只加入一層的隱藏層。

neuralnetwork.py

import numpy as np
# 將完整的神經網路結構定義成類
class NeuralNetwork:
	# 初始化，建構函式
	def __init__(self, layers, alpha=0.1):
		self.W = []
		self.layers = layers
		self.alpha = alpha
		# 除了最後兩層網路外，其他的都初始化Weight
		for i in np.arange(0, len(layers) - 2):
			# 先初始化常規的weights矩陣
			w = np.random.randn(layers[i] + 1, layers[i+1] + 1)
			# 歸一化
			self.W.append(w / np.sqrt(layers[i]))
			# print("W without bias trick:\n", self.W)
			# 使用bias trick也就是在W矩陣最後一列加入新的一列作為bias然後weight和bias合併為一個大W矩陣
			# biases可以作為學習引數進行學習
		w= np.random.randn(layers[-2] + 1, layers[-1])
		# 歸一化
		self.W.append(w / np.sqrt(layers[-2]))
		# print("W with bias trick:\n", self.W)
	
	# 過載python的magic函式
	def __repr__(self):
		return "NeuralNetwork:{}".format("-".join(str(l) for l in self.layers))

	def sigmoid(self, x):
		return 1.0 / (1 + np.exp(-x))
	# 對sigmoid函式求導
	def sigmoid_deriv(self, x):
		'''
		y = 1.0 / (1 + np.exp(-x))
		return y * (1 - y)
		'''
		return x * (1 - x)

	def fit(self, X, y, epochs=1000, displayUpdate=100):
		X = np.c_[X, np.ones((X.shape[0]))]
		losses = []
		# 根據每一層網路進行反向傳播，然後更新W
		for epoch in np.arange(0, epochs):
			for (x, target) in zip(X, y):
				self.fit_partial(x, target)
			# 控制顯示，並且加入loss
			if epoch == 0 or (epoch + 1) % displayUpdate == 0:
				loss = self.calculate_loss(X, y)
				losses.append(loss)
				print("[INFO] epoch={}, loss={:.7f}".format(epoch + 1, loss))
		return losses
	# 鏈式求導
	def fit_partial(self, x, y):
		A = [np.atleast_2d(x)]

		for layer in np.arange(0, len(self.W)):
			net = A[layer].dot(self.W[layer])

			out = self.sigmoid(net)

			A.append(out)

		# backprogation algorithm
		error = A[-1] - y

		D = [error * self.sigmoid_deriv(A[-1])]

		for layer in np.arange(len(A) - 2, 0, -1):
			delta = D[-1].dot(self.W[layer].T)
			delta = delta * self.sigmoid_deriv(A[layer])
			D.append(delta)

		D = D[::-1]
		# 更新權值W
		for layer in np.arange(0, len(self.W)):
			self.W[layer] += -self.alpha * A[layer].T.dot(D[layer])
	# 預測
	def predict(self, X, addBias=True):
		p = np.atleast_2d(X)
		# 是否加入偏置
		if addBias:
			p = np.c_[p, np.ones((p.shape[0]))]
		# 正常的前向傳播得到預測的輸出值
		for layer in np.arange(0, len(self.W)):
			p = self.sigmoid(np.dot(p, self.W[layer]))

		return p
	# 計算loss，就是計算MSE
	def calculate_loss(self, X, targets):
		targets = np.atleast_2d(targets)
		predictions = self.predict(X, addBias=False)
		loss = 0.5 * np.sum((predictions - targets) ** 2)

		return loss


if __name__ == '__main__':
	nn = NeuralNetwork([2, 2, 1])
	print(nn)

test.py

from neuralnetwork import NeuralNetwork
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
# 生成的資料
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_or = np.array([[0], [1], [1], [1]])
y_and = np.array([[0], [0], [0], [1]])
y_xor = np.array([[0], [1], [1], [0]])
# 構造2-2-1結構的神經網路，2個節點輸入層，2個節點的隱藏層，1個節點的輸出層
nn = NeuralNetwork([2, 2, 1], alpha=0.5)
# 模型開始訓練，更新得到最終不斷迭代更新的weigh矩陣
losses = nn.fit(X, y_xor, epochs=2000000)
# 列印輸出
for (x, target) in zip(X, y_xor):
	pred = nn.predict(x)[0][0]
	step = 1 if pred > 0.5 else 0
	print("[INFO] data-{}, ground_truth={}, pred={:.4f}, step={}"
		.format(x, target[0], pred, step))

# 視覺化訓練過程
plt.style.use("ggplot")
plt.figure()
plt.title("Data")
cm_dark = mpl.colors.ListedColormap(['g', 'b'])
plt.scatter(X[:, 0], X[:, 1], marker="o", c=y_xor.ravel(), cmap=cm_dark, s=80)
# print(testY)

plt.style.use("ggplot")
plt.figure()
plt.plot(np.arange(0, len(losses)), losses)
plt.title("Training Loss")
plt.xlabel("Epoch #")
plt.ylabel("Loss")
plt.show()

print("W\n", nn.W)

result:

很好，可見加入一層hidden layer之後，可以很好解決非線性問題。

這裡當然也可以把網路定義成之前的沒有隱藏層的結構：

test.py

from neuralnetwork import NeuralNetwork
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
# 生成的資料
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_or = np.array([[0], [1], [1], [1]])
y_and = np.array([[0], [0], [0], [1]])
y_xor = np.array([[0], [1], [1], [0]])
# 構造2-2-1結構的神經網路，2個節點輸入層，2個節點的隱藏層，1個節點的輸出層
nn = NeuralNetwork([2, 1], alpha=0.5)
# 模型開始訓練，更新得到最終不斷迭代更新的weigh矩陣
losses = nn.fit(X, y_xor, epochs=2000000)
# 列印輸出
for (x, target) in zip(X, y_xor):
	pred = nn.predict(x)[0][0]
	step = 1 if pred > 0.5 else 0
	print("[INFO] data-{}, ground_truth={}, pred={:.4f}, step={}"
		.format(x, target[0], pred, step))

# 視覺化訓練過程
plt.style.use("ggplot")
plt.figure()
plt.title("Data")
cm_dark = mpl.colors.ListedColormap(['g', 'b'])
plt.scatter(X[:, 0], X[:, 1], marker="o", c=y_xor.ravel(), cmap=cm_dark, s=80)
# print(testY)

plt.style.use("ggplot")
plt.figure()
plt.plot(np.arange(0, len(losses)), losses)
plt.title("Training Loss")
plt.xlabel("Epoch #")
plt.ylabel("Loss")
plt.show()

print("W\n", nn.W)

result:

我們將這一MLP演算法應用到MNIST資料集上看看：

testMNIST.py

from neuralnetwork import NeuralNetwork
from sklearn.preprocessing import LabelBinarizer
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report
from sklearn import datasets
import matplotlib as mpl
import matplotlib.pyplot as plt
import numpy as np
# 從sklearn包中匯入資料MNIST，其實是MNIST資料集的縮小版，僅包含1797張images
print("[INFO] loading mnist dataset...")
digits = datasets.load_digits()
data = digits.data.astype("float")
# print(data)
# 歸一化到（0， 1）
data = (data - data.min()) / (data.max() - data.min())
print("[INFO] samples:{}, dim:{}".format(data.shape[0], data.shape[1]))
# print(data)
# 75%做訓練資料集，25%做測試資料集
(trainX, testX, trainY, testY) = train_test_split(data, digits.target, test_size=0.25)

print("trainY:\n", trainY)
print("testY:\n", testY)
# 將標籤值向量化，即是one-hot編碼，如0--[1,0,0,0,0,0,0,0,0,0],1--[0,1,0,0,0,0,0,0,0,0],9--[0,0,0,0,0,0,0,0,0,1]
trainY = LabelBinarizer().fit_transform(trainY)
testY = LabelBinarizer().fit_transform(testY)

print("Vectorize trainY:\n", trainY)
print("trainY[0]\n", testY[0])
print("Vectroize testY:\n", testY)
# 定義網路結構64-32-32-16-10,64表示輸入層有64個nodes(因為8x8=64)，輸出層有10個nodes(10個數值0-9輸出)
print("[INFO] training network...")
nn = NeuralNetwork([trainX.shape[1], 32, 32, 16, 10])
print("[INFO] {}".format(nn))
# print("trainX.shape[0]:\n", trainX.shape[0])
# print("trainX.shape:\n", trainX.shape)

print("trainX.shape\n", trainX.shape)
print("testY.shape\n", testY.shape)
# 訓練模型
losses = nn.fit(trainX, trainY, epochs=5000)
# 預測，並生成報告
print("[INFO] evaluating network...")
predictions = nn.predict(testX)
predictions = predictions.argmax(axis=1)
print(classification_report(testY.argmax(axis=1), predictions))

plt.style.use("ggplot")
plt.figure()
plt.plot(np.arange(0, len(losses)), losses)
plt.title("Training Loss")
plt.xlabel("Epoch #")
plt.ylabel("Loss")
plt.show()

print("W\n", nn.W)

result:

得到97%的平均準確率還是可以的。

神經網路實現基本的與或異或邏輯

平時計算機領域的OR AND XOR邏輯問題就不去詳說，大家都有學習過。基本的邏輯圖如下：最開始神經網路解決線性可分問題給它帶來了一次小高峰，但是在幾年之後一個學者提出了XOR非線性問題的時候，並且專門寫了一篇論文論述神經網路對非線性問題求解的無能為力直接給當年的

pytorch系列 ---5以 linear_regression為例講解神經網路實現基本步驟以及解讀nn.Linear函式

本文主要講述最簡單的線性迴歸函式： y = w

Opencv人工神經網路實現字母與數字識別流程

人工神經網路簡介人工神經網路（Artificial Neural Network，ANN）簡稱神經網路(NN)，是基於生物學中神經網路的基本原理，在理解和抽象了人腦結構和外界刺激響應機制後，以網路拓撲知識為理論基礎，模擬人腦的神經系統對複雜資訊的處理機制的一種數學模型。神經網路是一種運算模型，由大量的節點

神經網路例程-使用（3-1）結構的神經網路實現與、或、異或三種邏輯運算

以下程式碼來自Deep Learning for Computer Vision with Python第十章。本例程需要在同一檔案內新建四個檔案。分別是1、perceptron.py；2、perceptron_or.py；3、perceptron_and.py；4、pe

或、與、異或

& 與（都是1時，結果才為1）表示按位與。 &表示按位與操作，我們通常使用0x0f來與一個整數進行&運算，來獲取該整數的最低4個bit位，例如，0x31 & 0x0f的結果為0x01。二進位制與運算規則:1&1=1

劍指offer——不用加減乘除做加法（按位與和異或）

class Solution { public: int Add(int num1, int num2) { while(num2 != 0){//若需要進位 int sum = num1 ^ num2;//異或，01=1，00=0，11=

《TensorFlow：實戰Google深度學習框架》——6.2 卷積神經網路簡介（卷積神經網路的基本網路結構及其與全連線神經網路的差異）

下圖為全連線神經網路與卷積神經網路的結構對比圖：由上圖來分析兩者的差異：全連線神經網路與卷積網路相同點 &nb

深度學習框架tensorflow學習與應用10（MNSIT卷積神經網路實現）

import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_sets('F:/PY/MNIST_data/',

二進位制位：或異或與操作

& 按位與 | 按位或 ^ 按位異或 1. 按位與運算按位與運算子"&"是雙目運算子。其功能是參與運算的兩數各對應的二進位相與。只有對應的兩個二進位均為1時，結果位才為1 ，否則為0。參與運算的數以補碼方式出現。例如：9&5可寫算式如下： 000

【深度學習】6：RNN遞迴神經網路原理、與MNIST資料集實現數字識別

前言：自己學習研究完CNN卷積神經網路後，很久的一段時間因為要完成自己的畢業設計就把更新部落格給耽擱了。瞎忙了這麼久，還是要把之前留的補上來。因為“種一棵樹最好的時間是在十年前，其次就是現在！” –—-—-—-—-—-—-—-—-—-—-—-—–—-—-—-—

Coursera deeplearning.ai 深度學習筆記1-4-Deep Neural Networks-深度神經網路原理推導與程式碼實現

在掌握了淺層神經網路演算法後，對深度神經網路進行學習。 1. 原理推導 1.1 深度神經網路表示定義：L表示神經網路總層數，上標[l]代表第l層網路，n[l]代表第l層的節點數，a[l]

位運算總結(按位與,或,異或)

按位與運算子（&）參加運算的兩個資料，按二進位制位進行“與”運算。運算規則：0&0=0; 0&1=0; 1&0=0; 1&1=1;

Neural Networks神經網路個人小結與MATLAB實現

Neural Networks，神經網路，我的理解是：與階梯下降演算法中的分類演算法類似，分類演算法是從輸入到輸出只經過一層的模型，模型的選擇很大程度決定了演算法的效果，而神經網路，通過對第一層引數進行多次傳遞，也許引數會形成類如平方，次方的效果，讓神經網路來選擇引數的模型

【火爐煉AI】深度學習001-神經網路的基本單元-感知器

【火爐煉AI】深度學習001-神經網路的基本單元-感知器 (本文所使用的Python庫和版本號: Python 3.6, Numpy 1.14, scikit-learn 0.19, matplotlib 2.2 ) 在人工智慧領域，深度學習已經脫穎而出，越來越成為大型複雜問題的首選解決方案。深度學習相對

神經網路實現Mnist資料集簡單分類

本文針對mnist手寫數字集，搭建了四層簡單的神經網路進行圖片的分類，詳細心得記錄下來分享我是採用的TensorFlow框架進行的訓練 import tensorflow as tf from tensorflow.examples.tutorials.mnist import in

高速路神經網路(Highway Networks)與深度殘差網路(ResNet)的原理和區別

高速路神經網路(Highway Networks)：我們知道，神經網路的深度是其成功的關鍵因素。然而，隨著深度的增加，網路訓練變得更加困難，並且容易出現梯度爆炸或梯度消失的問題。高速路神經網路(Highway Networks)就是為了解決深層網路訓練困難的問題而提出的。在一般的神經

全連線神經網路實現識別手寫資料集MNIST

全連線神經網路實現識別手寫資料集MNIST MNIST是一個由美國由美國郵政系統開發的手寫數字識別資料集。手寫內容是0~9，一共有60000個圖片樣本，我們可以到MNIST官網免費下載。總共4個檔案，該檔案是二進位制內容。 train-images-idx3-ubyte.gz: trainin

Tensorflow學習筆記(五)——卷積神經網路實現

今天來實現tensorflow架構下的卷積神經網路，首先了解清楚我們要構建的網路架構，資料集還是用mnist，所以輸入還是28X28。建立的卷積神經網路架構是：卷積層->pooling層->卷積層->pooling層->全連線層1->全連線層2。全連線層

Tensorflow學習筆記(四)——簡單的神經網路實現

首先要建立一個神經網路，就要把架構瞭解清楚才能動手。建立的神經網路如下：有一個輸入層和二個隱藏層和一個輸出層組成的簡單神經網路，結果通過交叉熵softmax分類得到損失函式，然後通過梯度下降優化模型。程式碼如下： import numpy as np import tensorfl

實時卷積神經網路實現人臉檢測和情感/性別分類

本文提出了一種通用的實現方法卷積神經網路（CNN）構建框架設計實時CNN。建立實時面部檢測視覺系統，實現性別分類和情緒分類。其中：IMDB性別分類測試準確率：96％；fer2013情緒分類測試準確率：66％。具體效果如下圖：這裡提供下資料集下載： 1、情緒

神經網路實現基本的與或異或邏輯

相關推薦