CH5 用神經網路解決線性問題

阿新 • • 發佈：2021-10-04

瞭解非線性問題、分類問題
掌握神經網路解決二分類問題
掌握隨機生成訓練資料的方法

非線性問題

三好學生問題：家長們再次湊到一起，但這次情況不一樣了，孩子們的總分不知道，僅知道是否評選上三好學生的結果。

計算總分的規則仍然是：總分 = 德育分*60% + 智育分*30% + 體育分*10%
評選三好學生的標準是：總分 ≥ 95

家長不知道這兩條規則。

這是一個典型的分類問題。學校一定是以德育分、智育分和體育分三項分數為依據，把學生們分成兩類：三好學生和非三好學生。因此，這是一個常見的二分類問題。下圖是用神經網路簡述二分類問題。

分類問題一般是非線性的。

可以看出，當總分達到95之後，y值有一個跳變，並非線性的（一條直線）

y=f（xA），跳變函式/階躍函式
“一票否決制”

設計神經網路模型

總分（0~100）= 德育分60% + 智育分30% + 體育分*10% -> 評選結果（0、1）

啟用函式：把線性關係轉換成非線性關係的函式。啟用函式 sigmoid 函式的作用是把引數轉換成為 0 到 1 之間的一個小數。

使用啟用函式後的神經網路模型：

實現該網路模型的程式碼：

# import tensorflow as tf
import tensorflow.compat.v1 as tf

tf.compat.v1.disable_eager_execution()

x = tf.placeholder(dtype=tf.float32)
yTrain = tf.placeholder(dtype=tf.float32)
w = tf.Variable(tf.zeros([3]), dtype=tf.float32)

n1 = w * x
n2 = tf.reduce_sum(n1)

y = tf.nn.sigmoid(n2)

準備訓練資料

使用 random 產生隨機數

import random

random.seed() # 初始化隨機數種子，增加隨機性
random.random() # 產生一個 [0,1) 範圍內的小數

r = random.random() * 10 # 通過乘以一個整數，使產生的隨機數的範圍增大，此處範圍為 [0,10)

產生隨機訓練資料

import random

random.seed()

# 產生一個 [0,100] 範圍內的整數代表某一科分數
xData = [int(random.random() * 101),int(random.random() * 101),int(random.random() * 101)]

# 按規則生成總分
xAll = xData[0] * 0.6 + xData[1] * 0.3 + xData[2] * 0.1

# 按規則生成評選結果
if xAll >= 95:
    yTrainData = 1
else:
    yTrainData = 0

print("xData: %s" %xData)
print("yTrainData: %s" %yTrainData)

優化產生的訓練資料，產生一個[60,101) 範圍內的更合理的分數:

xData = [
    int(random.random() * 41 + 60),
    int(random.random() * 41 + 60),
    int(random.random() * 41 + 60)
]

產生更多結果為 1 的訓練資料,產生一個[93,101）範圍內的符合三好學生要求的分數:

xData = [
    int(random.random() * 8 + 93),
    int(random.random() * 8 + 93),
    int(random.random() * 8 + 93)
]

為什麼要使用隨機資料來訓練神經網路:

並非“劇透”，用於演示和驗證
符合人工收集的規貝
滿足神經網路大規模訓練的需要

訓練

# import tensorflow as tf
import tensorflow.compat.v1 as tf
import random

tf.compat.v1.disable_eager_execution()

random.seed()

x = tf.placeholder(dtype=tf.float32)
yTrain = tf.placeholder(dtype=tf.float32)
w = tf.Variable(tf.zeros([3]), dtype=tf.float32)

wn = tf.nn.softmax(w)

n1 = wn * x

n2 = tf.reduce_sum(n1)
y = tf.nn.sigmoid(n2)
loss = tf.abs(yTrain - y)

optimizer = tf.train.RMSPropOptimizer(0.1)
train = optimizer.minimize(loss)

sess = tf.Session()
sess.run(tf.global_variables_initializer())

for i in range(5):
    xData = [
        int(random.random() * 8 + 93),
        int(random.random() * 8 + 93),
        int(random.random() * 8 + 93)
    ]

    xAll = xData[0] * 0.6 + xData[1] * 0.3 + xData[2] * 0.1

    if xAll >= 95:
        yTrainData = 1
    else:
        yTrainData = 0

    result = sess.run(
        [train, x, yTrain, w, n2, y, loss], 
        feed_dict={x:xData, yTrain:yTrainData}
    )

    print(result)

    xData = [
        int(random.random() * 41 + 60),
        int(random.random() * 41 + 60),
        int(random.random() * 41 + 60)
    ]

    xAll = xData[0] * 0.6 + xData[1] * 0.3 + xData[2] * 0.1

    if xAll >= 95:
        yTrainData = 1
    else:
        yTrainData = 0

    result = sess.run(
        [train, x, yTrain, w, n2, y, loss],
        feed_dict={x:xData, yTrain:yTrainData}
    )

    print(result)

觀察訓練結果:

增加偏移量 b 來加速訓練:

+ b = tf.Variable(80, dtype=tf.float32)
- n2 = tf.reduce_sum(n1)
+ n2 = tf.reduce_sum(n1) - b

# import tensorflow as tf
import tensorflow.compat.v1 as tf
import random

tf.compat.v1.disable_eager_execution()

random.seed()

x = tf.placeholder(dtype=tf.float32)
yTrain = tf.placeholder(dtype=tf.float32)
w = tf.Variable(tf.zeros([3]), dtype=tf.float32)
b = tf.Variable(80, dtype=tf.float32)

wn = tf.nn.softmax(w)

n1 = wn * x
n2 = tf.reduce_sum(n1) - b

y = tf.nn.sigmoid(n2)
loss = tf.abs(yTrain - y)

optimizer = tf.train.RMSPropOptimizer(0.1)
train = optimizer.minimize(loss)

sess = tf.Session()
sess.run(tf.global_variables_initializer())

for i in range(5):
    xData = [
        int(random.random() * 8 + 93),
        int(random.random() * 8 + 93),
        int(random.random() * 8 + 93)
    ]

    xAll = xData[0] * 0.6 + xData[1] * 0.3 + xData[2] * 0.1

    if xAll >= 95:
        yTrainData = 1
    else:
        yTrainData = 0

    result = sess.run(
        [train, x, yTrain, w, n2, y, loss], 
        feed_dict={x:xData, yTrain:yTrainData}
    )

    print(result)

    xData = [
        int(random.random() * 41 + 60),
        int(random.random() * 41 + 60),
        int(random.random() * 41 + 60)
    ]

    xAll = xData[0] * 0.6 + xData[1] * 0.3 + xData[2] * 0.1

    if xAll >= 95:
        yTrainData = 1
    else:
        yTrainData = 0

    result = sess.run(
        [train, x, yTrain, w, n2, y, loss],
        feed_dict={x:xData, yTrain:yTrainData}
    )

    print(result)

- b = tf.Variable(80, dtype=tf.float32)
+ b = tf.Variable(95, dtype=tf.float32)

批量產生隨機訓練資料:

import random
import numpy as np

tf.compat.v1.disable_eager_execution()

random.seed()

rowCount = 5

xData = np.full(
    shape=(rowCount, 3),
    fill_value=0,
    dtype=np.float32
)

yTrainData = np.full(
    shape=rowCount,
    fill_value=0,
    dtype=np.float32
)

for i in range(rowCount):
    xData[i][0] = int(random.random() * 11 + 90)
    xData[i][1] = int(random.random() * 11 + 90)
    xData[i][2] = int(random.random() * 11 + 90)

    xAll = xData[i][0] * 0.6 + xData[i][0] * 0.3 + xData[i][2] * 0.1

numpy 是常用於數學計算的類庫
npful 函式用於向陣列中填充初始數值
使用迴圈來生成批量的資料

# import tensorflow as tf
import tensorflow.compat.v1 as tf
import random
import numpy as np

tf.compat.v1.disable_eager_execution()

random.seed()

rowCount = 5

xData = np.full(
    shape=(rowCount, 3),
    fill_value=0,
    dtype=np.float32
)

yTrainData = np.full(
    shape=rowCount,
    fill_value=0,
    dtype=np.float32
)

goodCount = 0

for i in range(rowCount):
    xData[i][0] = int(random.random() * 11 + 90)
    xData[i][1] = int(random.random() * 11 + 90)
    xData[i][2] = int(random.random() * 11 + 90)

    xAll = xData[i][0] * 0.6 + xData[i][1] * 0.3 + xData[i][2] * 0.1

    if xAll >= 95:
        yTrainData[i] = 1
        goodCount = goodCount + 1
    else:
        yTrainData[i] = 0

print("xData=%s" %xData)
print("yTrainData=%s" %yTrainData)
print("goodCount=%s" %goodCount)

x = tf.placeholder(dtype=tf.float32)
yTrain = tf.placeholder(dtype=tf.float32)
w = tf.Variable(tf.zeros([3]), dtype=tf.float32)
b = tf.Variable(80, dtype=tf.float32)

wn = tf.nn.softmax(w)

n1 = wn * x
n2 = tf.reduce_sum(n1) - b

y = tf.nn.sigmoid(n2)
loss = tf.abs(yTrain - y)

optimizer = tf.train.RMSPropOptimizer(0.1)
train = optimizer.minimize(loss)

sess = tf.Session()
sess.run(tf.global_variables_initializer())

for i in range(2):
    for j in range(rowCount):
        result = sess.run(
            [train, x, yTrain, wn, b, n2, y, loss],
            feed_dict={x:xData[j], yTrain:yTrainData[j]}
        )
        print(result)

可以看到，xData 是一個二維陣列，其中包含了 5 條資料，每條是 3 項符合定義範圍的分數。tTrainData 中包含 3 個 1，也就是說有 3 位學生符合三好學生的條件，接下來輸出的 goodCount 也確實等於 3，再往下的訓練也一切正常。

CH5 用神經網路解決線性問題

瞭解非線性問題、分類問題掌握神經網路解決二分類問題掌握隨機生成訓練資料的方法

DeepMind 與谷歌又出大招，用神經網路解決 NP-hard 的 MIP 問題

近日，DeepMind 與 Google Research 團隊共同釋出了一項工作，用神經網路與機器學習方法來解決混合整數規劃（MIP）問題！

Python使用迴圈神經網路解決文字分類問題的方法詳解

本文例項講述了Python使用迴圈神經網路解決文字分類問題的方法。分享給大家供大家參考，具體如下：

蘋果 VR/AR 新專利：用神經網路模擬全身動作，讓 VR 無線傳輸更快

智東西 7 月 14 日訊息，近日，蘋果的兩項 VR/AR 相關新專利得到了美國專利商標局（U.S. Patent and Trademark Office）授權。

人工智慧發展迅速，DeepMind 用神經網路求解 MIP：要想攻破運籌學絕非易事

Google 的 DeepMind 團隊最近官宣了一篇神經網路 (Neural Networks) 求解 MIP 論文。一石激起千層浪，在國內外的運籌優化社群引起了討論。

手動實現前饋神經網路解決迴歸任務

1匯入所需要的包 import numpy as np import torch from torch import nn import matplotlib.pyplot as plt

手動實現前饋神經網路解決二分類任務

1 匯入實驗需要的包 import numpy as np import torch from torch import nn from sklearn.model_selection import train_test_split

利用 torch.nn 實現前饋神經網路解決多分類任務

1 匯入實驗需要的包 import torch import numpy as np from torch import nn from torchvision.datasets import MNIST

AI 與人文共舞！DeepMind 用神經網路修復古希臘銘文，登頂 Nature 封面

人工智慧領軍團 DeepMind 又爆出了一項重要成果：用深度神經網路修復古希臘受損的石碑銘文，號稱「Predicting the Past」（預測過去），在以 Nature 為首的科學媒介上掀起了一番熱烈關注。他們以古希臘的島嶼名為該模

Tensorflow實踐：用神經網路訓練分類器

任務：使用tensorflow訓練一個神經網路作為分類器，分類的資料點如下：螺旋形資料點

用神經網路做運動時序序列。

程式碼 import matplotlib.pyplot as plt import numpy as np import pandas as pd df = pd.read_csv(\'train.csv\')

自適應線性神經網路Adaline的python實現詳解

自適應線性神經網路Adaptive linear network，是神經網路的入門級別網路。相對於感知器，採用了f（z）=z的啟用函式，屬於連續函式。

用tensorflow搭建簡單神經網路測試iris 資料集和MNIST 資料集

1.步驟第一步：import 相關模組，如 import tensorflow as tf 第二步：指定輸入網路的訓練集和測試集，如指定訓練集的輸入 x_train 和標籤y_train，測試集的輸入 x_test 和標籤 y_test。

Keras構建神經網路踩坑(解決model.predict預測值全為0.0的問題)

終於構建出了第一個神經網路，Keras真的很方便。之前不知道Keras這麼方便，在構建神經網路的過程中繞了很多彎路，最開始學的TensorFlow，後來才知道Keras。

machine learning學習之邏輯迴歸解決多分類問題&神經網路前向傳播

寫在前面: 此次作業是使用兩種方式來識別手寫數字，順序為邏輯迴歸、神經網路前向傳播（帶已經訓練好的引數）

用全連線神經網路做汽車效能的迴歸預測

用全連線神經網路做汽車效能的迴歸預測 keyword: 全連線神經網路，tensorflow, 迴歸

用PyTorch對Leela Zero進行神經網路訓練

作者|Peter Yu 編譯|Flin 來源|towardsdatascience 最近，我一直在尋找方法來加快我的研究和管理我的實驗，特別是圍繞著寫訓練管道和管理實驗配置檔案這兩個方面，我發現這兩個新專案叫做PyTorch Lightning和Hydra。

用Keras構建神經網路的3種方法

作者|Orhan Gazi Yalçın 編譯|VK 來源|Towards Datas Science 如果你看看不同的教程，搜尋，花大量時間研究關於TensorFlow的Stack Overflow，你可能已經意識到有很多不同的方法來構建神經網路模型。

神經網路“煉丹爐”內部構造長啥樣？牛津大學博士小姐姐用論文解讀

蕭簫發自凹非寺量子位報道 | 公眾號 QbitAI 神經網路就像“煉丹爐”一樣，投喂大量資料，或許能獲得神奇的效果。

神經網路中的啟用函式是幹是什麼用的？

我是小玉，一個平平無奇的資料小天才！最近在回顧神經網路這裡知識，發現自己還是有很多知識點掌握不夠清楚明瞭，既然開始搞就要搞得明明白白，會了神經網路等於掌握了大半個機器學習。

CH5 用神經網路解決線性問題

非線性問題

設計神經網路模型

準備訓練資料

使用 random 產生隨機數

產生隨機訓練資料

訓練

相關推薦