《Python深度學習》——第三章神經網路入門

阿新 • • 發佈：2018-12-20

主要內容：

神經網路核心元件
Keras簡介
建立深度學習工作站——Jupter
使用深度學習解決二分類，多分類和迴歸問題

3.1 神經網路剖析

層，多層構成網路
輸入函式和目標
損失函式
優化器

3.1.1 層：基本元件

權重

2D張量，用密集連線層（densely connected layer）

3D張量，迴圈層（recurrent layer,如LSTM層）

4D張量，二維卷積層(conv2D)

層相容性（layer compatiblility）：每一層只接受特定層的輸入張量，輸出特定形狀的張量。

例：layers.Dense(32,input_shape=784,))#輸出張量，第一維大小是32。只接受第一維度是784的2D張量。

不寫input_shape，自動和上層匹配。

3.1.2 模型：層構成的網路

有向無環圖

常見網路拓撲結構（其決定假設空間（hypothesis space））

雙分支網路
多頭網路
Inception模組

選擇正確的網路架構是門藝術而不是科學。

3.1.3 損失函式與優化器：配置學習過程的關鍵

損失函式（目標函式）

優化器：SGD的變體

具有多個輸出的神經網路，可以具有多個損失函式，但梯度下降必須基於單個標準損失值，所以要對所有損失函式值求平均。

選擇目標函式的指導原則：

二分類問題：二元交叉熵（binary crossentropy）

多分類問題：分類交叉熵（categorical crossentropy）

迴歸問題：均方誤差（mean-squared error）

序列學習問題：聯結主義時序分類（CTC,coonectionist temporal classification）

3.2 Keras簡介

特點：

相同程式碼可以在CPU和GPU上無縫切換
具有友好的API
內建支援卷積網路（用於視覺）、迴圈網路（用於序列處理）以及二者的任意組合
支援任意網路框架：多輸入或多輸出、層共享、模型共享

3.2.1 Keras、TensorFlow、Theano和CNTK

後端引擎（backend engine）

3.2.2 使用Keras開發：概述

工作流程：

定義訓練資料
定義層組合的網路
配置學習過程
呼叫fit進行迭代

定義模型：

1.Sequential：僅用於層的線性堆疊，常用。

model.add(layers.Dense(32,activation='relu',input_shape=(784,)))

2.函式API：構建任意形式的架構

input_tenser=layer.Input(shape=(784,))

x=layers.Dense(32,activation='relu')(input_tenser)

3.3 建立深度學習網路

最好使用UNIX。

3.3.1 Jupyter筆記本：執行深度學習實驗的首選方法

3.3.2 執行Keras的兩種方法

雲端

本地

3.3.3 在雲端執行深度學習任務：優點和缺點

3.3.4 深度學習的最佳GPU

NVIDIA TITAN Xp

3.4 舉例

1.二分類

（1）準備資料

轉換方法

填充列表
對列表進行one-hot編碼

（2）構建網路

Dense(16,activation='relu')

16指隱藏單元（hidden unit）個數

隱藏單元越多，網路能夠學到更加複雜的表示，計算代價也越大，且可能過擬合

關鍵架構：

網路有幾層
每層有幾個隱藏單元

中間層用‘relu’,最後一層用‘sigmoid’（輸出0~1）。

引入啟用函式是為了：為系統引入非線性。

自定義優化器：通過optimizer傳入優化器類例項

自定義損失函式：通過loss和metric傳入函式物件

交叉驗證：validation_data

（3）進一步實驗：

嘗試增加或減少隱藏層
嘗試增加或減少隱藏單元
改變損失函式
改變啟用函式

rmsprop優化器，在任何問題下都可使用。

2.多分類

標籤向量化：

整數張量
one-hot編碼（分類編碼（categorical encoding））

中間層維數一般要大於輸出層維數，不然會造成資訊瓶頸。

one-hot 編碼使用 categorical_crossentropy損失函式

整數標籤使用 sparse_categorical_crossentropy

使用 softmax啟用函式

3.迴歸

不同特徵取值範圍不同，要先標準化

樣本數量少，使用小網路,利用K折驗證。

最後一層，沒有啟用函式，是線性層

損失函式：均方誤差（MSE,mean squared error）

監控指標：平均絕對誤差（MAE,mean absolute error）

《Python深度學習》——第三章神經網路入門

主要內容：神經網路核心元件 Keras簡介建立深度學習工作站——Jupter 使用深度學習解決二分類，多分類和迴歸問題 3.1 神經網路剖析層，多層構成網路輸入函式和目標損失函式優化器 3.1.1 層：基本元件權重 2D張量，用密集連

《Python深度學習》——第三章神經網路入門

主要內容：神經網路核心元件 Keras簡介建立深度學習工作站——Jupter 使用深度學習解決二分類，多分類和迴歸問題 3.1 神經網路剖析層，多層構成網路輸入函式和目標損失函式優化器 3.1.

《Python 深度學習》——第二章神經網路的數學基礎

內容：第一個神經網路示例張量與張量運算神經網路如何通過反向傳播與梯度下降進行學習張量，張量運算，微分，梯度下降 2.1 初識神經網路類別（class），樣本（sample），標籤（label） 1.載入Keras中的MNIST資料集 from ke

《Python 深度學習》——第二章神經網路的數學基礎

內容：第一個神經網路示例張量與張量運算神經網路如何通過反向傳播與梯度下降進行學習張量，張量運算，微分，梯度下降 2.1 初識神經網路類別（class），樣本（sample），標籤（label） 1.載入Keras中的MNIST資料集

04.神經網路與深度學習-第四周-深層神經網路

1. 通常情況下，我們使用L表示神經網路的層數，n表示神經網路的各個網路層的神經元個數，使用a=g(z)表示各個層所用的啟用函式，同理，z中的引數使用w和b表示。具體寫法如圖： 2. 前向反饋的表示方法所有樣本的前向反饋的表示方法 3. 我們在編碼深度神經

機器學習-第五章神經網路讀書筆記（周志華）

前言博主第一次接觸機器學習，內容可能有許多原文復現，但是我儘量用自己的話來講，覺得寫得還行的話點個喜歡，謝謝！讀書筆記第一目的是為了總結，第二是順便在部落格上記錄我的學習歷程，同時也希望讀者能有一點點收穫吧~如果不對的地方，還請多多指教！正文周志華的機器學習第五章講的是關於神

深度學習第三章-概率與資訊理論筆記

3.1 為什麼要使用概率？ 3.2 隨機變數 3.3 概率分佈 3.3.1 離散型變數和概率質量函式離散型變數的概率分佈可以用概率質量函式（probabilit mass function， PMF）描述。 3.3.2 連續型變數

反向傳播的工作原理（深度學習第三章）

What is backpropagation really doing? 梯度向量的每一項大小是在告訴大家，代價函式對於每一個引數有多敏感。對於改變啟用值，可以有三種方法： 1.增加偏置 2.增加權重 3.改變上一層的啟用值對於

深度學習之卷積神經網路入門（2）

卷積神經網路入門學作者：hjimce 卷積神經網路演算法是n年前就有的演算法，只是近年來因為深度學習相關演算法為多層網路的訓練提供了新方法，然後現在電腦的計算能力已非當年的那種計算水平，同時現在的訓練資料很多，於是神經網路的相關演算法又重新火了起來，因此卷積神經網路就又

《機器學習》周志華學習筆記第五章神經網路（課後習題） python實現

1.神經元模型 2.感知機與多層網路 3.誤差逆傳播演算法 (A)BP演算法：最小化訓練集D上的累積誤差標準BP演算法：更新規則基於單個Ek推導而得兩種策略防止過擬合：（1）早停（通過驗證集來判斷，訓練集誤差降低，驗證集誤差升高）（2）正則化：在誤差目標函式中引入描述網

吳恩達第一門-神經網路和深度學習第三週6-10學習筆記

吳恩達第一門-神經網路和深度學習第三週6-10學習筆記 3.6啟用函式啟用函式圖中給出了前面課程中所學到的利用神經網路計算輸出值的具體步驟。其中的 σ

【神經網路和深度學習-開發案例】第四章神經網路如何對數字進行分類

【神經網路和深度學習】第四章神經網路如何對數字進行分類案例：使用神經網路識別手寫數字好了，讓我們來寫一個程式，學習如何識別手寫的數字，使用隨機梯度下降和MNIST的訓練資料。我們將用一個簡短的Python（2.7）程式來完成這項工作，只

python學習第三章

cde python 表示 16px 字符串 abcdefg cor 截取 length 基本數據類型 python的基本數據類型如下: 1. int ==> 整數. 主要用來進行數學運算2. str ==> 字符串, 可以保存少量數據並進行相應的操作3. bo

Python之路(第三十三篇) 網路程式設計：socketserver深度解析

一、socketserver 模組介紹 socketserver是標準庫中的一個高階模組，用於網路客戶端與伺服器的實現。(version = "0.4") 在python2中寫作SocketServer,在python3中寫作socketserver。 socoketserver兩個主要的類，一個是S

基於Keras/Python的深度學習：遞迴神經網路速成大法

正在統治諸如輸入序列等機器學習難題的一種神經網路型別，是遞迴神經網路（Recurrent Neural Networks）。隨著時間的推移，遞迴神經網路已經擁有包含迴圈、增加反饋和記憶網路的連線。記憶可以使這種型別的網路能夠學習和歸納輸入序列而不是單個模式。遞迴

小白學習機器學習---第三章(2):對數機率迴歸python實現

上程式碼~~~~~~~~###梯度下降法實現多元線性迴歸 def loadDataSet(): ###資料匯入函式### dataMatrix=[] #資料矩陣，第一列是w=1.0，第2,3列是特徵 labelMatrix=[] #標籤矩陣

周志華《機器學習》筆記：第5章神經網路

1、神經元網路模型　　神經網路中最基本的成分是神經元模型，即“簡單單元”。“M-P神經元模型”，神經元接收到來自n 個其他神經元傳遞過來的輸入訊號，這些輸入訊號通過帶權重的連線進行傳遞，神經元接收的總輸入值將與神經元的閾值進行比較，然後通過“啟用函式”處理以

周志華《機器學習》學習筆記（第 5 章神經網路）

本內容記錄周志華《機器學習》——第 5 章神經網路學習筆記。第 5 章神經網路 5.1 神經元模型神經網路（neural networks）方面的研究很早就已開始，今天“神經網路”已是一個相當大的、多學科交叉的學科領域。各相關學科對神經網路的

Pytorch_第六篇_深度學習 (DeepLearning) 基礎 [2]---神經網路常用的損失函式

# 深度學習 (DeepLearning) 基礎 [2]---神經網路常用的損失函式 --- ## Introduce 在上一篇[“深度學習 (DeepLearning) 基礎 [1]---監督學習和無監督學習”](https://www.cnblogs.com/wangqinze/p/13433354.ht

python爬蟲學習第五章正則

多行匹配 href out 地址常見 apt 分別是 all arch html,body,div,span,applet,object,iframe,h1,h2,h3,h4,h5,h6,p,blockquote,pre,a,abbr,acronym,address,b

《Python深度學習》——第三章 神經網路入門

相關推薦

《Python深度學習》——第三章神經網路入門