深度學習——學習筆記（3）神經網路入門（新聞分類）

阿新 • • 發佈：2020-12-29

# 載入路透社資料集
from keras.datasets import reuters
(train_data,train_labels),(test_data,test_labels) = reuters.load_data(num_words=10000)

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/reuters.npz
2113536/2110848 [==============================] - 1s 1us/step


E:\my_software\anaconda3\lib\site-packages\tensorflow\python\keras\datasets\reuters.py:148: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray
  x_train, y_train = np.array(xs[:idx]), np.array(labels[:idx])
E:\my_software\anaconda3\lib\site-packages\tensorflow\python\keras\datasets\reuters.py:149: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray
  x_test, y_test = np.array(xs[idx:]), np.array(labels[idx:])

len(train_data)

test_labels

array([ 3, 10,  1, ...,  3,  3, 24], dtype=int64)

len(test_data)

train_data[10]

# 將索引解碼為新聞文字
word_index = reuters.get_word_index()
reverse_word_index = dict([(value,key) for (key,value) in word_index.items()])
decoded_newswire = ' '.join([reverse_word_index.get(i-3,'?') for i in train_data[0]])

Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/reuters_word_index.json
557056/550378 [==============================] - 0s 1us/step

train_labels[10]

# 準備資料
import numpy as np

def vectorize_sequences(sequences,dimension=10000):
    results = np.zeros((len(sequences),dimension))
    for i, sequence in enumerate(sequences):
        results[i,sequence] = 1
    return results

x_train = vectorize_sequences(train_data)
x_test = vectorize_sequences(test_data)

def to_one_hot(labels,dimension=46):  # 輸出類別是46個
    results = np.zeros((len(labels),dimension))
    for i,label in enumerate(labels):
        results[i,label] = 1
    return results

one_hot_train_labels = to_one_hot(train_labels)
one_hot_test_labels = to_one_hot(test_labels)

# 模型定義
from keras import models
from keras import layers

model = models.Sequential()
model.add(layers.Dense(64,activation='relu',input_shape=(10000,)))
model.add(layers.Dense(64,activation='relu'))
model.add(layers.Dense(46,activation='softmax'))  # 每個輸入樣本，網路都會輸出46維向量，每個維度表示不同的輸出類別

# 編譯模型
model.compile(optimizer='rmsprop',  
             loss = 'categorical_crossentropy',   # 損失函式使用分類交叉熵，衡量網路輸入的概率分佈和標籤的真實分佈
             metrics = ['acc'])

# 留出驗證集  1000個樣本
x_val = x_train[:1000]
partial_x_train = x_train[1000:]

y_val = one_hot_train_labels[:1000]
partial_y_train = one_hot_train_labels[1000:]

# 訓練模型
history = model.fit(partial_x_train,
                   partial_y_train,
                   epochs=20,
                   batch_size=512,
                   validation_data=(x_val,y_val))

Epoch 1/20
16/16 [==============================] - 2s 54ms/step - loss: 3.1920 - acc: 0.4216 - val_loss: 1.7198 - val_acc: 0.6360
Epoch 2/20
16/16 [==============================] - 1s 36ms/step - loss: 1.4709 - acc: 0.7034 - val_loss: 1.2679 - val_acc: 0.7270
Epoch 3/20
16/16 [==============================] - 1s 36ms/step - loss: 1.0407 - acc: 0.7804 - val_loss: 1.1028 - val_acc: 0.7600
Epoch 4/20
16/16 [==============================] - 1s 36ms/step - loss: 0.8029 - acc: 0.8301 - val_loss: 1.0156 - val_acc: 0.7750
Epoch 5/20
16/16 [==============================] - 1s 36ms/step - loss: 0.6605 - acc: 0.8615 - val_loss: 0.9430 - val_acc: 0.8010
Epoch 6/20
16/16 [==============================] - 1s 36ms/step - loss: 0.5219 - acc: 0.8927 - val_loss: 0.9151 - val_acc: 0.8060
Epoch 7/20
16/16 [==============================] - 1s 36ms/step - loss: 0.4242 - acc: 0.9141 - val_loss: 0.8901 - val_acc: 0.8090
Epoch 8/20
16/16 [==============================] - 1s 37ms/step - loss: 0.3290 - acc: 0.9317 - val_loss: 0.8953 - val_acc: 0.8040
Epoch 9/20
16/16 [==============================] - 1s 35ms/step - loss: 0.2787 - acc: 0.9383 - val_loss: 0.9103 - val_acc: 0.7980
Epoch 10/20
16/16 [==============================] - 1s 35ms/step - loss: 0.2348 - acc: 0.9482 - val_loss: 0.8917 - val_acc: 0.8180
Epoch 11/20
16/16 [==============================] - 1s 35ms/step - loss: 0.2013 - acc: 0.9500 - val_loss: 0.9381 - val_acc: 0.8100
Epoch 12/20
16/16 [==============================] - 1s 36ms/step - loss: 0.1748 - acc: 0.9571 - val_loss: 0.9009 - val_acc: 0.8230
Epoch 13/20
16/16 [==============================] - 1s 36ms/step - loss: 0.1582 - acc: 0.9572 - val_loss: 0.9446 - val_acc: 0.8090
Epoch 14/20
16/16 [==============================] - 1s 36ms/step - loss: 0.1409 - acc: 0.9560 - val_loss: 0.9726 - val_acc: 0.8070
Epoch 15/20
16/16 [==============================] - 1s 36ms/step - loss: 0.1272 - acc: 0.9612 - val_loss: 0.9624 - val_acc: 0.8160
Epoch 16/20
16/16 [==============================] - 1s 36ms/step - loss: 0.1260 - acc: 0.9582 - val_loss: 0.9704 - val_acc: 0.8090
Epoch 17/20
16/16 [==============================] - 1s 35ms/step - loss: 0.1110 - acc: 0.9627 - val_loss: 1.0493 - val_acc: 0.7980
Epoch 18/20
16/16 [==============================] - 1s 36ms/step - loss: 0.1069 - acc: 0.9628 - val_loss: 1.0567 - val_acc: 0.7950
Epoch 19/20
16/16 [==============================] - 1s 35ms/step - loss: 0.1038 - acc: 0.9638 - val_loss: 1.0635 - val_acc: 0.7970
Epoch 20/20
16/16 [==============================] - 1s 32ms/step - loss: 0.0991 - acc: 0.9620 - val_loss: 1.2842 - val_acc: 0.7650

# 繪製訓練損失和驗證損失
import matplotlib.pyplot as plt

loss = history.history['loss']
val_loss = history.history['val_loss']

epochs = range(1,len(loss)+1)

plt.plot(epochs,loss,'bo',label='Training loss')
plt.plot(epochs,val_loss,'b',label='Validation loss')
plt.title('Training and validation loss')
plt.xlabel('Epochs')
plt.ylabel('Loss')
plt.legend()

plt.show()

# 繪製訓練精度和驗證精度
plt.clf()

acc = history.history['acc']
val_acc = history.history['val_acc']

plt.plot(epochs,acc,'bo',label='Training acc')
plt.plot(epochs,val_acc,'b',label='Validation acc')
plt.title('Training and validation acc')
plt.xlabel('Epochs')
plt.ylabel('acc')
plt.legend()

plt.show()  # 第九次出現了過擬合

# 重新訓練一個迭代9次的網路
model = models.Sequential()
model.add(layers.Dense(64,activation='relu',input_shape=(10000,)))
model.add(layers.Dense(64,activation='relu'))
model.add(layers.Dense(46,activation='softmax'))  # 每個輸入樣本，網路都會輸出46維向量，每個維度表示不同的輸出類別

model.compile(optimizer='rmsprop',  
             loss = 'categorical_crossentropy',   # 損失函式使用分類交叉熵，衡量網路輸入的概率分佈和標籤的真實分佈
             metrics = ['acc'])

model.fit(partial_x_train,
       partial_y_train,
       epochs=9,
       batch_size=512,
       validation_data=(x_val,y_val))

results = model.evaluate(x_test,one_hot_test_labels)

Epoch 1/9
16/16 [==============================] - 2s 48ms/step - loss: 3.1355 - acc: 0.4151 - val_loss: 1.7546 - val_acc: 0.6460
Epoch 2/9
16/16 [==============================] - 1s 36ms/step - loss: 1.5295 - acc: 0.6920 - val_loss: 1.3043 - val_acc: 0.7100
Epoch 3/9
16/16 [==============================] - 1s 36ms/step - loss: 1.0924 - acc: 0.7680 - val_loss: 1.1147 - val_acc: 0.7590
Epoch 4/9
16/16 [==============================] - 1s 35ms/step - loss: 0.8348 - acc: 0.8246 - val_loss: 1.0238 - val_acc: 0.7870
Epoch 5/9
16/16 [==============================] - 1s 35ms/step - loss: 0.6446 - acc: 0.8607 - val_loss: 0.9424 - val_acc: 0.8050
Epoch 6/9
16/16 [==============================] - 1s 35ms/step - loss: 0.5079 - acc: 0.8983 - val_loss: 0.9296 - val_acc: 0.8050
Epoch 7/9
16/16 [==============================] - 1s 36ms/step - loss: 0.3936 - acc: 0.9246 - val_loss: 0.8924 - val_acc: 0.8090
Epoch 8/9
16/16 [==============================] - 1s 35ms/step - loss: 0.3364 - acc: 0.9317 - val_loss: 0.8653 - val_acc: 0.8190
Epoch 9/9
16/16 [==============================] - 1s 33ms/step - loss: 0.2872 - acc: 0.9419 - val_loss: 0.8967 - val_acc: 0.8060
71/71 [==============================] - 0s 2ms/step - loss: 0.9991 - acc: 0.7867

results  # 損失，精度

[0.9991146326065063, 0.7867319583892822]

# 和一個隨機的分類器進行比較
import copy 
test_labels_copy = copy.copy(test_labels)
np.random.shuffle(test_labels_copy)
hits_array = np.array(test_labels) == np.array(test_labels_copy)
float(np.sum(hits_array)) / len(test_labels)

0.19323241317898487

# 相比於隨機分類器，我們的模型可以達到78的準確率，完全OK

# 在新資料上預測
predictions = model.predict(x_test)

predictions[0].shape

(46,)

np.sum(predictions[0])

1.0

np.argmax(predictions[0])  # 概率最大的類別

深度學習——學習筆記（3）神經網路入門（新聞分類）

# 載入路透社資料集 from keras.datasets import reuters (train_data,train_labels),(test_data,test_labels) = reuters.load_data(num_words=10000)

深度學習——學習筆記（2）神經網路入門

1. 載入資料 from keras.datasets import imdb (train_data,train_labels),(test_data,test_labels) = imdb.load_data(num_words=10000)# num_words表示保留訓練資料中前10000個出個最常出現的單詞，捨棄低頻單詞

深度學習——學習筆記（1）神經網路基礎

# -*- coding: utf-8 -*- # @Time : 2020/12/25 16:30 # @Author : Renlele # @File : 2_1.py # @Software: Pycharm

深度學習——學習筆記（4）神經網路基礎迴歸

# 載入波士頓房價資料 from keras.datasets import boston_housing (train_data,train_targets),(test_data,test_targets) = boston_housing.load_data()

深度學習之Pytorch（一）神經網路基礎及程式碼實現

1.1 Tensor (張量) Tensor 可以和 numpy 的 ndarray相互轉換Tensor有不同資料型別，有32位浮點型torch.FloatTensor、64位浮點型 torch.DoubleTensor等

深度學習入門(魚書)學習筆記：第3章神經網路

目錄導航第3章神經網路 3.1 從感知機到神經網路 3.2 啟用函式 3.3 多維陣列運算

吳恩達深度學習課件_吳恩達深度學習筆記02.改善深層神經網路 W3.超引數除錯、Batch Norm和程式框架...

技術標籤：吳恩達深度學習課件 1. 除錯處理2. 為超引數選擇合適的範圍3. 超引數除錯的實踐4. 歸一化網路的啟用函式5. 將 Batch Norm 擬合進神經網路6. Batch Norm 為什麼奏效7. 測試時的 Batch Norm8. Softmax

Python深度學習3——神經網路入門

3.神經網路入門 3.1神經網路剖析層，多個層組合成網路（或模型）輸入資料和相應的目標

機器學習筆記（二十）——Tensorflow 2 入門（mnist與fashion_mnist）

本部落格僅用於個人學習，不用於傳播教學，主要是記自己能夠看得懂的筆記（

【MindSpore:跟著小Mi一起機器學習吧！】神經網路表述（二）

小Mi學習，向上積極！上週小Mi簡單給大家介紹了神經網路的模型表示，今天小Mi將進一步帶領大家對神經網路進行進一步的深入理解，話不多說，一起學起來吧~

【MindSpore：跟著小Mi一起機器學習吧！】神經網路表述（一）

好久不見，甚是想念！今天小Mi繼續帶大家學習我們的機器學習系列。相信神經網路這個名詞大家都不會陌生，神經網路實際上是一個相對比較古老的演算法，沉寂了很長一段時間，不過現在隨著硬體計算能力的提升，它又成為

微服務學習實戰筆記 4.3-系統部署篇-Nginx Ingress的安裝與配置

一、Nginx Ingress介紹 Kubernetes關於服務的暴露主要是通過NodePort方式，通過繫結主機的某個埠,然後進行pod的請求轉發和負載均衡，但這種方式下缺陷是Service可能有很多個，如果每個都繫結一個node主機埠的話，主機

深度學習基礎技術分析2：神經網路

感知機僅能解決線性的問題，這個侷限性使得其無法適應多數的實際應用。因此人們提出了神經網路。如圖2.1所示。圖2.1 神經網路

【PyTorch官方教程中文版學習筆記02】PyTorch 神經網路

　　學前準備：　　1. python 中關於【類】的語法　　　　　　　　　2. 學會查閱官方文件Linear — PyTorch 1.10 documentation

TensorFlow筆記（三）神經網路搭建八股

第三章神經網路搭建八股 1 tf.keras 搭建網路八股 1.1 keras 簡介 tf.keras 是 tensorflow2 引入的高封裝度的框架，可以用於快速搭建神經網路模型，keras為支援快速實驗而生，能夠把想法迅速轉換為結果，是深度學習框

TensorFlow筆記（四）神經網路優化

第四章神經網路優化 1 回顧 1.1 tf.keras 搭建神經網路八股——六步法 import——匯入所需的各種庫和包

零基礎入門深度學習 | 第五章：迴圈神經網路

無論即將到來的是大資料時代還是人工智慧時代，亦或是傳統行業使用人工智慧在雲上處理大資料的時代，作為一個有理想有追求的程式設計師，不懂深度學習這個超熱的技術，會不會感覺馬上就out了？

寫給程式設計師的機器學習入門 (八) - 卷積神經網路 (CNN) - 圖片分類和驗證碼識別

這一篇將會介紹卷積神經網路 (CNN)，CNN 模型非常適合用來進行圖片相關的學習，例如圖片分類和驗證碼識別，也可以配合其他模型實現 OCR。

基於FPGA的卷積神經網路實現（七）卷積模組

將卷積展開後要進行的運算實質上是大規模矩陣運算，因此卷積模組的實現時最容易的，什麼都不需要考慮，資料按順序來了就計算，而這個順序是資料讀取部分需要考慮的，計算完了輸出去這部分是下一層的資料資料

卷積神經網路CNN（一）

　　我們將先描述卷積神經⽹絡中卷積層和池化層的⼯作原理，並解釋填充、步幅、輸⼊通道和輸出通道的含義。掌握了這些基礎知識以後，我們將探究數個具有代表性的深度卷積神經⽹絡的設計思路。

深度學習——學習筆記（3）神經網路入門（新聞分類）

相關推薦