kreas搭建神經網路預測波士頓房價（手寫K折交叉驗證）

阿新 • • 發佈：2018-11-07

1、程式說明

所有注意事項均寫入註釋

from keras.datasets import boston_housing
import numpy as np
from keras import models
from keras import layers
from keras.optimizers import RMSprop

#  載入資料
(train_data, train_targets), (test_data, test_targets) = boston_housing.load_data()

#  訓練集404個，測試集102個，13個屬性
# print(train_data[0])
# print(train_data.shape)
# print(train_targets)
# print(test_data.shape)

#  資料標準化
'''
用於測試資料標準化的均值和標準差都是在訓練資料上計算得到的。
不能使用在測試資料上計算得到的任何結果，即使是像資料標準化這麼簡單的事情也不行。
'''
mean = train_data.mean(axis=0)
train_data -= mean
test_data -= mean
std = train_data.std(axis=0)
train_data -= std
test_data -= std

def build_model():
    model = models.Sequential()
    model.add(layers.Dense(units=64, activation='relu', input_shape=(13, )))
    model.add(layers.Dense(units=64, activation='relu'))
    '''
        網路的最後一層只有一個單元，沒有啟用，是一個線性層。這是標量回歸（標量回歸是預
    測單一連續值的迴歸）的典型設定。新增啟用函式將會限制輸出範圍。例如，如果向最後一層
    新增 sigmoid 啟用函式，網路只能學會預測 0~1 範圍內的值。這裡最後一層是純線性的，所以
    網路可以學會預測任意範圍內的值。
    '''
    model.add(layers.Dense(units=1))
    model.compile(optimizer=RMSprop(lr=0.001), loss='mse', metrics=['mae'])
    return model

def k_fold(k, model):
    num_val_samples = len(train_data) // k
    all_scores = []
    for i in range(k):
        print('Processing fold #', i+1)

        #  準備測試集，第i塊為測試集
        val_data = train_data[i*num_val_samples: (i+1)*num_val_samples]
        val_targets = train_targets[i*num_val_samples: (i+1)*num_val_samples]

        #  準備訓練集，除了第i塊都是訓練集，這裡用numpy的concatenate拼接
        partial_train_data = np.concatenate([train_data[:i*num_val_samples], train_data[(i+1)*num_val_samples:]], axis=0)
        partial_train_targets = np.concatenate([train_targets[:i * num_val_samples], train_targets[(i + 1) * num_val_samples:]],
                                            axis=0)
        '''
        verbose：日誌顯示
        verbose = 0 為不在標準輸出流輸出日誌資訊
        verbose = 1 為輸出進度條記錄
        verbose = 2 為每個epoch輸出一行記錄
        注意： 預設為 1
        '''
        model.fit(partial_train_data, partial_train_targets, epochs=100, batch_size=1, verbose=0)
        val_mse, val_mae = model.evaluate(val_data, val_targets)
        print('val_mse:', val_mae, '   val_mae:', val_mae)
        all_scores.append(val_mae)
    return all_scores

if __name__ == '__main__':
    all_scores = k_fold(5, build_model())
    print(all_scores)

2、訓練結果展示

Processing fold # 1

32/80 [===========>..................] - ETA: 0s
80/80 [==============================] - 0s 424us/step
val_mse: 2.2958826065063476    val_mae: 2.2958826065063476
Processing fold # 2

32/80 [===========>..................] - ETA: 0s
80/80 [==============================] - 0s 25us/step
val_mse: 2.2359493732452393    val_mae: 2.2359493732452393
Processing fold # 3

32/80 [===========>..................] - ETA: 0s
80/80 [==============================] - 0s 25us/step
val_mse: 1.8176211357116698    val_mae: 1.8176211357116698
Processing fold # 4

32/80 [===========>..................] - ETA: 0s
80/80 [==============================] - 0s 25us/step
val_mse: 1.8358864784240723    val_mae: 1.8358864784240723
Processing fold # 5

32/80 [===========>..................] - ETA: 0s
80/80 [==============================] - 0s 25us/step
val_mse: 2.025705862045288    val_mae: 2.025705862045288
[2.2958826065063476, 2.2359493732452393, 1.8176211357116698, 1.8358864784240723, 2.025705862045288]

可見，平均mae為2.04，即平均誤差為2040美元。

3、k折交叉驗證

在這裡插入圖片描述

4、小結

迴歸問題使用的損失函式與分類問題不同。迴歸常用的損失函式是均方誤差（MSE）,常見的迴歸指標是平均絕對誤差（MAE）。
如果可用的資料很少，使用 K 折驗證可以可靠地評估模型。
如果輸入資料的特徵具有不同的取值範圍，應該先進行預處理，對每個特徵單獨進行縮放。
如果可用的訓練資料很少，最好使用隱藏層較少（通常只有一到兩個）的小型網路，以避免嚴重的過擬合。

kreas搭建神經網路預測波士頓房價（手寫K折交叉驗證）

1、程式說明所有注意事項均寫入註釋 from keras.datasets import boston_housing import numpy as np from keras import models from keras import layers from keras.o

Kaggle神經網路實戰：CNN實現手寫數字辨識

簡要介紹本文是基於Kaggle入門專案Digit Recognizer的處理方案，在MINST資料集上訓練可以識別手寫數字的模型。專案連結程式碼來自專案Kernels，使用tensorflow實現CNN網路，完整圖文及程式碼請參照Kernel原文

C++使用matlab卷積神經網路庫MatConvNet來進行手寫數字識別

環境：WIN10(64 bit)+VS2010(64 bit)+Matlab2015b(64 bit) 我們的目的是將MatConvNet自帶的手寫數字識別DEMO移植到一個簡單的WIN32 DEMO中使用，主要過程有以下幾個步驟：（1）配置MatConvNet

python-積卷神經網路全面理解-tensorflow實現手寫數字識別

　　　　首先，關於神經網路，其實是一個結合很多知識點的一個演算法，關於cnn（積卷神經網路）大家需要了解：　　　　　　　　　　下面給出我之前總結的這兩個知識點（基於吳恩達的機器學習）　　　　　　　　　　代價函式：　　　　　　　　　　代價函式　　　　　　　　　　代價函式（Cost Function ）是

spring事務(6)-----手寫SpringMVC模式（手寫@RequestMapping和@Controller註解）

一，spring原生態的程式碼分析 1.1，首先，我們先來認識一下SpringMVC的主要元件前端控制器（DisatcherServlet）:接收請求，響應結果，返回可以是json,String等資料型別，也可以是頁面（Model）。處理器對映器（HandlerMap

機器學習之模型選擇（K折交叉驗證，超引數的選擇）

來源： https://www.cnblogs.com/jerrylead/archive/2011/03/27/1996799.html 對於解決同一個問題，如怎麼選擇模型去擬合線性迴歸中只有一個特徵時房價預測問題，如可能有不同的模型去解決，如： 1、d = 1，h（

泛化能力、訓練集、測試集、K折交叉驗證、假設空間、欠擬合與過擬合、正則化（L1正則化、L2正則化）、超引數

泛化能力（generalization）：機器學習模型。在先前未觀測到的輸入資料上表現良好的能力叫做泛化能力（generalization）。訓練集（training set）與訓練錯誤（training error）：訓練機器學習模型使用的資料集稱為訓練集（tr

帶著萌新看springboot原始碼13（手寫一個自己的starter）

　　springboot的最強大的就是那些xxxAutoconfiguration，但是這些xxxAutoConfiguration又依賴那些starter，只有匯入了這些場景啟動器（starter），我們很多自動配置類才能有用，並且還會新增一些功能，　　這次就來一起寫個簡單的starter，來看看內部到底

【機器學習】k-fold cross validation（k-摺疊交叉驗證）

交叉驗證的目的：在實際訓練中，模型通常對訓練資料好，但是對訓練資料之外的資料擬合程度差。用於評價模型的泛化能力，從而進行模型選擇。交叉驗證的基本思想：把在某種意義下將原始資料(dataset)進行分組,一部分做為訓練集(train set),另一部分做為驗證集(valid

k-fold cross validation（k-摺疊交叉驗證）,python pandas （ix & iloc &loc）的區別

交叉驗證的目的：在實際訓練中，模型通常對訓練資料好，但是對訓練資料之外的資料擬合程度差。用於評價模型的泛化能力，從而進行模型選擇。交叉驗證的基本思想：把在某種意義下將原始資料(dataset)進行分組,一部分做為訓練集(train set),另一部分做為驗證集(validat

機器學習為什麼需要交叉驗證？怎麼使用k-fold cross validation（k-摺疊交叉驗證）

介紹這個非常重要的概念，希望在訓練演算法時能幫助各位。概念和思維解讀叉驗證的目的：在實際訓練中，模型通常對訓練資料好，但是對訓練資料之外的資料擬合程度差。用於評價模型的泛化能力，從而進行模型選擇。交叉驗

機器學習實戰（一）—— 用線性回歸預測波士頓房價

-1 png 機器學習 mage 回歸線性回歸 blog 分享機器機器學習實戰（一）—— 用線性回歸預測波士頓房價

神經網路優化（二） - 搭建神經網路八股

為提高程式的可複用性，搭建模組化的神經網路八股 1 前向傳播前向傳播就是設計、搭建從輸入（引數 x ）到輸出（返回值為預測或分類結果 y ）的完整網路結構，實現前向傳播過程，一般將其放在 forward.py 檔案中前向傳播需要定義三個函式（實際上第一個函式是框架，第二、三個函式是賦初值過程）

使用者畫像（2）使用keras框架搭建神經網路模型

import pickle import pandas as pd import tensorflow as tf import numpy as np import matplotlib.pyplot as plt from keras import back

keras探索：regression-波士頓房價預測例項（小樣本K折驗證）

open source: deep learning with python (keras) open code: https://github.com/fchollet/deep-learning-with-python-notebooks/blob/master/3.7-predic

使用tensorflow：LSTM神經網路預測股票（三）

原始資料處理有朋友在qq群裡分享了原始資料處理的想法，例如調整origin_data_row引數、新增一些大盤的資料作為新的特徵等。所以這一篇我將原始資料以及原始資料的處理方法寫下來，為方便大家驗證、探

使用tensorflow：LSTM神經網路預測股票（一）

基礎理論知識關於深度學習和LSTM神經網路在網上有很多內容，這裡不再贅述，只列舉幾個優質的資源： 1. 深度學習入門：https://www.deeplearning.ai 百度前首席科學家吳恩達創立的網站，旨在傳播深度學習的基礎知識。他的視

簡單神經網路預測結構化資料關係___測試集（改良）

# coding: utf-8 import random import csv import tensorflow as tf import matplotlib.pyplot as plt from sklearn.preprocessing import

TensorFlow學習筆記（九）tf搭建神經網路基本流程

1. 搭建神經網路基本流程定義新增神經層的函式 1.訓練的資料 2.定義節點準備接收資料 3.定義神經層：隱藏層和預測層 4.定義 loss 表示式 5.選擇 optimizer 使 loss 達到最小然後對所有變數進行初始化，通過 sess.run optimizer，迭代 1000 次進行學習： i

用Keras搭建神經網路簡單模版（一）——Regressor 迴歸

#training print("Training~~~~~~~~") for step in range(301): cost = model.train_on_batch(X_train,Y_train)#一批一批的資料,這裡一批選擇全部資料 if step %100==0:

kreas搭建神經網路預測波士頓房價（手寫K折交叉驗證）

1、程式說明

2、訓練結果展示

3、k折交叉驗證

4、小結

相關推薦