《用Python玩轉資料》專案—線性迴歸分析入門之波士頓房價預測（二）

阿新 • • 發佈：2018-11-25

接上一部分，此篇將用tensorflow建立神經網路，對波士頓房價資料進行簡單建模預測。

二、使用tensorflow擬合boston房價datasets

1、資料處理依然利用sklearn來分訓練集和測試集。

2、使用一層隱藏層的簡單網路，試下來用當前這組超引數收斂較快，準確率也可以。

3、啟用函式使用relu來引入非線性因子。

4、原本想使用如下方式來動態更新lr，但是嘗試下來效果不明顯，就索性不要了。

def learning_rate(epoch):
    if epoch < 200:
        return 0.01
    if epoch < 400:
        return 0.001
    if epoch < 800:
        return 1e-4

好了，廢話不多說了，看程式碼如下：

from sklearn import datasets
from sklearn.model_selection import train_test_split
import os
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf

dataset = datasets.load_boston()
x = dataset.data
target = dataset.target
y = np.reshape(target,(len(target), 1))

x_train, x_verify, y_train, y_verify = train_test_split(x, y, random_state=1)
y_train = y_train.reshape(-1)
train_data = np.insert(x_train, 0, values=y_train, axis=1)


def r_square(y_verify, y_pred):
    var = np.var(y_verify)
    mse = np.sum(np.power((y_verify-y_pred.reshape(-1,1)), 2))/len(y_verify)
    res = 1 - mse/var
    print('var:', var)
    print('MSE-ljj:', mse)
    print('R2-ljj：', res)


EPOCH = 3000
lr = tf.placeholder(tf.float32, [], 'lr')
x = tf.placeholder(tf.float32, shape=[None, 13], name='input_feature_x')
y = tf.placeholder(tf.float32, shape=[None, 1], name='input_feature_y')

W = tf.Variable(tf.truncated_normal(shape=[13, 10], stddev=0.1))
b = tf.Variable(tf.constant(0., shape=[10]))

W2 = tf.Variable(tf.truncated_normal(shape=[10, 1], stddev=0.1))
b2 = tf.Variable(tf.constant(0., shape=[1]))


with tf.Session() as sess:
    hidden1 = tf.nn.relu(tf.add(tf.matmul(x, W), b))

    y_predict = tf.add(tf.matmul(hidden1, W2), b2)
    loss = tf.reduce_mean(tf.reduce_sum(tf.pow(y-y_predict,2), reduction_indices=[1]))
    print(loss.shape)
    train = tf.train.AdamOptimizer(learning_rate=lr).minimize(loss)

    sess.run(tf.global_variables_initializer())
    saver = tf.train.Saver()
    W_res = 0
    b_res = 0
    try:
        last_chk_path = tf.train.latest_checkpoint(checkpoint_dir='/home/ljj/PycharmProjects/mooc/train_record')
        saver.restore(sess, save_path=last_chk_path)
    except:
        print('no save file to recover-----------start new train instead--------')

        loss_list = []
        over_flag = 0
        for i in range(EPOCH):
            if over_flag ==1:
                    break
            y_t = train_data[:, 0].reshape(-1, 1)
            _, W_res, b_res, loss_train = sess.run([train, W, b, loss],
                                                   feed_dict={x: train_data[:, 1:],
                                                              y: y_t,
                                                              lr: 0.01})

            checkpoint_file = os.path.join('/home/ljj/PycharmProjects/mooc/train_record', 'checkpoint')
            saver.save(sess, checkpoint_file, global_step=i)
            loss_list.append(loss_train)
            if loss_train < 0.2:
                over_flag = 1
                break
            if i %500 == 0:
                print('EPOCH = {:}, train_loss ={:}'.format(i, loss_train))
            if i % 500 == 0:
                r = loss.eval(session=sess, feed_dict={x: x_verify,
                                                       y: y_verify,
                                                       lr: 0.01})
                print('verify_loss = ',r)
            np.random.shuffle(train_data)

        plt.plot(range(len(loss_list)-1), loss_list[1:], 'r')
        plt.show()

    print('final loss = ',loss.eval(session=sess, feed_dict={x: x_verify,
                                           y: y_verify,
                                           lr: 0.01}))

    y_pred = sess.run(y_predict, feed_dict={x: x_verify,
                                           y: y_verify,
                                           lr: 0.01})

    plt.subplot(2,1,1)
    plt.xlim([0,50])
    plt.plot(range(len(y_verify)), y_pred,'b--')
    plt.plot(range(len(y_verify)), y_verify,'r')
    plt.title('validation')

    y_ss = sess.run(y_predict, feed_dict={x: x_train,
                                           y: y_train.reshape(-1, 1),
                                           lr: 0.01})
    plt.subplot(2,1,2)
    plt.xlim([0,50])
    plt.plot(range(len(y_train)), y_ss,'r--')
    plt.plot(range(len(y_train)), y_train,'b')
    plt.title('train')

    plt.savefig('tf.png')
    plt.show()

    r_square(y_verify, y_pred)

訓練了大概3000個epoch後，儲存模型，之後可以多次訓練，但是loss基本收斂了，沒有太大變化。

輸出結果如下：

final loss = 15.117827
var: 99.0584735569471
MSE-ljj: 15.11782691349897
R2-ljj： 0.8473848185757882

從影象上看，擬合效果也是一般，再拿一個放大版本的validation圖，同樣取前50個樣本，這樣方便和之前的線性迴歸模型對比。

最後我們還是用資料來說明：

tf模型結果中，

R2：0.847 > 0. 779

MSE：15.1 < 21.8

都比sklearn的線性迴歸結果要好。所以，此tf模型對波士頓房價資料的可解釋性更強。

def learning_rate(epoch):
    if epoch < 200:
        return 0.01
if epoch < 400:
        return 0.001
if epoch < 800:
        return 1e-4

《用Python玩轉資料》專案—線性迴歸分析入門之波士頓房價預測（二）

接上一部分，此篇將用tensorflow建立神經網路，對波士頓房價資料進行簡單建模預測。二、使用tensorflow擬合boston房價datasets 1、資料處理依然利用sklearn來分訓練集和測試集。 2、使用一層隱藏層的簡單網路，試下來用當前這組超引數收斂較快，準確率也可以。 3、啟用函式

《用Python玩轉數據》項目—線性回歸分析入門之波士頓房價預測（二）

store mil ima 超參數 eval app lac on() break 接上一部分，此篇將用tensorflow建立神經網絡，對波士頓房價數據進行簡單建模預測。二、使用tensorflow擬合boston房價datasets 1、數據處理依然利用sklearn

用Python玩轉資料——20180928學習筆記

import pandas as pd import numpy as np djidf = pd.read_csv(r'C:\Users\USER\Desktop\^DJI.csv') pd.set_option('display.max_columns',5

筆記 Data Processing Using Python 1（用Python玩轉資料第一章）

輸入語句： price=raw_input("String"); 109; price; #值為109，型別為‘str’ 109; price; #值為109，型別為‘str’ 註釋問題：#註釋; \ 續行符；''',(不用加續行符；縮排問題：增加縮排表示語句的開始；

python線性迴歸的小例子--波士頓房價預測

今天學習了簡單的線性迴歸，用波士頓房價的例子測試了一下 import pandas as pd import numpy as np from sklearn import datasets import matplotlib.pyplot as plt from skle

用Python玩轉時序資料

時間序列是日常生活中最常見的資料型別之一。股票價格、銷售資訊、氣候資料、能源使用，甚至個人身高體重都是可以用來定期收集的資料樣本。幾乎每個資料科學家在工作中都會遇到時間序列，能夠有效地處理這些資料是資料科學領域之中的一項非常重要的技能。本文簡要介紹瞭如何從零開始使用Python中的時間序列。

2018最新大神教你用Python玩轉數據視頻教程

data arr 學習者 ui組件 array 字符玩轉統計 afr 本課程共分為5個模塊(實際課時為8周)：Module 01: Python基礎本模塊主要討論Python的基本語言結構、數據類型、基本運算、條件和循環、函數和模塊等內容，用它們就可以寫一些有用的程序了

【程式碼】用Python玩轉微信，echarts餅圖，WordCloud雲圖，自動回覆訊息，好友地區熱圖

參考用Python玩轉微信（一），做了一些修改 import re import os import time import itchat from echarts import Echart, Legend, Pie import wordcloud from wordcloud im

10分鐘教你用Python玩轉微信之抓取好友個性簽名製作詞雲

01 前言+展示各位小夥伴我又來啦。今天帶大家玩點好玩的東西，用Python抓取我們的微信好友個性簽名，然後製作詞雲。怎樣，有趣吧~好了，下面開始幹活。我知道你們還是想先看看效果的。後臺登入：詞雲： 02 環境準備 Python版本：3.6.0系統平臺：W

10分鐘教你用Python玩轉微信之好友性別比例統計分析

01 前言+效果展示想必，微信對於大家來說，是再熟悉不過的了。那麼，大家想不想探索一下微信上的各種奧祕呢？今天，我們一起來簡單分析一下微信上的好友性別比例吧~廢話不多說，開始幹活。結果如下： 02 環境準備 Python版本：3.6.0系統平臺：Windows 10

用python玩轉微信小遊戲大小猜猜看

用python玩轉微信小遊戲大小猜猜看遊戲模式在微信小程式裡搜尋“大小猜猜看”，即可找到該遊戲。遊戲的目標比拼計算能力，找出誰大誰小，一共有40題，全部答對即挑戰成功。一開始答題時間充足，數字也比較簡單，後面就需要特別快的計算速度。專案地址本專案地址

wxpy：用 Python 玩轉微信就是這麼簡單

前言 wxpy 在 itchat 的基礎上，通過大量介面優化提升了模組的易用性，並進行豐富的功能擴充套件。用來幹啥一些常見的場景控制路由器、智慧家居等具有開放介面的玩意兒執行指令碼時自動把日誌傳送到你的微信加群主為好友，自動拉進群中跨號或跨群轉發訊

Tensorflow之多元線性迴歸問題（以波士頓房價預測為例）

一、根據波士頓房價資訊進行預測，多元線性迴歸+特徵資料歸一化 #讀取資料 %matplotlib notebook import tensorflow as tf import matplotlib.pyplot as plt import numpy as np

線性迴歸之波士頓房價預測

from sklearn.datasets import load_boston import numpy as np import matplotlib.pyplot as plt def feature_scalling(X): mean = X.mean(axis=0) s

【python】詳解類class的屬性：類資料屬性、例項資料屬性、特殊的類屬性、屬性隱藏（二）

自上一篇python中的類，物件，方法，屬性初認識（一）認識了類的基本架構，下面繼續對類進行詳解，更加深入瞭解類的屬性、方法、訪問控制這三個方面的類容。緊接上一篇類的例項：一、資料屬性 1、在上面的person類中，“tall”、“name”、"age"和"weight "都被稱為類的資料屬性，

資料探勘十大演算法——支援向量機SVM（二）：線性支援向量機的軟間隔最大化模型

首先感謝“劉建平pinard”的淵博知識以及文中詳細準確的推導！！！支援向量機原理SVM系列文章共分為5部分：（一）線性支援向量機（二）線性支援向量機的軟間隔最大化模型（三）線性不可分支援向量機與核函式（四）SMO演算法原理（五）線性支援迴歸

Appium python自動化測試系列之appium環境搭建（二）

ftp 自動化手動文件搭建環境做到安裝python reg 成員 ?2.1 基礎環境搭建當我們學習新的一項技術開始基本都是從環境搭建開始，本書除了第一章節也是的，如果你連最基礎的環境都沒有那麽我們也沒必要去說太多，大概介紹一下： 1、因為appium是支持and

python設計模式之單例模式（二）

__new__ 有意 {} 開發人員 sta 字典 spa 出現創建上次我們簡單了解了一下什麽是單例模式，今天我們繼續探究。上次的內容點這 python設計模式之單例模式（一）上次們討論的是GoF的單例設計模式，該模式是指:一個類有且只有一個對象。通常我們需

Python修行之路之字符串（二）修改、查找、格式化

value 小寫 %d aar suffix mat 定義常量大寫字符串修改replace(old,new[,count]) - > str字符串中找到匹配替換為新子串，返回新字符串count表示替換幾次，不指定就是全部替換原字符串為一個常量，不可變。修改返回的

python數據結構之雙隊列（二）

self for __init__ pri solid pen odin __name__ urn 書接上文，雙端隊列區別於單隊列為：雙端隊列可以對隊列頭和尾部同時進行操作，單隊列不行#coding:utf-8 class DoubleQueue(object):

《用Python玩轉資料》專案—線性迴歸分析入門之波士頓房價預測（二）

相關推薦