tensorflow初級訓練

阿新 • • 發佈：2018-12-18

本文是來自Google機器學習

資料基於加利福尼亞州 1990 年的人口普查資料。

在 TensorFlow 中使用 LinearRegressor 類並基於單個輸入特徵預測各城市街區的房屋價值中位數
使用均方根誤差 (RMSE) 評估模型預測的準確率
通過調整模型的超引數提高模型準確率

from __future__ import print_function
import math
from IPython import display
from matplotlib import cm
from matplotlib import gridspec
from matplotlib import  pyplot as plt
import numpy as np
import pandas as pd
from sklearn import metrics
import  tensorflow as tf
from tensorflow.python.data import Dataset
#進行初始化
tf.logging.set_verbosity(tf.logging.ERROR)
pd.options.display.max_rows=10
pd.options.display.float_format='{:.lf}'.format
#pandas從特定網址載入資料集
california_housing_dataframe=pd.read_csv("https://download.mlcc.google.cn/mledu-datasets/california_housing_train.csv", sep=",")
#對資料集進行隨機化處理
california_housing_dataframe = california_housing_dataframe.reindex(
    np.random.permutation(california_housing_dataframe.index))
#將房價進行以千為單位的處理
california_housing_dataframe["median_house_value"] /= 1000.0
#檢視資訊
# print(california_housing_dataframe.describe())
#-------------step1:定義特徵並配置特徵-------#
#提取total_rooms這一列
my_feature=california_housing_dataframe[["total_rooms"]]
#定義一個特徵列，特徵列僅儲存對特徵資料的描述，但不包含特徵資料本身
feature_columns=[tf.feature_column.numeric_column("total_rooms")]
#-------------step2：定義目標---------------#
#定義目標：房價
targets=california_housing_dataframe["median_house_value"]
#-------------step3：配置線性模型-----------#
#GradientDescentOptimizer進行小批量隨機梯度下降法(SGD)訓練該模型
#learing_rate引數可控制梯度步長的大小
my_optimizer=tf.train.GradientDescentOptimizer(learning_rate=0.0000001)
#將梯度裁剪應用到優化器，梯度裁剪可確保梯度大小在訓練期間不會變得過大，過大會導致梯度下降失敗
my_optimizer=tf.contrib.estimator.clip_gradients_by_norm(my_optimizer,5.0)
#根據定義好的feature_columns和my_optimizer來配置線性迴歸模型
linear_regressor=tf.estimator.LinearRegressor(feature_columns=feature_columns,
                                              optimizer=my_optimizer)
#---------------step4:定義輸入函式------------#
#要將加利福尼亞州住房資料匯入 LinearRegressor，我們需要定義一個輸入函式
# 讓它告訴 TensorFlow 如何對資料進行預處理，以及在模型訓練期間如何批處理、隨機處理和重複資料。
#首先，我們將 Pandas 特徵資料轉換成 NumPy 陣列字典。
# 然後，我們可以使用 TensorFlow Dataset API 根據我們的資料構建 Dataset 物件
# 並將資料拆分成大小為 batch_size 的多批資料，以按照指定週期數 (num_epochs) 進行重複。
#注意：如果將預設值 num_epochs=None 傳遞到 repeat()，輸入資料會無限期重複。
#然後，如果 shuffle 設定為 True，則我們會對資料進行隨機處理，以便資料在訓練期間以隨機方式傳遞到模型。
# buffer_size 引數會指定 shuffle 將從中隨機抽樣的資料集的大小。
#最後，輸入函式會為該資料集構建一個迭代器，並向 LinearRegressor 返回下一批資料。
def my_input_fn(features,target,batch_size=1,shuffle=True,num_epochs=None):
    features={key:np.array(value) for key,value in dict(features).items()}
    ds=Dataset.from_tensor_slices((features,targets))
    ds=ds.batch(batch_size).repeat(num_epochs)
    if shuffle:
        ds=ds.shuffle(buffer_size=10000)
    #返回下一批資料
    #Dataset.make_one_shot_iterator()一次訪問資料集中的一個元素
    features,labels=ds.make_one_shot_iterator().get_next()
    return features,labels

#-----------------step5：訓練模型--------------#
_=linear_regressor.train(input_fn=lambda:my_input_fn(my_feature,targets),steps=100)
#-----------------step6：評估模型--------------#
prediction_input_fn=lambda:my_input_fn(my_feature,targets,num_epochs=1,shuffle=True)
predictions=linear_regressor.predict(input_fn=prediction_input_fn)
#將predictions格式化為numpy的array
predictions=np.array([item['predictions'][0] for item in predictions])
#計算均方誤差(MSE)
mean_squared_error=metrics.mean_squared_error(predictions,targets)
#由於均方誤差很難解讀，因此我們經常使用的是均方根誤差(RMSE)，它與原目標同規模
root_mean_squared_error=math.sqrt(mean_squared_error)
print("Mean Squared Error (on training data): %0.3f" % mean_squared_error)
print("Root Mean Squared Error (on training data): %0.3f" % root_mean_squared_error)

#-------來比較一下 RMSE 與目標最大值和最小值的差值：
min_house_value = california_housing_dataframe["median_house_value"].min()
max_house_value = california_housing_dataframe["median_house_value"].max()
min_max_difference = max_house_value - min_house_value
print("Min. Median House Value: %0.3f" % min_house_value)
print("Max. Median House Value: %0.3f" % max_house_value)
print("Difference between Min. and Max.: %0.3f" % min_max_difference)
print("Root Mean Squared Error: %0.3f" % root_mean_squared_error)
#--------------------------------#

#下面開始繪圖，隨機挑選一些樣本
sample=california_housing_dataframe.sample(n=300)
x_0=sample["total_rooms"].min()
x_1=sample["total_rooms"].max()
##從訓練好的線性迴歸模型中得到的weights與bias
weight=linear_regressor.get_variable_value('linear/linear_model/total_rooms/weights')[0]
bias = linear_regressor.get_variable_value('linear/linear_model/bias_weights')
y_0=weight*x_0+bias
y_1=weight*x_1+bias
#繪製一條直線，這就是訓練好的線性迴歸模型
plt.plot([x_0,x_1],[y_0,y_1],c='r')
plt.ylabel("median_house_value")
plt.xlabel("total_rooms")
#繪製一些樣本中的散點作為對照
plt.scatter(sample["total_rooms"],sample["median_house_value"])
plt.show()


#將上述所有程式碼放到一個函式中
def train_model(learning_rate, steps, batch_size, input_feature="total_rooms"):
    """Trains a linear regression model of one feature.

    Args:
      learning_rate: A `float`, the learning rate.
      steps: A non-zero `int`, the total number of training steps. A training step
        consists of a forward and backward pass using a single batch.
      batch_size: A non-zero `int`, the batch size.
      input_feature: A `string` specifying a column from `california_housing_dataframe`
        to use as input feature.
    """

    periods = 10
    steps_per_period = steps / periods

    my_feature = input_feature
    my_feature_data = california_housing_dataframe[[my_feature]]
    my_label = "median_house_value"
    targets = california_housing_dataframe[my_label]

    # Create feature columns.
    feature_columns = [tf.feature_column.numeric_column(my_feature)]

    # Create input functions.
    training_input_fn = lambda: my_input_fn(my_feature_data, targets, batch_size=batch_size)
    prediction_input_fn = lambda: my_input_fn(my_feature_data, targets, num_epochs=1, shuffle=False)

    # Create a linear regressor object.
    my_optimizer = tf.train.GradientDescentOptimizer(learning_rate=learning_rate)
    my_optimizer = tf.contrib.estimator.clip_gradients_by_norm(my_optimizer, 5.0)
    linear_regressor = tf.estimator.LinearRegressor(
        feature_columns=feature_columns,
        optimizer=my_optimizer
    )

    # Set up to plot the state of our model's line each period.
    plt.figure(figsize=(15, 6))
    plt.subplot(1, 2, 1)
    plt.title("Learned Line by Period")
    plt.ylabel(my_label)
    plt.xlabel(my_feature)
    sample = california_housing_dataframe.sample(n=300)
    plt.scatter(sample[my_feature], sample[my_label])
    colors = [cm.coolwarm(x) for x in np.linspace(-1, 1, periods)]

    # Train the model, but do so inside a loop so that we can periodically assess
    # loss metrics.
    print("Training model...")
    print("RMSE (on training data):")
    root_mean_squared_errors = []
    for period in range(0, periods):
        # Train the model, starting from the prior state.
        linear_regressor.train(
            input_fn=training_input_fn,
            steps=steps_per_period
        )
        # Take a break and compute predictions.
        predictions = linear_regressor.predict(input_fn=prediction_input_fn)
        predictions = np.array([item['predictions'][0] for item in predictions])

        # Compute loss.
        root_mean_squared_error = math.sqrt(
            metrics.mean_squared_error(predictions, targets))
        # Occasionally print the current loss.
        print("  period %02d : %0.2f" % (period, root_mean_squared_error))
        # Add the loss metrics from this period to our list.
        root_mean_squared_errors.append(root_mean_squared_error)
        # Finally, track the weights and biases over time.
        # Apply some math to ensure that the data and line are plotted neatly.
        y_extents = np.array([0, sample[my_label].max()])

        weight = linear_regressor.get_variable_value('linear/linear_model/%s/weights' % input_feature)[0]
        bias = linear_regressor.get_variable_value('linear/linear_model/bias_weights')

        x_extents = (y_extents - bias) / weight
        x_extents = np.maximum(np.minimum(x_extents,
                                          sample[my_feature].max()),
                               sample[my_feature].min())
        y_extents = weight * x_extents + bias
        plt.plot(x_extents, y_extents, color=colors[period])
    print("Model training finished.")

    # Output a graph of loss metrics over periods.
    plt.subplot(1, 2, 2)
    plt.ylabel('RMSE')
    plt.xlabel('Periods')
    plt.title("Root Mean Squared Error vs. Periods")
    plt.tight_layout()
    plt.plot(root_mean_squared_errors)

    # Output a table with calibration data.
    calibration_data = pd.DataFrame()
    calibration_data["predictions"] = pd.Series(predictions)
    calibration_data["targets"] = pd.Series(targets)
    display.display(calibration_data.describe())
    print("Final RMSE (on training data): %0.2f" % root_mean_squared_error)
train_model(
    learning_rate=0.00002,
    steps=500,
    batch_size=5
)

#即便如此，我們仍在下面列出了幾條可為您提供指導的經驗法則：
# 訓練誤差應該穩步減小，剛開始是急劇減小，最終應隨著訓練收斂達到平穩狀態。
# 如果訓練尚未收斂，嘗試執行更長的時間。
# 如果訓練誤差減小速度過慢，則提高學習速率也許有助於加快其減小速度。
# 但有時如果學習速率過高，訓練誤差的減小速度反而會變慢。
# 如果訓練誤差變化很大，嘗試降低學習速率。
# 較低的學習速率和較大的步數/較大的批量大小通常是不錯的組合。
# 批量大小過小也會導致不穩定情況。不妨先嚐試 100 或 1000 等較大的值，然後逐漸減小值的大小，直到出現效能降低的情況。
# 重申一下，切勿嚴格遵循這些經驗法則，因為效果取決於資料。請始終進行試驗和驗證。

tensorflow初級訓練

本文是來自Google機器學習資料基於加利福尼亞州 1990 年的人口普查資料。在 TensorFlow 中使用 LinearRegressor 類並基於單個輸入特徵預測各城市街區的房屋價值中位數使用均方根誤差 (RMSE) 評估模型預測

解決tensorflow在訓練的時候權重是nan問題

org 解釋數據集 ice track fill hot tps ng-click 搭建普通的卷積CNN網絡。 nan表示的是無窮或者是非數值，比如說你在tensorflow中使用一個數除以0，那麽得到的結果就是nan。在一個matrix中，如果其中的值都為

在 C/C++ 中使用 TensorFlow 預訓練好的模型—— 直接調用Ｃ++ 接口實現

input lac frame core 9.png pla 低版本訓練接口現在的深度學習框架一般都是基於 Python 來實現，構建、訓練、保存和調用模型都可以很容易地在 Python 下完成。但有時候，我們在實際應用這些模型的時候可能需要在其他編程語言下進行，本

tensorflow在訓練和驗證時監視不同的summary的操作

write scalar all glob sca val rain 不同 valid 如果想在訓練和驗證時監視不同的summary，將train summary ops和val summary ops放進不同的集合中即可。 train_writer = tf.summar

TensorFlow-cifar訓練與測試（可對自己資料進行分類和測試）

第一部分：測試軟硬體硬體：NVIDIA-GTX1080 軟體：Windows7、python3.6.5、tensorflow-gpu-1.4.0 第二部分：資料下載資料集下載連結第三部分：程式碼分步展示第一步：匯入tensorflow import os fr

TensorFlow-mnist訓練與測試

TensorFlow介紹性的概念就不闡述了，但是直接上程式碼好像又比較突兀！所以提前祝小夥伴們春節快樂！硬體：NVIDIA-GTX1080 軟體：Windows7、python3.6.5、tensorflow-gpu-1.4.0 好了，上程式碼！程式碼通過分步解析，淺顯易懂！

tensorflow隨筆-訓練檢查點tf.train.Saver(2)

#!/usr/bin/env python2 # -*- coding: utf-8 -*- """ Created on Thu Sep 6 10:16:37 2018 @author: myhaspl @email:[email protected] """

Tensorflow在訓練模型的時候如何指定GPU進行訓練

Tensorflow指定GPU進行訓練模型實驗室共用一個深度學習伺服器，兩塊GPU,在用tensorflow訓練深度學習模型的時候，假設我們在訓練之前沒有指定GPU來進行訓練，則預設的是選用第0塊GPU來訓練我們的模型，而且其它幾塊GPU的也會顯示被佔用。有些

在 C/C++ 中使用 TensorFlow 預訓練好的模型—— 直接呼叫Ｃ++ 介面實現

現在的深度學習框架一般都是基於 Python 來實現，構建、訓練、儲存和呼叫模型都可以很容易地在 Python 下完成。但有時候，我們在實際應用這些模型的時候可能需要在其他程式語言下進行，本文將通過直接呼叫 TensorFlow 的 C/C++ 介面來匯入 T

tensorflow載入訓練好的模型例項

1. 首先了解下tensorflow的一些基礎語法知識這裡不再詳細說明其細節，只舉例學習。 1.1 tensorflow的tf.transpose()簡單使用： tf.reshape(tensor, shape, name=None) 矩陣變形是常用的

TensorFlow量化訓練

前段時間研究了tflite和量化相關的操作, 經測試量化尤其在具有專門DSP加速的硬體上(比如MTK8183)有著很好的加速效果,大約3X的提升; tensorflow提供了tflite轉化工具toco,使用命令大致如下: bazel-bin/tensor

SSD-Tensorflow 512x512 訓練配置

搞了幾天終於把這個給搞得差不多了，遇到的錯誤這裡也記錄一下：一、配置【配置什麼的300和512其實差不多，這裡只舉一個例子來分析一下】　之前的檔案修改什麼的和300x300的一樣：https://www.cnblogs.com/GrPhoenix/p/10018072.html

Win10-Tensorflow-FasterRcnn訓練環境配置手冊

1、安裝顯示卡驅動：根據自己電腦的顯示卡下載適合的顯示卡驅動2、安裝CUDA8.0 安裝完成後檢視cuda版本：在命令列輸入nvcc -V3、安裝cudnn v6.0將該資料夾下的cuda資料夾下對應的檔案目錄拷貝到第一步安裝的CUDA 檔案目錄4、安裝Anaconda3

使用TensorFlow進行訓練識別視訊影象中物體

本教程針對Windows10實現谷歌公佈的TensorFlow Object Detection

tensorflow在訓練過程中逐步減少學習率

# 宣告學習率為不可訓練 learning_rate = tf.Variable(float(learning_rate), trainable=False, dtype=tf.float32) #

TensorFlow自己訓練的SSD mobilenet模型安卓移植

在做本專案之前，是一個非常非常小白的半吊子深度學習愛好者，但是一個月來接觸了並主導了一個計算機視覺小專案，收穫頗多。這篇文章詳細介紹一下從0到apk的一個TensorFlow模型移植的demo。不得不說，Google真是非常強大，尤其是TensorFlow和Android出自

tensorflow將訓練好的模型freeze,即將權重固化到圖裡面,並使用該模型進行預測

ML主要分為訓練和預測兩個階段,此教程就是將訓練好的模型freeze並儲存下來.freeze的含義就是將該模型的圖結構和該模型的權重固化到一起了.也即載入freeze的模型之後,立刻能夠使用了。下面使用一個簡單的demo來詳細解釋該過程, 一、首先執行指令碼tiny_mo

tensorflow-mnist訓練(一：只有全連線網路)

mnist資料集首先下載好，在根目錄下建立一個資料夾（MNIST_data），把下載好的mnist資料集儲存在MNIST_data中，注意下載的mnist不用解壓，程式會自動解壓下面程式碼包含：一：網路結構只有全連線，比較簡單二：能得到測試集的精確度，大約為百分之91

TensorFlow 組合訓練資料（batching）

在之前的文章中我們提到了TensorFlow TensorFlow 佇列與多執行緒的應用以及TensorFlow TFRecord資料集的生成與顯示，通過這些操作我們可以得到自己的TFRecord檔案，並從其中解析出單個的Image和Label作為訓練資料提供給

tensorflow批量訓練

學習了一下tensorflow傳入批量資料並且訓練的方法。程式碼如下：mport matplotlib.pyplot as plt import numpy as np import tensorflow as tf sess = tf.Session() batch_siz

tensorflow初級訓練

相關推薦