tensorflow的歸一化與梯度下降

阿新 • • 發佈：2018-11-28

程式碼：

# coding=utf-8
# By author MZ


import  numpy as np
from sklearn.datasets import load_boston
import tensorflow as tf
from sklearn.preprocessing import StandardScaler


## 從sklearn的資料集中拿出波士頓房價資料
boston = load_boston()
x=boston.data #獲取資料集中的真實資料
y=boston.target #資料的標籤
print(y.shape) # 列印下資料的shape
m,n = boston.data.shape
## numpy的.c_是combine，用來將兩個矩陣進行相加(按列)
X = np.c_[np.ones((m, 1)), x]
## 使用sklearn中的StandardScaler類可以將資料按期屬性（按列進行）減去其均值，併除以其方差。
## 得到的結果是，對於每個屬性/每列來說所有資料都聚集在0附近，方差為1。
## 好處在於可以儲存訓練集中的引數（均值、方差）直接使用其物件轉換測試集資料
## 對資料進行歸一化後，梯度下降的速度會有明顯的提升
scaler = StandardScaler().fit(X)
scaled_housing_data_plus_bias = scaler.transform(X)



## 定義兩個常量，一個是x一個是y
X_true = tf.constant(scaled_housing_data_plus_bias, dtype=tf.float32, name="xx")
y_true = tf.constant(y, dtype=tf.float32, name="yy")

# tf.random_uniform類似於numpy的ranom.rand
theta=tf.Variable(tf.random_uniform([n + 1, 1],-1.0,1.0),name="theta")


y_hat=tf.matmul(X_true,theta,name="y_hat")
erro=y_hat-y_true
# print(y_true.shape)
# print(y_hat.shape)

##求資料的均方根誤差
mse = tf.reduce_mean(tf.square(erro), name="mse")
## 直接使用tensorflow定義好的gradients方法求梯度
gradients = tf.gradients(mse, [theta])[0]

##定義學習率為0.01
learning_rate=0.01
##tf的assign方法，是賦值操作，將後一個引數的值賦給前一個引數
training_op = tf.assign(theta, theta - learning_rate * gradients)

## 初始化變數
initializer = tf.global_variables_initializer()
# epochs是訓練次數
n_epochs = 1000
with tf.Session() as sess:
    sess.run(initializer) #初始化
    ## 迭代，等待梯度下降
    for epochs in range(n_epochs):
        ## eval方法類似於session的run方法,也是啟動計算的一種方式
        ## mse.eval()等價於sess.run(mse)
        print("epochs: ",epochs," MSE: ",mse.eval())
        sess.run(training_op)
    best_theta = theta.eval()
    print(best_theta)

tensorflow的歸一化與梯度下降

程式碼： # coding=utf-8 # By author MZ import numpy as np from sklearn.datasets import load_boston import tensorflow as tf from sklearn.preproces

統計資料歸一化與標準化

歸一化：１）把資料變成(０，１)之間的小數２）把有量綱表示式變成無量綱表示式歸一化演算法有： 1.線性轉換 y=(x-MinValue)/(MaxValue-MinValue ２.對數函式轉換： y=log10(x) ３.反餘切函式轉換 y=atan(x)*2/

機器學習1《特征抽取，歸一化與標準化》

成了平方根穩定性人生返回值放棄 array 目的 extract 機器學習的數據來源：　　1.大多以文件的形式儲存，csv 等。　　2. 為什麽不用數據庫呢，因為會有瓶頸，可能30m 以上就不行了。　　3. 數據格式不匹配，數據庫格式是json，

資料變換-歸一化與標準化

> **公號：碼農充電站pro** > **主頁：** 一般在機器學習的**模型訓練**之前，有一個比較重要的步驟是**資料變換**。因為，一般情況下，原始資料的各個特徵的值並不在一個統一的範圍內，這樣資料之間就沒有**可比性**。資料變換的目的是**將不同渠道，不同量級的資料轉化到統一的範圍之內，

《白話深度學習與Tensorflow》學習筆記（2）梯度下降、梯度消失、引數、歸一化

1、CUDA(compute unified device architecture)可用於平行計算: GTX1060 CUDA核心數：1280 視訊記憶體大小：6G 2、隨機梯度下降：計算偏導數需要的計算量很大，而採用隨機梯度下降（即採用取樣的概念）從中提取一部分樣

梯度下降、過擬合和歸一化

href tps 課程容易視頻 iteration col one shu 好的課程應該分享給更多人：人工智能視頻列表-尚學堂，點開任意一個之後會發現他們會提供系列課程整合到一起的百度網盤下載地址，包括視頻+代碼+資料，免費的優質資源。當然，現在共享非常多，各種mooc

mxnet-梯度,反饋與標準化（歸一化）

1.attach_grad(grad_req='write', stype=None) 附加一個梯度快取在NDArray上，這樣，回退（反饋）能計算相應的梯度引數: grad_req ({'write', 'add', 'null'})‘write’: 梯度將在每

【CV知識學習】神經網路梯度與歸一化問題總結+highway network、ResNet的思考

目錄一、梯度消失/梯度爆炸的問題二、選擇其他啟用函式三、層歸一化四、權值初始化五、調整網路的結構一、梯度消失/梯度爆炸的問題首先來說說梯度消失問題產生的原因吧，雖然是已經被各大牛說爛的東西。不如先看一個簡單的網路

梯度下降中的歸一化、標準化問題

簡述　　在我上一篇完結的Tianic測試中，我曾提到了一個在使用sklenlearn包中出現的一個問題，這成為了我們這裡預留的一個懸念，也就是為了防止不擬合時而使用了scaling，但是當時我在scaling的時候報錯了，這一下就十分尷尬了，因此我在網上查找

Hulu機器學習問題與解答系列 | 二十三：神經網絡訓練中的批量歸一化

導致 xsl 泛化能力恢復不同詳細過程 ice ini 來看看批量歸一化的有關問題吧！記得進入公號菜單“機器學習”，復習之前的系列文章噢。今天的內容是【神經網絡訓練中的批量歸一化】場景描述深度神經網絡的訓練中涉及諸多手調參數，如學習率，權重衰減系數，

第十八節，TensorFlow中使用批量歸一化

item con 用法它的線性 dev 樣本需要 sca 在深度學習章節裏，已經介紹了批量歸一化的概念，詳情請點擊這裏：第九節，改善深層神經網絡：超參數調試、正則化以優化(下) 由於在深層網絡中，不同層的分布都不一樣，會導致訓練時出現飽和的問題。而批量歸一化就是為了緩

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

overfit 返回 pen ear 隨機梯度是否很大的建模回歸一線性模型給定由n個屬性描述的列向量\(f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}\)，其中 \(x^{(j)}\)是\(\textbf{x}\)

標準化，歸一化和的概念與適用範圍整理

網上講得比較亂有些部落格把歸一化和標準化認為一致，主要是覺得normalization這個詞語翻譯成標準化和歸一化都沒啥問題 Min-Max scaling（歸一化），也可以使用normalization，但是谷歌上不推薦，公式是：網上通俗的說法是：用來消除量鋼的影響。這個說法

斯坦福CS229機器學習課程筆記一：線性迴歸與梯度下降演算法

機器學習三要素機器學習的三要素為：模型、策略、演算法。模型：就是所要學習的條件概率分佈或決策函式。線性迴歸模型策略：按照什麼樣的準則學習或選擇最優的模型。最小化均方誤差，即所謂的 least-squares(在spss裡線性迴歸對應的模組就叫OLS即Ordinary Least Squares)：

深度學習基礎--正則化與norm--區域性響應歸一化層(Local Response Normalization, LRN)

區域性響應歸一化層(Local Response Normalization, LRN) 區域性響應歸一化層完成一種“臨近抑制”操作，對區域性輸入區域進行歸一化。該層實際上證明已經沒啥用了，一般也不用了。參考資料：見郵件公式與計算該層需要的引數包括：

資料歸一化，標準化，正則話的聯絡與區別

資料處理的features engineering過程中，常常需要根據演算法的input資料格式對資料進行預處理，對數值性數的表處理可以提高演算法的精度，保證演算法的可信度。常用的資料處理辦法有資料歸一化，標準話和正則話。 1：資料歸一化（Normalization） 1.把資料變為

（一）線性迴歸與特徵歸一化(feature scaling)

吳恩達機器學習視訊 https://study.163.com/course/courseMain.htm?courseId=1004570029 線性迴歸是一種迴歸分析技術，迴歸分析本質上就是一個函式估計的問題（函式估計包括引數估計和非引數估計），就是找出因變數和自變數之

機器學習與統計建模 —— 歸一化和標準化

歸一化（Min-Max Normalization）特點 1、對不同特徵維度進行伸縮變換 2、改變原始資料的分佈。使各個特徵維度對目標函式的影響權重是一致的（即使得那些扁平分佈的資料伸縮變換成類圓形） 3、對目標函式的影響體現在數值上 4、把有量綱表示式變為無量

深度學習筆記——理論與推導之概念，成本函式與梯度下降演算法初識（一）

前情提要一、神經網路介紹概念：Learning ≈ Looking for a Function 框架（Framework）： What is Deep Learning? 深度學習其實就是一個定義方法、判斷方法優劣、挑選最佳的方法的過程：

TensorFlow啟用函式+歸一化-函式

啟用函式的作用如下-引用《TensorFlow實踐》：這些函式與其他層的輸出聯合使用可以生成特徵圖。他們用於對某些運算的結果進行平滑或者微分。其目標是為神經網路引入非線性。曲線能夠刻畫出輸入的複雜的變化。TensorFlow提供了多種啟用函式，在CNN中一般使用tf.

tensorflow的歸一化與梯度下降

相關推薦