時序預測歸一化

阿新 • • 發佈：2019-01-06

在做預測問題時，當資料的量綱存在較大差異時，歸一化非常重要。以下問題是我遇到的：

1.多個維度的資料，是對每一個樣本進行歸一化？還是對每一個維度（屬性）歸一化

2.訓練集和測試集放在一起歸一化？還是分開歸一化？

問題1：

對每一個屬性進行歸一化，從sklearn的文件中提到：MinMaxScaler，This estimator scales and translates each feature individually such that it is in the given range on the training set.

在上一篇部落格中也使用了空氣汙染預測做了實驗。

問題2：在蒐集到的資料中，大部分都是將訓練集和測試集放在一起歸一化，可是這樣測試集就對模型有了影響，只要換了測試集訓練出來的模型就不一樣。當使用訓練好的模型去預測其他的資料集時，不知道是否合適。而且如果這樣的話，每次一更換測試集就需要將其餘訓練集放在一起重新歸一化，再去訓練新的模型。目前為了更好的結果，我採用的是這種方法。

也有人提到用歸一化訓練集的最大最小值來歸一化預測值，這樣的話預測值就會被限定在一個範圍，這樣做的原因是：訓練集和測試集應該是獨立同分布的，有理由認為最大值和最小值就出現在訓練集中。但在用python實現時，發現這樣操作並不是很方便。

時序預測歸一化

時序預測歸一化

LSTM時序預測時歸一化問題

機器學習資料處理時label錯位對未來資料做預測機器學習經典模型簡單使用及歸一化（標準化）影響

Python基礎day-18[面向對象:繼承,組合,接口歸一化]

轉：數據標準化/歸一化normalization

（五）歸一化

numpy 矩陣歸一化

【深度學習】批歸一化（Batch Normalization）

Hulu機器學習問題與解答系列 | 二十三：神經網絡訓練中的批量歸一化

softmax_loss的歸一化問題

機器學習數據預處理——標準化/歸一化方法總結

python 圖像歸一化作業代碼代編程代寫圖python作業

第十八節，TensorFlow中使用批量歸一化

第9章優化方法和歸一化

梯度下降、過擬合和歸一化

數據歸一化/標準化

Java基於opencv—歸一化

BatchNormalization批量歸一化

DIFFERENTIABLE LEARNING-TO-NORMALIZE VIA SWITCHABLE NORMALIZATION(SN,切換歸一化)

標準化，歸一化和的概念與適用範圍整理

時序預測歸一化

相關推薦