記錄RandomForestRegressor&MLPRegressor處理時間序列資料

阿新 • • 發佈：2022-03-11

資料概況：八個變數一個目標值；時間序列資料；

資料處理：歸一化後的資料更適用神經網路模型；

方法：隨機森林迴歸、神經網路模型（效果不佳）。

import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt
from sklearn import metrics

from sklearn.metrics import mean_absolute_error
from sklearn.metrics import mean_absolute_percentage_error
from sklearn.metrics import max_error

#---------------------------------------------------------------------------------
# 準備資料
# 匯入資料
data = pd.read_csv("yiyao.csv", encoding="utf8", low_memory=False)
#data = pd.read_csv("yiyaobzh.csv", encoding="utf8", low_memory=False)

data.head()

data.info()

# 選取特徵及分類標籤
features = data.iloc[:,[2,3,4,5,6,7,8,9]].values
targets = data.iloc[:,1].values

#分測試集，訓練集
X_train, X_test, y_train, y_test = train_test_split(features, targets, test_size=0.3, shuffle=False) # 訓練集前部分，測試集後部分，不打亂順序

print('X_train shape:{}'.format(X_train.shape))
print('X_test shape:{}'.format(X_test.shape))

隨機森林模型

# 隨機森林模型
from sklearn.ensemble import RandomForestRegressor

regr = RandomForestRegressor(#n_estimators=50,
                             #max_features=32,
                             #random_state=1
                                )

regr = regr.fit(X_train,y_train)

# 輸出預測結果
y_pred = regr.predict(X_test)
y_pred

# 將預測結果輸出到檔案中
y_pred=pd.DataFrame(y_pred)
y_pred.to_csv('y_pred.csv',header=True,index=False)

# 輸出測試集模型得分
score_r = regr.score(X_test,y_test)
print("Random Forest:{}".format(score_r))

# mape
metrics.mean_absolute_percentage_error(y_test, y_pred)

# me
metrics.max_error(y_test, y_pred)

# mae
metrics.mean_absolute_error(y_test, y_pred)

# mse
metrics.mean_squared_error(y_test, y_pred)

#返回特徵的重要性
#regr.feature_importances_
feature_name=["x1","x2","x3","x4","x5","x6","x7","x8"]
imp=[*zip(feature_name,regr.feature_importances_)]
imp

x=[]
y=[]
for i in range(0,8):
    x.append(imp[i][0])
for i in range(0,8):
    y.append(imp[i][1])
    
%matplotlib inline
plt.figure(figsize=(15, 10))

plt.barh(x,y,color='green')
plt.xlabel("Degree of importance")
plt.ylabel("Features")
plt.show()

神經網路模型

# 歸一化處理
from sklearn.preprocessing import StandardScaler

stdScaler = StandardScaler()

X_train = stdScaler.fit_transform(X_train) # 訓練集資料

X_test = stdScaler.fit_transform(X_test)

from sklearn.neural_network import MLPRegressor
regr = MLPRegressor(
                    random_state=42
                    ,hidden_layer_sizes=(4, 2)
                    ,max_iter=50000
                    #,activation='relu'
                   )
regr = regr.fit(X_train,y_train)

# 輸出預測結果
y_pred = regr.predict(X_test)
#y_pred

# 輸出測試集模型得分
score_r = regr.score(X_test,y_test)
print(":{}".format(score_r))

# 輸出相關引數
regr.get_params()

記錄RandomForestRegressor&MLPRegressor處理時間序列資料

資料概況：八個變數一個目標值；時間序列資料；資料處理：歸一化後的資料更適用神經網路模型；

5.轉換與處理時間序列資料

以此為例函式表類名稱說明 Timestamp 基礎的資料類，表示時間點。 Period 單個時間跨度,例如1天/1月

時間序列分析 Tsfresh 準備和處理時間序列資料

原文地址：點這裡時間序列分析定義：時間序列分析是指從按時間排序的資料點中抽取有價值的總結和統計資訊行為

Python量化交易基礎講堂-用Pandas庫處理時間序列

《Python實戰-構建基於股票的量化交易系統》小冊子，雖然主要側重於 Python 實戰講解，但在內容設計上提供了前置基礎章節幫助讀者快速掌握基礎工具的使用，因此小冊適合的人群僅具備Python最基礎程式設計經驗即可。

Python如何根據時間序列資料作圖

本例子程式展示了長白山火山氣體地球化學2002年觀測資料中CO2和He兩種氣體元素深度的時間序列。程式中用到了常用的時間序列python資料處理方法，箭頭標識方法，適合學習基本python作圖學習使用。程式中所用到的no09.

python時間序列資料轉為timestamp格式的方法

在此記錄自己學習python資料分析過程中學到的一些資料處理的小技巧。 1.資料的讀取

Python處理時間序列缺失值

import pandas as pdimport datetimedef load_Data():# 載入資料df0 = pd.read_csv(r\'D:\\PythonCharm\\Python\\Infos.csv\')df0[\'time\'] = pd.to_datetime(df0[\'time\'])return df0# 把datetime轉成字串def dat

適合時間序列資料的計算指令碼

技術標籤：SPL 時間序列資料在這裡指按時間排序的日常業務資料。對時間序列資料進行計算時，不僅涉及季度、月份、工作日、週末等常規計算，還經常遇到較為複雜的有序運算，這就要求指令碼語言應具備相應的計算能

拓端tecdat|R語言分解商業週期時間序列資料：線性濾波器、HP濾波器、Baxter King濾波器、Beveridge Nelson分解等去趨勢方法

原文連結：http://tecdat.cn/?p=23000 原文出處：拓端資料部落公眾號分解南非GDP資料

拓端tecdat|R語言計量經濟學：工具變數法(兩階段最小二乘法2SLS)線性模型分析人均食品消費時間序列資料和迴歸診斷

原文連結：http://tecdat.cn/?p=23759 原文出處：拓端資料部落公眾號簡介兩階段最小二乘法（2SLS）迴歸擬合的線性模型是一種常用的工具變數估計方法。

使用格拉姆角場(GAF)以將時間序列資料轉換為影象

這篇文章將會詳細介紹格拉姆角場（Gramian Angular Field），並通過程式碼示例展示“如何將時間序列資料轉換為影象”。

pandas處理時間型別資料

pandas處理時間型別資料高階介面dt的使用時間訪問器.dt.<屬性> dt.date 和 dt.normalize()，他們都返回一個日期的日期部分，即只包含年月日。但不同的是date返回的Series是object型別的，normalize()返回

在Python中如何差分時間序列資料集

差分是一個廣泛用於時間序列的資料變換。在本教程中，你將發現如何使用Python將差分操作應用於時間序列資料。

利用DInSAR和時間序列資料分析2010-2011的紐西蘭地震

本研究是SIGRIS專案的一部分，由紐西蘭地質研究機構完成。SIGRIS專案（www.sigris.it）致力於生產資訊產品來支援地震風險管理，資料來源是用衛星影像結合可獲取的地面資料，衛星影像主要用的是 COSMO-SkyMed 資料。

時間序列資料分析 tsfresh 平穩性

參考文章：點這裡平穩性：通常來說，一個平穩的時間序列指的是這個時間序列在一段時間內=具有穩定的統計值，如均值、方差。由於我們對於一個數據是否平穩是有自己的直覺的，所以在實踐的過程中要謹防過於依賴直

高頻資料處理技巧：資料庫非等間隔的時間序列處理

技術標籤：時序資料庫使用教程高頻交易DolphinDB資料庫資料處理量化金融高頻時間序列的處理中，經常會用到滑動，偏移，聚合，轉置，關聯等操作。譬如說我想對一個某指標列用過去一個小時的資料的均值來做平滑處

MySQL-線上處理大表資料 & 線上修改大表的表結構

文章目錄官方文件概述示例大表資料的分批處理修改大表的表結構方案一 : 從表修改，主從切換方案二：pt-online-schema-change

時間序列知識圖譜-《利用Python進行資料分析》

所有內容整理自《利用Python進行資料分析》，使用MindMaster Pro 7.3製作，emmx格式，原始檔已經上傳Github，需要的同學轉左上角自行下載或者右擊儲存圖片。

import numpy as npimport pandas as pdimport datetimeimport reimport timeimport globimport copydef buchong_shuju(path_in):time_parse = lambda date: datetime.datetime.strptime(date, \'%Y-%m-%d %H:%M:%S\

python時間日期資料處理

#匯入相關庫 import pandas as pd import numpy as np import time import datetime import matplotlib.pyplot as plt

記錄RandomForestRegressor&MLPRegressor處理時間序列資料

隨機森林模型

神經網路模型

相關推薦