pthon時間序列分析

阿新 • • 發佈：2018-11-04

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from statsmodels.graphics.tsaplots import plot_acf,plot_pacf
from statsmodels.tsa.arima_model import ARIMA #ARIMA模型
import patsy
from tsfresh.examples.robot_execution_failures import download_robot_execution_failures,load_robot_execution_failures
from tsfresh import extract_features,extract_relevant_features,select_features
from tsfresh.utilities.dataframe_functions import impute
from tsfresh.feature_extraction import ComprehensiveFCParameters
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report


"""
#TIMES 2018 Oct 12 10/12/2018 2018-10-12 2018/10/12
rng = pd.date_range("2018-10-12",periods=10,freq="D") #D 天(3D 三天)；M 月；H 小時
#print(rng)

#將時間作為索引
time_index = pd.Series(np.random.randn(20),index=pd.date_range("2018-10-12",periods=20,freq="D")) #預設為D增加
#print(time_index)
#print(time_index["2018-10-12"])

#過濾
time_index_tr = time_index.truncate(before="2018-10-20") #before2018-10-20之前的資料都不要；after是之後的資料都不要
#print(time_index_tr)

#時間戳
time_stamp = pd.Timestamp("2018-10-12 19")
#print(time_stamp) #2018-10-12 19:00:00

time_delta = pd.Timestamp("2018-10-12 19") + pd.Timedelta("1 day")
#print(time_delta) #2018-10-13 19:00:00

#時間週期
time_period = pd.period_range("2018-10-12","2018-12-12",freq="M")
#print(time_period) #這是包括2018-10-12
"""

"""
#資料重取樣
rng = pd.date_range("1/1/2011",periods=30,freq="3D")
ts = pd.Series(np.random.randn(len(rng)),index=rng)
print(ts)
#降取樣
ts_dec_re = ts.resample("M").sum()
print(ts_dec_re)

#升取樣（ffill空值取前面的值，bfill空值取後面的值，interpolate線性取值）
ts_asc_re = ts.resample("D").interpolate("linear")
print(ts_asc_re)
"""

"""
#滑動視窗
df = pd.Series(np.random.randn(600),index=pd.date_range("2018-1-1",freq="D",periods=600)) #資料的生成
print(df.head()) #預設列印5行
r = df.rolling(window=10)
print(r.mean()) #mean median(中位數) std(標準差) skew(傾斜度) sum var
"""

"""
#平穩性（差分）
fr = pd.read_csv("filename")
fr["diff_1"] = fr["column_name"].diff(1) #column_name這列資料的一階差分
fr["diff_2"] = fr["diff_1"].diff(1) #diff_1這列資料的一階差分
"""

"""
#ARIMA(差分自迴歸移動平均模型)
#AR自迴歸，p為自迴歸項，MA為移動平均，q為移動平均項數，d為時間序列成為平穩時所做的差分次數
#原理：將非平穩的時間序列轉化為平穩時間序列，然後僅對因變數的滯後值以及隨機誤差項的現值和滯後值進行迴歸建立模型
#步驟：平穩化（可以確定d）；p q的確定；呼叫ARIMA模型

#股票預測案列(做迴歸)
stockFile = "T10yr.csv"
stock = pd.read_csv(stockFile,index_col=0,parse_dates=[0]) #0列做索引
#print(stock.head())

#按Close列進行分析
stock_week = stock["Close"].resample("W-MON").mean() #Close列按照每一週的均值進行重取樣
stock_train = stock_week["2000":"2015"] #訓練資料

#plt.plot(stock_train)
#plt.show() #資料的波動比較大，需要差分來平穩化

stock_diff = stock_train.diff(1)
stock_diff = stock_diff.dropna() #去除空值

#plt.plot(stock_diff)
#plt.show() #一階差分基本上可以平穩化

#畫ACF（確定q）
#acf = plot_acf(stock_diff,lags=20)
#acf.show() #q=1
#pacf = plot_pacf(stock_diff,lags=20)
#pacf.show() #p=1

model = ARIMA(stock_train,order=(1,1,1),freq="W-MON")  #order=(1,1,1) p d q
result = model.fit()
#print(result.summary())
pred = result.predict("2015-05-04","2016-04-18",dynamic=True,typ="levels") #"2015-05-04"（開始值）必須是資料集中已有的值，否則報錯
#print(pred)

plt.plot(pred)
plt.plot(stock_train)
#plt.show()
"""

"""
#時間序列的分類任務（tsfresh庫做特徵的提取和過濾）
download_robot_execution_failures()
df,y = load_robot_execution_failures() #匯入tsfresh官網上例子資料
print(df.head())

#特徵提取
extraction_settings = ComprehensiveFCParameters() #例項化
X = extract_features(df,column_id="id",column_sort="time",
                     default_fc_parameters=extraction_settings,impute_function=impute)
print(X.head()) #列印提取完的特徵

#特徵過濾
X_filtered = extract_relevant_features(df,y,column_id="id",column_sort="time",default_fc_parameters=extraction_settings)

#切分資料集
x_train,x_test,x_filtered_train,x_filtered_test,y_train,y_test = train_test_split(X,X_filtered,y,test_size=0.4)

#訓練 預測
dtc = DecisionTreeClassifier()
dtc.fit(x_train,y_train)
print(classification_report(y_test,dtc.predict(x_test)))
"""

train = pd.read_csv("train_1.csv").fillna(0) #開啟檔案並用0填充空值
#print(train.head()) #資料是浮點數但是都是.0形式，小數部分無貢獻，轉化成int型別

#pandas轉化資料型別
for col in train.columns[1:]:
    train[col] = pd.to_numeric(train[col],downcast="integer")
#print(train.head())

pthon時間序列分析

import pandas as pd import numpy as np import matplotlib.pyplot as plt from statsmodels.graphics.tsaplots import plot_acf,plot_pacf from statsmode

2017.06.9 金融時間序列分析之Eview使用基礎

file 打開操作 span bject 生成 com 工作表時間序列分析一.創建時間序列工作文件：首先將數據轉換為Eviews系統能夠分析的Eviews Workfile數據集 1.創建工作文件：工作文件結構類型：非結構/非日期型；日期-規則頻率型；平衡面板型；

R語言--時間序列分析步驟

align 如何 -- list arima test bsp nat 建立大白。（1）根據趨勢定差分 plot(lostjob,type="b") 查看圖像總體趨勢，確定如何差分 df1 = diff(lostjob) d=1階差分 s4_df1=diff(df1,

計量經濟與時間序列_時間序列分析的幾個基本概念(自相關函數,偏自相關函數等)

sig 永不均值 blog 那種屬於 class 觀察自相關 1. 在時間序列分析中，數學模型是什麽？數學公式又是什麽？數學推導過程又是什麽？... ... 　　一句話：用數學公式後者符號來表示現實存在的意義。數學是“萬金油”的科學，它是作為工作和分析方法運用到某

時間序列分析

數理統計 bsp 移動分段 gpo 降雨量基礎知識 -s data- 時間序列分析( time series analysis)方法,強調的是通過對一個區域進行一定時間段內的連續遙感觀測，提取圖像有關特征，並分析其變化過程與發展規模。當然，首先需要根據檢測對象的時相變化

Python時間序列分析

單獨自己 line pandas mage lse atp 刻度 sta Pandas生成時間序列： import pandas as pd import numpy as np　　時間序列時間戳（timestamp）固定周期（period）時間間隔（int

論文筆記：時間序列分析

論文筆記：Causal Inference on EventSequences 論文綜述解決的問題：兩個不同的序列xn與yn，是否能斷定他們相互關聯，或者說存在因果關係。依託的主要知識：概率論名詞解釋：格蘭傑因果關係 Granger c

資料探勘——時間序列分析

時間序列分析一、概念時間序列（Time Series）時間序列是指同一統計指標的數值按其發生的時間先後順序排列而成的數列（是均勻時間間隔上的觀測值序列）。時間序列分析的主要目的是根據已有的歷史資料對未來進行預測。時間序列分析主要包括的內容有：趨勢分析、序列分解、序列預測。

SVR，時間序列分析的評價指標，python資料標準化

知識點 SVR 參考支援向量機(SVM)是一種分類演算法，但是也可以做迴歸，根據輸入的資料不同可做不同的模型（若輸入標籤為連續值則做迴歸，若輸入標籤為分類值則用SVC做分類）對於SVM演算法，我們首先匯入sklearn.svm中的

時間序列分析和預測

導論研究時間序列主要目的：進行預測，根據已有的時間序列資料預測未來的變化。時間序列預測關鍵：確定已有的時間序列的變化模式，並假定這種模式會延續到未來。時間序列預測法的基本特點假設事物發展趨勢會延伸到未來預測所依據的資料具有不規則性不

時間序列分析相關概念

1. 在時間序列分析中，數學模型是什麼？數學公式又是什麼？數學推導過程又是什麼？… … 一句話：用數學公式後者符號來表示現實存在的意義。數學是“萬金油”的科學，它是作為工作和分析方法運用到某個學科當中。比如在物理學中，數學公式或者數學符號也是表示現實存在的意

【原始碼】時間序列分析與預測工具箱（Time Series Analysis and Forecast，TSAF）

時間序列是一組隨時間變化而收集的定量型變數觀測值。比如：道瓊斯工業股價指數、線上銷售、庫存、客戶數量、利率、費用等歷史資料都屬於時間序列。預測時間序列變數對於企業準確掌控運營狀態非常有用。通常，獨立變數不能用來建立時間序列變數的迴歸模型。時間序列分析的特點：

基於R語言的簡單時間序列分析預測

資料來源： R語言自帶 co2 資料集分析工具：R-3.5.0 & Rstudio-1.1.453 本篇分析只是一個簡單的教程，不作深究 #清理環境，載入包 rm(list=ls()) library(forecast) library(tseries) #檢視資料 co2 Vi

python時間序列分析（ARIMA模型）

原文地址：https://blog.csdn.net/u011596455/article/details/78650458 轉載請註明出處。什麼是時間序列時間序列簡單的說就是各時間點上形成的數值序列，時間序列分析就是通過觀察歷史資料預測未來的值。在這裡需要

Matlab時間序列分析

在引入時間序列前，先介紹幾個matlab函式 matlab中的gallery函式簡析 Matlab 中的 gallery 函式是一個測試矩陣生成函式。當我們需要對某些演算法進行測試的時候，可以利用gallery函式來生成各種性質的測試矩陣。其用法如下： [A,B,C,…] =ga

【統計學】【2013.04】迦納伏爾塔地區霍霍埃市用水量的時間序列分析

本文為迦納恩克魯瑪科技大學（作者：COSMOS AGBE KWAME TODOKO）的碩士論文，共78頁。水被認為是所有生物特別是人類的生命線，因此水資源的可用性是通過人類發展指數（HDI）衡量人類福祉的關鍵組成部分。水資源在迦納的生產和分銷，特別是在伏爾塔

時間序列分析異常分析 stl

https://blog.csdn.net/snowdroptulip/article/details/79125912 https://www.cnblogs.com/runner-ljt/p/5245080.html http://www.nniiem.ru/file/news/2016/stl-st

python資料分析：時間序列分析（Time series analysis）

何為時間序列分析：時間序列經常通過折線圖繪製。時間序列用於統計，訊號處理，模式識別，計量經濟學，數學金融，天氣預報，地震預測，腦電圖，控制工程，天文學，通訊工程，以及主要涉及時間測量的任何應用科學和工程領域。時間序列分析包括用於分析時間序列資料的方法，以便提取有意義的統計資料

R語言學習筆記：時間序列分析

1.生成時間序列 ts() ts(data = NA, start = 1, end = numeric(), frequency = 1, deltat = 1, ts.eps = getOption("ts.eps"), class =, names = )data是數

如何深入理解時間序列分析中的平穩性？

來自：http://www.zhihu.com/question/21982358 在引入ARMA模型之前，一般課本都會對時間序列的平穩性作一個描述，但是總感覺沒有描述特別清晰：1. 通常時間序列模型要求的是協方差平穩，或者弱平穩，而對強平穩介紹很少，能否從數學角度分析比

pthon時間序列分析

相關推薦