Pandas時間序列處理

阿新 • • 發佈：2019-01-04

1、建立

from datetime import datetime
import pandas as pd
import numpy as np

# 指定index為datetime的list
date_list = [datetime(2018, 3, 3), datetime(2018, 3, 4), 
             datetime(2018, 3, 10), datetime(2018, 3, 11), 
             datetime(2018, 3, 17), datetime(2018, 3, 18)]
time_s = pd.Series(np.random.randn(6 
), index=date_list)
print(time_s)
print(type(time_s.index))
# pd.date_range()
dates = pd.date_range('2018-03-03', # 起始日期
                      periods=5,    # 週期
                      freq='W-SAT') # 頻率
print(dates)
print(pd.Series(np.random.randn(5), index=dates))

2、索引

# 索引位置
print(time_s[0])
# 索引值 

print(time_s[datetime(2018, 3, 3)])
# 可以被解析的日期字串
print(time_s['20180303'])
# 按“年份”、“月份”索引
print(time_s['2018-3'])
# 切片操作
print(time_s['2018-3-6':])

3、過濾

print(time_s)
tims_s2 = time_s.truncate(before='2018-3-15')
print(tims_s2)
print(time_s.truncate(after='2018-3-15'))

4、生成日期範圍

# 傳入開始、結束日期，預設生成的該時間段的時間點是按天計算的 

date_index = pd.date_range('2018/03/03', '2018/03/31')
print(date_index)
# 只傳入開始或結束日期，還需要傳入時間段
print(pd.date_range(start='2018/03/03', periods=10, freq='4D'))
print(pd.date_range(end='2018/03/31', periods=10))
# 規範化時間戳 
print(pd.date_range(start='2018/08/03 12:13:14', periods=10))
print(pd.date_range(start='2018/08/03 12:13:14', periods=10, normalize=True))

5、頻率與偏移量

print(pd.date_range('2018/03/03', '2018/03/31', freq='2D'))
# 偏移量通過加法連線
sum_offset = pd.tseries.offsets.Week(2) + pd.tseries.offsets.Hour(12)
print(sum_offset)
print(pd.date_range('2018/03/03', '2018/03/31', freq=sum_offset))

6、移動資料

ts = pd.Series(np.random.randn(5), index=pd.date_range('20180303', periods=5, freq='W-SAT'))
print(ts)
print(ts.shift(1))
#print(ts.shift(-1))

7、時間資料重取樣

# 1、resample
import pandas as pd
import numpy as np

date_rng = pd.date_range('20180303', periods=100, freq='D')
ser_obj = pd.Series(range(len(date_rng)), index=date_rng)
print(ser_obj.head(10))
# 統計每個月的資料總和
resample_month_sum = ser_obj.resample('M').sum()
# 統計每個月的資料平均
resample_month_mean = ser_obj.resample('M').mean()

print('按月求和：', resample_month_sum)
print('按月求均值：', resample_month_mean)

# 2、降取樣
# 將資料聚合到5天的頻率
five_day_sum_sample = ser_obj.resample('5D').sum()
five_day_mean_sample = ser_obj.resample('5D').mean()
five_day_ohlc_sample = ser_obj.resample('5D').ohlc()
print('降取樣，sum')
print(five_day_sum_sample)
print('降取樣，mean')
print(five_day_mean_sample)
print('降取樣，ohlc')
print(five_day_ohlc_sample)
# 使用groupby降取樣
print(ser_obj.groupby(lambda x: x.month).sum())
print(ser_obj.groupby(lambda x: x.weekday).sum())

# 3、升取樣
df = pd.DataFrame(np.random.randn(5, 3),
                 index=pd.date_range('20180101', periods=5, freq='W-MON'),
                 columns=['S1', 'S2', 'S3'])
print(df)
# 直接重取樣會產生空值
print(df.resample('D').bfill())
#ffill
print(df.resample('D').ffill(2))
print(df.resample('D').bfill())
print(df.resample('D').fillna('ffill'))
print(df.resample('D').interpolate('linear'))

8、時間序列資料統計—滑動視窗

# 1、視窗函式
import pandas as pd
import numpy as np
ser_obj = pd.Series(np.random.randn(1000), 
                    index=pd.date_range('20180101', periods=1000))
ser_obj = ser_obj.cumsum()
print(ser_obj.head())
print(ser_obj.head())
r_obj = ser_obj.rolling(window=5)
print(r_obj)
print(r_obj.mean())
# 驗證：
# 前5個數據的均值
# print(ser_obj[0:5].mean())
# 1-6個數據的均值
# print(ser_obj[1:6].mean())
# 畫圖檢視
import matplotlib.pyplot as plt
plt.figure(figsize=(15, 5))
ser_obj.plot(style='r--')
ser_obj.rolling(window=10, center=True).mean().plot(style='b')
print(ser_obj.rolling(window=5, center=True).mean())

Pandas時間序列處理

1、建立 from datetime import datetime import pandas as pd import numpy as np # 指定index為datetime的list date_list = [datetime(2018, 3

python+pandas+時間、日期以及時間序列處理

先簡單的瞭解下日期和時間資料型別及工具 python標準庫包含於日期（date）和時間（time）資料的資料型別，datetime、time以及calendar模組會被經常用到。 datetime以毫秒形式儲存日期和時間，datetime.timedelta

pandas時間序列頻率處理

《Python for Data Analysis》生成日期範圍 pd.data_range() In [15]: rng = pd.date_range('2000-01-01', '2000-06-30', freq='BM') I

Python時間序列處理之datetime與pandas模組

每次遇到時間型別的資料做處理的時候，我會非常頭疼，我忍無可忍之下決定硬著頭皮學習一下，發現也不是很複雜，掌握一些基礎方法就可以做，下面我將一一介紹這些有效的方法。 datetime模組 #匯入datetime包 import datetime #獲取當

時間序列處理方法

code 相關 ima 數據讀取 pacf air 讀取 imp 數列時間序列處理方法 1、ARIMA模型ARIMA模型，是統計學中的常見對時間序列處理的模型，全稱為自回歸移動平均模型。ARIMA模型主要有p,d,q三個參數。 p--代表預測模型中采用的時序數據本身的滯

pandas時間序列滑窗

print 4.0 als 圖片技術分享驗證 mage num range 時間序列數據統計—滑動窗口窗口函數 import pandas as pd import numpy as np ser_obj = pd.Series(np.random.randn(10

R語言時間序列處理介紹--以A股財報資料處理為案例

本文以處理A股財務報表為例，介紹了將資料轉換成時間序列後在進行處理的一些方法和思路。將會用到xts，lapply，do.call等資料結構和函式。 1、簡介我們從各個途徑獲得了個股的財務報表原始資料後，還需要對資料做一些處理，以便後續指標計算和使用。舉個簡單的例子，

pandas 時間序列

時間序列資料的意義取決於具體的應用場景，主要有以下幾種：時間戳(timestamp):特定的時刻。固定時期(period):如2017年1月或2018年全年時間間隔(interval):由起始和結束時間戳表示。時期(period)可以被看做間隔(interval)的特例。

python ---Pandas時間序列：生成指定範圍的日期

引入包 import pandas as pd import numpy as np 1.生成指定範圍的日期 print pd.date_range('11/1/2018','11/9/2018') 輸出： &n

pandas時間序列操作方法

在pandas中擁有強大的時間序列操作方法。直接上demo： import numpy as np import pandas as pd from pandas import Series, DataFrame from datetime import datetime np

Pandas時間序列：頻率和日期偏移量

import pandas as pd import numpy as np 一、介紹 pandas中的頻率是由一個基礎頻率(例如“日”、“月”)和一個乘陣列成。基礎頻率通常以一個字串別名表

pandas 時間序列、繪圖、儲存檔案 date_range（）

pandas.date_range(start=None, end=None, periods=None, freq=’D’, tz=None, normalize=False, name=None, closed=None, **kwargs)引數start：string或

Pandas 時間序列資料繪製X軸主要刻度和次要刻度

先上效果圖吧（圖中Tue表示週二）： Pandas和matplotlib.dates都是使用matplotlib.units來定位刻度。 matplotlib.dates可以方便的手動設定刻

pandas資料處理實踐四（時間序列date_range、資料分箱cut、分組技術GroupBy）

時間序列：關鍵函式 pandas.date_range（start = None，end = None，periods = None，freq = None，tz = None，normalize = False，name = None，closed = None，**

SpringBoot的json序列化及時間序列化處理

urn G1 public nwr port 方法 als 前後臺 nconf 使用場景：前臺的多種時間格式存入後臺，後臺返回同時的時間格式到前臺。 1 在config目錄下配置jscksonConfig.java package com.test.domi.config

幾個資料缺失處理，時間序列的python包——fancyimpute/impyute/knnimpute/tslearn/

由於專案的需要，對時間序列資料中存在的資料缺失和異常進行處理，所以找到幾個類似的python模組，裡面有knn等方式填補缺失值的演算法。目前正在嘗試使用中，後續有案例發上來。先附上每個包的簡介和GitHub： https://pypi.org/project/fancyimpute/

[譯]在 Keras 中使用一維卷積神經網路處理時間序列資料

原文地址：Introduction to 1D Convolutional Neural Networks in Keras for Time Sequences 原文作者：Nils Ackermann 譯文出自：掘金翻譯計劃本文永久連結：github.com/xitu/go

pandas的時間序列:日期操作、時間序列平滑

基礎操作 1）將“字元型別的日期列”轉化成“時間索引（DatetimeIndex）” u 首先，利用 pandas 的to_datetime 方法，把 "date" 列的字元型別資料解析成 datetime 物件。然後，把 "date" 列用作索引。 df['

python和pandas之時間序列模組

1.python中的時間序列模組，這裡就不詳細的說明，可以戳這個網址 python的datetime模組 2.pandas中時間序列模組 1)pandas通常用於處理成組日期，不管這些日期是DataFrame的軸索引還是列，to_datetime方法可以解析多種

pandas中的時間序列基礎

重要的資料形式時間序列 datetime以毫秒形式儲存日期和時間 now = datetime.now() now datetime.datetime(2018, 12, 18, 14, 18, 27, 693445) #now是一個時間物件 now.year,now.month,now.day (2

Pandas時間序列處理

相關推薦