pandas中read_csv、rolling、expanding用法詳解

阿新 • • 發佈：2020-04-22

如下所示：

import pandas as pd
from pandas import DataFrame

series = pd.read_csv('daily-min-temperatures.csv',header=0,index_col=0,parse_dates=True,squeeze=True)
temps = DataFrame(series.values)
width = 3
shifted = temps.shift(width-1)
print(shifted)
window = shifted.rolling(window=width)
dataframe = DataFrame()
dataframe = pd.concat([window.min(),window.mean(),window.max(),temps],axis=1)
dataframe.columns=['min','mean','max','t+1']
print(dataframe.head(5))

read_csv中引數用法：

當設定 header=None 時，則認為csv檔案沒有列索引，為其新增相應範圍的索引，range(1,1200)指建立索引號從1開始最大到1199的列索引，當資料長度超過範圍時，索引沿列資料的右側對齊。

obj=pd.read_csv('testdata.csv',names=range(1,4))

當設定 header=0 時，則認為csv檔案資料第一行是列索引，將用新的列索引替換舊的列索引。

obj=pd.read_csv('testdata.csv',usecols=[1,2,3])

當設定 index_col=0 時，則是csv檔案資料的指定資料中的第一列是行索引，usecols指選中資料的對應列數，[1,3]指第2列到第4列。

obj=pd.read_csv('testdata.csv',usecols=5)

用usecols選擇前n行資料進行後續處理，n為正整型。

rolling用法：

原始碼

 def rolling(self,*args,**kwargs):
  """
  Return a rolling grouper,providing rolling functionality per group.
  """
  from pandas.core.window import RollingGroupby

  return RollingGroupby(self,**kwargs)

 @Substitution(name="groupby")
 @Appender(_common_see_also)

pandas中read_csv、rolling、expanding用法詳解

用法程式碼演示

上面我們介紹了滑動視窗的概念及實現函式的引數，下面我們通過程式碼演示，依次展示各引數的作用。

import matplotlib.pylab as plt
import numpy as np
import pandas as pd
index=pd.date_range('20190116','20190130')
data=[4,8,6,5,9,1,4,7,13,6]
ser_data=pd.Series(data,index=index)
print(ser_data)

pandas中read_csv、rolling、expanding用法詳解

加入rolling使用時間窗後及具體原理

ser_data.rolling(3).mean()

pandas中read_csv、rolling、expanding用法詳解

min_periods用法

如上圖所示，當視窗開始滑動時，第一個時間點和第二個時間點的時間為空，這是因為這裡視窗長度為3，他們前面的數都不夠3，所以到2019-01-18時，他的資料就是2019-01-16到2019-01-18三天的均值。那麼有人就會這樣想，在計算2019-01-16序列的視窗資料時，雖然不夠視窗長度3，但是至少有當天的資料，那麼能否就用當天的資料代表視窗資料呢？答案是肯定的，這裡我們可以通過min_periods引數控制，表示視窗最少包含的觀測值，小於這個值的視窗長度顯示為空，等於和大於時有值，如下所示：

表示視窗最少包含的觀測值為1

ser_data.rolling(3,min_periods=1).mean()

pandas中read_csv、rolling、expanding用法詳解

expanding用法

徵用前面全部的資料

pandas中read_csv、rolling、expanding用法詳解

程式碼詳解

import pandas as pd
from pandas import DataFrame

series = pd.read_csv('daily-min-temperatures.csv',squeeze=True)
temps = DataFrame(series.values)
window = temps.expanding()
dataframe = DataFrame()
dataframe = pd.concat([window.min(),temps.shift(-1)],'t+1']
print(dataframe.head(5))

輸出結果

pandas中read_csv、rolling、expanding用法詳解

expanding可去除NaN值

以上這篇pandas中read_csv、rolling、expanding用法詳解就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

pandas中read_csv、rolling、expanding用法詳解

如下所示： import pandas as pd from pandas import DataFrame series = pd.read_csv(\'daily-min-temperatures.csv\',header=0,index_col=0,parse_dates=True,squeeze=True)

Python GUI程式設計學習筆記之tkinter中messagebox、filedialog控制元件用法詳解

本文例項講述了Python GUI程式設計學習筆記之tkinter中messagebox、filedialog控制元件用法。分享給大家供大家參考，具體如下：

MySQL儲存過程概念、原理與常見用法詳解

本文例項講述了MySQL儲存過程概念、原理與常見用法。分享給大家供大家參考，具體如下：

c++容器list、vector、map、set區別與用法詳解

c++容器list、vector、map、set區別 list 封裝連結串列，以連結串列形式實現，不支援[]運算子。

pycharm 中mark directory as exclude的用法詳解

比如說如果設定為例外，那麼裡面的.py檔案就不會被IDE索引，所以語法提示也不會包括裡面的內容

pandas DataFrame.groupby()所見的各種用法詳解

這篇文章主要介紹了DataFrame.groupby()所見的各種用法詳解，文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

C# 中的Async 和 Await 的用法詳解

眾所周知C#提供Async和Await關鍵字來實現非同步程式設計。在本文中，我們將共同探討並介紹什麼是Async 和 Await，以及如何在C#中使用Async 和 Await。

java中關於return返回值的用法詳解

我們輸入一個條件時，系統就會對這個條件進行判斷，然後給出一個返回時的結論，我們把這個結果看做是返回值。在java裡可以使用return語句來進行返回，從字面意思就能很好的理解它的用法了。下面我們就return的有無返

Postgresql中LIKE和ILIKE操作符的用法詳解

LIKE和ILIKE操作符可以模糊匹配字串，LIKE是一般用法，ILIKE匹配時則不區分字串的大小寫。

vuex 中輔助函式mapGetters的基本用法詳解

mapGetters輔助函式 mapGetters輔助函式僅僅是將 store 中的 getter 對映到區域性計算屬性：

Pandas教程 | 超好用的Groupby用法詳解

在日常的資料分析中，經常需要將資料根據某個（多個）欄位劃分為不同的群體（group）進行分析，如電商領域將全國的總銷售額根據省份進行劃分，分析各省銷售額的變化情況，社交領域將使用者根據畫像（性別、年齡）進

js中hasOwnProperty的屬性及例項用法詳解

1、不會保護hasOwnProperty被非法佔用，如果一個物件碰巧存在這個屬性，就需要使用外部的hasOwnProperty 函式來獲取正確的結果。

對python中assert、isinstance的用法詳解

1. assert 函式說明： Assert statements are a convenient way to insert debugging assertions into a program:

C++中getline()、gets()等函式的用法詳解

在學習C++的過程中，經常會遇到輸入輸出的問題，以下總結一下下面幾個函式的用法：

PHP中abstract(抽象)、final(最終)和static(靜態)原理與用法詳解

本文例項講述了PHP中abstract(抽象)、final(最終)和static(靜態)原理與用法。分享給大家供大家參考，具體如下：

Numpy中ndim、shape、dtype、astype的用法詳解

本文介紹numpy陣列中這四個方法的區別ndim、shape、dtype、astype。 1.ndim ndim返回的是陣列的維度，返回的只有一個數，該數即表示陣列的維度。

MySQL觸發器概念、原理與用法詳解

本文例項講述了MySQL觸發器概念、原理與用法。分享給大家供大家參考，具體如下：

pandas中read_csv的缺失值處理方式

今天遇到的問題是，要將一份csv資料讀入dataframe，但某些列中含有NA值。對於這些列來說，NA應該作為一個有意義的level，而不是缺失值，但read_csv函式會自動將類似的缺失值理解為缺失值並變為NaN。

Python 裝飾器原理、定義與用法詳解

本文例項講述了Python 裝飾器原理、定義與用法。分享給大家供大家參考，具體如下：

Python imread、newaxis用法詳解

這篇文章主要介紹了python imread、newaxis用法詳解,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下