1. 程式人生 > 程式設計 >python資料處理之如何選取csv檔案中某幾行的資料

python資料處理之如何選取csv檔案中某幾行的資料

前言

有些人看到這個問題覺得不是問題,是嘛,不就是df.col[]函式嘛,其實忽略了一個重點,那就是我們要省去把csv檔案全部讀取這個過程,因為如果在面臨億萬級別的大規模資料,得到的結果就是boom,boom,boom。

我們要使用一下現成的函式裡面的引數nrows,和skiprows,一個代表你要讀幾行,一個代表你從哪開始讀,這就可以了,比如從第3行讀取4個

示例程式碼

import pandas as pd
df = pd.DataFrame({'a':[1,2,3,4,5,6,7,8,9],'b':[22,33,44,55,66,77,88,99,10]})
df.to_csv('test.csv')
dt = pd.read_csv('test.csv',skiprows=5,nrows=3)
 
print(dt)
 
 
out:
 4 5 66
0 5 6 77
1 6 7 88
2 7 8 99
3 8 9 10

就可以了,不過這個列頭不知道是怎麼回事,順便如果想根據列值找index,可以參考下面的

然後

df = pd.DataFrame({'BoolCol': [1,4],'attr': [22,22,66]},index=[10,20,30,40,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)
 
 
df = pd.DataFrame({'BoolCol': [1,50])
print(df)
a = df[(df.BoolCol==3)&(df.attr==22)].index.tolist()
print(a)

問題得到了解決

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對我們的支援。