1. 程式人生 > >Pandas讀取檔案(read_csv與read_table 的區別)

Pandas讀取檔案(read_csv與read_table 的區別)

pandas

載入檔案方式:
在這裡插入圖片描述

注意,read_csv和read_table都是是載入帶分隔符的資料,每一個分隔符作為一個數據的標誌,但二者讀出來的資料格式還是不一樣的,read_table是以製表符 \t 作為資料的標誌,也就是以行為單位進行儲存。

read_csv 與 read_table 的區別
在這裡插入圖片描述
比如讀取以上excel中的資料:

  • read_table讀取
import pandas as pd
import numpy as np
c=pd.read_table('career_data.csv',nrows=5)  # 只讀了前5行
print c
print ('去掉列名和索引')
print c.values
print '\t'
print ('行列數')
c.values.shape

在這裡插入圖片描述
可以看出,讀完後每個字串之間有逗號相隔,這其實表明每一行作為一個維度進行了儲存,所以最後它是一個5行1列的陣列,每一行字串為一列而不是每一個字串。

  • read_csv 讀取
import pandas as pd
import numpy as np
c=pd.read_csv('career_data.csv',nrows=5)
print c
print ('去掉列名和索引')
print c.values
print '\t'
print ('行列數')
c.values.shape

在這裡插入圖片描述
而 read_csv讀完後是一個5行4列的陣列,每一個字串作為一列,這是二者的區別。還有固定寬度讀取的read_ffw 和table 的效果一樣。