padas讀取檔案的read_csv（）函式使用方法

阿新 • • 發佈：2021-06-16

  1 import pandas as pd
  2 pd.read_csv(filepath_or_buffer,header,parse_dates,index_col)
  3 引數：
  4 filepath_or_buffer：
  5 字串，或者任何物件的read()方法。這個字串可以是URL，有效的URL方案包括http、ftp、s3和檔案。可以直接寫入"檔名.csv"
  6 
  7 header：
  8 將行號用作列名，且是資料的開頭。
  9 注意當skip_blank_lines=True時，這個引數忽略註釋行和空行。所以header=0表示第一行是資料而不是檔案的第一行。
 
 10 
 11 【注】：如果csv檔案中含有中文，該如何？
 12 1、可修改csv檔案的編碼格式為unix(不能是windows)（用notepad++開啟修改）
 13 2、df = pd.read_csv(csv_file, encoding="utf-8")，設定讀取時的編碼或 encoding="gbk"
 14 3、在使用列名來訪問DataFrame裡面的資料時，對於中文列名，應該在列名前面加'u'，表示後面跟的字串以unicode格式儲存，如下所示
 15 print(df[u"經度(度)"])
 16 
 17 (1)、header=None
 18 即指定原始檔案資料沒有列索引，這樣read_csv為其自動加上列索引{從0開始}
 
 19 ceshi.csv原檔案內容：
 20 c1,c2,c3,c4
 21 a,0,5,10
 22 b,1,6,11
 23 c,2,7,12
 24 d,3,8,13
 25 e,4,9,14
 26 
 27 df=pd.read_csv("ceshi.csv",header=None)
 28 print(df)
 29 結果：
 30     0   1   2   3
 31 0  c1  c2  c3  c4
 32 1   a   0   5  10
 33 2   b   1   6  11
 34 3   c   2   7  12
 35 4   d   3   8  13
 36 5   e   4   9  14
 37 
 
 38 (2)、header=None，並指定新的索引的名字names=seq序列
 39 df=pd.read_csv("ceshi.csv",header=None,names=range(2,6))
 40 print(df)
 41 結果：
 42     2   3   4   5
 43 0  c1  c2  c3  c4
 44 1   a   0   5  10
 45 2   b   1   6  11
 46 3   c   2   7  12
 47 4   d   3   8  13
 48 5   e   4   9  14
 49 
 50 
 51 (3)、header=None，並指定新的索引的名字names=seq序列；如果指定的新的索引名字的序列比原csv檔案的列數少，那麼就擷取原csv檔案的倒數列新增上新的索引名字
 52 df=pd.read_csv("ceshi.csv",header=0,names=range(2,4))
 53 print(df)
 54 結果：
 55         2   3
 56 c1 c2  c3  c4
 57 a  0    5  10
 58 b  1    6  11
 59 c  2    7  12
 60 d  3    8  13
 61 e  4    9  14
 62 
 63 
 64 (4)、header=0
 65 表示檔案第0行（即第一行，索引從0開始）為列索引
 66 df=pd.read_csv("ceshi.csv",header=0)
 67 print(df)
 68 結果：
 69   c1  c2  c3  c4
 70 0  a   0   5  10
 71 1  b   1   6  11
 72 2  c   2   7  12
 73 3  d   3   8  13
 74 4  e   4   9  14
 75 
 76 (5)、header=0，並指定新的索引的名字names=seq序列
 77 df=pd.read_csv("ceshi.csv",header=0,names=range(2,6))
 78 print(df)
 79 結果：
 80    2  3  4   5
 81 0  a  0  5  10
 82 1  b  1  6  11
 83 2  c  2  7  12
 84 3  d  3  8  13
 85 4  e  4  9  14
 86 注：這裡是把原csv檔案的第一行換成了range(2,6)並將此作為列索引
 87 
 88 (6)、header=0，並指定新的索引的名字names=seq序列；如果指定的新的索引名字的序列比原csv檔案的列數少，那麼就擷取原csv檔案的倒數列新增上新的索引名字
 89 df=pd.read_csv("ceshi.csv",header=0,names=range(2,4))
 90 print(df)
 91 結果：
 92      2   3
 93 a 0  5  10
 94 b 1  6  11
 95 c 2  7  12
 96 d 3  8  13
 97 e 4  9  14
 98 
 99 
100 parse_dates：
101 布林型別值 or int型別值的列表 or 列表的列表 or 字典（預設值為 FALSE）
102 (1)True:嘗試解析索引
103 (2)由int型別值組成的列表(如[1,2,3]):作為單獨資料列，分別解析原始檔案中的1,2,3列
104 (3)由列表組成的列表(如[[1,3]]):將1,3列合併，作為一個單列進行解析
105 (4)字典(如{'foo'：[1, 3]}):解析1,3列作為資料，並命名為foo
106 
107 
108 index_col：
109 int型別值，序列，FALSE（預設 None）
110 將真實的某列當做index（列的數目，甚至列名）
111 index_col為指定資料中那一列作為Dataframe的行索引，也可以可指定多列，形成層次索引，預設為None,即不指定行索引，這樣系統會自動加上行索引。
112 
113 舉例：
114 df=pd.read_csv("ceshi.csv",index_col=0)
115 print(df)
116 結果：
117     c2  c3  c4
118 c1            
119 a    0   5  10
120 b    1   6  11
121 c    2   7  12
122 d    3   8  13
123 e    4   9  14
124 表示：將第一列作為索引index
125 
126 df=pd.read_csv("ceshi.csv",index_col=1)
127 print(df)
128 結果：
129    c1  c3  c4
130 c2           
131 0   a   5  10
132 1   b   6  11
133 2   c   7  12
134 3   d   8  13
135 4   e   9  14
136 表示：將第二列作為索引index
137 
138 
139 df=pd.read_csv("ceshi.csv",index_col="c1")
140 print(df)
141 結果：
142     c2  c3  c4
143 c1            
144 a    0   5  10
145 b    1   6  11
146 c    2   7  12
147 d    3   8  13
148 e    4   9  14
149 表示：將列名"c1"這裡一列作為索引index
150 【注】：這裡將"c1"這一列作為索引即行索引後，"c1"這列即不在屬於列名這類，即不能使用df['c1']獲取列值
151 【注】：read_csv()方法中header引數和index_col引數不能混用，因為header指定列索引，index_col指定行索引，一個DataFrame物件只有一種索引
152 
153 squeeze：
154 布林值，預設FALSE
155 TRUE 如果被解析的資料只有一列，那麼返回Series型別。

轉載至：https://www.jianshu.com/p/ebb64a159104

padas讀取檔案的read_csv（）函式使用方法

1 import pandas as pd 2 pd.read_csv(filepath_or_buffer,header,parse_dates,index_col) 3 引數： 4 filepath_or_buffer：

php讀取檔案內容（入門）

技術標籤：安全自用第一種方法（整體）乾脆利索($myfile接收資料流),注意fread第二個引數是設定讀取的長度，這裡直接獲取檔案內容的長度，然後根據檔案內容長度直接讀出檔案內容。

Python中join（）函式多種操作程式碼例項

這篇文章主要介紹了Python中join（）函式多種操作程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python讀取檔案內容為字串的方法(多種方法詳解)

以下筆記是我在 xue.cn 學習群之資料分析小組所整理分享的心得。相關背景是：我選擇中文詞頻統計案例作為考察大家python基礎功掌握程度。

print（）函式知識點總結

print()方法用於列印輸出語法： print(*objects, sep=\' \', end=\'\\n\', file=sys.stdout, flush=False)

SQL Server CONVERT（）函式

SQL Server CONVERT（）函式作用把日期轉換為新資料型別的通用函式，用不同的格式顯示日期/時間資料

mysql中if（）函式使用

轉自：https://www.cnblogs.com/zjdxr-up/p/8383609.html 博主原創，轉載請註明出處：在mysql中if()函式的用法類似於java中的三目表示式，其用處也比較多，具體語法如下：

C++中的sort（）函式

C++中的sort（）函式 1. sort（）函式是C++中的排序方法之一，時間複雜度為 n*log2n，執行效率較高

Python-flask-render_template（）函式

技術標籤：python-flask-html 表格問題 #run.py檔案 from flask import Flask, render_template app = Flask(__name__)

SQL的GROUP_CONCAT（）函式使用

技術標籤：mysqlsql資料庫oracle SQL的GROUP_CONCAT（）函式使用思路:按照相同記錄欄位的分組，然後將不同記錄欄位，進行連線。

atoi（）函式的實現

技術標籤：c語言 atoi()函式的實現 atoi()的作用：將字串轉換成整型數；掃描字串跳過前面的空格字元遇上數字或正負號開始轉換遇到非數字或字串時（’\\0’）結束轉化返回轉換後的整型數

filter（）函式

高階函式——filter（） 1. filter（）函式用於過濾序列，作用是從一個序列中篩選出符合條件的元素。

Python——sorted（）函式

sorted（）函式 1. python內建的sorted（）函式可以對 list 進行排序 >>> sorted([12,1,3,34,-4])

range（）函式

為python內建函式，多用於for迴圈中，用於生成一系列連續的整數。語法格式：

JS利用正則配合REPLACE（）函式替換指定字元

定義和用法replace() 方法用於在字串中用一些字元替換另一些字元，或替換一個與正則表示式匹配的子串。語法stringObject.replace(regexp,replacement)引數　　描述regexp　必需。規定了要替換的模式的 RegExp 物件。

【Linux環境】linux下利用核心statfs（）函式檢視磁碟的使用情況

最近有開發有個需求，需要根據系統中某一檔案系統的總容量規模情況，進行彈性調節回收資源執行緒的啟動時機。本人的環境是linux，並且需要用c語言進行處理。

c語言中使用fscanf函式從檔案讀取資料（逐行讀取並儲存變數）

1、 #include <stdio.h> int main(void) { FILE *fp; int lines = 0; char name[128]; double height, weight;

分享一下操作檔案得常用方法可以直接拿來用哦（讀取檔案，解壓Zip，Rar）

/// <summary>/// 讀取檔案/// </summary>/// <param name=\"Path\">檔案路徑</param>/// <param name=\"encode\">編碼</param>/// <returns></returns>public st

C#/VB.NET 在PDF中新增檔案包（Portfolio）的方法

PDF檔案包（Portfolio）允許使用者將多種不同型別的檔案如Word、Excel、PDF、PowerPoint和圖片等集合到一個PDF檔案中，使用者可以開啟、更改PDF檔案包中的單個檔案。新增檔案包時，可支援建立檔案包時並直接將檔案新

MFC/C++用Char（Byte）讀取檔案utf-8的檔案亂碼----解碼

//utf8Str：以位元組（char*或者Byte*）讀取中文的字串（亂碼） CString UTF8toUnicode(const char* utf8Str)

padas讀取檔案的read_csv（）函式使用方法

相關推薦