Pandas系列教程(1)Pandas資料讀取
阿新 • • 發佈:2020-10-21
1. 下載安裝pandas
pip install pandas pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple
Pandas需要先讀取表格型別的資料,然後進行分析
資料型別 | 說明 | Pandas讀取方法 |
---|---|---|
csv, tsv, txt | 用逗號分隔,tab分隔的純文字檔案 | pd.read_csv |
excel | 微軟xls或者xlsx檔案 | pd.read_excel |
mysql | 關係型資料庫表 | pd.read_sql |
# 讀取csv檔案,使用預設的標題行,逗號分隔符import pandas as pd file_path = '../files/ratings.csv' # 使用pd.read_csv讀取資料 ratings = pd.read_csv(file_path) print(ratings) # 檢視資料的前幾行 print("檢視資料的前幾行:\n ", ratings.head()) # 檢視資料的形狀(返回行數,列數) print("檢視資料的形狀:\n ", ratings.shape) # 檢視列表列名 print("檢視列表列名:\n ", ratings.columns) # 檢視索引列 print("檢視索引列:\n", ratings.index) # 檢視每列的資料型別 print("檢視每列的資料型別:\n ", ratings.dtypes)
# 讀取csv檔案,使用預設的標題行,逗號分隔符 import pandas as pd file_path = '../files/access_pvuv.txt' # 使用pd.read_csv讀取資料 pvuv = pd.read_csv(file_path, sep='\t', header=None, names=['pdate', 'pv', 'uv']) """ sep: 指定列的分隔符 header: 沒有標題行設定為None names: 自定義列名""" print(pvuv) # 檢視資料的前幾行 print("檢視資料的前幾行:\n ", pvuv.head()) # 檢視資料的形狀(返回行數,列數) print("檢視資料的形狀:\n ", pvuv.shape) # 檢視列表列名 print("檢視列表列名:\n ", pvuv.columns) # 檢視索引列 print("檢視索引列:\n ", pvuv.index) # 檢視每列的資料型別 print("檢視每列的資料型別:\n ", pvuv.dtypes)
# 讀取csv檔案,使用預設的標題行,逗號分隔符 import pandas as pd file_path = '../files/access_pvuv.xlsx' # 使用pd.read_excel讀取資料 pvuv = pd.read_excel(file_path) print(pvuv)
# 讀取csv檔案,使用預設的標題行,逗號分隔符 import pymysql import pandas as pd # 建立資料庫連線 conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8') # 使用pd.read_excel讀取資料 pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn) print(pvuv)