1. 程式人生 > 實用技巧 >Pandas系列教程(1)Pandas資料讀取

Pandas系列教程(1)Pandas資料讀取

1. 下載安裝pandas

pip install pandas
pip install pandas -i https://pypi.tuna.tsinghua.edu.cn/simple

2. Pandas資料讀取

Pandas需要先讀取表格型別的資料,然後進行分析

資料型別說明Pandas讀取方法
csv, tsv, txt 用逗號分隔,tab分隔的純文字檔案 pd.read_csv
excel 微軟xls或者xlsx檔案 pd.read_excel
mysql 關係型資料庫表 pd.read_sql

2.1 Pandas讀取純文字檔案

讀取csv檔案

# 讀取csv檔案,使用預設的標題行,逗號分隔符
import pandas as pd file_path = '../files/ratings.csv' # 使用pd.read_csv讀取資料 ratings = pd.read_csv(file_path) print(ratings) # 檢視資料的前幾行 print("檢視資料的前幾行:\n ", ratings.head()) # 檢視資料的形狀(返回行數,列數) print("檢視資料的形狀:\n ", ratings.shape) # 檢視列表列名 print("檢視列表列名:\n ", ratings.columns) # 檢視索引列 print("檢視索引列:\n
", ratings.index) # 檢視每列的資料型別 print("檢視每列的資料型別:\n ", ratings.dtypes)

讀取txt檔案

# 讀取csv檔案,使用預設的標題行,逗號分隔符

import pandas as pd

file_path = '../files/access_pvuv.txt'

# 使用pd.read_csv讀取資料
pvuv = pd.read_csv(file_path, sep='\t', header=None, names=['pdate', 'pv', 'uv'])
"""
sep: 指定列的分隔符
header: 沒有標題行設定為None
names: 自定義列名
""" print(pvuv) # 檢視資料的前幾行 print("檢視資料的前幾行:\n ", pvuv.head()) # 檢視資料的形狀(返回行數,列數) print("檢視資料的形狀:\n ", pvuv.shape) # 檢視列表列名 print("檢視列表列名:\n ", pvuv.columns) # 檢視索引列 print("檢視索引列:\n ", pvuv.index) # 檢視每列的資料型別 print("檢視每列的資料型別:\n ", pvuv.dtypes)

2.2 讀取excel檔案

# 讀取csv檔案,使用預設的標題行,逗號分隔符

import pandas as pd

file_path = '../files/access_pvuv.xlsx'

# 使用pd.read_excel讀取資料
pvuv = pd.read_excel(file_path)
print(pvuv)

2.3 讀取mysql

# 讀取csv檔案,使用預設的標題行,逗號分隔符
import pymysql
import pandas as pd

# 建立資料庫連線
conn = pymysql.connect(host='127.0.0.1', user='root', password='123456', database='demo', charset='utf8')

# 使用pd.read_excel讀取資料
pvuv = pd.read_sql("select * from crazyant_pvuv", con=conn)
print(pvuv)