1. 程式人生 > 資料庫 >Python使用Pandas庫實現MySQL資料庫的讀寫

Python使用Pandas庫實現MySQL資料庫的讀寫

本次分享將介紹如何在Python中使用Pandas庫實現MySQL資料庫的讀寫。首先我們需要了解點ORM方面的知識

ORM技術

物件關係對映技術,即ORM(Object-Relational Mapping)技術,指的是把關係資料庫的表結構對映到物件上,通過使用描述物件和資料庫之間對映的元資料,將程式中的物件自動持久化到關係資料庫中。

在Python中,最有名的ORM框架是SQLAlchemy。Java中典型的ORM中介軟體有:Hibernate,ibatis,speedframework。

SQLAlchemy

SQLAlchemy是Python程式語言下的一款開源軟體。提供了SQL工具包及物件關係對映(ORM)工具,使用MIT許可證發行

SQLAlchemy模組提供了create_engine()函式用來初始化資料庫連線,SQLAlchemy用一個字串表示連線資訊:

'資料庫型別+資料庫驅動名稱://使用者名稱:口令@機器地址:埠號/資料庫名

Pandas讀寫MySQL資料庫

我們需要以下三個庫來實現Pandas讀寫MySQL資料庫:

  • pandas
  • sqlalchemy
  • pymysql

其中,pandas模組提供了read_sql_query()函式實現了對資料庫的查詢,to_sql()函式實現了對資料庫的寫入。並不需要實現新建MySQL資料表。

sqlalchemy模組實現了與不同資料庫的連線,而pymysql模組則使得Python能夠操作MySQL資料庫。

我們將使用MySQL資料庫中的mydb資料庫以及employee表,內容如下:

注意:

1.根據庫的文件,我們看到to_sql函式支援兩類mysql引擎一個是sqlalchemy,另一個是sqlliet3.沒錯,在你寫入庫的時候,pymysql是不能用的!!!

mysqldb也是不能用的,你只能使用sqlalchemy或者sqlliet3!!鑑於sqllift3已經很久沒有更新了,筆者這裡建議使用sqlalchemy!!

2.to_sql函式並不在pd之中,而是在io.sql之中,是sql指令碼下的一個類!!!所以to_sql的最好寫法就是:

pd.io.sql.to_sql(df1,tablename,con=conn,if_exists='repalce')  

下面將介紹一個簡單的例子來展示如何在pandas中實現對MySQL資料庫的讀寫:

import pandas as pd
from sqlalchemy import create_engine
# 初始化資料庫連線,使用pymysql模組
# MySQL的使用者:root,密碼:147369,埠:3306,資料庫:test
engine = create_engine('mysql+pymysql://root:123456@localhost:3306/test')
# 查詢語句,選出employee表中的所有資料
sql = ''' select * from employee; '''
# read_sql_query的兩個引數: sql語句, 資料庫連線
df = pd.read_sql_query(sql,engine)
# 輸出employee表的查詢結果
print(df)

# 新建pandas中的DataFrame,只有id,num兩列
df = pd.DataFrame({'id': [1,2,3,4],'name': ['zhangsan','lisi','wangwu','zhuliu']})
# 將新建的DataFrame儲存為MySQL中的資料表,儲存index列
df.to_sql('mydf',engine,index=True)
print('Read from and write to Mysql table successfully!')

執行結果:

這說明我們確實將pandas中新建的DataFrame寫入到了MySQL中!

將CSV檔案寫入到MySQL中

以上的例子實現了使用Pandas庫實現MySQL資料庫的讀寫,我們將再介紹一個例項:將CSV檔案寫入到MySQL中,示例的example.csv檔案如下

示例的Python程式碼如下:

# -*- coding: utf-8 -*-

# 匯入必要模組
import pandas as pd
from sqlalchemy import create_engine

# 初始化資料庫連線,使用pymysql模組
db_info = {'user': 'root','password': '123456','host': 'localhost','port': 3306,'database': 'test'
      }

engine = create_engine('mysql+pymysql://%(user)s:%(password)s@%(host)s:%(port)d/%(database)s?charset=utf8' % db_info,encoding='utf-8')
# 直接使用下一種形式也可以
# engine = create_engine('mysql+pymysql://root:123456@localhost:3306/test')

# 讀取本地CSV檔案
df = pd.read_csv("C:/Users/fuqia/Desktop/example.csv",sep=',')
print(df)
# 將新建的DataFrame儲存為MySQL中的資料表,不儲存index列(index=False)
# if_exists:
# 1.fail:如果表存在,啥也不做
# 2.replace:如果表存在,刪了表,再建立一個新表,把資料插入
# 3.append:如果表存在,把資料插入,如果表不存在建立一個表!!
pd.io.sql.to_sql(df,'example',con=engine,index=False,if_exists='replace')
# df.to_sql('example',if_exists='replace')這種形式也可以
print("Write to MySQL successfully!")

在MySQL中檢視example表格

補充:engine.execute(sql)可以直接執行sql語句:

from sqlalchemy import create_engine 
 
 engine = create_engine('mysql+pymysql://root:123456@localhost:3306/test')
sql = "DROP TABLE IF EXISTS example"
engine.execute(sql)

如果用pymysql,則必須用cursor,讀者可以對比一下。

import pymysql
from sqlalchemy import create_engine

conn = pymysql.connect(host='127.0.0.1',port=3306,user='root',passwd='123456',db='test')
# engine = create_engine('mysql+pymysql://root:123456@localhost:3306/test')
sql = "DROP TABLE IF EXISTS test_input"
cursor = conn.cursor()
cursor.execute(sql)

總結

本文主要介紹了ORM技術以及SQLAlchemy模組,並且展示了兩個Python程式的例項,介紹瞭如何使用Pandas庫實現MySQL資料庫的讀寫。

以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支援我們。