3.8 模擬總結
阿新 • • 發佈:2022-05-29
這次的實戰作業是分析imdb5000電影資料集
因為一開始時使用的movie_metadata.csv進行的資料處理,但是要求是使用資料庫儲存資料再進行資料分析,因此需要連線資料庫
首先先引入庫
import pymysql
資料庫連線相關變數:
localhost:也可寫成資料庫主機IP:127.0.0.1,
port:資料庫埠號
user:資料庫使用者名稱,
password:資料庫使用者密碼
database / db:資料庫例項名,
charset:資料庫編碼集
- 第一種方法(也是最常用的方法)
conn = pymysql.connect(host="127.0.0.1", user="root", password="root", db="movie") movies_df = pd.read_sql("select * from movie_metadata", conn)
- 第二種方法
conn = pymysql.connect(host='localhost', port=3306, user='root', passwd='root', db="movie")
# 獲取遊標
cur = conn.cursor()
cur.execute("SELECT * FROM movie_metadata")
# 獲取遊標指定sql後得到的資料
data = cur.fetchall()
conn.close()
此時會發現沒有列名,可手動新增列名
df = pd.DataFrame(data=data, columns=["列名1","列名2","列名3"])
- 第三種方法(類似於第一種方法)
# 讀取資料庫表,返回表資料
def movies_df(movie_metadata):
conn = Connect(host='localhost', port=3306, user='root', passwd='root',
database='movie', charset='utf8')
df = pd.read_sql(f"SELECT * FROM {movie_metadata}", conn)
return df