1. 程式人生 > 其它 >3.8 模擬總結

3.8 模擬總結

這次的實戰作業是分析imdb5000電影資料集

因為一開始時使用的movie_metadata.csv進行的資料處理,但是要求是使用資料庫儲存資料再進行資料分析,因此需要連線資料庫

首先先引入庫

import pymysql

資料庫連線相關變數:
localhost:也可寫成資料庫主機IP:127.0.0.1,
port:資料庫埠號
user:資料庫使用者名稱,
password:資料庫使用者密碼
database / db:資料庫例項名,
charset:資料庫編碼集

  • 第一種方法(也是最常用的方法)
conn = pymysql.connect(host="127.0.0.1", user="root", password="root", db="movie")
movies_df = pd.read_sql("select * from movie_metadata", conn)
  • 第二種方法
conn = pymysql.connect(host='localhost', port=3306, user='root', passwd='root', db="movie")
# 獲取遊標
cur = conn.cursor()
cur.execute("SELECT * FROM movie_metadata")
# 獲取遊標指定sql後得到的資料
data = cur.fetchall()
conn.close()

此時會發現沒有列名,可手動新增列名

df = pd.DataFrame(data=data, columns=["列名1","列名2","列名3"])
  • 第三種方法(類似於第一種方法)
# 讀取資料庫表,返回表資料
def movies_df(movie_metadata):
    conn = Connect(host='localhost', port=3306, user='root', passwd='root',
                   database='movie', charset='utf8')
    df = pd.read_sql(f"SELECT * FROM {movie_metadata}", conn)
    return df