觀影大資料分析(3)
阿新 • • 發佈:2021-12-16
8.資料分析
8.1 why
想要探索影響票房的因素,從電影市場趨勢,觀眾喜好型別,電影導演,發行時間,評分與 關鍵詞等維度著手,給從業者提供合適的建議。
8.2 what
8.2.1 電影型別:定義一個集合,獲取所有的電影型別
genre = set()
for i in df['genres'].str.split(','): # 去掉字串之間的分隔符,得到單個電影型別
genre = set().union(i,genre) # 集合求並集
# genre.update(i) #或者使用update方法
print(genre)
#注意到genre集合中存在多餘的元素:空的單引號,所以需要去除
genre.discard('') # 去除多餘的元素
genre
8.2.1.1條形圖
8.2.1.2餅圖
8.2.1.3折線圖
8.2.2 電影關鍵詞(keywords 關鍵詞分析,繪製詞雲圖)
8.3 when
檢視 runtime 的型別,發現是 object 型別,也就是字串,所以,先進行資料轉化。
8.3.1 電影時長(繪製電影時長直方圖)
8.3.2 繪製每月電影數量和單片平均票房
8.4 Who
8.4.1 分析票房分佈及票房 Top10 的導演
8.5 How
8.5.1 原創 VS 改編佔比(餅圖)
8.5.2 原創 VS 改編預算/利潤率(組合圖)