1. 程式人生 > 實用技巧 >Python訓練營——寶可夢資料分析(2020.10.23)

Python訓練營——寶可夢資料分析(2020.10.23)

Python訓練營——寶可夢資料分析

分析好抓的寶可夢

我們通過免費計算資源且預置了許多常用資料分析依賴庫的DSW探索者版來幫助完成分析的過程。
資料集下載

!wget -O pokemon_data.csv https://pai-public-data.oss-cn-beijing.aliyuncs.com/pokemon/pokemon.csv
讀取資料
在這裡插入圖片描述
觀察資料的尺寸,可以通過 df.shape 這個來實現。當然 df.info() 能夠給我們更加詳細的每個列的資訊。
通過如下程式碼來觀察每個特徵的缺失情況:
在這裡插入圖片描述
通過檢視以上資料,我們發現,type2 這個欄位缺失的比率最高,達到了 48% 左右。說明超過半數的寶可夢只有一個屬性,剩下一般的則具有兩種屬性。
這麼多寶可夢,每代分別有幾隻?這裡可以通過簡單的 df[‘generation’].value_counts() 來得到。但是為了更加直觀的表現出不同代的寶可夢的數量差別,這裡我們可以用pandas自帶的畫圖的功能來繪製一個柱狀圖:

在這裡插入圖片描述
在這裡插入圖片描述
看完了基礎的一些分佈,接下來可以做一些簡單的相關性分析。我們可以通過以下的程式碼生成相關性圖

在這裡插入圖片描述
我們可以通過簡單的過濾和排序來找到我們應該去捕捉的寶可夢:

在這裡插入圖片描述

高效通關寶可夢選擇

在這裡插入圖片描述
目的:以最效率的方式打贏道館賽通關

在這裡插入圖片描述
有些玩家喜歡屬性均衡,所以在每個屬性下輸出3個較強的寶可夢供參考

在這裡插入圖片描述