1. 程式人生 > >pd.Categorical 的用法

pd.Categorical 的用法

最近在資料處理過程中遇到 pd.Categorical() 因此特地查了一下

先給出官網的連結 http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Categorical.html

我們直接通過例子來學習 

       那麼在實際應用中 我們常常是結合他的 codes 屬性來一起使用的 , 即 pd.Categorical( list ).codes 這樣就可以直接得到原始資料的對應的序號列表,通過這樣的處理可以將類別資訊轉化成數值資訊 ,這樣就可以應用到模型中去了 另外更加詳細的功能參考官網。

    其實看到這裡 可以發現 Categorical 的功能和 之前在機器學習 資料處理部分提到的 LabelEncoder (https://blog.csdn.net/weixin_38656890/article/details/80849334) 的功能是一樣的, 不過 Categorical 是對自己編碼 ,而LabelEncoder 是通過通過一個樣本 製成標準 然後 對其他樣本編碼,因而相對的更加靈活。