Python CategoricalDtype自定義排序實現原理解析

阿新 • • 發佈：2020-09-14

CategoricalDtype自定義排序

當我們的透視表生成完畢後，有很多情況下需要我們對某列或某行值進行排序。排序有很多種方法。例如sort_index及sort_values函式也可以對資料進行排序，這裡就不多說了。

對於數值和字母的排序很容易，但是對於中文的排序就有點麻煩了。預設情況下是按照utf-8的編碼來進行排序的但是即使如此也很難滿足我們對漢字排序的要求。所以通過CategoricalDtye可以把資料型別轉成Category型別

然後通過指定引數列表的順序來自定義那個元素先那個元素後，完全取決於你把那個元素放在List的前面，這樣就大大方便了我們對中文排序的操作。

程式碼如下：

1. 自動生成DataFrame資料

#%%

import pandas as pd
from datetime import datetime

city =["上海","北京","深圳","杭州","蘇州","青島","大連","齊齊哈爾","大理","麗江","天津","濟南","南京","廣州","無錫","連雲港","張家界"]

#建立自動從list中選取valuse值的get_list函式
#replace=True代表允許選出的元素重複
def get_list(items,size=20):
  return pd.Series(items).sample(n=size,replace=True).to_list()

#通過get_list自動生成資料，最終生成一個DataFrame
df = pd.DataFrame({
   "城市":get_list(city),"倉位":get_list(["經濟艙","商務艙","頭等艙"]),"航線":get_list(["單程","往返"]),"日期": get_list([datetime(2020,8,1),datetime(2020,2),3),4)]),"時間": get_list(["09:00 - 12:00","13:00 - 15:30","06:30 - 15:00","18:00 - 21:00","20:00 - 23:20","10:00 - 15:00"]),"航空公司": get_list(["東方航空","南方航空","深圳航空","山東航空","中國航空"]),"出票數量":get_list([10,15,20,25,30,35,40,45,50,55,60]),})
#%%
df

結果如下：

Python CategoricalDtype自定義排序實現原理解析

2. 檢視資料型別

#%%

df.dtypes

Python CategoricalDtype自定義排序實現原理解析

3. 自定義資料型別（Category）按照指定順序排序，並通過透視表展示資料

#%%
#自定義type，以及自定義排序的順序
my_type = pd.CategoricalDtype(
  categories=["頭等艙","經濟艙"],ordered=True
)
df["倉位"] = df["倉位"].astype(my_type) #將指定列轉成自定義的type
df.dtypes
#%%
#通過透視表統計資料
tb = pd.pivot_table(
  df,index=["城市","倉位","航線","日期","時間"],values="出票數量",aggfunc=sum
)
tb

先檢視資料型別：可以看出倉位的資料型別已經從Object變成了category型別了。

Python CategoricalDtype自定義排序實現原理解析

結果為：

Python CategoricalDtype自定義排序實現原理解析

分析上述資料可以看出，我們把倉位按照["頭等艙","經濟艙"]的順序進行了排序，排序結果也是按照這個順序排列的，成功的滿足了我們對中文列自定義排序的需求。

通過Pivot_table函式更加清晰的對原有資料進行了展示。也可以按照自己的需求展示其中的一部分資料。這樣對資料的清洗及展示變得更加的靈活。

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援我們。

Python CategoricalDtype自定義排序實現原理解析

CategoricalDtype自定義排序當我們的透視表生成完畢後，有很多情況下需要我們對某列或某行值進行排序。排序有很多種方法。例如sort_index及sort_values函式也可以對資料進行排序，這裡就不多說了。

Java Arrays.sort和Collections.sort排序實現原理解析

1、使用排序 2、原理事實上Collections.sort方法底層就是呼叫的array.sort方法，而且不論是Collections.sort或者是Arrays.sort方法，

Python基礎類繼承重寫實現原理解析

1.繼承繼承是面向物件三大特性之一 - 通過繼承我們可以使用一個類獲取到其他類中的屬性和方法

Python logging模組進行封裝實現原理解析

1. 簡介追蹤某些軟體執行時所發生事件的方法,可以在程式碼中呼叫日誌中某些方法來記錄發生的事情

SpringBoot Import及自定義裝配實現方法解析

Import的註冊形式： 1、使用@Import匯入一個或者多個類位元組物件 @Target({ElementType.TYPE})

Oracle使用者自定義異常實現過程解析

注意：普通的查詢語句不會出現異常，只有使用into對變數進行賦值的時候才會發生異常

Django自定義YamlField實現過程解析

需求在使用django admin時希望後臺的Textarea多行文字框可以按yaml格式編寫，資料庫儲存為Text文字型別，欄位和介面中讀取出來自動變為字典或列表格式。

python執行緒定時器Timer實現原理解析

這篇文章主要介紹了python執行緒定時器Timer實現原理解析,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

Python異常繼承關係和自定義異常實現程式碼例項

這篇文章主要介紹了Python異常繼承關係和自定義異常實現程式碼例項,文中通過示例程式碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下

python3 sorted 如何實現自定義排序標準

在 python2 中，如果想要自定義評價標準的話，可以這麼做 def cmp(a,b): # 如果邏輯上認為 a < b ，返回 -1

Oracle用decode函式或CASE-WHEN實現自定義排序

1 問題對SQL排序，只要在order by後面加欄位就可以了，可以通過加desc或asc來選擇降序或升序。但排序規則是預設的，數字、時間、字串等都有自己預設的排序規則。有時候需要按自己的想法來排序，而不是按欄位預設排序

Python變數格式化輸出實現原理解析

print() 函式使用以 % 開頭的轉換說明符對各種型別的資料進行格式化輸出。轉換說明符(Conversion Specifier)只是一個佔位符(也稱為格式化操作符)，它會被後面表示式(變數、常量、數字、字串、加減乘除等各種形式)的

Python函式遞迴呼叫實現原理例項解析

函式的遞迴呼叫: 是函式巢狀呼叫的一種特殊形式具體是指: 在呼叫一個函式的過程中又直接或間接地呼叫到了本身

java中用Arrays.sort實現多維陣列的自定義排序

java中有這樣一個方法可以幫助我們實現陣列的自定義排序：Arrays類的public static <T> void sort(T[] a, Comparator<? super T> c)

Spring Boot自定義favicon實現方法例項解析

自定義歡迎頁 Spring Boot 專案在啟動後，首先會去靜態資源路徑下查詢index.html作為首頁檔案，若查詢不到，則會去查詢動態的index檔案作為首頁檔案。例如，如果想使用靜態的index.html作為首頁，那麼只需在resource

【Python】Pivot_table透視表用法及CCategoricalDtype自定義排序

一，Pivot 及 Pivot_table函式用法 Pivot和Pivot_table函式都是對資料做透視表而使用的。其中的區別在於Pivot_table可以支援重複元素的聚合操作，而Pivot函式只能對不重複的元素進行聚合操作。

這一次搞懂Spring自定義標籤以及註解解析原理說明

前言在上一篇文章中分析了Spring是如何解析預設標籤的，並封裝為BeanDefinition註冊到快取中，這一篇就來看看對於像context這種自定義標籤是如何解析的。同時我們常用的註解如：@Service、@Component、@Controller標

Java如何實現List自定義排序

實體類 package com.whty.entity; public class User { private int id; private String name; private int age;

python自定義排序

發現不是很清楚，遂整理StackOverflow如下 Generally, you want to use the built-insorted()function which takes a custom comparator as its parameter.

Python CategoricalDtype自定義排序實現原理解析

相關推薦