內建函式sorted的10個小tips
sorted
用於對集合進行排序(這裡說的集合是對可迭代物件的一個統稱,他們可以是列表、字典、set、甚至是字串),它的功能非常強大,本文將深入淺出地介紹 sorted 的各種使用場景。
1、預設排序
1、預設情況,sorted 函式將按列表升序進行排序,並返回一個新列表物件,原列表保持不變,最簡單的排序
>>> nums = [3,4,5,2,1]
>>> sorted(nums)
[1, 2, 3, 4, 5]
複製程式碼
2、降序排序
2、降序排序,如果要按照降序排列,只需指定引數 reverse=True 即可
>>> sorted(nums, reverse=True )
[5, 4, 3, 2, 1]
複製程式碼
3、自定義規則排序
3、如果要按照某個特定的規則排序,則需指定引數 key
, key 是一個函式(或其它可呼叫物件),例如:一個字串構成的列表,我想按照字串的長度來排序
>>> chars = ['Andrew', 'This', 'a', 'from', 'is', 'string', 'test']
>>> sorted(chars, key=len)
['a', 'is', 'from', 'test', 'This', 'Andrew', 'string']
複製程式碼
len
是內建函式,sorted 函式在排序的時候會用len去獲取每個字串的長度來排序。 有些人可能使用匿名函式 key=lambda x: len(x) ,其實是多此一舉。
>>> chars = ['Andrew', 'This', 'a', 'from', 'is', 'string', 'test']
>>> sorted(chars, key=lambda x: len(x))
['a', 'is', 'from', 'test', 'This', 'Andrew', 'string']
複製程式碼
4、複合排序
4、如果是一個複合列表結構,例如:由元組構成的列表,要按照元組中的第二個元素排序,那麼可以用 lambda 定義一個匿名函式,這裡就是按照第二個元素的字母升序來排列的
>>> students = [('zhang' , 'A'), ('li', 'D'), ('wang', 'C')]
>>> sorted(students, key=lambda x: x[1])
[('zhang', 'A'), ('wang', 'C'), ('li', 'D')]
複製程式碼
這裡將按照字母 A-C-D 的順序排列。
5、類的例項物件排序
5、如果要排序的元素是自定義類,例如Student類按照年齡來排序,則可以寫成
>>> class Student:
def __init__(self, name, grade, age):
self.name = name
self.grade = grade
self.age = age
def __repr__(self):
return repr((self.name, self.grade, self.age))
>>> student_objects = [
Student('john', 'A', 15),
Student('jane', 'B', 12),
Student('lily', 'A', 12),
Student('dave', 'B', 10), ]
>>> sorted(student_objects, key=lambda t:t.age)
[('dave', 'B', 10), ('jane', 'B', 12), ('lily', 'A', 12), ('john', 'A', 15)]
複製程式碼
6、多個值排序
6、和資料庫的排序一樣,sorted 也可以根據多個欄位來排序,例如我有先要根據age排序,如果age相同的則根據grade排序,則可以使用元組:
>>> sorted(student_objects, key=lambda t:(t.age, t.grade))
[('dave', 'B', 10), ('lily', 'A', 12), ('jane', 'B', 12), ('john', 'A', 15)]
複製程式碼
7. 不可直接比較的值排序
7、前面碰到的排序場景都是建立在兩個元素是可以互相比較的前提下,例如數值按大小比較, 字母按ASCII順序比較,如果遇到本身是不可比較的,需要我們自己來定義比較規則的情況如何處理呢?
舉個簡單的例子:
>>> nums = [2, 1.5, 2.5, '2', '2.5']
>>> sorted(nums)
TypeError: '<' not supported between instances of 'str' and 'int'
複製程式碼
一個整數列表中,可能有數字,字串,在Python3中,字串與數值是不能比較的,而Python2中任何型別都可以比較,這是兩個版本中一個很大的區別:
# python2.7
>>> "2.5" > 2
True
# python3.6
>>> "2.5" > 2
TypeError: '>' not supported between instances of 'str' and 'int'
複製程式碼
我們需要使用 functools 模組中的 cmp_to_key 來指定比較函式是什麼。
import functools
def compare(x1, x2):
if isinstance(x1, str):
x1 = float(x1)
if isinstance(x2, str):
x2 = float(x2)
return x1 - x2
>>>sorted(nums, key=functools.cmp_to_key(compare))
[1.5, 2, '2', 2.5, '2.5']
複製程式碼
8、定義com_to_key
8、關於 sorted 函式,Python2和Python3之間的區別是Python2中的sorted 可以指定cmp關鍵字引數,就是當遇到需要自定義比較操作的資料可以通過 cmp=compare 來實現,不需要像Python3中還需要匯入functools.cmp_to_key實現。
nums = [2, 1.5, 2.5, '2', '2.5']
def compare(x1, x2):
if isinstance(x1, str):
x1 = float(x1)
if isinstance(x2, str):
x2 = float(x2)
return 1 if x1 - x2 > 0 else -1 if x1 - x2 < 0 else 0
>>> sorted(nums, cmp=compare)
[1.5, 2, '2', 2.5, '2.5']
複製程式碼
其實,在Python2中,上面這種情況你不指定cmp,預設也會按照這種方式排序,記住,Python2中,任何東西(不同型別之間)都可以比較,而Python3只有同類型資料可以比較。
9、優化排序
9、 對於集合構成的列表,有一種更高效的方法指定這個key
>>> from operator import itemgetter
>>> sorted(students, key=itemgetter(1))
[('zhang', 'A'), ('wang', 'C'), ('li', 'D')]
複製程式碼
10、高階排序
10、同樣的,對於自定義類,也有一種更高效的方法指定key
>>> from operator import attrgetter
>>> sorted(student_objects, key=attrgetter('age'))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
複製程式碼
如果參與排序的欄位有兩個怎麼辦,你可以這樣:
>>> sorted(student_objects, key=attrgetter('grade', 'age'))
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]
複製程式碼
以上是關於 sorted 函式的全部。
同步發表部落格:foofish.net/python-sort…
關注一下,第一時間獲取更多好文