經驗豐富程式設計師才知道的8種高階Python技巧
本文將介紹8個簡潔的Python技巧,若非經驗十足的程式設計師,你肯定有些從未見過。向著更簡潔更高效,出發吧!
1.通過多個鍵值將物件進行排序
假設要對以下字典列表進行排序:
people = [ { 'name': 'John',"age": 64 },{ 'name': 'Janet',"age": 34 },{ 'name': 'Ed',"age": 24 },{ 'name': 'Sara',{ 'name': 'John',"age": 32 },{ 'name': 'Jane',"age": 99 },]
不僅要按名字或年齡對其進行排序,還要將兩個欄位同時進行排序。在SQL中,會是這樣的查詢:
SELECT * FROM people ORDER by name,age
實際上,這個問題的解決方法可以非常簡單,Python保證sort函式提供了穩定的排序順序,這也意味著比較相似的項將保留其原始順序。要實現按名字和年齡排序,可以這樣做:
import operator people.sort(key=operator.itemgetter('age')) people.sort(key=operator.itemgetter('name'))
要注意如何反轉順序。首先按年齡分類,然後按名字分類,使用operator.itemgetter()從列表中的每個字典中獲取年齡和名字欄位,這樣你就會得到想要的結果:
[ {'name': 'Ed','age': 24},{'name': 'Jane','age': 34},{'name': 'Janet',{'name': 'John','age': 32},'age': 64},'age': 99},{'name': 'Sara','age': 64} ]
名字是主要排序項,如果姓名相同,則以年齡排序。因此,所有John都按年齡分組在一起。
2.資料類別
自3.7版之後,Python開始能提供資料類別。比起常規類或其他替代方法(如返回多個值或字典),它有著更多優點:
- 資料類需要很少的程式碼
- 可以比較資料類,因為 __eq__ 可以實現此功能
- 資料類需要型別提示,減少了發生錯誤的可能性
- 可以輕鬆列印資料類以進行除錯,因為__repr__可以實現此功能
這是一個工作中的資料類示例:
from dataclasses import dataclass @dataclass classCard: rank: str suit: str card=Card("Q","hearts") print(card == card) # True print(card.rank) # 'Q' print(card) Card(rank='Q',suit='hearts')
3.列表推導
列表推導可以在列表填寫裡代替討厭的迴圈,其基本語法為
[ expression for item in list if conditional ]
來看一個非常基本的示例,用數字序列填充列表:
mylist = [i for i inrange(10)] print(mylist) # [0,1,2,3,4,5,6,7,8,9]
因為可以使用表示式,所以你還可以進行一些數學運算:
squares = [x**2for x inrange(10)] print(squares) # [0,9,16,25,36,49,64,81]
甚至能呼叫外部函式:
defsome_function(a): return (a +5) /2 my_formula= [some_function(i) for i inrange(10)] print(my_formula) # [2.5,3.0,3.5,4.0,4.5,5.0,5.5,6.0,6.5,7.0]
最後,可以使用if函式來篩選列表。在這種情況下,只保留可被2除的值:
filtered = [i for i inrange(20) if i%2==0] print(filtered) # [0,10,12,14,18]
4.檢查物件的記憶體使用情況
使用sys.getsizeof()可以檢查物件的記憶體使用情況:
import sys mylist =range(0,10000) print(sys.getsizeof(mylist)) # 48
為什麼這個龐大的列表只有48個位元組?這是因為range函式返回的類表現為列表。與使用實際的數字列表相比,數序列的儲存效率要高得多。我們可以通過列表推導來建立相同範圍內的實際數字列表:
import sys myreallist = [x for x inrange(0,10000)] print(sys.getsizeof(myreallist)) # 87632
通過使用sys.getsizeof(),我們可以瞭解更多關於Python和記憶體使用情況的資訊。
5.查詢最頻繁出現的值
要查詢列表或字串中最頻繁出現的值:
test = [1,4] print(max(set(test),key = test.count)) # 4
- max()將返回列表中的最大值。key引數採用單個引數函式自定義排序順序,在本例中為test.count,該函式適用於迭代器上的每個專案。
- test.count是list的內建功能。它接受一個引數,並計算該引數的出現次數。因此test.count(1)將返回2,而test.count(4)將返回4。
- set(test)返回test中的所有唯一值,所以{1、2、3、4}
那麼在這一行程式碼將接受test的所有唯一值,即{1、2、3、4}。接下來,max將對其應用list.count 函式並返回最大值。
還有一種更有效的方法:
from collections import Counter Counter(test).most_common(1) # [4: 4]
6.屬性包
你可以使用attrs代替資料類,選擇attrs有兩個原因:
- 使用的Python版本高於3.7
- 想要更多功能
Theattrs軟體包支援所有主流Python版本,包括CPython 2.7和PyPy。一些attrs可以提供驗證器和轉換器這種超常規資料類。來看一些示例程式碼:
@attrs classPerson(object): name =attrib(default='John') surname =attrib(default='Doe') age =attrib(init=False) p =Person() print(p) p=Person('Bill','Gates') p.age=60 print(p) # Output: # Person(name='John',surname='Doe',age=NOTHING) # Person(name='Bill',surname='Gates',age=60)
實際上,attrs的作者已經在使用引入資料類的PEP了。資料類被有意地保持得更簡單、更容易理解,而attrs 提供了可能需要的所有特性。
7.合併字典(Python3.5+)
dict1 = { 'a': 1,'b': 2 } dict2= { 'b': 3,'c': 4 } merged= { **dict1,**dict2 } print (merged) # {'a': 1,'b':3,'c': 4}
如果有重疊的鍵,第一個字典中的鍵將被覆蓋。在Python 3.9中,合併字典變得更加簡潔。上面Python 3.9中的合併可以重寫為:
merged = dict1 | dict2
8.返回多個值
Python中的函式在沒有字典,列表和類的情況下可以返回多個變數,它的工作方式如下:
defget_user(id): # fetch user from database # .... return name,birthdate name,birthdate =get_user(4)
這是有限的返回值,但任何超過3個值的內容都應放入一個(資料)類。
這8個小技巧足夠你好好消化一陣兒啦!
到此這篇關於經驗豐富程式設計師才知道的8種高階Python技巧的文章就介紹到這了,更多相關程式設計師必知Python技巧內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們!