1. 程式人生 > 其它 >開啟Python列表解析式的正確使用方式

開啟Python列表解析式的正確使用方式

Python 是一種極其多樣化和強大的程式語言!當需要解決一個問題時,它有著不同的方法。在本文中,將會展示列表解析式

(List Comprehension)。我們將討論如何使用它?什麼時候該或不該使用它?

列表解析式的優勢

•比迴圈更節省時間和空間。

•需要更少的程式碼行。

•可將迭代語句轉換為公式。

如何在 Python 中建立列表

列表解析式是一種基於現有列表建立列表的語法結構。讓我們來看看建立列表的不同實現

迴圈

迴圈是建立列表的傳統方式。不管你使用什麼樣的迴圈。要以這種方式建立列表,您應該:

1.例項化一個空列表。

2.迴圈遍歷一個可迭代的(如 range)的元素。

3.將每個元素附加到列表的末尾。

Python學習交流Q群:906715085###
numbers = []
for number in range(10):
    numbers.append(number)
    
print(numbers)

 

輸出:

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

 

在此示例中,您例項化了一個空列表 numbers。然後使用 for 迴圈迭代 range(10) 並使用 append() 方法將每個數字附加到列表的

末尾。

map() 物件

map() 是建立列表的另一種方法。您需要向 map() 傳遞一個函式和一個可迭代物件,之後它會建立一個物件。該物件包含使用指

定函式執行每個迭代元素所獲得的輸出。

例如,我們將呈現在某些產品的價格中增加增值稅的任務。

VAT_PERCENT = 0.1  # 10%
def add_vat(price):
    return price + (price * VAT_PERCENT)
Python學習交流Q群:906715085###
prices = [10.03, 8.6, 32.85, 41.5, 22.64]
grand_prices = map(add_vat, prices)
print(grand_prices)
grand_prices = list(grand_prices)
print(grand_prices)

 

您已經構建了 add_vat() 函式並建立了 prices 可迭代物件。您將這兩個引數都傳遞給 map() 並收集生成的 map 物件

grand_prices,或者您可以使用 list() 輕鬆地將其轉換為列表。

輸出:

<map object at 0x7f18721e7400>  # map(add_vat, prices)
[11.03, 9.46, 36.14, 45.65, 24.9]  # list(grand_prices)

 

列表解析式

現在,讓我們看一下列表解析式方法!這確實是 Python 風格,並且是建立列表的更好方法。為了弄清楚這種方法有多強大,我們用一個單行程式碼來重寫那個迴圈示例。

numbers = [number for number in range(10)]
print(numbers)

 

輸出

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

 

正如您所見,這是一種不可思議的方法!列表解析式看起來足夠可讀,您不需要編寫更多程式碼,而只需一行。

為了更好地理解列表,請檢視以下語法格式:

new_list = [expression for member in iterable]

 

哪種方法更有效

好的,我們已經學習瞭如何使用迴圈、map() 和列表解析式來建立列表,在您的腦海中可能會提出“哪種方法更有效”的問題。我們來分析一下吧!

import random
import timeit
VAT_PERCENT = 0.1
PRICES = [random.randrange(100) for x in range(100000)]
def add_vat(price):
    return price + (price * VAT_PERCENT)
    
def get_grand_prices_with_map():
    return list(map(add_vat, PRICES))
    
def get_grand_prices_with_comprehension():
    return [add_vat(price) for price in PRICES]

 

Python學習交流Q群:906715085###
def get_grand_prices_with_loop():
    grand_prices = []
    for price in PRICES:
        grand_prices.append(add_vat(price))
    return grand_prices
print(timeit.timeit(get_grand_prices_with_map, number=100))
print(timeit.timeit(add_grand_prices_with_comprehension, number=100))
print(timeit.timeit(get_grand_prices_with_loop, number=100))

 

輸出:

0.9833468980004909  # with_map
1.197223742999995   # with_comprehension
1.3564663889992516  # with_loop

 

正如我們現在所看到的,建立列表的最優的方法是 map(),排在第二位的是列表解析式,最後是迴圈。

但是,方法的選擇應取決於您想要實現的目標。

•使用 map() 可以使你的程式碼更高效。

•使用迴圈可以使程式碼的思路展現更加清晰。

•使用列表解析式可以您使程式碼更加緊湊,且較高效。這是建立列表的最佳方式,因為這種方式可讀性最強。

高階解析式

條件邏輯

早些時候,我向您展示了這個公式:

new_list = [expression for member in iterable]

 

公式可能有些不完整。對解析式的更加完整描述增加了對可選條件的支援。將條件邏輯新增到列表解析式的最常見方法是在表示式的末尾新增條件:

new_list = [expression for member in iterable (if conditional)]

 

在這裡,您的條件語句正好位於右邊的括號中。

條件很重要,因為它們允許列表解析式過濾掉不需要的值,這在一般情況下也可以呼叫 filter():

numbers = [number for number in range(20) if number % 2 == 0]
print(numbers)

 

輸出:

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

 

正如您所看到的那樣,這個解析式收集了可被 2 整除且沒有餘數的數字。

如果您需要更復雜的過濾器,那麼您甚至可以將條件邏輯移動到單獨的函式中。

def is_prime(number):
    if number > 1:
        for el in range(2, int(number/2)+1):
            if (number % el) == 0:
                return False 
        else:
            return True
          
numbers = [number for number in range(20) if is_prime(number)]
print(numbers)

 

輸出:

[2, 3, 5, 7, 11, 13, 17, 19]

 

您構建 is_prime(number) 以確定是否是素數並返回布林值。接下來,您應該將函式新增到解析式的條件中。

該公式允許您使用條件邏輯從幾個可能的輸出選項中進行選擇。例如,您有一個產品價格表,若有負數,您應將其轉換為正數:

price_list = [1.34, 19.01, -4.2, 6, 8.78, -1,1]
normalized_price_list = [price if price > 0 else price*-1 for price in price_list]
print(normalized_price_list)

 

輸出:

[1.34, 19.01, 4.2, 6, 8.78, 1,1]

 

在這裡,您的表示式 price 有一個條件語句,如果 price > 0 else price*-1。這會告訴 Python,如果價格為正,則輸出價格值;但如果價格為負,則將價格轉換為正值。該功能很強大,考慮將條件邏輯視為其自身的函式的確是很有用的:

def normalize_price(price):
    return price if price > 0 else price*-1
    
price_list = [1.34, 19.01, -4.2, 6, 8.78, -1,1]
normalized_price_list = [normalize_price(price) for price in price_list]
print(normalized_price_list)

 

輸出:

[1.34, 19.01, 4.2, 6, 8.78, 1,1]

 

集合解析式

您還可以建立一個集合解析式!它基本與列表解析式相同。不同之處在於集合解析式不包含重複項。您可以通過使用花括號取代方括號來建立集合解析式:

string = "Excellent"
unique_string = {letter for letter in string}
print(unique_string)

 

輸出:

{"E", "e", "n", "t", "x", "c", "l"}

 

你的集合解析式只包含唯一的字母。這與列表不同,集合不保證專案將以特定順序儲存資料。這就是為什麼集合輸出的第二個字母是 e,即使字串中的第二個字母是 x。

字典解析式

字典解析式也是是類似的,但需要定義一個鍵:

string = "Words are but wind"
word_order = {el: ind+1 for ind, el in enumerate(string.split())}
print(word_order)

 

輸出:

{"Words": 1, "are": 2, "but": 3, "wind": 4}

 

要建立 word_order 字典,請在表示式中使用花括號 ({}) 以及鍵值對 (el: ind+1)。

海象運算子

Python 3.8 中引入的海象運算子允許您一次解決兩個問題:為變數賦值,返回該值。

假設您需要對將返回溫度資料的 API 應用十次。您想要的只是 100 華氏度以上的結果。而每個請求可能都會返回不同的資料。在

這種情況下,沒有辦法在 Python 中使用列表解析式來解決問題。可迭代成員(如果有條件)的公式表示式無法讓條件將資料分配

給表示式可以訪問的變數。

海象運算子解決了這個問題。它允許您在執行表示式的同時將輸出值分配給變數。以下示例顯示了這是如何實現的,使用

get_weather_data() 生成偽天氣資料:

import random
def get_weather_data():
    return random.randrange(90, 110)
hot_temps = [temp for item in range(20) if (temp := get_weather_data()) >= 100]
print(hot_temps)

 

輸出:

[108, 100, 106, 103, 108, 106, 103, 104, 109, 106]

 

什麼時候不要使用解析式

列表解析式非常有用,它可以幫助您編寫清晰且易於閱讀和除錯的程式碼。但在某些情況下,它們可能會使您的程式碼執行速度變慢

或使用更多記憶體。如果它讓您的程式碼效率更低或更難理解,那麼可以考慮選擇另一種方式。

注意巢狀的解析式

可以通過巢狀解析式以建立列表、字典和集合的組合集合(譯者注:這個集合不是指 set 物件型別,而是 collection,泛指容

器)。例如,假設一家公司正在跟蹤一年中五個不同城市的收入。儲存這些資料的完美資料結構可以是巢狀在字典解析式中的列

表解析式。

cities = ['New York', 'Oklahoma', 'Toronto', 'Los Angeles', 'Miami']
budgets = {city: [0 for x in range(12)] for city in cities}
print(budgets)

 

輸出:

{
    "NewYork": [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "Oklahoma": [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "Toronto": [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "LosAngeles": [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0],
    "Miami": [0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0]
}

 

您使用字典解析式建立了 budgets 容器。該表示式是一個鍵值對,其中包含另一個解析式。此程式碼將快速生成城市中每個 city 的

資料列表。

巢狀列表是建立矩陣的常用方法,通常用於數學目的。檢視下面的程式碼塊:

matrix = [[x for x in range(7)] for y in range(6)]
print(matrix)

 

輸出:

[
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6],
    [0, 1, 2, 3, 4, 5, 6]
]

 

外部列表解析式 [… for y in range(6)] 建立了六行,而內部列表解析式 [x for x in range(7)] 將用值填充這些行中的每一行。

到目前為止,每個巢狀解析式的目標都是真正且直觀的。但是,還有一些其他情況,例如建立扁平化的巢狀列表,其中的邏輯可

以使您的程式碼非常難以閱讀。讓我們看下面的例子,使用巢狀列表解析式來展平一個矩陣:

matrix = [
    [0, 1, 0],
    [1, 0, 1],
    [2, 1, 2],
]
flat = [num for row in matrix for num in row]
print(flat)

 

輸出:

[0, 1, 0, 1, 0, 1, 2, 1, 2]

 

扁平化矩陣的程式碼確實很簡潔,但是太難理解了,您應該花點時間弄清楚它是如何工作的。另一方面,如果您使用 for 迴圈來展

平相同的矩陣,那麼您的程式碼將更加簡單易讀:

matrix = [
    [0, 1, 0],
    [1, 0, 1],
    [2, 1, 2],
]
flat = []
for row in matrix:
    for num in row:
        flat.append(num)
print(flat)

 

輸出:

[0, 1, 0, 1, 0, 1, 2, 1, 2]

 

現在,您可以看到程式碼一次遍歷矩陣的一行,在移動到下一行之前取出該行中的所有元素。

雖然巢狀列表解析式可能看起來更具有 Python 風格,但對於能夠編寫出您的團隊可以輕鬆理解和修改的程式碼來才是更加最重要

的。當選擇一個方法時,您應該根據解析式是有助於還是有損於可讀性來做出相應的判斷。

為大型資料集使用生成器

Python 中的列表解析式通過將整個列表儲存到記憶體中來工作。對於小型至中型列表這通常很好。如果您想將前一千個整數相加,

那麼列表解析式將輕鬆地解決此任務:

summary = sum([x for x in range(1000)])
print(summary)

 

輸出:499500

但是,如果您需要對十億個數字求和呢?您可以嘗試執行此操作,但您的計算機可能不會有響應。這是可能因為計算機中分配大量記憶體。也許您是因為計算機沒有如此多的記憶體資源。

例如,你想要一些第一個十億整數,那麼讓我們使用生成器!這可能多需要一些時間,但計算機應該可以克服它:

summary = sum((x for x in range(1000000000)))
print(summary)

 

輸出:

499999999500000000

讓我們來對比一下哪種方法是更優的!

import timeit
def get_sum_with_map():
    return sum(map(lambda x: x, range(1000000000)))
def get_sum_with_generator():
    return sum((x for x in range(1000000000)))
print(timeit.timeit(get_sum_with_map, number=100))
print(timeit.timeit(get_sum_with_generator, number=100))

 

輸出:

4940.844053814  # get_sum_with_map
3464.1995523349997  # get_sum_with_generator

 

正如您所見,生成器比 map() 高效得多。

總結

本文向您介紹了列表解析式,以及如何使用它來解決複雜的任務,而不會使您的程式碼變得過於困難。

現在你:

•學習了幾種建立列表的替代方法。

•找出每種方法的優點。

•可以簡化迴圈和 map() 呼叫列表解析式。

•理解了一種將條件邏輯新增到解析式中的方法。

•可以建立集合和字典解析式。

•學會了何時不使用解析式。

今天分享的列表解析式學會了嗎?文章特別長,看起來也很枯燥吧,不過能堅持到最後的一定都棒極了。