代替for迴圈的方法
為什麼要挑戰自己在程式碼裡不寫for loop?因為這樣可以迫使你去使用比較高階、地道的語法或庫。文中以python為例子,講了不少大家其實在別人的程式碼裡都見過、但自己很少用的語法。
這是一個挑戰。我要你避免在任何情況下寫for迴圈。同樣的,我也要你找到一種場景——除了用for迴圈以外,用其他方法寫都太難。請分享你的發現,我非常想聽到這些
距離我開始探索超棒的Python語言特性已經有一段時間了。一開始,這只是我給自己的一個挑戰,練習使用更多的語言特性來替代我從其他程式語言那裡所學到的。但是事情漸漸變得更有趣了!程式碼不止變得更簡短整潔,而且看起來更加結構化和有規律,在這篇文章中我將更多地介紹這些好處。
首先,讓我們退一步看看在寫一個for迴圈背後的直覺是什麼:
1.遍歷一個序列提取出一些資訊
2.從當前的序列中生成另外的序列
3.寫for迴圈已經是我的第二天性了,因為我是一個程式設計師
幸運的是,Python裡面已經有很棒的工具幫你達到這些目標!你需要做的只是轉變思想,用不同的角度看問題。
不到處寫for迴圈你將會獲得什麼
1.更少的程式碼行數
2.更好的程式碼閱讀性
3.只將縮排用於管理程式碼文字
Let’s see the code skeleton below:
看看下面這段程式碼的構架:
Python
1 2 3 4 5 6 7 |
# 1 with ...: for ...: if ...: try: except: else: |
這個例子使用了多層巢狀的程式碼,這是非常難以閱讀的。我在這段程式碼中發現它無差別使用縮排把管理邏輯(with, try-except)和業務邏輯(for, if)混在一起。如果你遵守只對管理邏輯使用縮排的規範,那麼核心業務邏輯應該立刻脫離出來。
“扁平結構比巢狀結構更好” – 《Python之禪》
為了避免for迴圈,你可以使用這些工具
1. 列表解析/生成器表示式
看一個簡單的例子,這個例子主要是根據一個已經存在的序列編譯一個新序列:
Python
1 2 3 4 |
result = [] for item in item_list: new_item = do_something_with(item) result.append(item) |
如果你喜歡MapReduce,那你可以使用map,或者Python的列表解析:
Python
1 |
result = [do_something_with(item) for item in item_list] |
同樣的,如果你只是想要獲取一個迭代器,你可以使用語法幾乎相通的生成器表示式。(你怎麼能不愛上Python的一致性?)
Python
1 |
result = (do_something_with(item) for item in item_list) |
2. 函式
站在更高階、更函式化的變成方式考慮一下,如果你想對映一個序列到另一個序列,直接呼叫map函式。(也可用列表解析來替代。)
Python
1 |
doubled_list = map(lambda x: x * 2, old_list) |
如果你想使一個序列減少到一個元素,使用reduce
Python
1 2 |
from functools import reduce summation = reduce(lambda x, y: x + y, numbers) |
另外,Python中大量的內嵌功能可/會(我不知道這是好事還是壞事,你選一個,不加這個句子有點難懂)消耗迭代器:
Python
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 |
>>> a = list(range(10)) >>> a [0, 1, 2, 3, 4, 5, 6, 7, 8, 9] >>> all(a) False >>> any(a) True >>> max(a) 9 >>> min(a) 0 >>> list(filter(bool, a)) [1, 2, 3, 4, 5, 6, 7, 8, 9] >>> set(a) {0, 1, 2, 3, 4, 5, 6, 7, 8, 9} >>> dict(zip(a,a)) {0: 0, 1: 1, 2: 2, 3: 3, 4: 4, 5: 5, 6: 6, 7: 7, 8: 8, 9: 9} >>> sorted(a, reverse=True) [9, 8, 7, 6, 5, 4, 3, 2, 1, 0] >>> str(a) '[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]' >>> sum(a) 45 |
3. 抽取函式或者表示式
上面的兩種方法很好地處理了較為簡單的邏輯,那更復雜的邏輯怎麼辦呢?作為一個程式設計師,我們會把困難的事情抽象成函式,這種方式也可以用在這裡。如果你寫下了這種程式碼:
Python
1 2 3 4 5 6 7 |
results = [] for item in item_list: # setups # condition # processing # calculation results.append(result) |
顯然你賦予了一段程式碼太多的責任。為了改進,我建議你這樣做:
Python
1 2 3 4 5 6 7 8 |
def process_item(item): # setups # condition # processing # calculation return result
results = [process_item(item) for item in item_list] |
巢狀的for迴圈怎麼樣?
Python
1 2 3 4 |
results = [] for i in range(10): for j in range(i): results.append((i, j)) |
列表解析可以幫助你:
Python
1 2 3 |
results = [(i, j) for i in range(10) for j in range(i)] |
如果你要儲存很多的內部狀態怎麼辦呢?
Python
1 2 3 4 5 6 7 8 9 |
# finding the max prior to the current item a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8] results = [] current_max = 0 for i in a: current_max = max(i, current_max) results.append(current_max)
# results = [3, 4, 6, 6, 6, 9, 9, 9, 9, 9] |
讓我們提取一個表示式來實現這些:
Python
1 2 3 4 5 6 7 8 |
def max_generator(numbers): current_max = 0 for i in numbers: current_max = max(i, current_max) yield current_max
a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8] results = list(max_generator(a)) |
“等等,你剛剛在那個函式的表示式中使用了一個for迴圈,這是欺騙!”
好吧,自作聰明的傢伙,試試下面的這個。
4. 你自己不要寫for迴圈,itertools會為你代勞
這個模組真是妙。我相信這個模組能覆蓋80%你想寫下for迴圈的時候。例如,上一個例子可以這樣改寫:
Python
1 2 3 |
from itertools import accumulate a = [3, 4, 6, 2, 1, 9, 0, 7, 5, 8] resutls = list(accumulate(a, max)) |
另外,如果你在迭代組合的序列,還有product(),permutations(),combinations()可以用。
結論
1.大多數情況下是不需要寫for迴圈的。
2.應該避免使用for迴圈,這樣會使得程式碼有更好的閱讀性。
行動
1.再看一遍你的程式碼,找出任何以前憑直覺寫下for迴圈的地方,再次思考一下,不用for迴圈再寫一遍是不是有意義的。
2.分享你很難不使用for迴圈的例子。