1. 程式人生 > 其它 >python的數學函式(1)-python組合函式模組itertools

python的數學函式(1)-python組合函式模組itertools

要解決的問題: 輸出n個 ['A','T','C','G'] 所有的排列組合。 比如n=2 時,輸出為 AA,AT,AC,AG,TA,TT,TC,TG,……………… n=3時,輸出為 AAA,AAT,AAC,AAG,ATA,ATT,ATC,ATG,…………………… 解法1 :傳統的map reduce函式 map(func,seq1[,seq2...]):將函式func作用於給定序列的每個元素,並用一個列表來提供返回值;如果func為None,func表現為身份函式,返回一個含有每個序列中元素集合的n個元組的列表。 reduce(func,seq[,init]):func為二元函式,將func作用於seq序列的元素,每次攜帶一對(先前的結果以及下一個序列的元素),連續的將現有的結果和下一個值作用在獲得的隨後的結果上,最後減少我們的序列為一個單一的返回值:如果初始值init給定,第一個比較會是init和第一個序列元素而不是序列的頭兩個元素。 filter(bool_func,seq):此函式的功能相當於過濾器。呼叫一個布林函式bool_func來迭代遍歷每個seq中的元素;返回一個使bool_seq返回值為true的元素的序列。 用map reduce解此題:

def sequence(n):
base=['A','T','C','G']
print reduce(lambda x,y:[(a+b) for a in x for b in y],map(lambda x:[x]*n,[base])[0])
print sequence(4)

這是發帖人自己的一個實現 [(a+b) for a in x for b in y] 產生一個笛卡爾積 map(lambda x:[x]*n,[base])[0] 其實等價於 [base]*4,寫法太費解 reduce原始碼:

def reduce(bin_func,seq,initial=None):
lseq = list(seq)
if initial is None:
res = lseq.pop(0)
else:
res = initial
for eachItem in lseq:
res = bin_func(res,eachItem)
return res

解法2 :itertools組合函式 import itertools # python 3 or use __future__ print([''.join(x) for x in itertools.product('ATCG', repeat=4)] product(A, B) 等價於 ((x,y) for x in A for y in B). product(A, repeat=4) 等價於 product(A, A, A, A).