要解決的問題:
輸出n個 ['A','T','C','G'] 所有的排列組合。
比如n=2 時,輸出為 AA,AT,AC,AG,TA,TT,TC,TG,………………
n=3時,輸出為 AAA,AAT,AAC,AAG,ATA,ATT,ATC,ATG,……………………
解法1 :傳統的map reduce函數
map(func,seq1[,seq2...]):將函數func作用於給定序列的每個元素,並用一個列表來提供傳回值;如果func為None,func表現為身份函數,返回一個含有每個序列中元素集合的n個元組的列表。
reduce(func,seq[,init]):func為二元函數,將func作用於seq序列的元素,每次攜帶一對(先前的結果以及下一個序列的元素),連續的將現有的結果和下一個值作用在獲得的隨後的結果上,最後減少我們的序列為一個單一的傳回值:如果初始值init給定,第一個比較會是init和第一個序列元素而不是序列的頭兩個元素。
filter(bool_func,seq):此函數的功能相當於過濾器。調用一個布爾函數bool_func來迭代遍曆每個seq中的元素;返回一個使bool_seq傳回值為true的元素的序列。
用map reduce解此題:
def sequence(n):
base=['A','T','C','G']
print reduce(lambda x,y:[(a+b) for a in x for b in y],map(lambda x:[x]*n,[base])[0])
print sequence(4)
這是發帖人自己的一個實現
[(a+b) for a in x for b in y] 產生一個笛卡爾積
map(lambda x:[x]*n,[base])[0] 其實等價於 [base]*4,寫法太費解
reduce源碼:
def reduce(bin_func,seq,initial=None):
lseq = list(seq)
if initial is None:
res = lseq.pop(0)
else:
res = initial
for eachItem in lseq:
res = bin_func(res,eachItem)
return res
解法2 :itertools組合函數
import itertools
# python 3 or use __future__
print([''.join(x) for x in itertools.product('ATCG', repeat=4)]
product(A, B) 等價於 ((x,y) for x in A for y in B).
product(A, repeat=4) 等價於 product(A, A, A, A).