Bioinformatics/Rosalind
-
Calculating Protein MassBioinformatics/Rosalind 2019. 3. 2. 23:50
단백질의 질량을 구하는 문제이다. 원래 아미노산이 펩타이드 결합을하면서 물이 빠져나가 단백질이되면 그것을 고려해줘야하지만 설명에서 we avoid the complication of having to distinguish between residues and non-residues by only considering peptides excised from the middle of the protein.이라고 되어있으므로 그냥 단순히 더하면 된다. from functools import reduce MASS_TABLE = {'A': 71.03711, 'C': 103.00919, 'D': 115.02694, 'E': 129.04259, 'F': 147.06841, 'G': 57.02146, 'H': 137...
-
Open Reading FramesBioinformatics/Rosalind 2019. 3. 2. 00:30
http://rosalind.info/problems/orf/ORF를 찾는 문제. Open Reading Frame은 개시코돈으로 시작하고 종결코돈으로 끝나는 seqence이다. 물론 triplet codon이어야하므로 ATGATAA같은경우는 ORF에 해당하지 않는다. regex를 사용하면 간단하지만 겹쳐있는경우는 찾기가 어려워 그냥 dna sequence의 sub sequence들에서 전부 찾았다. from util.read import read_fasta from textwrap import wrap import re from util.func_tools import DNA_CODON_TABLE seq = read_fasta('rosalind_orf.txt')[0][1] complement = ''...
-