Bioinformatics/Rosalind
-
Error Correction in ReadsBioinformatics/Rosalind 2019. 6. 19. 14:45
http://rosalind.info/problems/corr/ ROSALIND | Error Correction in Reads It appears that your browser has JavaScript disabled. Rosalind requires your browser to be JavaScript enabled. Error Correction in Reads solved by 1467 2012년 7월 2일 12:00:00 오전 by Mikhail Dvorkin Topics: Genome Assembly Genome Sequencing Isn't Perfect In “G rosalind.info DNA seq에서 하나의 base에 err가 발생했을때 이를 교정하는 문제이다. 입력된 seque..
-
Finding a Spliced MotifBioinformatics/Rosalind 2019. 6. 19. 14:40
http://rosalind.info/problems/sseq/ ROSALIND | Finding a Spliced Motif It appears that your browser has JavaScript disabled. Rosalind requires your browser to be JavaScript enabled. Finding a Spliced Motif solved by 3298 2012년 7월 13일 12:00:00 오전 by Rosalind Team Topics: String Algorithms Motifs Are Rarely Contiguous In “Findi rosalind.info Bioinformatics Contest 2017의 Qualification Round 3와 사실상 ..
-
k-Mer CompositionBioinformatics/Rosalind 2019. 6. 18. 23:26
http://rosalind.info/problems/kmer/ ROSALIND | k-Mer Composition It appears that your browser has JavaScript disabled. Rosalind requires your browser to be JavaScript enabled. k-Mer Composition solved by 2226 2012년 7월 13일 12:00:00 오전 by Gabriel Valiente Topics: String Algorithms Generalizing GC-Content Figure 1. The 2-m rosalind.info input으로 들어온 fasta파일에 있는 sequence에 k-mer의 각각의 갯수를 세서 사전순서대로 출력해..
-
Completing a TreeBioinformatics/Rosalind 2019. 6. 17. 23:37
http://rosalind.info/problems/tree/ ROSALIND | Completing a Tree It appears that your browser has JavaScript disabled. Rosalind requires your browser to be JavaScript enabled. Completing a Tree solved by 2689 2012년 7월 11일 12:00:00 오전 by Rosalind Team Topics: Graph Algorithms, Phylogeny The Tree of Life Figure 1. A phylo rosalind.info adjacency list를 입력으로 주고 그 리스트들을 하나의 tree로 만들려면 몇개의 최소 edge가 필요..
-
Genome Assembly as Shortest SuperstringBioinformatics/Rosalind 2019. 6. 13. 22:39
http://rosalind.info/problems/long/ Bioinformatics contest 2019의 Final Round의 4번문제인 Minimal Genom이 생각나는 문제였다. Dynamic을 쓸 수 있을것 같아 보이지만 그렇지 않다. 선택이나 그런게 아닌 모든 경우의 수를 생각해야하는 np complete 문제이기 때문이다. from util.read import read_fasta def weld_seq(seq1, seq2): for weld_len in reversed(range(min(len(seq1), len(seq2)))): if seq1[-weld_len:] == seq2[0: weld_len]: return seq1 + seq2[weld_len:] return seq1 ..
-
Independent AllelesBioinformatics/Rosalind 2019. 6. 8. 15:04
http://rosalind.info/problems/lia/ from itertools import combinations from functools import reduce from math import factorial with open('rosalind_lia.txt') as f: data= list(map(lambda x: int(x), f.read().strip().split(' '))) def combi(n, r): return int(factorial(n) / factorial(r) / factorial(n - r)) AaBb_prob= 0.25 total = 2 ** data[0] # result = reduce(lambda a, b: a+b, map(lambda x: len(list(c..
-
Locating Restriction SitesBioinformatics/Rosalind 2019. 3. 4. 22:58
Resctiction enzyme은 유전자 재조합에 핵심적인 기술중 하나이다. restriction enzyme을 이용할 수 있는 restriction site를 찾는 문제이다. 문제에선 길이가 4-12인 restriction site들을 찾으라고 되어있다. restriction site는 upstream과 downstream이 일정 지점을 경계로 대칭으로 놓여있어야 하므로 결국 길이는 2n이어야 한다. 그러므로 4, 6, 8, 10, 12가 된다. from util.read import read_fasta data = read_fasta('rosalind_revp.txt')[0][1] def get_complement(seq): return ''.join(map(lambda base: 'T' if ba..
-
RNA SplicingBioinformatics/Rosalind 2019. 3. 3. 21:34
주어진 dna sequence에서 intron을 제거하고 exon만 남겨서 protein sequence를 구하는 문제이다. 단순하게 dna sequence에서 intron만 제거후 transcript하면 끝이다. from util.read import read_fasta from util.func_tools import DNA_CODON_TABLE from functools import reduce from textwrap import wrap fasta = read_fasta('rosalind_splc.txt') dna_seq = list(map(lambda x: x[1], fasta)) exon = reduce(lambda a,b: a[0:a.find(b)]+a[a.find(b)+len(b):], ..