-
Burrows-Wheeler Transform (버로우스-휠러 변환)Bioinformatics 2019. 8. 2. 23:58
BWT는 bzip2에서 사용되는 알고리즘 중 하나이다. 비슷한 단어(패턴)이 많다는 점에 착안하여 그것들을 모음으로써 run length encoding을 사용할 수 있게끔 해준다.
예를들어 'very_very_very_very_long'이라는 문장에 BWT를 적용한다면 'gyyyyvvvvn_oleeee___$rrrr'가 되며 run length encoding을 적용하게 되면 'g4y4vn_ol4e3_$4r'이 된다.
변환 과정은
버로우즈-휠러 변환 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전.
ko.wikipedia.org
를 참고하기 바란다.
'Bioinformatics' 카테고리의 다른 글
Pigeonhole Principle for Approximate Sequence Matching (0) 2019.06.23 Bioinformatics 문제에 대해서 (0) 2019.03.03 댓글