DNA 스트링에 대하여 써픽스 배열을 구축하는 빠른 알고리즘Fast Construction of Suffix Arrays for DNA Strings
- Other Titles
- Fast Construction of Suffix Arrays for DNA Strings
- Authors
- 조준하; 김남희; 권기룡; 김동규
- Issue Date
- Aug-2007
- Publisher
- 한국정보과학회
- Keywords
- full-text index data structures; suffix arrays; DNA strings; 전체 텍스트 인덱스 자료구조; 써픽스 배열; 써픽스 배열 구축; DNA 스트링
- Citation
- 정보과학회논문지 : 시스템 및 이론, v.34, no.8, pp.319 - 326
- Indexed
- KCI
- Journal Title
- 정보과학회논문지 : 시스템 및 이론
- Volume
- 34
- Number
- 8
- Start Page
- 319
- End Page
- 326
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/179717
- ISSN
- 1229-683X
- Abstract
- 스트링과 같은 대용량의 데이타에 대한 빠른 검색을 수행하기 위해서는 전체 텍스트 인덱스 자료구조를 구축하여 검색하는 방법이 효율적이다. 가장 일반적인 인덱스 자료구조는 써픽스 트리와 써픽스 배열이다. 써픽스 배열은 써픽스 트리보다 적은 공간을 사용하기 때문에 DNA 스트링과 같은 대용량의 데이타에 적합한 자료구조이다. 기존의 써픽스 배열 구축 알고리즘들은 정수 문자집합에 적합한 알고리즘들이어서 DNA 스트링에 적합하지 않았다. 본 논문에서는 DNA 스트링의 문자집합이 4로 고정되어 있는 사실을 이용하여 DNA 스트링에 대한 써픽스 배열을 빠르게 구축하는 방법을 제안한다. 고정길이 문자집합에 효율적인 Kim et. al.[1]의 알고리즘의 인코딩 과정과 합병 과정 개선으로 전체 구축 시간을 향상시켰다. 실험 결과 1.3배에서 1.6배 정도 구축 속도가 향상되었으며, 기존의 다른 써픽스 배열 구축 알고리즘들과 비교한 결과에서도 대부분 가장 빠르게 써픽스 배열을 구축하였다.
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 공과대학 > 서울 융합전자공학부 > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.