Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

자연어처리 기반 바이오 텍스트 마이닝 시스템A Bio-Text Mining System Based on Natural Language Processing

Other Titles
A Bio-Text Mining System Based on Natural Language Processing
Authors
박경미황규백
Issue Date
Apr-2011
Publisher
한국정보과학회
Keywords
바이오 텍스트 마이닝; 개체명 인식; 관계 추출; 자연언어처리; 품사 부착; 기본구 인식; 구문 분석; 술어-논항 인식; Bio-text mining; named-entity recognition; relation extraction; natural language processing; POS tagging; base phrase recognition; parsing; predicate-argument recognition
Citation
정보과학회 컴퓨팅의 실제 논문지, v.17, no.4, pp.205 - 213
Journal Title
정보과학회 컴퓨팅의 실제 논문지
Volume
17
Number
4
Start Page
205
End Page
213
URI
http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/13789
ISSN
2383-6318
Abstract
바이오 분야에는 개체 간의 관계에 대한 정보를 얻을 수 있는 방대한 양의 연구 문헌들이 데이터베이스 형태로 저장되어 있다. 그러나, 컴퓨터에 의한 연구 문헌들에 대한 접근에 많은 문제를 겪고 있기 때문에 이처럼 방대한 자료에서 원하는 정보를 효율적으로 찾는 것은 어려운 일이다. 본 논문은 바이오 텍스트로부터 생의학 상호 작용 정보를 자동으로 추출하는 방법을 제안하고 이를 구현한 결과를 제시한다. 제안된 방법은 최대 엔트로피 모형을 사용하여 단백질, 유전자와 같은 바이오 개체명을 인식하고, 그 다음 단계에서 확인된 개체명들 중 INTERACTION 또는 NO-INTERACTION 클래스를 적용하여 상호 작용이 존재하는 개체쌍을 추출한다. 이때 품사 부착, 기본구 인식, 구문 분석, 술어-논항 인식과 같은 자연언어 분석 결과로부터 유용한 정보를 추출하여 사용한다. 특히, 심층 자연언어 분석을 통해 개체명을 논항으로 갖는 동사가 ‘촉진하다(activate)’, ‘억제하다(inhibit)’, ‘감소시키다(diminish)’처럼 상호 작용을 표현하는 동사인지 확인하는 것은 유용하다. 실제 바이오 관련 문헌에 대한 실험을 통해, 자연언어 분석이 바이오 텍스트 마이닝에 기여하는 정도를 보인다. 제안하는 방법은 철자적 특성, 개체명을 구성하는 단어들, 개체명 주변의 문맥 등의 어휘 정보를 사용하는 베이스라인 시스템보다 F1 척도 기준 약 1.4%의 성능 향상을 보이는데, 이는 자연언어 분석을 통해 개체명 주변의 외부 문맥을 효과적으로 사용한 것에 기인한다. 또한, 제안하는 학습 기반 방법이 관계 추출에서 공기 기반 방법과 규칙 기반 방법보다 우수한 성능을 낼 수 있음을 보인다.
Files in This Item
Go to Link
Appears in
Collections
College of Information Technology > School of Computer Science and Engineering > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Hwang, Kyu Baek photo

Hwang, Kyu Baek
College of Information Technology (School of Computer Science and Engineering)
Read more

Altmetrics

Total Views & Downloads

BROWSE