우편주소정보 추출모듈 개발 및 평가Development and Evaluation of Information Extraction Module for Postal Address Information
- Other Titles
- Development and Evaluation of Information Extraction Module for Postal Address Information
- Authors
- 신현경; 김현석
- Issue Date
- 2019
- Publisher
- 한국창의정보문화학회
- Keywords
- NLP; HMM; Named Entity Recognition; Postal Address Extraction; Information Retrieval; Information Extraction; MUC; NLP; HMM; 명명된 엔티티 인식; 우편 주소 추출; 정보 검색; 정보추출; MUC
- Citation
- 창의정보문화연구, v.5, no.2, pp.145 - 156
- Journal Title
- 창의정보문화연구
- Volume
- 5
- Number
- 2
- Start Page
- 145
- End Page
- 156
- URI
- https://scholarworks.bwise.kr/gachon/handle/2020.sw.gachon/2292
- DOI
- 10.32823/jcic.5.2.201908.145
- ISSN
- 2384-2008
- Abstract
- 본 연구에서는 명명된 실체 인식 기법에 기초한 정보 추출 모듈을 개발하고 평가하였다. 본 논문의 제시된 목적을 위해, 모듈은 사전 지식 없이 임의의 문서에서 우편 주소 정보를 추출하는 문제에 적용하도록 설계되었다. 정보 기술 실무의 관점에서, 우리의 접근방식은 유니그램 기반 키워드 매칭과 비교하여 일반화된 기법인 확률론적 n-gram(바이오그램 또는 트리그램) 방법이라고 말할 수 있다. 모델을 순차적으로 적용하지 않고 문장검출, 토큰화, POS 태그를 재귀적으로 적용하는 것이 우리의 접근법과 자연어 처리에 채택된 전통적인 방법 사이의 주요한 차이점이다. 이 논문에서는 약 2천 개의 문서를 포함한 시험 결과를 제시한다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - 경영대학 > 금융수학과 > 1. Journal Articles
![qrcode](https://api.qrserver.com/v1/create-qr-code/?size=55x55&data=https://scholarworks.bwise.kr/gachon/handle/2020.sw.gachon/2292)
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.