전자문서에서 서식인식과 광학문자인식을 이용한 개인정보 탐지 및 보호 시스템A Personal Information Security System using Form Recognition and Optical Character Recognition in Electronic Documents
- Other Titles
- A Personal Information Security System using Form Recognition and Optical Character Recognition in Electronic Documents
- Authors
- 백종경; 지윤석; 박재표
- Issue Date
- May-2020
- Publisher
- 한국산학기술학회
- Keywords
- Classification; OCR; Image Correction; Personal Information; Security
- Citation
- 한국산학기술학회논문지, v.21, no.5, pp.451 - 457
- Journal Title
- 한국산학기술학회논문지
- Volume
- 21
- Number
- 5
- Start Page
- 451
- End Page
- 457
- URI
- http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/36935
- DOI
- 10.5762/KAIS.2020.21.5.451
- ISSN
- 1975-4701
- Abstract
- 전자문서에서 개인정보를 보호하기 위한 방법으로 서식 인식과 광학 문자 인식 기법이 많이 이용되고 있으나 OCR 엔진의 저조한 인식률로 인해서 개인정보를 탐지하지 못하거나 오탐이 많이 발생하고 있고 또한 대량의 전자문서를 분석하는데도 오랜 시간이 걸린다. 본 논문에서는 기존의 방법을 개선하여 전자문서의 이미지 분석 속도와 OCR엔진의 글자 인식률, 그리고 개인정보의 탐지율을 향상할 수 있는 방안을 제시한다. 서식 인식 방법을 이용하여 분석 속도를 높이고, 이미지 보정을 통해 OCR 엔진 분석 속도 및 글자 인식률을 향상한다. 이미지에서의 개인정보 분석 알고리즘을 제안하여 개인정보의 탐지율을 높였다. 실험을 통하여 이미지 서식 인식 시료 1755개를 분석하여 평균 0.24초가 소요되어 기존의 PAID 시스템 서식 인식 방안보다 0.5초 향상되었으며 이미지 서식 인식률은 평균 99%를 기록하였다. 본 논문에서 제안한 방법은 전자문서에서 개인정보를 보호할 수 있는 시스템으로서 공공, 통신사, 금융, 관광, 보안 등 여러 분야에서 활용할 수 있을 것이다.
- Files in This Item
- There are no files associated with this item.
- Appears in
Collections - ETC > 1. Journal Articles
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.