Detailed Information

Cited 0 time in webofscience Cited 0 time in scopus
Metadata Downloads

웹 검색엔진 및 딥러닝 기반 한글 단어 인식 OCR 시스템

Full metadata record
DC Field Value Language
dc.contributor.author장혁수-
dc.contributor.author고상호-
dc.contributor.author이재현-
dc.contributor.author박승권-
dc.date.accessioned2023-10-04T06:54:01Z-
dc.date.available2023-10-04T06:54:01Z-
dc.date.issued2023-09-
dc.identifier.issn1226-4717-
dc.identifier.issn2287-3880-
dc.identifier.urihttps://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/191663-
dc.description.abstractOptical character recognition (OCR)은 이미지 내의 텍스트를 인식하여 이를 텍스트 데이터로 변환하는 기술이다. 외국에서는 OCR로 문서 처리를 자동화하여 비용과 시간을 절약하는 데 활용되고 있다. 그러나 한국에서는 한글의 언어적 특성 때문에 영어와 숫자에 비해 인식률이 낮아, OCR이 적극적으로 사용되지 않고 있다. 따라서OCR의 한글 인식 정확도가 향상되면 한국에서도 OCR을 통한 업무 효율성 증가를 기대할 수 있다. 본 논문에서는 convolutional neural network (CNN)을 이용해 한글, 영어 및 숫자를 훈련시켰다. 이를 기반으로 문자가 복합적으로 구성된 단어에서 한글의 완성형 글자를 구분해 인식하고, 인식된 단어를 검색엔진에 검색 후 수정된 검색어가 존재하면 이를 최종 결과물로 출력해 인식 정확도를 향상시키는 시스템을 구현하였다. 인식률 측정 결과 한글, 영어 및 숫자가 복합적으로 구성된 영수증에서 최대 90.1%의 문자 인식률이 확인되었다.-
dc.description.abstractOptical character recognition (OCR) is the technology that recognizes text in an image and converts it into text data. In foreign countries, OCR enables automated document processing. Since the recognition rate of Hangul is lower than that of English and Numbers, the OCR is not widely used in Korea. If the OCR accuracy of Hangul is improved, we expect an increase in work efficiency through OCR in Korea as well. In this paper, the OCR system was based on the convolutional neural network (CNN) to train Hangul, English, and Numbers. Subsequently, the process was implemented that distinguishes the complex words to complete Hangul characters, recognizes the complete Hangul characters, and converts them into text data. Additionally, to further improve the accuracy of the OCR system, search the text data in a web search engine, and verify the existence of modified words. If a modified word is found in the web search results, it is considered the correct recognition result and included in the final text data. We conducted a recognition rate measurement and found that the OCR system was able to accurately recognize up to 90.1% of characters in documents containing Hangul, English, and Numbers.-
dc.format.extent6-
dc.language한국어-
dc.language.isoKOR-
dc.publisher한국통신학회-
dc.title웹 검색엔진 및 딥러닝 기반 한글 단어 인식 OCR 시스템-
dc.title.alternativeThe Deep Learning-Based OCR System for Korean Word with Web Search Engine-
dc.typeArticle-
dc.publisher.location대한민국-
dc.identifier.doi10.7840/kics.2023.48.9.1169-
dc.identifier.scopusid2-s2.0-85189150656-
dc.identifier.bibliographicCitation한국통신학회논문지, v.48, no.9, pp 1169 - 1174-
dc.citation.title한국통신학회논문지-
dc.citation.volume48-
dc.citation.number9-
dc.citation.startPage1169-
dc.citation.endPage1174-
dc.identifier.kciidART002997135-
dc.description.isOpenAccessN-
dc.description.journalRegisteredClasskci-
dc.subject.keywordAuthor광학 문자 인식-
dc.subject.keywordAuthor딥러닝-
dc.subject.keywordAuthor합성곱 신경망-
dc.subject.keywordAuthor한글 단어 인식-
dc.subject.keywordAuthor단어 분리-
dc.subject.keywordAuthorOCR-
dc.subject.keywordAuthorDeep Learning-
dc.subject.keywordAuthorCNN-
dc.subject.keywordAuthorKorean Word Recognition-
dc.subject.keywordAuthorWord Segmentation-
dc.identifier.urlhttps://www.dbpia.co.kr/journal/articleDetail?nodeId=NODE11520203&language=ko_KR&hasTopBanner=true-
Files in This Item
Go to Link
Appears in
Collections
서울 공과대학 > 서울 융합전자공학부 > 1. Journal Articles

qrcode

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.

Related Researcher

Researcher Park, Sung kwon photo

Park, Sung kwon
COLLEGE OF ENGINEERING (SCHOOL OF ELECTRONIC ENGINEERING)
Read more

Altmetrics

Total Views & Downloads

BROWSE