온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드인식을 위한 딥러닝 훈련 데이터 자동 생성 방안
DC Field | Value | Language |
---|---|---|
dc.contributor.author | 김기태 | - |
dc.contributor.author | 오원석 | - |
dc.contributor.author | 임근원 | - |
dc.contributor.author | 차은우 | - |
dc.contributor.author | 신민영 | - |
dc.contributor.author | 김종우 | - |
dc.date.accessioned | 2021-08-02T13:52:10Z | - |
dc.date.available | 2021-08-02T13:52:10Z | - |
dc.date.created | 2021-05-13 | - |
dc.date.issued | 2018-03 | - |
dc.identifier.issn | 2288-4866 | - |
dc.identifier.uri | https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/17718 | - |
dc.description.abstract | E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 ‘훈련 데이터 자동 생성 프로그램’을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다. | - |
dc.language | 한국어 | - |
dc.language.iso | ko | - |
dc.publisher | 한국지능정보시스템학회 | - |
dc.title | 온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 | - |
dc.title.alternative | The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce | - |
dc.type | Article | - |
dc.contributor.affiliatedAuthor | 김종우 | - |
dc.identifier.doi | 10.13088/jiis.2018.24.1.001 | - |
dc.identifier.bibliographicCitation | 지능정보연구, v.24, no.1, pp.1 - 23 | - |
dc.relation.isPartOf | 지능정보연구 | - |
dc.citation.title | 지능정보연구 | - |
dc.citation.volume | 24 | - |
dc.citation.number | 1 | - |
dc.citation.startPage | 1 | - |
dc.citation.endPage | 23 | - |
dc.type.rims | ART | - |
dc.identifier.kciid | ART002331445 | - |
dc.description.journalClass | 2 | - |
dc.description.isOpenAccess | N | - |
dc.description.journalRegisteredClass | kci | - |
dc.subject.keywordAuthor | Deep learning | - |
dc.subject.keywordAuthor | train data generation | - |
dc.subject.keywordAuthor | OCR | - |
dc.subject.keywordAuthor | attribute-based search | - |
dc.subject.keywordAuthor | Single Shot MultiBox Detector | - |
dc.subject.keywordAuthor | 딥러닝 | - |
dc.subject.keywordAuthor | 훈련데이터 생성 | - |
dc.subject.keywordAuthor | OCR | - |
dc.subject.keywordAuthor | 속성 기반 검색 | - |
dc.subject.keywordAuthor | Single Shot MultiBox Detector | - |
dc.identifier.url | http://koreascience.or.kr/article/JAKO201810852361472.page | - |
Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.
222, Wangsimni-ro, Seongdong-gu, Seoul, 04763, Korea+82-2-2220-1365
COPYRIGHT © 2021 HANYANG UNIVERSITY.
Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.