SparQLing : SparkSQL 기반 대용량 트리플 데이터를 위한 SPARQL 질의 시스템 구축

전명중; 홍진영; 박영택

Detailed Information

Cited 0 time in webofscience

Cited 0 time in scopus

Metadata Downloads

SparQLing : SparkSQL 기반 대용량 트리플 데이터를 위한 SPARQL 질의 시스템 구축SPARQL Query Processing System over Scalable Triple Data using SparkSQL Framework

Other Titles: SPARQL Query Processing System over Scalable Triple Data using SparkSQL Framework

Authors: 전명중; 홍진영; 박영택

Issue Date: Apr-2016

Publisher: 한국정보과학회

Keywords: 인메모리 기반 분산 질의 엔진; RDFS; SPARQL; Spark; SparkSQL; Sempala; in-memory based distributed query engine; RDFS; SPARQL; spark; SparkSQL; sempala

Citation: 정보과학회논문지, v.43, no.4, pp.450 - 459

Journal Title: 정보과학회논문지

Volume: 43

Number: 4

Start Page: 450

End Page: 459

URI: http://scholarworks.bwise.kr/ssu/handle/2018.sw.ssu/8044

ISSN: 2383-630X

Abstract: 매년 RDFS 데이터는 대용량화 되어 가며, 빠른 질의를 위한 SPARQL 처리방식에 대한 변화가 필요하게 되었다. 이를 위해 대용량 분산 처리 프레임워크를 활용한 SPARQL의 질의 처리방식이 많이연구되고 있다. 기존의 연구 중 대용량 분산 처리 프레임워크인 Hadoop(MapReduce) 기반 질의 엔진은반복적인 작업으로 인한 잦은 I/O 발생으로 실시간 질의 처리가 불가능하며, 인메모리 기반 분산 질의 엔진 역시 낮은 단계의 언어 수준에서 분산 구조를 고려한 구현이 필요하기 때문에 질의 엔진 구축이 어렵다. 본 논문에서는 인메모리 기반 분산 질의 처리 프레임워크인 SparkSQL을 활용하여 대용량 트리플 데이터에 대한 SPARQL 질의문 처리 속도를 향상시킬 수 있는 질의 처리 엔진 구축 방법을 제안한다. SparkSQL 은 Spark 기반의 고수준 분산 질의 엔진으로서 기존의 SQL문을 활용한 질의가 가능하다. 따라서 SPARQL 질의문을 처리하기 위해서는 Jena를 이용하여 Algebra Tree를 생성한 후 이를 Spark 시스템에 적용하기 위한 Spark Algebra Tree로 변환해야 한다. 그리고 이를 이용하여 SparkSQL 질의문을생성하는 시스템을 구축하였다. 또한 Spark 인메모리 시스템에서 보다 효율적인 질의 처리를 위한DataFrame기반의 트리플 Property 테이블 설계를 제안하고 SparkSQL 프레임워크에 활용하였다. 마지막으로 기존의 분산처리 프레임워크를 사용한 질의 엔진과 비교 평가를 통하여 연구의 타당성을 검증한다.

Files in This Item: Go to Link

Appears in Collections: College of Information Technology > School of Computer Science and Engineering > 1. Journal Articles

Show full item record

qrcode

Related Researcher

Researcher PARK, YOUNG TACK photo

PARK, YOUNG TACK

Read more

Altmetrics

Total Views & Downloads

STATISTICS: Total View :8,352,786; Today View :974

RSS_1.0 RSS_2.0 ATOM_1.0

Soongsil University Library 369 Sangdo-Ro, Dongjak-Gu, Seoul, Korea (06978)02-820-0733

Certain data included herein are derived from the © Web of Science of Clarivate Analytics. All rights reserved.
You may not copy or re-distribute this material in whole or in part without the prior written consent of Clarivate Analytics.

Detailed Information

Related Researcher

Altmetrics

Total Views & Downloads

BROWSE