클러스터링과 특성분석을 이용한 구간 데이터에서 다차원 연관 규칙 마이닝Mining of Multi-dimensional Association Rules over Interval Data using Clustering and Characterization
- Other Titles
- Mining of Multi-dimensional Association Rules over Interval Data using Clustering and Characterization
- Authors
- 임승환; 권용석; 김상욱
- Issue Date
- Jan-2010
- Publisher
- 한국정보과학회
- Keywords
- Association Rules; Data Mining; Clustering; Characterization; 연관 규칙; 데이터마이닝; 클러스터링; 특성 분석
- Citation
- 정보과학회 컴퓨팅의 실제 논문지, v.16, no.1, pp 60 - 64
- Pages
- 5
- Indexed
- KCI
- Journal Title
- 정보과학회 컴퓨팅의 실제 논문지
- Volume
- 16
- Number
- 1
- Start Page
- 60
- End Page
- 64
- URI
- https://scholarworks.bwise.kr/hanyang/handle/2021.sw.hanyang/175535
- ISSN
- 2383-6318
2383-6326
- Abstract
- 비 트랜잭션 데이터를 대상으로 연관 규칙을 도출하기 위해서, 데이터의 속성들을 구간화하는 기법들이 활발하게 연구되었다. 이러한 기존의 연구들은 구간화 단계에서 구간 범위의 변화에 따른 연관 규칙의 신뢰도 변화를 반영하지 않고, 구간화 단계와 연관 규칙을 도출하는 단계들을 독립적으로 수행하였다. 이로 인해 속성들의 구간이 부적절하게 설정되고, 이 결과 높은 신뢰도를 갖는 연관 규칙들이 최종 결과에서 누락된다. 따라서 본 논문에서는 속성들을 구간화하는 단계와 연관 규칙들을 도출하는 단계를 병합하여 동시에 수행함으로써, 가장 신뢰도가 높은 연관 규칙들을 도출할 수 있는 구간을 설정하는 방안을 제안한다. 이를 위해서 연관 규칙의 우변의 속성들을 대상으로 계층적 클러스터링을 수행하고, 각 클러스터들에 대해서 특성 분석을 수행한다. 실험 결과, 제안하는 기법은 기존의 기법들에 비해서 높은 신뢰도를 갖는 연관 규칙들을 발견하는 것으로 나타났다.
To discover association rules from non- transactional data, there have been many studies on discretization of attribute values. These studies do not reflect the change of discovered rules' confidence according to the change of the ranges of the discretized attributes, and perform the discretization stage and the rule discovery stage independently. This causes the ranges of attributes not properly discretized, thereby making the rules having high confidence excluded in the result set. To solve this problem, we propose a novel method that performs the discretization and rule discovery stages simultaneously in order to discretize ranges of attributes in such a way that the rules having high confidence are discovered well. To the end, we perform hierarchical clustering on the attributes in the right hand side of rules, then do characterization on every cluster thus obtained. The experimental result demonstrates that our method discovers the rules having high confidence better than existing methods.
- Files in This Item
-
Go to Link
- Appears in
Collections - 서울 공과대학 > 서울 컴퓨터소프트웨어학부 > 1. Journal Articles

Items in ScholarWorks are protected by copyright, with all rights reserved, unless otherwise indicated.