본문 바로가기

IT신제품정보/BI_KMS

Data Mining의 정의

Data Mining의 정의

대량의 데이터베이스로부터 숨어 있는(알려지지 않은) 유용한 정보를 통계적기법이나 AI기법 등을
    이용하여 찾아내는 과정 - Gartner Group
핵심적인 의사결정에 이용하기 위하여 대량의 데이터베이스로부터 사전에 알려지지 않은, 이해
    할 수 있는 실행 가능한 정보를 추출하는 과정 - Zekulin
Global 2000기업의 80%는 데이터마이닝을 1999년까지 확보해야 할 중요한 성공요인(CSF:Critical
    Success Factor) 중의 하나라고 인식 - META Group

즉 데이터마이닝이란 대용량의 데이터로부터 그 속에 산재 되어 있는 알려지지 않은 사실 및 정보의 패턴 및 연관관계를 도출해내어 업무에 활용하기 위한 적합한 정보로 변환하여 기업의 의사결정에 적용하는 일련의 과정(기술) 이다.
예) "매출액이 왜 감소하는가?", "왜 고객들이 떠나고 있는가?"

기존의 DSS(Decision Support System: 의사결정지원서비스)는 대용량 데이터에 취약하고 가설위주의 분석이라면 데이터마이닝은 발전된 정보 기술의 활용이고 대용량 데이터 중심이다. 데이터마이닝은 경험 데이터 위주의 분석을 하며 데이터의 종류에 자유로운 분석을 할 수 있으며 기존의 DSS방법을 필요에 따라 적용 가능하다. 지식 집약적이며 장기간의 반복작업이 요구되고 다양한 지원도구가 필요하며 사람과 데이터 중심의 지식 발견 프로세스라 할 수 있다.

즉, 방대한 데이터에서 관계를 탐색하고 모형화 하는 고등 기법이다.

SQL (Structured Query Language : 구조화 질의어), OLAP과 마이닝의 비교
SQL OLAP 마이닝
2000년 3월 500,000원 이상을 구매한 사람은? 2000년 3월 500,000원 이상을 구매한 사람으로 여자이며, 미혼이고 강남구에 살며 연간 소득이 3,000만원 이상이고 자가용을 보유하고 있는 고객은? 2000년 3월 500,000원 이상을 구매한 사람으로 여자이며, 미혼이고 강남구에 살며 연간 소득이 3,000만원 이상이고 자가용을 보유하고 있으며 여행이 취미인 고객의 신용불량 여부는?
29인치 컬러 TV를 구매한 고객들의 공통된 특성은?


OLAP과 마이닝의 비교
OLAP 마이닝
다차원질의를 이용한 자료의 요약
What에 대한 답 : 지역별,상품별 매출액은?
데이터마이닝의 효과를 극대화새로운 해결책 탐사
불가
예상하지 못한 숨겨진 지식의 발견
Why에 대한 답 : 매출증대를 위해 어느 지역을 공략해야 하나?
예측 및 전망
OLAP에 또 다른 분석 차원을 제공