본문 바로가기

IT신제품정보/BI_KMS

[OLAP] OLAP의 정의

[OLAP] OLAP의 정의

OLAP(On-line Analytical Processing)은 데이터웨어하우스에 있는 많은 데이터를 분석하는 것이다.
즉 데이터웨어하우스가 대용량 데이터가 들어있는 저장고(repository)라고 한다면 OLAP은 저장고에 있는 데이터에 직접 접근하여 데이터를 분석하는 과정이다. 나아가 최종 사용자가 다차원적 질의를 통해 대화식으로 정보를 분석하고 의사결정에 활용하는 과정이라고 할 수 있다.

예) "어떤 지역의 매출이 가장 높은가?", "어떤 고객집단이 가장 이익을 가져다 주었는가?" 등 데이터웨어하우스에 집적되어있는 정보에 다차원적 질의를 통한 접근으로 답을 얻을 수 있다.

OLAP의 필수요건
OLAP과 데이터웨어하우스는 분석 기반의 의사결정지원 정보처리(ABDOP; Analysis-Based Decision-Oriented information Processing) 에서 요구되는 전체 기능상에서 상호 보완적인 요소이다. 데이터웨어하우징이 서버 측면 또는 데이터 공급 측면이라고 한다면, OLAP은 이를 사용이라는 측면이다. 따라서 OLAP 시스템은 신속한 데이터 액세스 및 계산(calculation), 강력한 분석 기능, 유연성, 멀티 사용자 지원 등의 기능이 요구되며 무엇보다도 중요한 것은 바로 속도라 하겠다. 분석자가 가지고 있는 사고의 흐름을 시기적절하게 이어줄 수 있는 중요한 사항이기 때문이다.

OLAP의 구현 방식
OLAP은 다차원적 데이터 분석을 목적으로 하는 프로세싱이다. 지금까지 OLAP을 실제로 구현하기 위해 MOLAP과 ROLAP이라는 크게 서로 다른 두 가지 방식이 존재해 왔다. 비록 사용자 입장에서 보여지는 화면이 유사할 수는 있어도 내부적으로 데이터를 분석하는 근원적인 체계에서 차이가 있는 것이다.

MOLAP (MDB-based OLAP)
OLAP 전용의 새로운 형태의 DB인 다차원 DB(Multi-dimensional DB)를 중심으로 다차원적인 분석이 이루어져 다양하고 신속한 분석이 가능하도록 만들어진 OLAP 구현 방식이다.

ROLAP (Relational OLAP, RDB-based OLAP)
일반적으로 사용되고 잇는 관계형 DB를 그대로 이용하면서 다차원적 데이터 모델링을 통해서 다차원적인 분석이 가능하도록 하는 방식이다.

스타 스키마 (Star schema)
차원 테이블과 사실 테이블로 구성되어 차원 테이블의 key 필드가 사실 테이블의 key가 된다.

스노플렉 스키마 (Snowflake schema)
스노플렉 스키마의 경우 스타 스키마의 차원 테이블이 보다 더 정규화된 형태로 어플리케이션의 유연성이 증가되고 성능이 향상되었다.

HOLAP (Hybrid OLAP)
MOLAP의 단점을 보강하기 위해서 MOLAP의 근간이 되는 다차원 DB에서 관계형 DB에 있는 데이터를 액세스할 수 있도록 기능을 추가하고 있다.