Ⅰ데이터마이닝 개요
1. 데이터마이닝이란
Mine 이란 의미는 채광하다 즉, 거대한 더미 속에서 가치 있는 무언가를 캐낸다라는 것이다. 즉, 데이터 마이닝이라는 것은 방대한 양의 데이터 속에서 쉽게 드러나지않는 유용한 정보를 찾아내는 과정이라고 말할 수 있다.
2. 데이터마이닝의 출현배경
데이터마이닝 이라는 사상은 축적된 정보기술의 발달과 비즈니스적 요구에 의해 시장에 등장하게 되었다고 볼 수 있다.
이미 알려져 있고 기대했던 정보 뿐만 아니라 전혀 예상하지 못했고, 쉽게 드러나지도 않는 정보까지를 데이터베이스나 데이터웨어하우스로부터 찾아내고자 하는 목적하에 개념적인 정보추출방법론인 데이터마이닝이 시장에 등장하게 되었고, 이는 데이터웨어하우스와 함께 향후 정보산업을 이끌 주제가 되고 있다.
3. 데이터마이닝과 데이터웨어하우징의 관계는
데이터웨어하우스는 효율적인 데이터마이닝을 위한 출발점이 된다고 볼 수 있다. 또한 데이터마이닝은 데이터웨어하우징의 가장 중요하고 핵심적인 적용업무 중 하나이다.
4. OLAP이 데이터마이닝인가
단순한 질의 및 분석을 통해서 얻을 수 있는 정보의 한계를 극복하고 대용량의 데이터베이스나 데이터웨어하우스를 좀 더 면밀히 탐색할 수 있는 방법으로 등장한 것이 바로 OLAP (On-Line Analytical Processing)이다.
5. 데이터마이닝은 어떻게 진행되는가
데이터마이닝은 개념적인 정보추출의 방법론이며 일련의 과정(Process)이다.
니라 개념적인 정보추출의 방법론이며 일련의 과정(Process)이다. 실제 데이터마이닝이 적용되는 프로세스를 살펴보면 다음과 같은 단계로 나누어 볼 수 있다.
① 문제정의 : 적용하고자 하는 비즈니스 문제 정의 및 목표 결정
② 데이터베이스 : 정의된 비즈니스 문제에 따라 필요한 데이터를 선택하고 데이터웨어하우스(또는 데이터마트)를 구축함으로써 데이터를 준비한다.
....
[데이터마이닝] CRISP - DM 에 대해서 조사하기 [데이터마이닝 / CRISP - DM 에 대해서 조사하기.]
*CRISP-DM에 대해 알아보기에 앞서 간단하게 데이터 마이닝에 대해 알아보자.
데이터마이닝이란 다들 알고 있는것과 같이 데이터(data)에서 마이닝(mining)..