데이터 마이닝

데이터마이닝(data mining), 또는 자료채굴(資料採掘)은, 대규모로 저장된 데이터안에서 체계적이고 자동적으로 통계적규칙이나 짜임을 분석하여, 가치있는 정보를 빼내는 과정이다. 다른 말로는, KDD(데이터베이스속의 앎발견, knowledge-discovery in databases)라고도 일컫는다.^[1]

개요[편집]

데이터마이닝은, 통계학에서 패턴인식에 이르는 다양한 계량기법을 사용한다. 데이터 마이닝 기법은 통계학쪽에서 발전한 탐색적자료분석, 가설 검정, 다변량 분석, 시계열 분석, 일반선형모형 등의 방법론과 데이터베이스 쪽에서 발전한 OLAP (온라인 분석 처리:On-Line Analytic Processing), 인공지능 진영에서 발전한 SOM, 신경망, 전문가 시스템 등의 기술적인 방법론이 쓰인다.

데이터 마이닝의 응용 분야로 신용평점 시스템(Credit Scoring System)의 신용평가모형 개발, 사기탐지시스템(Fraud Detection System), 장바구니 분석(Market Basket Analysis), 최적 포트폴리오 구축과 같이 요즘날 다양한 산업 분야에서 광범위하게 사용되고 있다.

단점으로는, 자료에 의존하여 현상을 해석하고 개선하려고 하기 때문에 자료가 현실을 충분히 반영하지 못한 상태에서 정보를 추출한 모형을 개발할 경우 잘못된 모형을 구축하는 오류를 범할 수가 있다.^[1]

적용 분야[편집]

데이터마이닝은 데이터 분석을 통해 아래와 같은 분야에 적용하여 결과를 도출할 수 있다.

분류(Classification): 일정한 집단에 대한 특정 정의를 통해 분류 및 구분을 추론한다 ( 이탈한 고객)
군집화(Clustering): 구체적인 특성을 공유하는 군집을 찾는다. 군집화는 미리 정의된 특성에 대한 정보를 가지지 않는다는 점에서 분류와 다르다 (예:유사 행동 집단의 구분)
연관성(Association): 동시에 발생한 사건간의 관계를 정의한다. (예:장바구니안의 동시에 들어 가는 상품들의 관계 규명)
연속성(Sequencing): 특정 기간에 걸쳐 발생하는 관계를 규명한다. 기간의 특성을 제외하면 연관성 분석과 유사하다 (예: 슈퍼마켓과 금융상품 사용에 대한 반복 방문)
예측(Forecasting): 대용량 데이터집합 내의 패턴을 기반으로 미래를 예측한다 (예: 수요예측)^[1]

같이 보기[편집]

각주[편집]

↑ ^가 ^나 ^다 이재규,권순범,임규건. 《경영정보시스템원론(제2판), 2005, 534p》. 법영사. ISBN-10 : 027375453X / ISBN-13 : 9780273754534. CS1 관리 - 여러 이름 (링크)

외부 링크[편집]

위키미디어 공용에 관련된
미디어 분류가 있습니다.

데이터 마이닝

(영어) 데이터 마이닝 소프트웨어 - Curlie

[DATA마이닝-1] 가 ^나 ^다 이재규,권순범,임규건. 《경영정보시스템원론(제2판), 2005, 534p》. 법영사. ISBN-10 : 027375453X / ISBN-13 : 9780273754534. CS1 관리 - 여러 이름 (링크)

[1]

v t e 컴퓨터 과학의 주요 분야
수학적 기초	수리논리학 집합론 정수론 그래프 이론 유형 이론 범주론 수치해석학 이산수학
계산 이론	오토마타 이론 계산 가능성 이론 계산 복잡도 이론 양자 계산 이론
알고리즘 & 자료 구조	알고리즘 알고리즘 설계 알고리즘 해석 자료 구조 계산기하학
프로그래밍 언어 & 컴파일러	구문 분석 컴파일러 인터프리터 프로그래밍 언어 구조적 프로그래밍 객체 지향 프로그래밍
병렬 & 분산 시스템	병렬 컴퓨팅 컴퓨터 클러스터 분산 컴퓨팅 그리드 컴퓨팅 클라우드 컴퓨팅 IaaS PaaS SaaS
소프트웨어 공학	요구 분석 소프트웨어 설계 컴퓨터 프로그래밍 정형 기법 소프트웨어 테스트 소프트웨어 개발
시스템 아키텍처	컴퓨터 아키텍처 마이크로아키텍처 운영 체제
통신 & 네트워크	컴퓨터 오디오 라우팅 네트워크 토폴로지 암호학 차세대 통신망
데이터베이스	데이터 마이닝 RDBMS SQL NoSQL 오라클 데이터베이스
인공지능	자동추론 전산언어학 컴퓨터 비전 진화 연산 기계 학습 자연 언어 처리 로봇학
컴퓨터 그래픽	시각화 영상 처리
인간과 컴퓨터 상호 작용	컴퓨터 접근성 사용자 인터페이스 착용 컴퓨터 유비쿼터스 컴퓨팅 가상현실
계산과학	인공생명 생물정보학 인지과학 계산화학 계산신경과학 계산물리학 수치해석학 기호계산
정보보호	암호학 물리 보안 애플리케이션 보안 인터넷 보안 네트워크 보안 해킹 크래킹