개괄식으로 먼저 알려주자면, 다음과 같은 파이프라인 구조를 지닌다
[DBMS] → [Data Warehouse] → [Data Mining]
(저장) (분석용 정리) (패턴/예측)
- DBMS는 현재의 데이터를 실시간으로 저장하고 관리한다
- Data Warehouse는 다양한 원천의 데이터를 모아 분석할 수 있게 정리한다
- Data Mining은 Data Warehouse의 데이터를 기반으로 유의미한 정보를 추출한다
1. DBMS – 데이터를 저장하고 관리하는 시스템
[데이터베이스] ep0) 파일시스템 vs 데이터베이스
데이터베이스 등장 이전에는 보통 파일시스템을 이용하여 데이터를 관리하였다ㅇ파일시스템(File System): 컴퓨터에서 파일이나 자료를 쉽게 발견 및 접근할 수 있도록 보관 또는 조직하는 체제(
claremont.tistory.com
DBMS(Database Management System)는 가장 기초적인 데이터 관리 시스템이다. 실시간으로 발생하는 데이터, 예를 들어 주문, 결제, 회원 정보와 같은 운영 데이터를 저장하고 관리한다.
- 목적: 데이터를 안전하게 저장하고, 필요할 때 빠르게 읽고 쓸 수 있게 하는 것
- 주요 기능: 데이터 삽입, 수정, 삭제, 검색
- 사용 대상: 웹 서비스, 쇼핑몰, 앱 등 운영 시스템
- e.g. 온라인 쇼핑몰의 주문 처리
DBMS는 현재 시점의 데이터를 다루기 때문에, 정합성과 빠른 응답 속도가 중요하다. Oracle, MySQL, PostgreSQL 등이 우리가 흔히 아는 대표적인 DBMS 제품들이다!
2. Data Warehouse – 분석을 위한 데이터 통합 저장소
Data Warehouse(데이터 웨어하우스)는 단순 저장이 목적이 아닌, 분석을 위해 데이터를 정리하고 통합하는 공간이다. 여러 DBMS에서 수집한 과거 데이터를 모아, 기업의 의사결정이나 트렌드 분석 등에 활용할 수 있게 만든다.
- 목적: 과거 데이터를 분석하기 좋게 통합/정리
- 주요 기능: 분석용 데이터 저장, 통계 및 리포트 제공
- 사용 대상: 경영진, BI 팀, 데이터 분석 부서
- e.g. 쇼핑몰의 매출 변화 추이, 고객 구매 패턴 분석
운영 DBMS와는 달리, Data Warehouse는 빠른 쓰기보다는 대규모 조회 및 집계에 최적화되어 있다. 주로 OLAP(On-Line Analytical Processing) 방식으로 활용된다.
3. Data Mining – 데이터로부터 지식을 발견하는 과정
Data Mining(데이터 마이닝)은 데이터 웨어하우스에 저장된 대량의 데이터에서 패턴이나 트렌드, 예측 모델을 추출하는 작업이다. 분석 기법에는 군집화, 분류, 회귀, 연관 규칙 분석 등이 있으며, 최근에는 머신러닝이나 AI 기법과도 결합된다.
- 목적: 숨겨진 패턴, 규칙, 예측 모델 도출
- 주요 기능: 데이터 분석, 모델 학습, 자동화된 의사결정 지원
- 사용 대상: 데이터 분석가, AI 시스템
- e.g. 사기 거래 탐지, AI 추천 시스템
데이터 마이닝은 단순 통계를 넘어서 예측과 자동화된 인사이트 추출에 초점을 둔다.
이 파이프라인은 데이터 기반의 의사결정과 AI 시스템 구축을 위해 모두 필수적인 요소이다. 개념만 명확히 이해해도 데이터 시스템을 설계하거나 도구를 선택할 때 큰 도움이 된다! 특히 실무에선 이 세 가지가 어떻게 연계되는지 흐름을 파악하는 것이 중요하다 😉
#SK, #SKALA, #SKALA1기
'DBMS > 데이터베이스' 카테고리의 다른 글
[데이터베이스] SQL 튜닝 체크리스트(실전 팁) (0) | 2025.04.18 |
---|---|
[데이터베이스] 옵티마이저(Optimizer) 개념에 대해 (0) | 2025.04.18 |
[데이터베이스] SQL 연습문제 (0) | 2025.02.06 |
[데이터베이스] SQL JOIN + INDEX 개념 (0) | 2025.02.06 |
[데이터베이스] 트랜잭션 개념과 관리 방안 수립 (0) | 2025.02.06 |