데이터 분석 기법에 대해 알아보자
정형 데이터 분석 / 비정형 데이터 분석으로 구분되며, 각각의 기법이 특정한 데이터 유형과 분석 목적에 따라 활용된다!
[정형 데이터 분석]
- 탐색적 데이터 분석 (EDA) - 모델을 만들기 전에 데이터를 파악하고 이해하기 위해 통계적 기법과 시각화 등을 통해 데이터를 분석하는 과정
- 데이터 시각화: 데이터를 시각적으로 표현하여 패턴을 파악 (Box plot, Histogram, Pareto chart, Odds ratio)
- 군집분석 (Clustering): 비슷한 특성을 가진 고객이나 데이터를 그룹화 (구매 패턴 유사 고객 분석, People Like Me 분석)
- 연관분석 (Association): 데이터 간의 연관 관계 파악 (장바구니 분석, 연관 검색어 분석)
- 예측 분석 (Prediction)
- 의사결정나무 (Decision Tree): 분류 및 예측 모델 구축 (고객 행동 예측, 부정 적발 모델)
- 회귀분석 (Logistic Regression): 연속형 데이터를 기반으로 수치 예측 (부정적발 고객 탐지, 수요 예측, 배송 소요 시간 예측)
- 최적화 분석 (Optimization)
- LP (Linear Programming), NLP (Non-Linear Programming): 유통/물류 최적화 경로 관리 및 비용 최적화
- 기계 학습 (Machine Learning)
- 지도학습 (Supervised Learning): 라벨이 있는 데이터를 학습하여 예측 모델 생성 (수요 예측, 고객 VOC 분류 분석)
- 자율학습 (Unsupervised Learning): 라벨 없이 데이터를 그룹화하여 패턴 분석 (제품 분류, 시장 세분화)
[비정형 데이터 분석]
- 텍스트 데이터 분석
- Text mining: 자연어 데이터를 분석하여 의미 있는 정보를 추출 (NLP, 자연어 처리)
- 소셜 네트워크 분석
- Opinion Mining: 감성 분석을 통해 고객 의견 파악 (Topic Analysis, 키워드 분석)
- 동영상/Streaming 분석
- Streaming 분석: 실시간 데이터 분석 (동영상, 이미지, 음성 데이터 분석)
'데이터 분석' 카테고리의 다른 글
[데이터 분석] 결측치 처리(Missing Value Handling) (0) | 2025.02.11 |
---|---|
[데이터 분석] 데이터 구조 유형(R, Python) (0) | 2025.02.11 |
[데이터 분석] 척도화(스케일링, Scaling) 종류 (0) | 2025.02.11 |
[데이터 분석] 변수 유형 및 용어 정리 (0) | 2025.02.11 |
[데이터 분석] PyDeck 라이브러리 (2) | 2024.12.28 |