[데이터 분석 변수 유형]
1. 독립변수 (Input, X 변수) - 보통 값이 여러 개이기 때문에 대문자 X로 표기한다
현상의 변화를 초래하는 원인이 되는 원인변수
e.g. 날씨, 가격, 광고비 등
2. 종속변수 (Target / Output, y 변수) - 보통 값이 하나이기 때문에 소문자 y로 표기한다
모든 현상의 결과가 되는 결과변수
e.g. 판매량, 방문자 수, 수익 등
3. 매개변수 (intervening variable)
- 종속변수에 영향을 미치기 위하여 독립변수가 작용하는 시점과 독립변수가 종속변수에 영향을 미치는 시점의 중간에 나타나는 변수
- 독립변수와 종속변수에 직접적 영향을 주고받음
e.g. 학습 시간(독립변수)이 성적(종속변수)에 영향을 미칠 때, 집중력(매개변수)이 중간 역할을 함
4. 통제변수 (control variable)
독립변수가 종속변수에 미치는 영향을 보다 정확하게 파악하기 위해 통제되는 변수
e.g. 실험에서 동일한 환경(온도, 조명, 실험 시간 등)을 유지하는 경우
+
파생변수 (Derived Variable)
기존 변수들을 조합하여 새롭게 만들어진 변수
데이터 분석에서 피처 엔지니어링(Feature Engineering, 특징 엔지니어링)의 중요한 요소 중 하나이다
e.g. 총 지출(= 단가 × 구매 수량), 평균 속도(= 이동 거리 / 이동 시간)
'데이터 분석' 카테고리의 다른 글
[데이터 분석] 분석 기법 및 활용 (0) | 2025.02.11 |
---|---|
[데이터 분석] 척도화(스케일링, Scaling) 종류 (0) | 2025.02.11 |
[데이터 분석] PyDeck 라이브러리 (2) | 2024.12.28 |
[데이터 분석] NumPy(넘파이) 라이브러리 (2) | 2024.12.24 |
[데이터 분석] Joblib 라이브러리 (0) | 2024.12.17 |