BOXPLOT1 [데이터 분석] 이상치 처리(Outlier Handling) "데이터 전처리"에서 중요한 과정 중 하나인 이상치 처리에 대해 알아보자 ㅇ이상치(Outlier): 대다수의 데이터와 다른 통계적 특성을 가진 값Fraud Detection(사기 탐지) 등의 경우, 분석 목적에 따라 정상/비정상의 기준을 정하는 것이 중요하다 [이상치 탐지 방법]Boxplot을 활용하면 데이터의 중앙값(median)과 사분위 범위(1st Qu. ~ 3rd Qu.)를 기준으로 이상치를 시각적으로 확인할 수 있다- Lower Whisker : 최소 정상값- Upper Whisker : 최대 정상값 Whisker 밖에 위치한 데이터는 이상치로 간주될 수 있음(예시)boxplot(iris$sepal.width, main="Boxplot of Sepal Width") [이상치 처리 방법]i) 분.. 2025. 2. 11. 이전 1 다음