샤피로 윌크 검정 - 정규성 가설검정
이번 포스팅에서는 정규성 가설검정 방법 중 하나인 Shapiro-Wilk Test를 공유해보려고 합니다.
KPSS Test
순서 통계량
데이터 포인트가 정렬된 순서에서의 상대적인 위치 값을 의미합니다.
W 검정 통계량
- 귀무가설: 데이터가 정규분포를 따름
- 대립가설: 데이터가 정규분포를 따르지 X
정규성 평가를 위해 W 검정통계량을 사용합니다. 이를 통해 주어진 데이터가 알려지지않은 평균과 분산을 가진 정규분포에서 추출된 표본인지 가설로 검정하게 됩니다.
- 분자: 이론적으로 세팅된 값(ex. 선형 계수 테이블에 의해 결정됨)
- 분모: 데이터로부터 얻은 정보
상세
계산 과정
- W 는 0 ~ 1 사이
- 1에 가까울수록 데이터가 정규분포를 따를 가능성이 높음
- 표 50% 지점인 것보다 크기에 기각하기엔 충분한 증거가 없으므로, 데이터는 정규분포를 따른다고 할 수 있음
참고 논문
- [Biometrika Trust - An Analysis of Variance Test for Normality (Complete Samples)]