2023-10-31,   Gun-ha, KANG

이번 포스팅에서는 정규성 가설검정 방법 중 하나인 Shapiro-Wilk Test를 공유해보려고 합니다.

KPSS Test

순서 통계량

데이터 포인트가 정렬된 순서에서의 상대적인 위치 값을 의미합니다.

Screenshot_1

W 검정 통계량

  • 귀무가설: 데이터가 정규분포를 따름
  • 대립가설: 데이터가 정규분포를 따르지 X

정규성 평가를 위해 W 검정통계량을 사용합니다. 이를 통해 주어진 데이터가 알려지지않은 평균과 분산을 가진 정규분포에서 추출된 표본인지 가설로 검정하게 됩니다.

  • 분자: 이론적으로 세팅된 값(ex. 선형 계수 테이블에 의해 결정됨)
  • 분모: 데이터로부터 얻은 정보

Screenshot_2

상세

Screenshot_3

계산 과정

Screenshot_4

Screenshot_5

  • W 는 0 ~ 1 사이
  • 1에 가까울수록 데이터가 정규분포를 따를 가능성이 높음
  • 표 50% 지점인 것보다 크기에 기각하기엔 충분한 증거가 없으므로, 데이터는 정규분포를 따른다고 할 수 있음

Screenshot_6

참고 논문

  • [Biometrika Trust - An Analysis of Variance Test for Normality (Complete Samples)]

Contact Author. KangGunha Email. zxcvbnm9931@epozen.com

업데이트: