R) 정규 분포 검정 : Shapiro-wilk, t-test

 어떤 집단에 대한 데이터를 '무한'에 가까울 정도로 수집(30건 이상), 분포, 평균, 표준 편차는 중심극한정리에 의해 아래의 모델과 유사해진다.(상단의 그래프는 '상자 그림')



수집된 데이터에 대해 평균 과 표준편차에 대해 N(,^2)으로 표기하며,
표준 정규 분포에 대해서는 N(0,1) 로 표기한다.


※참고 용어
귀무가설 : 처음부터 버릴 것을 예상, 차이가 없거나 의미있는 차이가 없는 경우의 가설
대립가설 : 대립가설의 대립되는 명제


※특정 데이터에 대해 정규 분포 여부 검정

shapiro.test(데이터)
-해당 데이터에 대해 표준 정규 분포 검증


데이터 변수 s에 대한 귀무가설은 정규분포 한다 이며
                            대립가설은 정규분포하지 않는다 이다.

여기서 p-value(유의확률) 의 값은 0.2715 이며,

정규 분포의 신뢰수준을 0.95, 유의수준을 0.05라고 한다면,

Sp-value > 0.05 

즉, 귀무가설을 채택한다.

정리 : p-value 값이 자신이 설정한 유의수준(정규 분포의 경우 0.05)보다 클 경우 귀무가설(정규분포 한다), 작을경우 대립가설(정규분포하지 않는다)을 채택한다.



※두 데이터 집단 간의 평균 검증

t.test(데이터A, 데이터B) 
-데이터A, 데이터B 간의 평균값이 동일한지에 대한 검증


Shapiro-test와 유사하게 귀무가설은 두 데이터간의 평균은 동일하다 이며
                                대립가설은 두 데이터간의 평균은 다르다 이다.

p-value의 값이 신뢰수준 0.95, 유의수준 0.05인 표준 정규 분포에 대해

data p-value < 0.05

이므로, 대립가설 두 데이터간의 평균은 다르다 을 채택한다.

정리 : p-value 값이 자신이 설정한 유의수준(정규 분포의 경우 0.05)보다 클 경우 귀무가설(두 데이터간의 평균은 동일하다), 작을 경우 대립가설(두 데이터간의 평균은 다르다)을 채택한다.

댓글