엑셀과 통계 (Excel&Statistic)

초보자를 위한 기초 엑셀 통계 (13) - 단일 표본 가설검정 (Hypothesis Test)

jay_the_code 2025. 6. 20. 10:50

지난번 작은 크기의 표본에서의 신뢰구간 및
적절한 표본의 최소 크기에 이어서
이번글에서는 단일 표본에서의
가설검정(Hypothesis Test)
대해서 알아보겠습니다.

가설검정 (Hypothesis Test)

우선 가설검정은 통계 분석에서 아주 핵심이 되는
기법입니다.

표본 데이터를 통해서 모집단에 대한 추정
평가할 수 있는 방법입니다.

가설검정의 기본 구조

가설 검정은 아래와 같은 5가지 요소로 구성됩니다.

1. 가설 (Hypothesis)
- H0 (귀무가설): 변화가 없다. 아무 일도 일어나지 않는다.
- H1 (대립가설): 변화가 있다.

2. 전제조건 (Assumption)
- 표본이 랜덤 하게 추출되었는가?
- 표본의 크기가 충분한가?

3. 검정통계량(Test Statistic)
- 표본오차를 표준오차로 나눈 값 (Z값 or t값)

4. P값 (P-value)
- 귀무가설 아래에서 현재 관측된 결과보다 극단적인
결과가 나올 확률

5. 결론 (Conclusion)
- P값에 따라 귀무가설을 기각 또는 기각 실패

우선 P값에 따라 귀무가설을 기각할 수 있을지
아니면 귀무가설의 기각에 실패할지가 결정되는데
어떠한 기준으로 결정되는지 아래에서 살펴보도록
하겠습니다.

우선 P값이 작으면 작을수록 우리는 통계적으로
유의미한 변화가 있다고 판단하고 귀무가설을
기각할 확률이 높아집니다.

P < 0.10: 변화의 가능성이 존재함
P < 0.05: 통계적으로 유의미한 변화를 보임
P < 0.01: 매우 강력한 변화의 증거

우리는 위와 같은 기준으로 귀무가설을
기각할지 말지 결정하게 됩니다.

보통 P값이 0.05 이하이면 유의미한 변화가
있다고 보고 귀무가설을 기각합니다.

가설검정 (비율 / proportion)

그럼 이제 예시를 통해 비율에 대한
가설검정 과정에 대해서 알아보겠습니다.

한 대학교 강좌의 통과율이 88%였으나
다른 기준을 도입한 후에 100명 중에 92명이
통과하였을 때 이 변화가 통계적으로 유의미한지
알아보겠습니다.

일단 그럼 검정통계량을 구해보겠습니다.

Z = (0.92 - 0.88) / ((0.88)*(1-0.88) / 100)의 제곱근
Z값은 대략 1.23으로 구할 수 있고

NORM.S.DIST(-1.23, TRUE) * 2로
P값을 구할 수 있는데

2를 곱해주는 이유는 증가, 감소 한 가지만 보는 것이
아닌 양끝단의 변화를 확인하는 작업이기 때문입니다.

P값은 약 0.219가 나오게 되고
0.1보다 큰 값을 가지므로
귀무가설을 기각할 수 없습니다.

따라서 기준을 도입한 것이 통계적으로 유의미한
변화가 있었다고 보기 어렵습니다.

가설검정 (평균 / mean)

그럼 이번에는 평균에 대한 가설검정에
대해서 알아보겠습니다.

성인의 평균 혈압이 132라고 가정하고
이보다 높은 평균을 가진 집단이 있는데
이 집단이 실제로 평균이 높은지 알아보겠습니다.

표본 평균: 139.16
표준편차: 22.77
표본 수: 100

일단 T값을 구해보도록 하겠습니다.

T = (139.16 - 132) / (22.77/100의 제곱근)
위 수식을 계산하여서 3.14라는 값을
알아낼 수 있고 이를 통해 P값을 구해보도록 하겠습니다.

이번에는 증가에 관심이 있으므로 오른쪽
꼬리만 확인해야 합니다.

따라서 P값은 엑셀함수 T.DIST.RT(3.14,99)를
통해서 구할 수 있고 t값을 사용했으므로 인자로
표본수 - 1로 degree of freedom 값을 입력해 줍니다.

이렇게 계산하면 0.0011이라는 P값을
얻을 수 있게 되고 p < 0.01이므로
실제로 평균의 차이가 없다는 귀무가설을
기각하고 혈압에 유의미한 증가가 존재한다는
강력한 증거를 가지고 있다고 해석할 수 있습니다.

가설검정의 해석

마지막으로 가설검정의 해석에 대해서 알아보겠습니다.

가설검정에서 가장 헷갈리는 부분이 바로 이 부분인데
H0를 만약에 데이터에 변화가 없다고 설정할 경우
H0를 기각하지 못했다고 해서 반드시 H0가 맞다는
것은 아니라는 것을 명심해야 합니다.

예를 들어 어떤 가설검정 과정 중에 P값이 0.2로 0.1보다
높게 나왔다고 해서 H0로 설정한 것이 무조건 옳다고
보는 것은 옳지 않습니다.

가설검정은 어떠한 변화가 있다는 가정에 대해서
"변화가 없다고 할 수는 없다"라는 논리적인 접근을
통해서 통계적으로 의미 있는 결론을
도출하는 과정입니다.

변화가 있다는 것의 증거를 발견하는 것에 실패했다고
해서 H0를 사실이라고 판단하는 것만 주의한다면
가설검정은 통계적으로 유의미한 변화를 판단하는
아주 좋은 도구라고 생각합니다.

이번 글에서는 단일표본에 대한
가설검정에 대해서 알아보았습니다.

다음 글에서는 범주형(Categorical)에
대한
가설검정에 대해서 알아보겠습니다.