지난번 중심극한정리에 이어서
이번 글에서는 신뢰구간(Confidence Interval)에
대해서 알아보겠습니다.
중심극한정리와 표준오차에 대한 이해가
필수적인 내용이므로 아래 글 내용 참고 부탁드립니다.
2025.06.12 - [엑셀과 통계 (Excel&Statistic)] - 초보자를 위한 기초 엑셀 통계 (10) - 중심극한정리 (Central Limit Theorem)
중심극한정리를 통해 우리가 표본 평균이
정규분포를 따른다는 사실을 알게 되었습니다.
신뢰구간은 이러한 개념을 바탕으로 활용가능한
추론 도구입니다.
신뢰구간 (Confidence Interval)
신뢰구간은 표본을 기반으로 모집단의
진짜 값을 추정할 수 있는 범위를 의미합니다.
예를 들어서, 성인의 평균 혈압이 139.16이고
신뢰구간 95%에서의 신뢰구간이
(134.7, 143.6)이라고 말한다면 다음과 같은
의미를 가집니다.
표본이 모집단을 잘 대표한다고 가정하면
모집단의 평균은 134.7과 143.6 사이일
가능성이 높다라고 해석할 수 있습니다.
하지만 이 말이 이 구간이 항상 모집단 평균을
포함한다는 보장은 아니므로 주의해야 합니다.
단지 많은 표본을 반복하였을때 그중 약 95%의
구간이 실제 값을 포함한다라고 생각하시면
좋을 것 같습니다.
신뢰구간은 아래와 같은 공식을 바탕으로 합니다.
여기서 표본 통계량은 평균 또는 비율을 의미하고
표준오차는 모집단의 표준편차 / 표본크기의 제곱근,
Z 값은 신뢰수준에 따른 임계값을 말하는데
엑셀에서 아래와 같은 공식으로 구할 수 있습니다.
신뢰 수준이 95%라면 α = 0.05이고
1 - α/2 값을 NORM.S.INV() 함수에 인자로
삽입하면 Z값을 알아낼 수 있습니다.
NORM.S.INV(0.975) = 1.96
신뢰 수준이 90%라면 α = 0.1이고
NORM.S.INV(0.95) = 1.645
신뢰수준이 99%라면 α = 0.01이고
NORM.S.INV(0.995) = 2.576
이렇게 신뢰 수준의 따른 Z값을 구했다면
위 공식에 값들을 대입하여
신뢰구간을 구할 수 있습니다.
그럼 아래 두 예시로 각각 비율일 때
그리고 평균일 때 어떻게 신뢰구간을
활용하는지 알아보겠습니다.
1. 비율
100명 중에 42명이 고혈압인 표본이 있습니다.
그렇다면 고혈압을 가진 사람의 비율
p = 0.42이고
표준 오차는 p(1-p) / 100(표본크기)의 제곱근으로
0.0494의 값을 가집니다.
이 표본의 신뢰 수준 95%에서
Z값은 1.96이고
신뢰구간은 0.42 +- 1.96*0.0494를 계산한
(0.3233, 0.5167)이 되겠습니다.
연습을 위해 신뢰수준 90%와 99%를
직접 해보시는 걸 강력하게 추천드립니다!
2. 평균
평균 혈압이 139.16이고 표준편차가 22.767인
100명의 표본이 있습니다.
이때 신뢰수준 95%에서 평균 혈압의 신뢰구간을
알아보겠습니다.
평균 139.16
표준오차 = 22.767 / 100의 제곱근 = 2.2767
신뢰구간
139.16 +- 1.96 * 2.2767 = (134.70, 143.62)
라는 신뢰구간을 구할 수 있습니다.
이 두 가지 예시를 해석해 보겠습니다.
첫 번째 예시:
표본을 바탕으로 볼 때 전체 인구 중 고혈압을 가진 사람의
비율은 32% ~ 51.7% 사이일 것으로 95%의 신뢰 수준에서
추정할 수 있습니다.
두 번째 예시:
표본을 바탕으로 볼 때 전체 인구의 혈압은
134.7에서 143.6 사이일 것으로 95% 신뢰 수준에서
추정할 수 있습니다.
라고 두 가지 예시를 해석할 수 있습니다.
하지만 가령 95%의 확률로 고혈압의 비율이
신뢰구간 안에 존재합니다 와 같은 표현은
부정확한 표현이니 해석에 주의하셔야 합니다!
이번 글에서는 신뢰구간에 대해서 알아보았습니다.
다음 글에서는 작은 표본에서의 신뢰구간과
필요한 표본의 수를 알아보는 방법에 대해서
알아보겠습니다.
'엑셀과 통계 (Excel&Statistic)' 카테고리의 다른 글
초보자를 위한 기초 엑셀 통계 (14) - 두 집단 가설검정 (Hypothesis Test) (0) | 2025.06.21 |
---|---|
초보자를 위한 기초 엑셀 통계 (13) - 단일 표본 가설검정 (Hypothesis Test) (0) | 2025.06.20 |
초보자를 위한 기초 엑셀 통계 (10) - 중심극한정리 (Central Limit Theorem) (0) | 2025.06.17 |
초보자를 위한 기초 엑셀 통계 (9) - 정규 분포 (Normal Distribution) (0) | 2025.06.16 |
초보자를 위한 기초 엑셀 통계 (8) - 조건부 확률과 베이즈 정리(Bayes Theorem) (4) | 2025.06.15 |