지난번 신뢰구간(Confidence Interval)에 이어서
이번 글에서는 표본의 크기가 30 이하인 작은 표본에서
신뢰구간을 구하는 방법과 필요한 최소 표본의 크기를
구하는 방법에 대해서 알아보겠습니다.
작은 표본에서 신뢰구간
기본적으로 작은 표본이라고 하는 것을
표본의 크기가 30 이하라고 설정하고 진행하겠습니다.
만약의 표본의 크기가 30 이하라면
위 공식에서 Z값만 t값으로 바꿔주면 됩니다.
t값은 엑셀에서
T.INV.2T(1 - α, 표본 크기 - 1)를 사용해
구할 수 있습니다.
이때 표본크기에서 1을 빼는 이유는
degree of freedom라고 부르는 자유도를
위해서 인데 표본에서 극단적인 값이 존재할 수도
있으니 그 극단적인 값을 보정하기 위해 사용합니다.
이렇게 t값을 구한 후에는
표본 통계량 +- t값 * 표준오차와 같이
동일한 수식을 사용해서 신뢰구간을 구할 수 있습니다.
필요한 표본의 수 계산
그럼 정해진 오차범위 안에서 신뢰구간을 만들기 위해
필요한 표본의 크기를 계산하는 방법에 대해서
알아보겠습니다.
1. 평균 (Mean)
평균을 사용하는 상황에서는 아래와 같은 공식을 사용합니다.
여기서 Z값은 이전글에서 설명한 것과 같고
Z값에 표준편차를 곱하고 허용오차 m으로 나눈 후에
제곱한 값이 신뢰구간을 만들기 위해 필요한 최소한의
표본의 크기가 됩니다.
2. 비율
비율을 사용하는 상황에서는 아래와 같은 공식을 사용합니다.
이때 비율을 가장 보수적으로 잡는 경우에는 p를 0.5로
설정하고 진행합니다.
회의에서 어떤 제안에 대한 찬성 비율을
추측하고 싶다고 가정해 봅시다.
95%의 신뢰 수준으로 3% 이하의 오차일 때
모집단의 비율을 모르는 상태이므로 p값은
보수적으로 0.5로 설정합니다.
그럼 (1.96/0.03)의 제곱에 0.5(1-0.5)를
곱하여 1067.228라는 값을 얻어낼 수 있고
이를 통해 최소 1068명의 표본이
찬성 비율을 추정하기 위해서
필요하다는 것을 알 수 있습니다.
이번 글에서는 작은 표본에서의 신뢰구간과
필요한 최소의 표본 크기를 구하는 방법에
대해서 알아보았습니다.
다음 글에서는 가설검정에 대해서 알아보겠습니다.