지난번 양적 변수의 활용에 이어서
이번 글에서는 Z-score 개념에 대해서
알아보도록 하겠습니다.
Z-score
Z-score이라는 개념을 이해하기 위해서
한 가지 질문을 먼저 해보겠습니다.
다른 변수들로부터의 값들을 우리는
어떻게 비교할 수 있을까요?
예를 들면 두 학생 alpha와 beta가
각각 시험을 치렀다고 가정해 봅시다.
alpha학생이 치른
A시험은 평균이 60점이고 표준편차가 10점입니다.
beta학생이 치른
B시험은 평균이 80점이고 표준편차가 5점입니다.
alpha와 beta 모두 75점을 받았다면
두 학생 중에 어떤 학생이 더 잘한 걸까요?
점수는 75점으로 동일하지만 시험 난이도에는
차이가 있었을지도 모릅니다.
따라서 정확한 비교를 위해서 데이터 값을 평균에서
얼마나 떨어져 있는지 비교하면 좋지 않을까요?
이때 Z-score의 개념이 등장합니다.
Z-score는 데이터 값이 평균에서 얼마나 떨어져 있는지
표준편차 단위로 나타낸 값입니다.
다른 말로 "표준화된 점수"라고 부르기도 합니다.
표준편차 단위로 나타냈기 때문에 서로 다른 분포를
비교할 때도 같은 기준을 사용하기 때문에
보다 더 나은 비교가 가능합니다.
Z-score를 계산하는 공식은 아래와 같습니다.
X는 관측값
μ는 평균
σ는 표준편차
를 나타냅니다.
그럼 이제 위 예시의 Z-score값을 구해보고
두 값을 비교해 보겠습니다.
alpha학생의 Z-score는
(75-60) / 10 = 1.5이고
이는 alpha학생의 점수가 평균으로부터
1.5 표준편차만큼 크다는 것을 의미합니다.
beta학생의 Z-score는
(75-80) / 5 = -1 이고
이는 beta학생의 점수가 평균으로부터
-1 표준편차만큼 작다는 것을 의미합니다.
alpha와 beta 학생 모두 75점으로 동일한 점수를
받았지만 Z-score로부터 알게 된 정보에 의하면
alpha학생은 A시험의 평균보다 1.5 표준편차만큼
큰 점수를 받았고
beta학생은 B시험의 평균보다 -1 표준편차만큼
작은 점수를 받았습니다.
alpha학생은 상대적으로 평균보다 높은 점수를
가지고 있고
beta학생은 상대적으로 평균보다 낮은 점수를
가지고 있습니다.
따라서 alpha 학생이 beta학생보다 시험을
더 잘 보았다는 것을 알아낼 수 있습니다.
아래 엑셀파일로 Z-score 구하는 방법을
연습해 보도록 하겠습니다.
A열은 학생
B열은 스마트폰 사용시간
C열에는 Z-score로 정리해 보도록 하겠습니다.
먼저 위 Z-score공식을 이용해서
100명의 학생들의 Z-score를 나열할 건데
D1셀에는 =Average(B2:B101)을 입력해서
평균을 구해주고
D2셀에는 =STDEV.S(B2:B101)을 입력해서
표준편차를 구해주겠습니다.
그럼 각각 5.38과 1.09의 값을 얻어낼 수 있고
C2셀에는 =(B2-$D$1) / $D$2를 작성해 주겠습니다.
이때 D1과 D2에 $표시를 한 이유는
C2셀에 있는 값을 C101까지 그대로 드래그해서
적용시킬 예정인데 이때 D1과 D2의 값은 고정이기
때문입니다.
그럼 이제 1번 학생부터 100번 학생까지
Z-score의 값을 알게 되었는데
평균에 가장 근접한 학생은 누구인지
평균에서 가장 멀리 떨어진 학생은
누구인지 관찰하면서
Z-score의 개념에 대해서 생각해 보시는
시간을 가져보면 좋을 것 같습니다.
서로 다른 분포를 비교할 때 동일한 기준으로
비교할 수 있게 도와주는 Z-score의 개념에
대해서 이번 글에서 알아보았습니다.
다음 글에서는 두 질적변수 조합의 분석에
대해서 알아보겠습니다.
'엑셀과 통계 (Excel&Statistic)' 카테고리의 다른 글
초보자를 위한 기초 엑셀 통계 (6) - 두 양적 변수 조합 분석 (0) | 2025.06.13 |
---|---|
초보자를 위한 기초 엑셀 통계 (5) - 두 질적 변수 조합 분석 (4) | 2025.06.12 |
초보자를 위한 기초 엑셀 통계 (3) - 양적 변수 활용 (Quantitative Variable) (3) | 2025.06.10 |
초보자를 위한 기초 엑셀 통계 (2) - 질적 변수 활용 (Categorical Variable) (0) | 2025.06.09 |
초보자를 위한 기초 엑셀 통계 (1) - 통계 변수(Statistics variables) (4) | 2025.06.08 |