엑셀과 통계 (Excel&Statistic)

초보자를 위한 기초 엑셀 통계 (2) - 질적 변수 활용 (Categorical Variable)

jay_the_code 2025. 6. 9. 16:00

지난번 통계 변수에 이어서 이번 글에서는

변수가 질적 변수(Categorical / Qualitative)일 때

어떤 점에 주목해야 하고 어떤 방식으로 활용하는지

알아보겠습니다.

 

지난 글을 안 읽어보신 분들은 하단 링크 또는

하단 이미지 참고 부탁드립니다!

 

2025.06.06 - [엑셀과 통계 (Excel&Statistic)] - 초보자를 위한 기초 엑셀 통계 (1) - 통계 변수(Statistics variables)

 

초보자를 위한 기초 엑셀 통계 (1) - 통계 변수(Statistics variables)

지난번 기초 엑셀 사용법에 이어서이번 글부터는 엑셀을 활용한 통계에대해서 알아보겠습니다. 먼저 통계하면 어떤 것들이 먼저 떠오르시나요? 인구조사, 매출, 이용자 통계 등등 일상생활 속

jaythecode.tistory.com

 

 

질적 변수의 활용 (Categorical / Qualitative)

 

어떠한 조사 결과가 있다고 가정해 봅시다.

 

그 조사는 다양한 국적의 사람들이 모인 파티에

어떤 나라의 사람이 몇 명 참석하였는지 조사한

결과라고 가정해 봅시다.

 

그럼 우리는 어떤 것이 궁금할까요?

 

예를 들어 일본, 한국, 중국, 그리고 미국의

국적을 가진 사람들이 모였다고 가정하면

우리는 각 나라마다 몇 명이 파티에 참석하였는지

그리고 그 비율은 전체에 비해 얼마나 될지가

궁금할 것입니다.

 

만약에 어떤 통계에서 변수가 질적 변수라면

우리는 각 범주에 해당하는 관측값의 개수

세고 그 빈도(frequency)에 집중합니다.

 

그래서 각 범주가 전체에서 차지하는 비율

비교하여 유의미한 결론을 내릴 수 있습니다.

 

그럼 각 범주 사이의 비율을 비교할 때는

어떤 차트(Chart)를 사용하는 것이 효과적일까요?

 

정답은 바 차트(Bar Chart)파이 차트(Pie Chart)

입니다.

 

아래 엑셀 파일로 예시를 살펴보겠습니다.

파티참석자명단.xlsx
0.01MB

  

어떤 파티에 미국, 한국, 일본, 중국의 국적을

가진 30명의 사람들이 참석한 참석자 명단입니다.

 

이 파일에서 국적별로 참석자 수를 세어보고

차트를 활용해 이를 비교해 보겠습니다.

 

먼저 E3, E4, E5, E6에 각각 나라의 이름을

작성하고 함수 COUNTIF()를 활용하여

아래와 같이 표를 만들었습니다.

 

이때 주의할 점은 COUNTIF를 활용할 때

아래 이미지와 같이 문자열을 큰따옴표로

감싸주어야 합니다.

 

그럼 저 그래프를 모두 드래그해서 선택하고

'삽입' 메뉴에 들어가서 바 차트를 생성하고

파이 차트도 같이 생성해 주겠습니다.

 

 

위 이미지에서 확인해 볼 수 있듯이 각 나라별

참석자수의 차이를 쉽게 알아볼 수 있습니다.

 

이제 참석자 비율을 계산해 볼까요?

 

E2셀에 Total 그리고 F2셀에는 총 참석자수를

작성하겠습니다.

 

그리고 G3셀에 "=F3/$F$2" 라고 작성하겠습니다.

 

알파벳과 숫자 앞에 $를 붙이게 되면

복사해서 붙여 넣어도 그 부분은 그대로 유지가

가능합니다.

 

G3셀에 작성이 완료되었으면 오른쪽 하단에

작은 사각형을 잡아서 G6번 셀까지 드래그하겠습니다.

 

그리고 다시 G3 ~ G6까지 선택하고 셀 서식에서

백분율 소수점 2자리까지로 설정하겠습니다.

 

그럼 위 이미지에서 보시는 것과 같이

각 나라별 참석자 수의 비율을 구할 수 있습니다.

 

일본인이 가장 많은 비율을 차지하고 있고

미국인이 가장 적은 비율을 차지하고 있는 것을

확인할 수 있습니다.

 

이번 글을 읽으시면서 비교적 쉬운 내용에

어 뭐야 이거 너무 당연한 소리 아닌가?

라고 생각을 하셨을지도 모릅니다.

 

하지만 기초를 잘 익혀야 두 가지 이상의 변수들이

조합된 상황에서 상황에 맞게 차트와 함수들을

활용할 수 있다고 생각합니다.

 

이번 글에서는 질적 변수의 활용에 대해서

알아보았습니다.

 

다음 글에서는 양적 변수의 활용에 대해서

알아보겠습니다.