본문 바로가기
@ '통계학' 당주힘실

[당주힘실 통계학_엑셀편] 21. 중학교 1학년 남학생 30명 키를 통한 신뢰구간과 가설검정 확인하기

by jjsm1000:) 2022. 9. 27.
당.주.힘.실 : 당신의 주장에 힘을 실어줄

 


*엑셀편은 microsoft excel 2016을 활용하였습니다

 

목차

1. 중학교 1학년 남학생 임의 추출 자료

1-1. 신뢰구간 구하기

1-2. 가설검정 보이기

 

 

1. 중학교 1학년 남학생 임의 추출 자료

키가 큰 편도 아니었지만 매년 어린 학생들의 평균 키가 점점 커지는 것을 확인할 수 있다. 중학교 1학년의 평균 키는 분산이 매우 클 것이다. 따라서 고3 학생의 평균 키 추이를 보면 본인의 체감은 현실이었음을 증명할 수 있다. 평균 키가 커진 데에는 서구화된 식습관이나 키에 대한 부모의 관심과 투자 등 여러 가지 요인이 있을 것이다. 키에 대한 미련을 버린 지 오래되었지만 점점 좋은 시대에 태어나는 어린 친구들이 참 축복받았다는 생각을 한다. 물론 시대 탓을 하는 것은 아니다. 분산이 매우 큰 중학교 1학년 학생들의 자료를 살펴볼 예정이다.

 

2019년까지 고3 학생 평균 키 추이, 출처 : 한국교육부, 일본 문부과학성

 

임의 추출된 28명의 키 자료이며 이를 통해 신뢰구간을 구하고 가설검정을 엑셀로 확인할 예정이다. 이번 해당 자료는 실제 자료는 아니다.

120.5 164 136.6 160.6
119.3 158.4 142.7 173.5
125.7 168.9 143.1 160.8
124.5 159.7 149.2 173.5
131.8 171.6 150.1 160.7
130.2 160.3 157.2 158
137.4 172.8 155.3 161

 

 

1-1. 신뢰구간 구하기

위 주어진 자료에 근거하여 중학교 1학년 남학생의 평균키에 대한 95% 신뢰구간을 구하라.

 

아래와 같이 자료 입력이 필요하다. 단 하나의 열에만 작성하는 것이 주의 점이다. 별개의 열에 각각 입력하면 기술 통계량 요약 시 각 열에 대한 요약으로 출력될 수 있다.

자료입력

데이터 탭 - 데이터 분석 - 기술 통계법을 선택하고

기술통계법 선택

 

요약 통계량의 체크 박스를 선택하여 신뢰수준을 95%로 지정한 후 확인을 누르면 다음과 같이 요약 통계량을 구할 수 있다.

기술 통계법 대화상자
결과 출력

 

표본의 크기가 28이므로 모집단의 평균에 대한 신뢰구간은 정규분포를 이용하여 근사적으로 구한다. 요약 통계량에 표본 평균, 표준오차, 관측수 등이 주어져 있으므로 엑셀에서 함수 CONFIDENCE.NORM(alpha, standard_dev, size) 를 이용해서 구하면 된다. 결과를 보면 표준편차 셀과 관측수가 주어져 있는 셀 자체를 활용하여 구한다.

 

이 결과를 이용하여 아래 그림에서와 같이 셀에 위 함수를 입력하여 구할 수 있다. 그 값은 6.260389 임을 알 수 있다.

CONFIDENCE 함수 사용 예시

 

여기서 한 가지 주의할 점은 신뢰 수준이라고 하는 부분에 이전에 소개한 신뢰 수준과 의미가 전혀 다르다는 점이다. 엑셀에서는 신뢰수준을 신뢰구간을 구할 때 추정치로부터 가감되는 양을 일컫는다. 이와 같은 예는 기술 통계법의 결과 가장 밑에 주어져 있는 신뢰 수준에서도 찾을 수 있는데, 이것은 다음 장에서 다룰 내용으로 모집단이 정규분포를 따를 때 적용하는 t 분포를 이용한 신뢰구간에서 계산된 값이다. 이와 같이 엑셀에서의 신뢰수준의신뢰 수준의 의미는 엑셀에서만 통용되는 것으로 본래의 신뢰 수준의 의미와는 많이 다르다는 사실을 기억해야 한다.

 

 

1-2. 가설검정 보이기

만약 위에 추출된 28명의 중학생 1학년의 남학생 키가 A도시에서만 추출되었다면 다른 B도시에서의 중학교 1학년 남학생의 평균 키가 155cm와 차이가 있다고 할 수 있는지 판단이 필요할 것이다. 이러한 경우 검정하고자 하는 가설은 아래 두 가지로 볼 수 있다.

 

1. 평균 = 155

2. 평균 ≠ 155

 

가설을 검정하기 위한 검정통계량의 값을 구하기 위하여 먼저 기술 통계법을 이용해 요약 통계량을 구한다. 이는 1-1을 참고한다.

 

각각의 통계량 값이 주어져 있는 위치를 지정하여 아래와 같이 지정한 셀에 입력하면 그 값을 구할 수 있다. 위의 대립 가설로부터 양측 검정에 대한 P-값은 2*P 이므로 다음과 같이 구할 수 있다.

통계량 Z값, 위의 함수식 참고
결과값
=2*(1-NORMSDIST(ABS(D20)))

 

통계량 Z값은 일반 수식에 의해서 -1.259로 확인되었고, B도시 추정 평균키 155cm에 대한 양측 검정 p-값은 NORMSDIST와 ABS를 사용하여 이 또한 일반 수식으로 0.208 수준으로 확인했다.

 

결론은 P-값이 0.208로 상당히 커서 귀무가설을 기각할 수 없으므로, 중학교 1학년 남학생의 평균 키가 155와 차이가 난다고 판단할 수 없다. 이전과 유사하듯 이론적인 계산값과 비교하게 되면 그 값에 대한 오차는 있을 수 있으나 판정에 대한 결과는 같다.


 

 

댓글