당.주.힘.실 : 당신의 주장에 힘을 실어줄
*엑셀편은 microsoft excel 2016을 활용하였습니다
목차
1. 1032회간 로또 번호 조회
1-1. 1부터 45번까지 몇 번 나왔는지 세기
1-2. 표본 평균과 히스토그램
1. 1032회간 로또 번호 조회
매주 로또를 통해 일주일의 희망을 품는다. 많은 사람들이 로또를 구매하며 1등을 바라보지만 애석하게도 7자리를 맞추는 것은 쉽지 않다. 1부터 45까지의 45개 정수 값을 가지는 모집단이라 고려될 수 있다. 여기에 9월 10일 기준으로 1032회가 진행되었다. 역대 기록되어 있는 1등 번호는 곧 그 분포에서 1032회 추출된 표본이라 가정할 수 있다.
1등을 향하여 통계적인 접근을 할 것이고 엑셀을 이용하여 알아보자. (본 주제는 엑셀 활용하는 것이다.)

1-1. 1번부터 45번까지 몇 번 나왔는지 세기
1032회에 걸쳐 매번 7개의 번호를 추출한다. 물론 한 회에 비중복 추출이긴하나 7*1032 = 7224번의 중복 추출이라 가정한다. 그리고 함수의 COUNTIF(범위, 조건)을 이용하여 1부터 45번이 7224번 중 몇 번 나왔는지 세어본다.
1. COUNTIF와 그 조건을 입력한다. 조건 입력 시 범위는 절대참조, 셀 숫자는 상대 참조로 미리 적어둔 1 셀을 클릭한다.
2. 자동채우기를 실행한다.

1-2. 표본 평균과 히스토그램
우선 1032회동안 추출된 표본자료가 있지만 엑셀에서 45개 사이의 임의의 숫자를 표본 추출할 수 있는 함수가 있다. 그것은 RANDBETWEEN이다. 이 함수를 사용할 때는 Bottom 1, Top 45를 입력하면 된다.
예시. 엑셀에서 1032회 1부터 45 사이의 임의 추출
1. RANDBETWEEN을 사용하여 1032행까지 반복. 단, 새로 sheet를 추가하여 만들고 그 sheet에는 임의 추출된 이후에는 빈 셀에 어떠한 값도 넣어선 안된다. 값이 바뀌기 때문이다.

2. sheet를 추가하여 1-1. 에서 진행한 것과 같이 1부터 45까지 몇 번 나왔는지 세기
이제 본격적으로 실제 1032회간 1부터 45사이의 추출된 자료를 분석해본다.
(1) 기초자료 조사
이전에 배웠던 함수들로 회차별 평균(=표본 평균), 최소/최대, 분산, 중간값을 구해본다.
회차별 평균(표본 평균)

이를 바탕으로 혹시나 특정 분포가 보일까 분산표를 그렸지만 큰 의미는 없어 보인다.

최소/최대 : MIN/MAX
분산 : VAR
중간값 : MEDIAN
숫자를 고를 때 평균이 23에 가깝게 하는 것도 하나의 방법이 될 수도 있겠다.

(2) 표본평균의 히스토그램을 그려본다.

모집단의 분포가 이산 균등 분포이므로 정규분포와는 거리가 멀다. 그러나 표본평균의 히스토그램을 보면 어느 정도 정규분포와 유사한 종 모양을 하고 있음을 알 수 있다. 표본의 크기가 어느 정도 되기도 하고 더 많은 표본이 있다면 더욱이 정규분포에 가까우리라고 예상할 수 있을 것이다. 이것은 지난 장에서 했던 정규 확률그림을 통해서 정규성을 갖는지까지도 알 수 있다.
로또에서 1등이 되기 위해 분포의 특이점을 찾아보려 했지만 알 수가 없었다.
이 장에서 원래 알려고 했던 것은 반복 추출된 표본들의 회차별로 평균은 표본의 크기가 클 수록 정규분포를 따라감을 보여주는 것이다.
'@ '통계학' 당주힘실' 카테고리의 다른 글
| [당주힘실 통계학_엑셀편] 22. 수질 지표로 t분포에서 신뢰구간과 가설검정, 정규성 가정에 대한 적합성 확인 (0) | 2022.09.27 |
|---|---|
| [당주힘실 통계학_엑셀편] 21. 중학교 1학년 남학생 30명 키를 통한 신뢰구간과 가설검정 확인하기 (0) | 2022.09.27 |
| [당주힘실 통계학_엑셀편] 19. 전력소비 행태의 정규분포를 통한 자료 분석 (0) | 2022.09.16 |
| [당주힘실 통계학_엑셀편] 18. 고속도로 교통량을 통한 예측(이항분포, 포아송분포 확인하기) (0) | 2022.09.09 |
| [당주힘실 통계학_엑셀편] 17. 폭우관련 역대 강수량 자료를 요약한다(평균, 분산 등 & 관계) (1) | 2022.09.07 |
댓글