당.주.힘.실 : 당신의 주장에 힘을 실어줄
표본으로부터 전체(모집단)를 파악하게 되는데, 앞에서 배운 간단한 방법 외에도 ㅌ통계적인 추론을 통하여 모집단에 대한 좀 더 다양한 정보를 얻는다. 이러한 통계적 추론은 확률이론을 기초로 한다.
사건의 확률
한 사건의 확률이란 사건이 일어날 가능성의 정도를 나타내는 수치이다. 동일한 결과가 일정하게 발생하지 않을 때 그 불확실성을 설명한다. 어떤 사건의 확률이라는 것은 가장 직관적으로 동일한 실험을 무한히 반복할 때 그 사건이 일어나게 되는 상대적인 비율이라는 것이다. 사건을 A라고 하면 A의 확률은 P(A)로 표시한다.
- 표본공간 : 한 실험에서 나올 수 있는 모든 결과들, 모집합(ohm)
- 근원사건 : 표본 공간을 구성하는 개개의 결과, 원소(w)
- 사건 : 표본공간의 부분집합으로 어떤 특성을 갖는 결과들의 모임, 근원사건들의 집합(A)
표본공간의 원소는 유한한 경우만 있는 것이 아니다. 무한개의 원소를 포함하는 표본공간 중에는 셀 수 있는 경우, 셀 수 없는 경우가 있다. 셀 수 없는 경우는 표본 공간의 원소가 연속체로 주어져 나열할 수 없는 경우를 연속표본공간이라고 한다. 이때의 확률이론도 근본적으로는 유한인 표본공간의 경우와 다를 게 없고 약간의 복잡한 이론이 추가돼야 하므로 이후 설명은 유한개의 원소를 포함하는 표본공간에만 국한한다. 확률의 기본 법칙은 다음과 같다.
확률의 계산
확률은 크게 어떠한 규칙성을 갖거나 갖지 못한 것에 대해 확률을 구하는 방식이 다르다. 주사위에서 1이 나올 확률은 6개 중의 하나이므로 1/6이다. 그러나 신규제품이 시장에서 성공할 확률은 규칙성이 없기 때문에 시장조사를 하여 성공할 확률을 추측한다. 다시 말해 귀납적인 방법으로 확률 값을 계산하는 것이다.
주사위와 같은 경우를 균일 확률(= 요구되는 사건에 속하는 근원사건의 개수 / 표본공간에 속하는 근원사건의 개수)이라 부른다. 신규 제품과 같은 경우는 상대도수 수렴치로서의 확률(= N번의 시행 중 A가 일어난 횟수 / N)이라 부른다. 이 둘은 완전 구분되어 있지 않다. 상대도수 수렴치로서의 확률을 통해 주사위의 1이 나올 확률을 구할 수도 있다. 다만 그 N번의 시행이 충분하여 그 값이 하나로 수렴하여 안정값을 찾을 때 균일 확률과 가까워지는 경향이 있다. 그래서 균일 확률로 구할 수 있는 것은 간단하게 균일 확률로 도출한다.
확률 법칙
어떤 사건이 여러 다른 사건들과 연관 지어져 복합적인 형태를 이루고 있을 때는 확률을 구하기 위해 그 사건과 관계있는 다른 사건들의 확률들을 이요하는 것이 쉬운 경우가 많이 있다. 이 절에서는 사건들의 기본 연산인 여사건, 합사건과 확률계싼에 유용한 확률법칙을 확인한다. 고등학교 1학년 첫시간에 배운 수학의 집합과 동일한 개념으로 접근한다.
- 여사건 : 사건 A의 여사건은 A에 포함되지 않은 근원사건들의 모임이다. '~를 하지 않는'
- 합사건 : 사건 A, B의 합사건은 A 혹은 B에 포함되는 근원사건들의 모임이다. '~하거나'
- 곱사건 : 사건 A, B의 곱사건은 A혹은 B에 동시에 포함되는 근원사건들의 모임이다. '~하고'
(* 배반사건 : 교집합이 없어 벤다이어그램 상 공유하는 근원사건이 없다. 이를 배반사건이라고 한다)
조건부 확률과 독립성
두 개 이상의 사건이 있을 때 한 사건의 결과가 다른 사건의 확률에 영향을 미치는 경우가 있다. 그것이 예상되는 두 사건이든 예상하지 못한 사건이든 분할표로 나타내었을 때 또는 산점도로 나타내었을 때 경향성이 나타나는 경우가 있다. 이 외에도 확률을 통하여 두 사건의 관련성을 확인할 수 있다. 어떠한 접근이던 상관없이 두 개의 사건 A, B를 조사했다. 이때 사건 B가 일어난 사람들 중에 사건 A도 함께 발생한 확률, 사건 B가 일어났는데 그중에 A도 일어나고 B도 일어난 확률을 조건부 확률 P(A|B)라고 한다. 단, 사전 사건 B가 일어날 확률은 반드시 0이 아니다. 수식에 의한 정의는 다음과 같다.
두 사건의 발생이 전혀 무관할 때 이러한 두 사건을 서로 독립이라고 한다. 예를 들어 주사위와 동전을 던질 때 1이 나오는 경우와 동시에 앞면이 나오는 경우는 각각의 개체 간 발생하는 경우로 두 사건은 무관하다. 독립과 배반은 구분되어야 한다. 하나의 주사위를 한번 던질 때 1이 나오는 경우와 동시에 3이 나오는 경우는 배반사건이다.
표본공간의 분할과 베이즈 정리
표본공간을 몇 개의 배반사건들의 합사건으로 표현할 수 있을 때 이러한 배반사건들의 모임을 표본공간의 분할이라고 한다. 명확한 기준에 의하여 다분법이 가능하다면 그 기준으로 나뉜 사건들의 집합을 만들어낼 수 있다. 곱사건의 확률법칙과 사건의 분할을 이용하여 임의의 사건의 확률을 표현하는 것을 총확률의 법칙이라고 한다.
베이즈 정리는 어떤 사건의 발생 확률에 대한 선험적인 생각이 실험에 의하여 변화되어 가는 체계적인 과정을 표현한 것이다. 실험 결과에 따라 과거의 생각이나 믿음이 변화를 하게 된다. 이때 믿음이 변화하는 정도는 예년의 평균 결과량에 신뢰도가 높다면 상대적으로 현재의 실험 결과의 비중을 낮게 보고 만약 현재의 결과가 어느 하루, 이틀의 변화에 의해서 평균이 달라진 게 아니라 지속적으로 동일한 양상을 보였다면 현재의 실험의 결과에 비중이 높아질 것이다. 표본공간의 분할과 곱사건의 확률법칙을 이용하여 사전지식을 실험을 통하여 보완하는 방법이다. 베이즈 정리는 다시 말해 조건부 확률을 기초로 한 특정 사건 Ak하고 B가 일어날 확률이다. 분할된 사건 A마다 B가 함께 일어난 사건들의 총합 중에 특정 사건 Ak하고 B가 일어날 확률을 통해 구한다.
한 줄 요약
현상은 자료가 제시하고 사건은 확률이 보여준다.
'@ '통계학' 당주힘실' 카테고리의 다른 글
[당주힘실 통계학] 7. 이항분포와 그에 관련된 분포_베르누이, 비복원, 연속 (0) | 2022.08.16 |
---|---|
[당주힘실 통계학] 6. 확률분포 (0) | 2022.08.16 |
[당주힘실 통계학] 4. 두 변수 자료의 요약 (0) | 2022.08.16 |
[당주힘실 통계학] 3. 연속형 자료의 요약_객관성 확보 (0) | 2022.08.11 |
[당주힘실 통계학] 2. 표와 그림_목적에 따라 보기 좋게 (0) | 2022.08.11 |
댓글