※ 베르누이 시행이란?
베르누이 시행은 단 한 번의 실험으로서 오직 두 가지 결과만 가능한 시행을 의미합니다. 가장 일반적인 예는 동전 던지기이며, 앞면이 나올 확률과 뒷면이 나올 확률이 동일합니다.
```
표본공간 S는 다음과 같습니다:
$$
S = { H, T }
$$
여기서 H는 앞면(Head), T는 뒷면(Tail)을 나타냅니다.
앞면이 나올 확률은 다음과 같습니다:
$$
P(H) = \frac{1}{2}
$$
즉 매 시행마다 아래의 조건을 만족하는 실험
- ' 성공' 또는 '실패'의 오직 두가지 가능한 결과만 가짐
- '성공의 확률이 ( p )로 일정함
ex) 동전 던지기
A. 이항분포 (Binomial Distribution)
이항분포는 고정된 수의 독립적인 베르누이 시행에서 특정 성공 확률을 가지고 발생하는 성공 횟수의 확률을 나타냅니다.
정의
- ( n )번의 베르누이 시행
- 각 시행의 성공 확률 ( p )
- ( k )번의 성공을 얻는 확률
확률질량함수 (Probability Mass Function, PMF)
$$ P(X = x) = \binom{n}{x} p^x (1-p)^{n-x} $$
확률질량함수는 이산 확률변수가 특정 값을 가질 확률을 나타내는 함수입니다. 이항분포의 경우, 다음과 같이 정의됩니다:
- ( X ): ( n )번의 독립적인 시행 중 '성공'의 횟수로 정의됩니다.
- ( x ): 가능한 '성공'의 횟수는 ( 0, 1, \ldots, n )의 값을 가집니다.
- 확률질량함수는 다음 공식으로 주어집니다:
$$
P(X = x) = \binom{n}{x} p^x (1-p)^{n-x}
$$
- 이 경우, 확률변수 ( X )는 ( Bin(n, p) )로 표기하며, 이는 ( X )가 매개변수 ( n )과 ( p )를 가진 이항분포를 따른다는 것을 의미합니다.
Binomial 분포의 3가지 형태의 그래프를 보자.
* x가 이산형 막대그래프 형태로 확률 표현한 상태
1. p = 0.2 >> p가 0 에 가까운 경우 오른쪽으로 꼬리가 길어지는 형태를 보인다.
2. p = 0.5 >> 가운데에 몰려 봉우리 형태
3.p = 0.8 >> p가 1 에 가까운 경우 왼쪽으로 꼬리가 길어지는 형태를 보인다.
* p의 값에 따라 치우침이 생길 수 있다는 점을 기억하자.
기대값과 분산
\( X \sim \text{Bin}[n,p] \) 인 경우
- 기대값: ( E[X] = np )
- 분산: ( Var[X] = np(1-p) )
이항분포는 실험의 횟수가 많아질수록 정규분포로 근사될 수 있습니다.
B. 포아송분포 (Poisson Distribution)
포아송분포는 단위 시간 또는 공간( t = 1) 내에서 평균적으로 발생하는 사건의 횟수를 바탕으로 한 사건의 발생 횟수를 나타내는 확률분포입니다.
정의
- 시간 또는 공간 단위당 평균 ( \lambda \)번의 사건 발생
- 주어진 단위에서 정확히 ( k )번의 사건이 발생할 확률
확률질량함수 (PMF)
$$ P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} $$
기대값과 분산
- 기대값과 분산은 모두 ( \lambda )로 같습니다.
포아송분포는 이항분포에서 시행 횟수 ( n )이 매우 크고 성공 확률 ( p )가 매우 작을 때 ( np = \lambda )인 경우에 근사할 수 있습니다.
지수분포 (Exponential Distribution)
지수분포는 포아송 과정에서 발생하는 사건들 사이의 시간을 모델링하는 데 사용됩니다.
정의
- 단위 시간당 평균 ( \lambda )번 발생하는 사건 사이의 시간 간격
확률밀도함수 (PDF)
$$ f(x) = \lambda e^{-\lambda x}, \text{ for } x \geq 0 $$
기대값과 분산
- 기대값: ( \frac{1}{\lambda} )
- 분산: ( \frac{1}{\lambda^2} )
지수분포는 '무기억성'의 성질을 가지고 있어, 과거의 사건이 현재의 확률에 영향을 주지 않습니다.
감마분포 (Gamma Distribution)
감마분포는 여러 지수분포 사건들의 대기 시간의 합 또는 연속된 여러 사건들 사이의 대기 시간을 모델링하는 데 사용됩니다.
정의
- 형상 매개변수 ( k )와 비율 매개변수 ( \theta )를 가집니다.
- ( k )는 일반적으로 사건의 발생 횟수로 해석됩니다.
확률밀도함수 (PDF)
$$ f(x; k, \theta) = \frac{x^{k-1} e^{-x/\theta}}{\theta^k \Gamma(k)}, \text{ for } x \geq 0 $$
기대값과 분산
- 기대값: ( k\theta )
- 분산: ( k\theta^2 )
감마분포는 특별한 경우의 분포로, ( k = 1 )일 때 지수분포가 되며, ( k )가 정수일 때는 '에를랑 분포'라고도 합니다.
'기초 통계' 카테고리의 다른 글
No07_수치적 기술통계 - 변동성 (1) | 2024.04.13 |
---|---|
NO.5 정규분포, 표준정규분포 (1) | 2024.04.02 |
No3.확률변수와 확률분포의 특성치 (0) | 2024.03.28 |
NO2.베이즈 정리 (0) | 2024.03.27 |
No1. 확률의 개념과 특징 (0) | 2024.03.26 |