본문 바로가기
기초 통계

No4.이항분포, 포아송분포, 지수분포, 감마분포

by 스터디마형 2024. 3. 28.

※ 베르누이 시행이란?

베르누이 시행은 단 한 번의 실험으로서 오직 두 가지 결과만 가능한 시행을 의미합니다. 가장 일반적인 예는 동전 던지기이며, 앞면이 나올 확률과 뒷면이 나올 확률이 동일합니다.

```
표본공간 S는 다음과 같습니다:

$$
S = { H, T }
$$

여기서 H는 앞면(Head), T는 뒷면(Tail)을 나타냅니다.

앞면이 나올 확률은 다음과 같습니다:

$$
P(H) = \frac{1}{2}
$$

즉 매 시행마다 아래의 조건을 만족하는 실험

- ' 성공' 또는 '실패'의 오직 두가지 가능한 결과만 가짐

- '성공의 확률이 ( p )로 일정함

ex) 동전 던지기

A. 이항분포 (Binomial Distribution)

이항분포는 고정된 수의 독립적인 베르누이 시행에서 특정 성공 확률을 가지고 발생하는 성공 횟수의 확률을 나타냅니다.

정의

  • ( n )번의 베르누이 시행
  • 각 시행의 성공 확률 ( p )
  • ( k )번의 성공을 얻는 확률

확률질량함수 (Probability Mass Function, PMF)

$$ P(X = x) = \binom{n}{x} p^x (1-p)^{n-x} $$

확률질량함수는 이산 확률변수가 특정 값을 가질 확률을 나타내는 함수입니다. 이항분포의 경우, 다음과 같이 정의됩니다:

  • ( X ): ( n )번의 독립적인 시행 중 '성공'의 횟수로 정의됩니다.
  • ( x ): 가능한 '성공'의 횟수는 ( 0, 1, \ldots, n )의 값을 가집니다.
  • 확률질량함수는 다음 공식으로 주어집니다:

$$
P(X = x) = \binom{n}{x} p^x (1-p)^{n-x}
$$

  • 이 경우, 확률변수 ( X )는 ( Bin(n, p) )로 표기하며, 이는 ( X )가 매개변수 ( n )과 ( p )를 가진 이항분포를 따른다는 것을 의미합니다.

Binomial 분포의 3가지 형태의 그래프를 보자.

* x가 이산형 막대그래프 형태로 확률 표현한 상태

1. p = 0.2 >> p가 0 에 가까운 경우 오른쪽으로 꼬리가 길어지는 형태를 보인다.

2. p = 0.5 >> 가운데에 몰려 봉우리 형태

3.p = 0.8 >> p가 1 에 가까운 경우 왼쪽으로 꼬리가 길어지는 형태를 보인다.

* p의 값에 따라 치우침이 생길 수 있다는 점을 기억하자.

기대값과 분산

\( X \sim \text{Bin}[n,p] \) 인 경우

  • 기대값: ( E[X] = np )
  • 분산: ( Var[X] = np(1-p) )

이항분포는 실험의 횟수가 많아질수록 정규분포로 근사될 수 있습니다.

B. 포아송분포 (Poisson Distribution)

포아송분포는 단위 시간 또는 공간( t = 1) 내에서 평균적으로 발생하는 사건의 횟수를 바탕으로 한 사건의 발생 횟수를 나타내는 확률분포입니다.

정의

  • 시간 또는 공간 단위당 평균 ( \lambda \)번의 사건 발생
  • 주어진 단위에서 정확히 ( k )번의 사건이 발생할 확률

확률질량함수 (PMF)

$$ P(X = k) = \frac{e^{-\lambda} \lambda^k}{k!} $$

기대값과 분산

  • 기대값과 분산은 모두 ( \lambda )로 같습니다.

포아송분포는 이항분포에서 시행 횟수 ( n )이 매우 크고 성공 확률 ( p )가 매우 작을 때 ( np = \lambda )인 경우에 근사할 수 있습니다.

지수분포 (Exponential Distribution)

지수분포는 포아송 과정에서 발생하는 사건들 사이의 시간을 모델링하는 데 사용됩니다.

정의

  • 단위 시간당 평균 ( \lambda )번 발생하는 사건 사이의 시간 간격

확률밀도함수 (PDF)

$$ f(x) = \lambda e^{-\lambda x}, \text{ for } x \geq 0 $$

기대값과 분산

  • 기대값: ( \frac{1}{\lambda} )
  • 분산: ( \frac{1}{\lambda^2} )

지수분포는 '무기억성'의 성질을 가지고 있어, 과거의 사건이 현재의 확률에 영향을 주지 않습니다.

감마분포 (Gamma Distribution)

감마분포는 여러 지수분포 사건들의 대기 시간의 합 또는 연속된 여러 사건들 사이의 대기 시간을 모델링하는 데 사용됩니다.

정의

  • 형상 매개변수 ( k )와 비율 매개변수 ( \theta )를 가집니다.
  • ( k )는 일반적으로 사건의 발생 횟수로 해석됩니다.

확률밀도함수 (PDF)

$$ f(x; k, \theta) = \frac{x^{k-1} e^{-x/\theta}}{\theta^k \Gamma(k)}, \text{ for } x \geq 0 $$

기대값과 분산

  • 기대값: ( k\theta )
  • 분산: ( k\theta^2 )

감마분포는 특별한 경우의 분포로, ( k = 1 )일 때 지수분포가 되며, ( k )가 정수일 때는 '에를랑 분포'라고도 합니다.

'기초 통계' 카테고리의 다른 글

No07_수치적 기술통계 - 변동성  (1) 2024.04.13
NO.5 정규분포, 표준정규분포  (1) 2024.04.02
No3.확률변수와 확률분포의 특성치  (0) 2024.03.28
NO2.베이즈 정리  (0) 2024.03.27
No1. 확률의 개념과 특징  (0) 2024.03.26