No3.확률변수와 확률분포의 특성치

A. 확률변수의 개념

확률변수는 확률적인 실험의 결과에 수치를 할당하는 변수입니다.(표본공간에성 정의된 실수 값 함수)

이는 실험의 결과를 실수집합에 매핑하는 함수로, 각 결과에 대한 확률을 제공합니다. 확률변수는 대개 대문자로 표기되며, 예를 들어 X, Y와 같은 형태를 취합니다.

B. 확률분포함수

확률분포함수는 확률변수의 각 결과값에 대한 확률을 설명합니다. 이 함수는 확률변수가 특정 값 이하가 될 확률을 나타내는 누적분포함수(CDF)와 확률변수가 특정 값을 취할 확률을 나타내는 확률질량함수(PMF) 또는 확률밀도함수(PDF)로 구분됩니다.

이산 확률변수 : 확률질량함수가 사용되며, 특정 값을 취할 확률을 직접 나타냅니다./확률변수가 취할 수 있는 값이 셀 수 있는 경우
ex) 고객, 사고 건수, 불량 수
예: P(X=x)
연속 확률변수 : 확률밀도함수가 사용되며, 확률변수의 값이 주어진 구간에서 모든 실수 값을 취할 수 있어 셀 수 없는 경우
ex) 시간, 길이, 온도, 무게.
예: P(a ≤ X ≤ b) = ∫_a^b f(x) dx

A. 확률변수의 개념

확률변수(Random Variable)는 확률실험의 각 결과에 실수 값을 할당하는 함수입니다. 이러한 할당을 통해 추상적인 실험 결과를 수치적인 분석의 대상으로 전환할 수 있습니다. 확률변수는 크게 두 가지 유형으로 나뉩니다: 이산 확률변수와 연속 확률변수입니다.

이산 확률변수(Discrete Random Variable): 셀 수 있는 값들을 취하며, 특정 값에 대한 확률을 직접 계산할 수 있습니다. 예를 들어, 동전 던지기의 결과나 주사위의 눈금 등이 이에 해당합니다.
연속 확률변수(Continuous Random Variable): 연속적인 값들을 취하며, 특정 구간에서 정의된 확률밀도함수를 통해 확률을 계산합니다. 예를 들어, 어떤 지점의 일일 온도나 측정된 높이 등이 이에 해당합니다.

출처 :  https://excelsior-cjh.tistory.com/193

1. 확률질량함수(Probability Mass Function, PMF)

확률질량함수는 이산 확률변수의 각 가능한 값에 대한 확률을 제공합니다. PMF는 확률변수가 특정 값과 정확히 일치할 확률을 나타냅니다.

- 성질

모든 가능한 값에 대해 PMF의 합은 1입니다.
각 확률은 0 이상이어야 합니다.
이산 확률변수의 경우, 확률질량함수 $ f(x) $는 특정 값 $ x $를 취하는 확률을 나타냅니다.

- 식

PMF는 보통 다음과 같이 표기됩니다:

$$
f(x_i) = P(X = x_i) = p(x_i)
$$

여기서 $ p(x) $는 확률변수 X가 $x_i$ 값을 취할 확률을 나타냅니다.

2. 확률밀도함수(Probability Density Function, PDF)

확률밀도함수는 연속 확률변수에 대해 정의됩니다. PDF 자체는 확률을 직접 나타내지 않지만, 특정 구간에서의 적분을 통해 그 구간에 확률변수가 속할 확률을 계산할 수 있습니다.

- 성질

PDF를 전 구간에 걸쳐 적분하면 그 값은 1입니다.
PDF는 항상 0 이상의 값을 가집니다.
연속 확률변수의 경우, 확률밀도함수 ( f(x) )는 ( x )에서의 확률밀도를 나타내며, 구간 ( [a, b] )에 대한 확률은 ( f(x) )를 해당 구간에서 적분함으로써 구할 수 있습니다.

- 식

PDF는 일반적으로 다음과 같이 표기됩니다:

$$
P(a \leq X \leq b) = \int_{a}^{b} f(x) , dx
$$

또한 PDF는 다음 두 가지 성질을 만족합니다:

$ f(x) \geq 0 ) for all ( x $
$ \int_{-\infty}^{\infty} f(x) , dx = 1 $

3. 누적분포함수(Cumulative Distribution Function, CDF)

누적분포함수는 확률변수가 특정 값 이하일 확률을 나타내며, 이산 및 연속 확률변수 모두에 대해 정의됩니다. CDF는 확률변수의 모든 가능한 값에 대해 비감소하는 형태를 가집니다.
CDF는 모든 이산 및 연속 확률변수에 대해 정의되며, 확률변수의 분포를 완벽하게 설명합니다.

- 식

CDF는 다음과 같이 정의됩니다:

$$
F(x) = P(X \le x) = \int_{-\infty}^{x} f(t) , dt
$$

여기서 $ F(x) $는 누적분포함수를, $ f(t) $는 확률밀도함수를 의미합니다. 이산 확률변수의 경우, CDF는 확률질량함수의 누적합으로 계산됩니다.

C. 확률분포함수의 특성치

확률분포함수의 특성치는 분포의 중요한 수치적 특성을 나타내는 척도들입니다.

기대값(평균): 확률변수의 평균적인 값입니다. 이산 확률변수와 연속 확률변수 모두에 대해 계산할 수 있습니다.
E(X) = ∑ x P(X=x) 또는 E(X) = ∫ x f(x) dx
분산: 확률변수의 값이 기대값에서 얼마나 퍼져있는지를 나타냅니다.
Var(X) = E[(X - E(X))^2]
표준편차: 분산의 양의 제곱근으로, 확률변수의 퍼짐 정도를 나타내는 척도입니다.
σ(X) = √Var(X)

이러한 특성치는 확률분포의 형태와 확률변수의 값의 분포를 이해하는 데 핵심적인 요소입니다.

'기초 통계' 카테고리의 다른 글

No07_수치적 기술통계 - 변동성 (1)	2024.04.13
NO.5 정규분포, 표준정규분포 (1)	2024.04.02
No4.이항분포, 포아송분포, 지수분포, 감마분포 (1)	2024.03.28
NO2.베이즈 정리 (0)	2024.03.27
No1. 확률의 개념과 특징 (0)	2024.03.26

데이터 분석 새내기

No3.확률변수와 확률분포의 특성치

A. 확률변수의 개념

B. 확률분포함수

A. 확률변수의 개념

1. 확률질량함수(Probability Mass Function, PMF)

- 성질

- 식

2. 확률밀도함수(Probability Density Function, PDF)

- 성질

- 식

3. 누적분포함수(Cumulative Distribution Function, CDF)

- 식

C. 확률분포함수의 특성치

'기초 통계' 카테고리의 다른 글

티스토리툴바

No3.확률변수와 확률분포의 특성치

A. 확률변수의 개념

B. 확률분포함수

A. 확률변수의 개념

1. 확률질량함수(Probability Mass Function, PMF)

- 성질

- 식

2. 확률밀도함수(Probability Density Function, PDF)

- 성질

- 식

3. 누적분포함수(Cumulative Distribution Function, CDF)

- 식

C. 확률분포함수의 특성치

'기초 통계' 카테고리의 다른 글

관련글

티스토리툴바