본문 바로가기
기초 통계

No12.가설검증의 원리

by 스터디마형 2024. 4. 22.

A. 가설검정의 원리

통계적 추론 중 대표적인 방법, 표본의 정보를 활용하여 모집단에 대한 가설의 합당성 여부를 판정하는 과정

가설설정 > 검정통계량 > 기각역 or 유의확률 > 결론

>> 두 개의 상반된 가설 중 어느쪽이 맞는지 결론 제시

 

통계적 가설검정이란?

- 표본으로부터 주어지는 정보를 이용하여, 모수에 대한 예상, 주장 또는 추측 등의 옳고 그름을 판정하는 과정

가설

- 통계적 가설은 모수에 대한 예상, 주장 또는 추측을 표현한 것.

1. 귀무가설(H₀)과 대립가설(H₁)의 개념

- 귀무가설(H₀) : 지금까지 사실로 알려져 있는 가설

- 대립가설(H₁) : 표본자료로부터의 강력한 증거에 의해 입증하고자 하는 가설

귀무가설(H₀)은 일반적으로 "변화가 없다", "효과가 없다", 또는 "차이가 없다"와 같은 기본적인 주장을 내용으로 하는 가설입니다. 반면, 대립가설(H₁)은 귀무가설과 반대되는 가설로, 연구자가 입증하고자 하는 주장을 담고 있습니다.

가설 검정은 표본의 정보가 귀무가설 (H₀)에 대한 충분한 반증이 되는가를 보는 것이다.

귀무가설 : 변화가 없다. 같다. 차이가 없다. 효과가 없다.

대립가설 : 변화가 있다. 다르다 . 차이가 있다. 효가가 있다.

결론도 '귀무가설을 기각' 또는 귀무가설을 기각하지 못함' 중 하나로 표현한다.

예시:

연구자가 새로운 약이 두통을 더 빨리 완화시킨다고 주장할 때, 귀무가설은 "새 약은 기존 약과 효과가 동일하다"가 됩니다. 대립가설은 "새 약이 기존 약보다 두통 완화에 더 효과적이다"입니다.

2. 검정통계량의 개념

검정통계량은 가설검정에서 사용되는 측정값으로, 표본 데이터로부터 계산되어 귀무가설의 타당성을 평가하는 데 사용됩니다.

 

- 가설검정에는 단측검정(one-tailed, one-sided)양측검정(two-tailed, two-sided)이 있다.
- 단측검정에는 모집단 평균을 기준으로 왼쪽 검정(lower tail)과 오른쪽 검정(upper tail)이 있음

출처 : https://dbrang.tistory.com/1407

 

가설의 형태를 결정할때 내 검정의 목적가 무엇이냐를 대립가설에 작성하고, 귀무가설에는 등호를 쓰면된다.

 

예시 )

[양측 검정] -  같거나 다르다.

• 귀무가설 : μ  = 100

• 대립가설 : μ  ≠ 100

 

[단측 검정]   - 왼 꼬리 검정

• 귀무가설 : μ  ≥  100

• 대립가설 : μ  < 100

 

[단측 검정]   - 오른꼬리 꼬리 검정

• 귀무가설 : μ  100

• 대립가설 : μ  > 100

 

 

- 귀무가설과 대립가설 중 어느 하나를 택하는 기준을 결정하는 통계량

- 모집단 모분산이 알려진 정규분포인 경우, 모평균에 관해 검정의 경우

 

[검정 통계량]

 

 

B. 귀무가설 (H₀)의 기각여부를 파난하기 위한 2가지 접근 방식

기각역 또는 유의확률(p-value)에 의한 검정법

- 기각역은 미리 정해진 기준으로, 검정통계량이 이 기각역에 들어올 경우 귀무가설을 기각합니다.

- p-value는 관찰된 검정통계량이 귀무가설 하에서 얻을 수 있는 분포 중 극단적인 값으로 나타날 확률을 의미합니다.

1. 유의수준(p-value) 검정법

귀무가설이 사실인 경우의 검정통계량의 분포에서 대립가설의 방향으로 검정통계량의 관찰값보다 더 극단적인 값이 나올 확률로 계산된다.

 

유의수준은 귀무가설을 기각하는 데 사용되는 확률의 임계값으로, 통상적으로 0.05(5%) 또는 0.01(1%)을 사용합니다. 이는 귀무가설이 사실일 때, 그것을 기각할 확률의 최대 허용 한계를 의미합니다.

 

유의확률(p-value)의 해석

유의확률은 값이 작을수록 해당하는 표본의 귀무가설이 사실인 경우의 표본으로 보기 어려우며, 대립가설을 더욱 지지하는 것으로 해석할 수 이다.

 

유의수준를 계산했는데 이 영역에 포함될 경우, 귀무가설을 기각하고 대립가설을 채택하게 되므로 기각역(Critical Region)이라고 한다. 

반대로  1 - α 영역은 귀무가설을 채택하게 되기 때문에 채택역(Acceptance Region)이라고 한다. 

 

 

앞서 계산한 검정통계량이 x축 좌표라고 했는데, 이 값이 어느 영역에 있는지에 따라 귀무가설을 채택하거나 기각하게 된다. 

 

 

C. 검정의 오류 : 제1종 오류와 제2종 오류

 

  실제현상
귀무가설이 사실 대립가설이 사실
검정결과 귀무가설 기각하지 못함 올바른 의사결정 제2종 오류
귀무가설을 기각 제1종 오류 올바른 의사결정

 

- 제1종 오류는 귀무가설이 사실일 때, 잘못해서 그것을 기각하는 오류입니다

- 제 1종 오류의 확률을 α 로 표기함

 

 

- 제2종 오류는 대립가설이 사실일 때, 잘못해서 귀무가설을 기각하지 않는 오류입니다

- 제 2종 오류의 확률을 β 로 표기함

예시:

의사가 환자가 질병이 없다는 귀무가설을 가지고 진단했을 때, 실제로는 건강한 환자를 질병이 있다고 잘못 진단하는 것이 제1종 오류입니다. 반면, 실제로는 질병이 있는 환자를 건강하다고 잘못 진단하는 것이 제2종 오류입니다.