본문 바로가기

기초 통계11

No12.가설검증의 원리 A. 가설검정의 원리 통계적 추론 중 대표적인 방법, 표본의 정보를 활용하여 모집단에 대한 가설의 합당성 여부를 판정하는 과정 가설설정 > 검정통계량 > 기각역 or 유의확률 > 결론 >> 두 개의 상반된 가설 중 어느쪽이 맞는지 결론 제시 통계적 가설검정이란? - 표본으로부터 주어지는 정보를 이용하여, 모수에 대한 예상, 주장 또는 추측 등의 옳고 그름을 판정하는 과정 가설 - 통계적 가설은 모수에 대한 예상, 주장 또는 추측을 표현한 것. 1. 귀무가설(H₀)과 대립가설(H₁)의 개념 - 귀무가설(H₀) : 지금까지 사실로 알려져 있는 가설 - 대립가설(H₁) : 표본자료로부터의 강력한 증거에 의해 입증하고자 하는 가설 귀무가설(H₀)은 일반적으로 "변화가 없다", "효과가 없다", 또는 "차이가 없.. 2024. 4. 22.
NO11_점추정과 구간추정 점추정과 구간추정 A. 통계적 추론 - 추정 개요 1. 추정 개념 모수의 추정에 사용되는 두 가지 방법의 의미와 중요성에 대해 논의합니다. 표본을 통해 모집단의 모수를 추정하는 것은 통계학의 중요한 분야 중 하나입니다. - 모수는 모집단의 특성을 보여주는 값으로, 일반적으로 \( \theta \) (세타)로 표현한다. 2. 점추정과 구간추정 점추정 (Point Estimation): 하나의 모수를 하나의 값으로 추정합니다. 이는 표본 데이터를 바탕으로 한 모집단의 모수 추정치를 제공합니다. 구간추정 (Interval Estimation): 모수가 포함될 가능성이 있는 구간으로 모수를 추정합니다. 이는 신뢰도를 기반으로 한 범위 안에서 모수가 존재할 확률을 제시합니다. • 점추정 (Point Estimat.. 2024. 4. 18.
No10.[추정과 검정]통계적 추론 개요, 표본추출법 통계적 추론은 모집단으로부터 얻은 표본 데이터를 기반으로 모집단의 특성을 추론하는 과정을 말합니다. 이 과정에서는 대부분의 경우, 전체 모집단을 조사하는 것이 불가능하기 때문에, 표본을 통해 모집단에 대한 결론을 내리게 됩니다. 통계적 추론은 크게 추정과 검정의 두 가지 주요 과정으로 나눌 수 있습니다. 모집단(Population): 관심의 대상이 되는 전체 집단으로, 연구나 분석의 대상이 되는 모든 개체나 사건의 집합입니다. 예를 들어, 모든 고등학교 학생, 모든 나무 등이 될 수 있습니다. 모수(Parameter): 모집단의 특성을 나타내는 수치로, 예를 들어 모집단의 평균, 분산, 비율 등이 이에 해당합니다. 모수는 일반적으로 알려져 있지 않으며, 통계적 방법을 통해 추정합니다. 표본(Sample).. 2024. 4. 17.
No09_그래프에 의한 기술통계 그래프를 이용한 자료의 정리 - 자료의 유형에 맞는 그래프를 이용하여, 한눈에 알아볼 수 있게 자료를 시각화 할 수 있다. [다양한 종류의 그래프를 이용한 시각화 기법] '어떤 타입의 데이터에 대해서 무엇을 보고 싶을 때 그리는가?' 데이터 시각화는 데이터를 분석하고 이해하는 데 매우 중요한 과정입니다. 그래프를 이용한 자료 정리는 복잡한 데이터 집합에서 유용한 정보를 추출하고, 데이터 사이의 관계를 명확히 보여줄 수 있습니다. 데이터는 크게 질적 자료와 양적 자료로 분류할 수 있으며, 이에 따라 적절한 그래프를 선택해야 합니다. 1. 데이터 시각화 개요 데이터 시각화는 크게 질적 자료와 양적 자료를 다룹니다. 질적 자료: 카테고리 또는 그룹으로 표현되는 비수량적 데이터입니다. - 1개 변수 : 바차트(.. 2024. 4. 16.
No08_수치적 기술통계 - 연관성 [탐색적 데이터 분석] 수치적 기술통계에서 연관성을 이해하는 데 중요한 개념에는 공분산, 피어슨 상관계수, 스피어만 상관계수, 켄달의 상관계수가 있습니다. 비선형적 관계나 순위 데이터에 더 적합합니다. 공분산은 두 변수 간의 관계의 방향 피어슨 상관계수는 두 변수 간의 선형적 관계의 강도와 방향을 측정 스피어만 상관계수와 켄달의 상관계수는 순위 기반의 상관 관계를 측정 A. 두 숫자형 변수의 선형적 연관성 - 선형적 연관성의 방향과 강도 1. 양의 연관성 - 하나가 커지면 다른 하나도 커진다. - 하나가 작아지면 다른 하나도 작아진다 . 2. 음의 연관성 - 하나가 작어지면 다른 하나는 커진다. - 하나가 커지면 다른 하나는 작아진다. 3. 무상관 B. 연관성의 측도 - 공분산(Covariance) 공분.. 2024. 4. 14.
No07_수치적 기술통계 - 변동성 [탐색적 데이터 분석] A. 중심 위치 척도 탐색적 데이터 분석에서 중심위치척도는 데이터 집합의 대표값을 의미합니다. 이를 통해 데이터가 어느 지점에 위치하는지를 파악할 수 있죠. 대표적인 중심위치척도에는 평균(mean), 중앙값(median), 최빈값(mode)이 있습니다. 평균(Mean)은 모든 데이터 값의 합을 데이터의 개수로 나눈 값입니다. 데이터의 총합을 대표하는 가장 일반적인 척도 중위수, 중앙값(Median)은 데이터를 크기 순으로 나열했을 때 중앙에 위치하는 값입니다. 이상치의 영향을 덜 받아서 때때로 평균보다 선호되기도 해요. 최빈값(Mode)은 데이터 집합에서 가장 자주 나타나는 값입니다. 범주형 데이터에서 유용하게 사용되죠. 이 세 가지 척도를 함께 분석하면 데이터의 분포와 형태에 대.. 2024. 4. 13.