Look, See, Why

[기초통계] 통계학 4대 연속확률분포 본문

사회학 공부/통계 및 데이터분석

[기초통계] 통계학 4대 연속확률분포

S YE 2026. 3. 21. 00:15

1. Z 분포

가장 기본이 되는 종 모양의 분포로, 모든 정규분포를 평균 0, 표준편차 1로 표준화한 형태입니다.
• 형태: 평균 0을 중심으로 완벽한 좌우 대칭을 이루는 종 모양(Bell curve)입니다.
• 조건: 모집단의 분산을 이미 알고 있거나, 표본의 크기가 충분히 클 때(일반적으로 n >= 30) 중심극한정리에 의해 사용합니다.
• 표기: Z ~ N(0, 1)
• 주요 용도: 모평균에 대한 가설 검정 및 신뢰구간 추정, 두 모집단의 비율 차이 검정.



2. t 분포

표본의 크기가 작을 때 Z분포를 대신하여 사용하는 분포입니다.
• 형태: Z분포처럼 평균 0을 중심으로 좌우 대칭이지만, 중심부가 약간 낮고 양극단(꼬리 부분)이 더 두꺼운 형태(Fat tail)를 가집니다. 이는 표본 크기가 작아 발생하는 불확실성을 반영한 것입니다.
• 조건: 모집단의 분산을 모르고, 표본의 크기가 작을 때(일반적으로 n < 30) 사용합니다.
• 자유도의 영향: 분포의 모양이 표본의 크기에 따른 '자유도(Degrees of Freedom, df = n - 1)'에 의해 결정됩니다. 표본의 크기(자유도)가 커질수록 T분포는 Z분포에 거의 완벽하게 근사합니다.
• 주요 용도: 단일 표본 또는 두 집단 간의 평균 차이 검정(t-test), 회귀계수의 통계적 유의성 검정.


3. chi-square 분포

정규분포를 따르는 데이터의 '분산'을 다룰 때 주로 등장하는 분포입니다.
• 형태: 항상 0 이상의 양수 값을 가집니다. Z분포에서 추출한 표본들의 '제곱합'으로 이루어져 있기 때문입니다. 오른쪽으로 긴 꼬리를 가진 비대칭 모양입니다.
• 자유도의 영향: T분포와 마찬가지로 자유도에 따라 모양이 변합니다. 자유도가 커질수록 대칭에 가까워지며 정규분포의 형태를 띠게 됩니다.
• 주요 용도:
• 교차분석: 명목형/범주형 변수들 간의 연관성이나 독립성을 검정할 때(예: 성별에 따라 선호하는 정당이 다른가?).
• 적합도 검정: 관측된 빈도가 기대되는 빈도와 일치하는지 검정.
• 단일 모집단의 모분산에 대한 가설 검정.


4. F 분포

두 개의 서로 다른 그룹이나 모델의 '분산'을 비교하기 위해 만들어진 비율의 분포입니다.
• 형태: 두 개의 독립적인 카이제곱 확률변수를 각각의 자유도로 나눈 '비율(Ratio)'로 정의됩니다. 카이제곱분포처럼 항상 양수 값을 가지며, 오른쪽으로 꼬리가 긴 비대칭 형태입니다.
• 자유도의 영향: 분자 자유도와 분모 자유도, 즉 두 개의 자유도에 의해 분포의 정확한 모양이 결정됩니다.
• 주요 용도:
• 분산분석(ANOVA): 세 개 이상 집단의 평균 차이를 검정할 때 사용합니다. (집단 간 분산과 집단 내 분산의 비율을 비교)
• 두 모집단의 분산이 동일한지 비교 검정.
• 다중 회귀분석에서 회귀 모형 전체가 통계적으로 유의미한지 확인(모형의 적합도 검정).