Look, See, Why

[기초통계] 중심극한정리 CLT가 통계학에서 중요한 이유는? 본문

사회학 공부/통계 및 데이터분석

[기초통계] 중심극한정리 CLT가 통계학에서 중요한 이유는?

S YE 2026. 3. 23. 23:24

 
1. 모집단의 분포 형태를 몰라도 분석이 가능하다.
원래 데이터가 어떤 분포를 따르든 상관없이, 표본의 크기가 충분히 크면 표본평균의 분포가 정규분포에 가까워진다.
현실 데이터는 완벽한 정규분포를 띠는 경우보다 극단적으로 한쪽으로 치우쳐 있거나 불규칙한 경우가 훨씬 많다.
중심극한정리 덕분에 모집단의 원래 분포 형태를 정확히 몰라도, 표본평균들이 이루는 분포가 정규분포를 따른다고 가정하고 분석을 진행할 수 있음 (n>=30)
 
2. 추론 통계학의 기반이 된다.
통계 분석에서 흔히 사용하는 방법론들은 대부분 정규분포를 기초로 수학적 틀이 짜여 있다.
중심극한정리가 있기 때문에 다음과 같은 핵심적인 추론 작업이 수학적 정당성을 얻음 
1) 가설 검정 : 두 집단의 평균을 비교하는 t test나 ANOVA 같은 분석을 할 때 표본 평균의 차이가 유의미한지 계산할 수 있음
2) 신뢰구간 : 표본 평균을 바탕으로 실제 모집단의 평균이 존재할 범위를 95%나 99% 확률로 추정할 수 있음
 
3. 표본의 크기와 오차의 관계를 수학적으로 보장한다.
중심극한정리를 표본이 커질수록 분산이 작아지는 것을 보여줌.
데이터를 많이 수집할수록 표본 평균이 모집단 통계에 가까워지면서 정확도가 높아진다는 사실을 수학적으로 증명한다
대규모 데이터나 설문조사 분석이 신뢰성을 가질 수 있게 된다
 


중심극한정리는 수학적 가정(사고실험)에서 출발한다. 수학자들은 복잡한 확률 수식으로 증명을 해냈음.