Look, See, Why

[기초통계] 연속확률분포 / 표본분포 본문

사회학 공부/통계 및 데이터분석

[기초통계] 연속확률분포 / 표본분포

S YE 2026. 3. 25. 19:55

<연속확률분포>
-이산확률분포(discrete, 별개의)와 달리 연속확률변수는 비정수(noninteger) 값을 범위로 갖는 것이 특징이다.
--> 이 쪽 line : 베르누이분포, 이항분포, 다항분포
 
-연속 확률분포함수(PDF, Probability Density Function)는 f(x)로 나타내며, 연속확률분포는 음의 값을 갖지 않음

--> 이 쪽 line : 정규분포, t분포, F분포, 카이제곱분포..
Cf. 고급통계란 무엇인가? 통계학적 가정이 깨졌을 때(현실 분포는 항상 가정대로 되지 않는다)의 대안을 찾는 것이다.
Cf. 자르는 걸 미분, 자른 것을 붙이는 걸 적분하는 것이다.
 
 
-연속 누적확률분포함수(CDF, Cumulative distribution function)은 F(x)로 나타내며, 누적 면적인 P(X<=x)를 의미

s

 
<정규분포>

 
-Gaussian Distribution 이라고도 한다.
-두 모수인 μ 와 σ에 의해서 정의
-N(µ, 𝜎 )로 표기
-정규확률변수 X 의 범위는 −무한대 < x < +무한대

-정규분포는 대칭적인 분포이며 평균주변에서 단봉형(single peak, 오직 하나의 최댓값을 가지는 형태)이다.
 
<확률변수가 정규성을 갖기 위한 특징>
1) 연속적인 눈금으로 측정
2) 분명한 중심경향을 가지고 있어야 함
3) 단봉 (single peak)을 가지고 있어야 함
4) 점차 줄어드는 꼬리 모양을 가지고 있어야 함
5) 평균을 중심으로 대칭적 (양쪽 꼬리 모양이 같다)
 
<기본 용어>

-분산은 단위 영향을 많이 받는다. (단위가 커지면 분산도 엄청 커짐) -> 표준편차 사용 : 어느 정도에서 왔다갔다하는구나 알 수 있음
 
 
<표준정규분포>
-μ 과 σ 값에 따라 다양한 종류의 정규분포가 존재할 수 있는데, 평균을 빼고 표준편차로 나누어 줌으로써 표준화된 확률변수로 변환

 
-표준정규분포는 평균이 0이고 표준편차가 1이다
-표준정규분포는 Z ~ N(0, 1) 으로 표기하며 , f(z) 의 모양은 0(평균)에서 가장 높고 변곡점은 +-1(표준편차)
 

1시그마일 때, 2시그마일 때, 3시그마일 때

 
 

Z table
면적=확률

P(-1.95<Z<1.96) 면적을 계산하고 싶으면 확률분포표를 찾아보면 면적을 알아낼 수 있다.