Look, See, Why

패널고정효과모형과 잠재계층성장분석 본문

사회학 공부/통계 및 데이터분석

패널고정효과모형과 잠재계층성장분석

S YE 2026. 4. 13. 17:24

1. 패널고정효과모형 (Fixed Effecgts Model)

패널고정효과모형은 관측되지 않은 개별 특성을 통제하여 변수 간의 인과관계를 보다 정확하게 추론하기 위해 사용되는 핵심적인 방법론이다.

패널 데이터는 여러 대상을 여러 시점에 걸쳐 관측한 데이터로, 각 대상은 고유한 특성을 가진다. 어떤  특성이 있냐면...

  • 관측 가능: 교육 수준, 성별, 지역 (보통 데이터에 포함됨)
  • 관측 불가능: 개인의 선천적 능력, 기업의 조직 문화, 국가의 역사적 배경

고정효과모형의 핵심 논리는 시간이 흘러도 변하지 않는 각 대상의 고유한 특성(개별 고정효과)을 모델에서 상쇄시켜 버리는 것이다. 이렇게 함으로써 X와 Y 사이의 순수한 변화 (within variation)만을 포착할 수 있다.

개별 고유한 특성은 차분이나 평균 제거를 통해 제거한다. 각 변수에서 해당 개체의 시계열 평균값을 뺀다.

<장점>

-내생성 통제 : 독립변수와 상관관계가 있는 관측되지 않은 시간 불변 특성을 효과적으로 제거한다.

cf.내생성이란? 관측 불가능 변수가 독립변수와 종속변수 모두에 영향을 주어 결과를 왜곡하는 것이다.

-확률효과모형(Random Effects)보다 가정이 덜 까다로워 사회과학 연구에서 선호된다.

<단점>

-시간 불변 변수 추정 불가 : 성별이나 인종처럼 시간에 따라 변하지 않는 변수의 효과는 개별 고정효과와 함께 사라져 추정할 수 없다.

-자유도 손실 : 개체 수가 많을 경우 추정해야 할 파라미터가 늘어나서 효율성이 떨어질 수 있다.

 

 

2. 잠재계층성장분석(LGCA)

잠재계층성장분석은 인구집단이 동질적이라는 가정을 배제하고 그 안에 서로 다른 발달 경로를 걷는 여러 하위 집단이 존재함을 전제로 한다. 반면 전통적인 잠재모형(LGM)은 모든 개인이 단일한 평균 궤적을 공유한다고 전제한다.

<특징>

-계층 내 동질성 가정 : 동일한 계층에 속한 모든 개인은 동일한 성장 파라미터를 공유하며, 계층 내 분산은 0이다.

이렇게 하면 모형의 파라미터수를 줄여서 수렴을 용이하게 하지만 실제 데이터를 충분히 반영하지 못한다.

이를 보완하기 위해 계층 내의 분산을 허용하는 성장혼합모형(GMM)도 있다. 그래서 LCGA는 GMM보다 더 엄격한 형태임.