Look, See, Why

STATA로 특정 직업군에 대한 성별 쏠림 현상 분석연습 - Association Model 활용 본문

사회학 공부/통계 및 데이터분석

STATA로 특정 직업군에 대한 성별 쏠림 현상 분석연습 - Association Model 활용

S YE 2025. 6. 14. 01:00

*왜 특정 직업군에 대한 성별 쏠림 현상이 나타나는가?
 
1. 데이터 전처리 by EXCEL
 

Gender Occupation Frequency
1 관리자 160,678
1 전문가 및 관련 종사자 2,631,027
1 사무 종사자 2,749,669
1 서비스 종사자 1,118,225
1 판매 종사자 1,452,961
1 농림∙어업 숙련 종사자 672,979
1 기능원 및 관련 기능 종사자 1,949,973
1 장치∙기계 조작 및 조립 종사자 2,576,062
1 단순노무 종사자 1,338,035
1 기타 106,193
2 관리자 47,997
2 전문가 및 관련 종사자 2,504,692
2 사무 종사자 2,481,065
2 서비스 종사자 2,142,006
2 판매 종사자 1,448,303
2 농림∙어업 숙련 종사자 428,119
2 기능원 및 관련 기능 종사자 372,472
2 장치∙기계 조작 및 조립 종사자 559,534
2 단순노무 종사자 1,090,830
2 기타 8,748

 
출처 : KOSIS, 2020
 
 
2. Occupation 변수 숫자형 변환
encode Occupation, gen(occ_id)
 
 
 
 3. 교차표 확인
tab Gender occ_id [fw=Frequency]
 
 

 
cf. 행비율과 열비율, 기대비도 확인해보자.
 
<행비율> : 성별 내에서

 
<열비율> : 직업 내에서

 
<기대비>
 

 
-> 여성이 과소대표된 직업 (<0.8) : 기능원, 장치기계, 관리자
반면 서비스는 여성 과대대표
 
 
4. 장벽효과 dummy 변수 생성
 
관리자(1), 기능원 및 관련 기능 종사자(2), 장치·기계 조작 및 조립 종사자(8), 농림∙어업 숙련 종사자(4)의 장벽효과를 파악.
 
gen sector_female = (Gender==2 & inlist(occ_id, 1, 2, 4, 8))
 
 
 5. 기준 모델 적합 (성별 + 직종)
glm Frequency i.Gender i.occ_id, family(poisson)
 

est store m1
 
 
6. 확장 모델
 
glm Frequency i.Gender i.occ_id sector_female, family(poisson)
 

sector_female을 보면 된다.

 
 
7. 기준 모델 vs 확장 모델 비교 (LR Test)
lrtest m1 m2
 
 
LR chi2(1) = 1940870.00
Prob > chi2 =     0.0000
 
 
 
8. 교호항 분석 (직종별 장벽 탐색) - 기준범주: 사무 종사자(occ_id==6)
glm Frequency i.Gender##ib6.occ_id, family(poisson)

Iteration 0:  Log likelihood = -519602.75  
Iteration 1:  Log likelihood = -46231.545  
Iteration 2:  Log likelihood = -3383.5408  
Iteration 3:  Log likelihood = -176.12128  
Iteration 4:  Log likelihood =  -152.9126  
Iteration 5:  Log likelihood = -152.91208  
Iteration 6:  Log likelihood = -152.91208  

Gender#occ_id를 보면 된다.

 
 
 
9. Coefficient -> Odds Ratio 변환
 

Occupation Coefficient Odds Ratio
관리자(1) -1.105471 0.331054919
기능원(2) -1.552616 0.211693459
장치·기계조작및조립(8) -1.42412 0.240720204
농림∙어업숙련종사자(4) -0.3495203 0.70502621

 
Odds Ratio = 여성이 해당 직업군에 진입할 비율이 일반 사무종사자에 비해 몇 배인가.(기대 대비 몇% 수준인가)
OR 이 작으면 작을 수록 장벽이 존재함.
 
 


 
정리해보면 사무종사자를 기준으로 했을 때 가장 장벽이 높은 직업은 기능원>장치기계조작및조립>관리자>농림어업숙련종사자
 
 
연구 발전 방향
-추세 분석 : 현대로 올수록 진입 장벽이 약화되었는가?
-교차요인 분석 : 성별뿐 아니라 학력, 혼인 상태, 지역과 같은 다중 요인을 분석해보기
-세밀화된 직종 코드 : 세부적으로 직종, 직무 나눠보기. 이를테면 같은 IT 직종이라하더라도 소프트웨어 개발에는 여전히 여성진입이 어려운 문제. 반면 UX/UI 디자이너는 여성이 많음.