| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 |
- 계몽의변증법
- 뒤르켐
- 사회학
- AHP분석
- 육체의 변증법
- 독립표본t검정
- Grouped-BarChart
- 취업준비생연구
- HLM
- 고급통계
- Topicmodeling
- LDA
- 세종시
- 청년연구
- 행렬
- 아도르노
- 파슨스
- 데이터분석
- 고급통계학
- 통계학분포
- 취준연구
- LDA분석
- 논술대회
- 베이지안통계학
- 광기의역사
- 청년비경제활동인구
- 공동생산
- 데이팅앱
- 베버
- 동시출현의미망
- Today
- Total
Look, See, Why
STATA로 특정 직업군에 대한 성별 쏠림 현상 분석연습 - Association Model 활용 본문
*왜 특정 직업군에 대한 성별 쏠림 현상이 나타나는가?
1. 데이터 전처리 by EXCEL
| Gender | Occupation | Frequency |
| 1 | 관리자 | 160,678 |
| 1 | 전문가 및 관련 종사자 | 2,631,027 |
| 1 | 사무 종사자 | 2,749,669 |
| 1 | 서비스 종사자 | 1,118,225 |
| 1 | 판매 종사자 | 1,452,961 |
| 1 | 농림∙어업 숙련 종사자 | 672,979 |
| 1 | 기능원 및 관련 기능 종사자 | 1,949,973 |
| 1 | 장치∙기계 조작 및 조립 종사자 | 2,576,062 |
| 1 | 단순노무 종사자 | 1,338,035 |
| 1 | 기타 | 106,193 |
| 2 | 관리자 | 47,997 |
| 2 | 전문가 및 관련 종사자 | 2,504,692 |
| 2 | 사무 종사자 | 2,481,065 |
| 2 | 서비스 종사자 | 2,142,006 |
| 2 | 판매 종사자 | 1,448,303 |
| 2 | 농림∙어업 숙련 종사자 | 428,119 |
| 2 | 기능원 및 관련 기능 종사자 | 372,472 |
| 2 | 장치∙기계 조작 및 조립 종사자 | 559,534 |
| 2 | 단순노무 종사자 | 1,090,830 |
| 2 | 기타 | 8,748 |
출처 : KOSIS, 2020
2. Occupation 변수 숫자형 변환
encode Occupation, gen(occ_id)
3. 교차표 확인
tab Gender occ_id [fw=Frequency]

cf. 행비율과 열비율, 기대비도 확인해보자.
<행비율> : 성별 내에서

<열비율> : 직업 내에서

<기대비>

-> 여성이 과소대표된 직업 (<0.8) : 기능원, 장치기계, 관리자
반면 서비스는 여성 과대대표
4. 장벽효과 dummy 변수 생성
관리자(1), 기능원 및 관련 기능 종사자(2), 장치·기계 조작 및 조립 종사자(8), 농림∙어업 숙련 종사자(4)의 장벽효과를 파악.
gen sector_female = (Gender==2 & inlist(occ_id, 1, 2, 4, 8))
5. 기준 모델 적합 (성별 + 직종)
glm Frequency i.Gender i.occ_id, family(poisson)

est store m1
6. 확장 모델
glm Frequency i.Gender i.occ_id sector_female, family(poisson)

7. 기준 모델 vs 확장 모델 비교 (LR Test)
lrtest m1 m2
LR chi2(1) = 1940870.00
Prob > chi2 = 0.0000
8. 교호항 분석 (직종별 장벽 탐색) - 기준범주: 사무 종사자(occ_id==6)
glm Frequency i.Gender##ib6.occ_id, family(poisson)
Iteration 0: Log likelihood = -519602.75
Iteration 1: Log likelihood = -46231.545
Iteration 2: Log likelihood = -3383.5408
Iteration 3: Log likelihood = -176.12128
Iteration 4: Log likelihood = -152.9126
Iteration 5: Log likelihood = -152.91208
Iteration 6: Log likelihood = -152.91208

9. Coefficient -> Odds Ratio 변환
| Occupation | Coefficient | Odds Ratio |
| 관리자(1) | -1.105471 | 0.331054919 |
| 기능원(2) | -1.552616 | 0.211693459 |
| 장치·기계조작및조립(8) | -1.42412 | 0.240720204 |
| 농림∙어업숙련종사자(4) | -0.3495203 | 0.70502621 |
Odds Ratio = 여성이 해당 직업군에 진입할 비율이 일반 사무종사자에 비해 몇 배인가.(기대 대비 몇% 수준인가)
OR 이 작으면 작을 수록 장벽이 존재함.
정리해보면 사무종사자를 기준으로 했을 때 가장 장벽이 높은 직업은 기능원>장치기계조작및조립>관리자>농림어업숙련종사자 순
연구 발전 방향
-추세 분석 : 현대로 올수록 진입 장벽이 약화되었는가?
-교차요인 분석 : 성별뿐 아니라 학력, 혼인 상태, 지역과 같은 다중 요인을 분석해보기
-세밀화된 직종 코드 : 세부적으로 직종, 직무 나눠보기. 이를테면 같은 IT 직종이라하더라도 소프트웨어 개발에는 여전히 여성진입이 어려운 문제. 반면 UX/UI 디자이너는 여성이 많음.
'사회학 공부 > 통계 및 데이터분석' 카테고리의 다른 글
| 종합 지표 가중합산 방법, 산술기하조화평균 (0) | 2025.11.14 |
|---|---|
| 델파이 기법과 AHP(Analytical Hierarchy Process) 분석 (0) | 2025.11.13 |
| 지표의 정규화 Normalization (0) | 2025.11.13 |
| 지표의 타당도, 신뢰도, Interpolation (0) | 2025.11.13 |
| 지표와 지수 (0) | 2025.11.13 |