Look, See, Why

Notice

Recent Posts

Recent Comments

Link

« 2026/06 »
일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

Tags more

Archives

Today

Total

관리 메뉴

목록전체 글 (81)

Look, See, Why

다층모형과 공간분석

1) 다층모형다층모형은 위계적인 구조를 가진 데이터를 분석하는 통계 방법이다.중첩된 데이터 구조를 가지고 있으며, 같은 집단 내 관측치들이 서로 독립적이지 않다는 점을 고려한다.집단 간 차이와 집단 내 차이를 동시에 분석한다.*주요 특징1. 급내상관계수 : 같은 집단 내 개체들이 얼마나 비슷한가?를 나타내는 지표2. 무선효과 : 집단마다 절편이나 기울기가 다르다고 가정3. 고정효과 : 모든 집단에 동일하게 적용되는 평균적인 효과 2) 공간분석공간분석은 지리적 위치와 공간적 관계를 고려한 분석 방법.주요개념-공간적 자기상관 : 가까운 지역끼리 비슷한 값을 가지는 경향-공간 회귀모형 : 공간시차모형, 공간오차모형, 공간더빈모형-지리가중회귀 : 위치에 따라 회귀계수가 달라진다.-공간 가중행렬ㄴ공간적 관계를 ..

사회학 공부/통계 및 데이터분석 2026. 5. 20. 23:20

[기초통계] 회귀분석

[단순선형회귀모형]종속변수를 Y라 하고, 독립변수를 X라 할 때 두 변수간의 선형 모델은cf. 비선형을 선형처럼 만들어서 쓰는 경우가 있다. [보통최소제곱추정(OLS)]종속변수와 독립변수 간의 관계를 가장 잘 나타내는 best fit인 직선을 추정한다.=추정값과 관찰값의 차이, 즉 오차가 최소가 됨을 의미한다추정값 : 보통의 사람들은 이럴 것이다 하는 값 (집단적, 평균적인 값)이거의 확장판이 WLS, ML, GLS, GEE 등등이 있다..(지금도 개발 중)두 변수 간의 관계를 가장 잘 설명한다는 것은 추정된 직선상에 있는 각 점들과 각 종속변수와 독립변수들의 관찰값들과의 수직 거리인 오차들이 최소가 됨[오차와 잔차의 차이]ㄴ오차(error) : 참값(실제 값)과 관찰값 간의 차이오차는 이론적이고 미지의..

사회학 공부/통계 및 데이터분석 2026. 5. 20. 22:27

[기초통계] 카이제곱 분포와 상관분석

GLM(일반화 선형모형) 그룹들 - 선형회귀, 로지스틱 회귀, 포아송 회귀 ... -카이제곱 검정은 범주형 데이터간의 관계를 분석하거나, 관측빈도가 기대빈도와 얼마나 다른지를 검정한다.-카이제곱분포는 단일 모집단으로부터 추출한 표본분산과 모집단분산의 비를 나타내는 확률변수에 대한 검정에서 활용되는 분포.ㄴ연속확률분포로서 확률변수는 항상 양의 값만을 가짐, 오른쪽 꼬리를 가진 비대칭 분포ㄴ자유도에 의해 모양이 결정되며 자유도가 커질수록 정규분포에 근접 -카이제곱 검정을 하려면 빈도교차표를 먼저 만들어야 한다. 교차분석을 하고 통계량을 만들 때 카이제곱 통계랑을 가져다 쓰는 것임.-빈도교차표는 카이제곱 검정의 시작. 관찰값과 기대값의 차이를 보고, 이를 통해서 카이제곱 통계량을 산출한다.ㄴ카이제곱 통계량 =..

사회학 공부/통계 및 데이터분석 2026. 5. 6. 20:17

[기초통계] 자유도, 분산분석(평균차이 검정), F검정(분산비 검정)

-자유도로 나누는 이유? 불편추정량을 얻기 위함이다. -수학적 설명으로 도출할 수 있음, 표본평균을 이용할 경우 항상 갭(bias)가 있게 된다.n-1로 나누어야 불편추정량(bias가 없이 추정하기 위해서임)이 된다. [분산분석]평균차이를 한 번에 적용할 수 있는 방법을 찾다가 평균차이검정(t검정)에 분산을 사용한 것임.엄밀히 말하면 세 집단 이상의 평균차이검정을 효율적으로(한 번에) 하기 위해서 분산분석을 사용하는 것임.평균이 같은지 틀린지를 알고 싶은것임. 쓸데없이 독립표본t검정을 여러 번 하면 힘듦. [분산분석 원리]전체 데이터가 흩어진 정도를 두 부분으로 나눈다. Y의 변동=설명된 변동+설명되지 않은 변동(yᵢⱼ − ȳ) = (ȳⱼ − ȳ) + (yᵢⱼ − ȳⱼ) 이걸 제곱해서 합치면SST(총 제..

사회학 공부/통계 및 데이터분석 2026. 4. 29. 20:27

추적 60분 은둔중년 다큐멘터리 유튜브 댓글 분석 텍스트마이닝

사회학 공부/통계 및 데이터분석 2026. 4. 19. 00:10

[기초통계] 독립변수 종속변수 척도 방법론

독립 / 종속범주형연속형범주형카이제곱검정t검정, F검정연속형로지스틱 회귀상관분석

사회학 공부/통계 및 데이터분석 2026. 4. 15. 18:55

패널고정효과모형과 잠재계층성장분석

1. 패널고정효과모형 (Fixed Effecgts Model)패널고정효과모형은 관측되지 않은 개별 특성을 통제하여 변수 간의 인과관계를 보다 정확하게 추론하기 위해 사용되는 핵심적인 방법론이다.패널 데이터는 여러 대상을 여러 시점에 걸쳐 관측한 데이터로, 각 대상은 고유한 특성을 가진다. 어떤 특성이 있냐면...관측 가능: 교육 수준, 성별, 지역 (보통 데이터에 포함됨)관측 불가능: 개인의 선천적 능력, 기업의 조직 문화, 국가의 역사적 배경고정효과모형의 핵심 논리는 시간이 흘러도 변하지 않는 각 대상의 고유한 특성(개별 고정효과)을 모델에서 상쇄시켜 버리는 것이다. 이렇게 함으로써 X와 Y 사이의 순수한 변화 (within variation)만을 포착할 수 있다.개별 고유한 특성은 차분이나 평균 제..

사회학 공부/통계 및 데이터분석 2026. 4. 13. 17:24

[기초통계] 가설검정/독립표본t검정

[가설검정]-가설검정 : 모수에 대한 새로운 가설이 옳다고 판단할 수 있는지를 표본통계량을 이용해서 평가하고 판단하는 과정-유의수준 : 귀무가설이 옳다는 전제하에서 어느정도 극단적인 표본통계량값이 나오면 귀무가설이 잘못되었다고 판단하여 귀무가설을 기각할 최대한의 확률-임계치 : 검정의 종류(양측, 단측)와 유의수준을 고려해서 산출한 값으로 가설의 채택 여부를 결정짓는 경계값-검정통계량 : 표본으로부터 추출한 통계량이나 검정에 사용할 분포에 따라 그에 맞는 값으로 치환한 통계량-p값 : 표본으로부터 얻은 통계량 혹은 이를 치환한 검정통계량의 절대값보다 더 큰 절대값을 또다른 표본으로부터 얻을 수 있는 확률[독립표본 t검정]양측검정과 단측검정이 있다.[분산이 같은 경우와 다른 경우]

사회학 공부/통계 및 데이터분석 2026. 4. 9. 13:10

이전 Prev 1 2 3 4 ··· 11 Next 다음

목록전체 글 (81)

Look, See, Why

티스토리툴바