안녕하세요 쫑아입니다. 이번 포스팅에서는 카이제곱 검정에 대해서 알아보도록 하겠습니다. 카이제곱 검정은 일원 검증과 이원 검증으로 나뉘어져 있으며, 여기서는 이원 검증에 대해서 알아보겠습니다. (일원 검증은 한 집단, 한 변수를 말하며 이원 검증은 두 변수, 두 집단 간의 차이를 보는 것을 말합니다.)
본격적인 검정 과정을 설명하기 전에 카이제곱 검정에 대해 간단히 설명하면 카이제곱 검정은 비연속변수간의 차이를 보는 것입니다. 여기서 비연속 변수란 성별, 학년과 같이 어떤 숫자의 연속성이 있지않은 변수들을 말합니다. 관련된 자세한 내용은 추후 포스팅을 통해서 따로 정리하도록 하겠습니다.
자 그럼 아래 그림을 봐 주시길 바랍니다.
보시는 바와 같이 성별과 흡연유무에 따른 변수들의 특성이 나열되어 있습니다. 성별에서는 0인 경우를 남자, 1인 경우를 여자로 정의하였고, 흡연유무는 0인 경우 비흡연1인 경우를 흡연으로 보았습니다.
우리는 여기서 성별에 따른 흡연유무의 차이가 있는지를 검정하고 싶습니다. 즉, 남자인지 여자인지에 따라 흡연을 하는 것에 차이가 있는가를 말하며, 그 반대의 경우도 마찬가지입니다. 흡연에 따라 성별의 차이가 있는지를 보는 것을 의미하기도 합니다.
결과적으로 카이제곱 검정은 인과관계를 찾는다기 보다는 두 집단의 어떤 유의미한 차이가 있는지를 보는 것을 의미한다고 보는것이 맞습니다. 여기서는 영가설을 세우는데 '성별에 따른 흡연 유무에 차이가 없다'로 설정하도록 하겠습니다.
이제 본격적으로 카이제곱 검증을 하기 위해서 위의 그림처럼 분석 -> 기술통계량 -> 교차분석을 차례로 눌러줍니다. 그러면 아래와 같이 왼쪽에 모든 변수가 나타나고 왼쪽에서는 행과 열 박스가 나타납니다.
이제 내가 보고자하는 변수 2가지를 행과 열에 차례로 집어넣어줍니다. 사실 어느 변수가 행과 열에 들어갈지 정하는 것은 크게 상관이 없습니다. 여기서는 성별을 행으로 넣고, 흡연유무를 열로 넣도록 하겠습니다.
각각의 변수를 클릭하여 활성화한 상태에서 빨간 박스 안에 있는 화살표 아이콘을 클릭하여 행과 열에 넣어줍니다.
다음으로 먼저, 통계량을 눌러줍니다.
통계량을 클릭하면 위의 그림처럼 작은 창이 하나 뜹니다. 처음에는 아무것도 체크가 되어있지 않습니다. 여기서는 카이제곱 검증만 체크를 해줍니다. 그리고 계속을 눌러줍니다.
다음으로 셀을 눌러 줍니다. 여기서 본격적으로 행과 열에 대한 설정 창이 나오게 됩니다.
위의 그림과 같이 교차분석: 셀 표시라는 작은 창이 나옵니다. 왼쪽 상단에는 관측빈도가 체크되어 있을 겁니다. 그대로 나두시면 됩니다. 우리가 체크할 것은 왼쪽 중단입니다. 퍼센트라고 되어있는 박스칸에 행, 열, 전체가 있습니다. 이 부분은 본인이 보고 있는 부분에 따라 체크해주시면 됩니다. 지금은 전부다 체크하여 보도록 하겠습니다. 그런 뒤 계속을 눌러줍니다.
마지막으로 확인을 눌러 줍니다. 그러면 아래 그림과 같이 결과값이 나옵니다.
새롭게 출력결과 창이 뜨면서 먼저, 케이스 처리 요약이 가장 상단에 뜹니다. 이것은 어떤 것을 교차분석을 했으며, 전체 몇 명을 조사했는지 그 퍼센트는 얼마인지를 나타내주는 표입니다. 간단히 보고 넘어가도록 합니다.
다음으로 성별과 흡연유무 변수간의 교차표가 나타납니다. 먼저, 가장 큰 빨간색 박스 구분을 봐주시길 바랍니다. 우리가 행에 성별을 넣었으므로 행에 따른 남,녀값이 나오고, 열에는 흡연 유무를 넣었으므로 열에 따른 비흡연, 흡연 유무가 나타납니다. 그리고 그 아래 작은 빨간색 박스는 그 전체를 나타냅니다.
이제 빈도를 봐주시길 바랍니다. 각각의 행의 첫번째 줄에 나타납니다. 가장 상단 첫째줄의 빈도를 읽어보면 남자이면서 비흡연인 사람이 6명, 남자이면서 흡연인 사람이 17명, 남자 전체 23명으로 나타남을 알 수 있습니다.
가장 상단의 두번째 줄(주황색 박스)을 보시길 바랍니다. 우리가 앞서 '셀'을 눌러 '퍼센트'박스에서 '행'을 눌러주면 나타나는 결과 값입니다. 행에서는 우리가 성별로 설정했기 때문에 각각의 성별에 따른 퍼센트를 나타냅니다. 즉, 주황색 박스는 전체 남자(23명) 중에서 비흡연인 사람(6명)에 대한 퍼센트입니다. 행 끝에 전체 숫자와 퍼센트가 나옵니다.
이번에는 파란색 박스를 보시길 바랍니다. 여기는 우리가 '셀'을 눌러 '퍼센트'박스에서 '열'을 눌러주면 나타나는 결과 값입니다. 열은 우리가 흡연유무를 넣어 설정했기 때문에 전체 흡연자(24명) 중에서 남자이면서 비흡연인(6명)에 대한 퍼센트입니다. 열 끝에 (맨 아래 전체 블럭) 전체 빈도와 퍼센트가 나옵니다.
끝으로 녹색 박스를 보시길 바랍니다. 여기도 역시 우리가 '셀'을 눌러 '퍼센트'박스에서 '전체'를 눌러준 결과 값입니다. 이는 전체 50명 중, 남자이면서 비흡연, 남자이면서 흡연의 비중을 나타냅니다.
마지막으로 가장 주요한 카이제곱 검정 결과 값에 대한 표입니다. 위의 그림의 빨간 박스 안에 있는 내용만 보시면 됩니다. 여기서 값은 카이제곱의 값을 나타냅니다. 여기서 눈여겨 볼 것은 근사 유의확률(양측검정) 값입니다. 이 값이 0.05보다 작으면 우리가 최초에 세운 '성별에 따라 흡연유무의 차이가 없다'라는 가설을 기각합니다. 즉, 카이제곱 검정 결과 성별에 따라 흡연유무의 차이가 통계적으로 유의미하게 있다는 것을 말합니다.
'SPSS 통계 프로그램' 카테고리의 다른 글
[SPSS] 상관관계 분석 (0) | 2020.02.18 |
---|---|
[SPSS] 일원 분산분석(One-way ANOVA) (0) | 2020.02.13 |
[SPSS] T-검증(T-test) (0) | 2020.02.12 |
[SPSS] 왜도, 첨도의 구분 (0) | 2020.02.10 |
[SPSS] 빈도분석 방법 (0) | 2020.02.07 |