본문 바로가기
SPSS 통계 프로그램

[SPSS] T-검증(T-test)

by 쫑아's 2020. 2. 12.

 안녕하세요 풍요로운 쫑아입니다. 오늘은 T-검증 또는 T-test에 대해서 알아보도록 하겠습니다. T-검증은 일반적으로 두 집단 간의 차이가 있는지 비교를 하는 것입니다. 예를 들면 성별에 따른 소득 차이를 들 수 있습니다. 

 여기서 성별은 독립변수이며 소득은 종속변수라고 할 수 있습니다. T-test를 하기 위해서는 첫째, 독립변수는 두 집단으로 이루어진 비연속 변수여야 합니다. 예를 들어 성별, 흡연 유무 등이 될 수 있습니다. 이것을 숫자로 표현하면 0 또는 1로 나타낼 수 있습니다.  둘째, 종속변수는 연속 변수여야 합니다. 예를 들면 소득, 키, 만족도 점수 등이 될 수 있습니다. 연속적인 숫자로 나열된 변수를 말합니다.

 이러한 조건을 만족한 상태에서 본격적으로 T-test를 실시하게 됩니다. 아래 그림을 봐주세요

 저는 T-test를 실행하기 위해 0(남자)과 1(여자)로 구성된 성별 변수와 소득으로 구성된 소득 변수의 값을 미리 입력해놨습니다. 일반적으로 T-test에서는 두 집단간의 종속변수의 차이를 보려고 하므로 여기서 독립변수는 '성별', 종속변수는 '소득'이 됩니다.

 여기서도 영가설을 세워줍니다. 영가설은 '성별에 따른 소득의 차이가 없다'입니다. 

 T-test의 순서는 위의 그림과 같습니다. 분석 -> 평균비교 -> 독립표본 T 검정을 차례대로 눌러줍시다. 그러면 아래 그림과 같이 작은 창이 하나 뜹니다.

 왼쪽 박스에는 모든 변수가 나열되어 있습니다. 오른쪽 상단 박스 '검정 변수'에는 종속변수를 넣고, 오른쪽 하단 박스 '집단변수'에는 독립변수를 넣으면 됩니다. 먼저, 독립변수인 성별을 한번 클릭하여 집단변수 옆에 있는 빨간색 화살표 버튼을 클릭해줍니다. 

 위의 그림과 같이 성별 변수가 들어간 상태입니다. 그런데 들어간 성별 옆에 물음표가 두 개가 떠 있습니다. 아직 집단 정의를 해주지 않았기 때문입니다. 저는 성별을 0은 남자, 1은 여자로 입력했기 때문에 0과 1로 집단을 정의해주어야 합니다. 집단 정의를 클릭해봅니다. 

 그럼 위의 그림과 같이 집단 정의 창이 뜨게 되고 우리는 지정값을 사용할 것이기 때문에 지정값이 집단1에 0을 입력하고, 집단2에는 1을 입력해줍니다. 이렇게 해야 SPSS 통계 프로그램이 0과 1로 이루어진 집단이구나하고 인식을 하게 됩니다. 그리고 계속을 눌러줍니다.

 다시 처음 화면으로 넘어왔습니다. T-test에서는 옵션은 그대로 둡니다. 바로 확인을 눌러줍니다.

 최종적으로 위의 그림과 같은 결과값이 나왔습니다. 첫번째 표는 남자와 여자의 숫자, 그리고 소득의 평균, 표준편차, 표준오차 평균 값들이 나열되어 있습니다. 

 여기서 두 번째로 등장하는 표가 우리가 주요하게 볼 값들입니다. 먼저 두 번째 표의 빨간색 박스를 봐주세요 Levene의 등분산 검정을 나타낸 값입니다. 간단하게 설명하면 두 집단의 소득에 대한 분산 정도가 어느정도 일치하는지를 보는 것입니다. 일종의 정규분포를 따르는지 여부를 파악하는 것입니다. 

 Levene의 등분산 검정에서 영가설은 '두 집단의 소득에 대한 분산이 같다'입니다. 이것을 등분산을 가정함이라고 나타내는 거죠 이에 대한 해석은 유의확률을 보시면 됩니다. 유의확률이 0.626으로 0.05보다 크므로 등분산을 가정함을 채택하게 됩니다. 즉, 영가설을 채택한다는 의미입니다. 이 경우 우리는 왼쪽의 독립표본 검정 결과에서 첫째줄로 해석을 하시면 됩니다. 반대로 0.05보다 유의확률이 작다고 가정하면 두번째줄로 해석을 하면 됩니다. 

 의외로 이 부분을 놓치고 해석하는 분들이 많으므로 주의해서 살펴보아야 합니다. 

 마지막으로 T-test 검증 결과를 해석하면 첫째줄을 봐야하므로 t값은 -2.594, 자유도 18, 유의확률 0.018 등으로 값이 나타났음을 알게 되었습니다. 여기서 유의확률이 0.05 보다 작으므로 최초에 우리가 세운 영가설 '성별에 따른 소득의 차이가 없다'를 기각하고 우리는 이 데이터상에서는 '성별에 따른 소득의 차이가 있다'라고 해석할 수 있게 되는거죠 

 정리하면 최종적인 결론은 '성별에 따른 소득의 차이가 통계적으로 유의미하게 있다'라고 할 수 있겠습니다. 

'SPSS 통계 프로그램' 카테고리의 다른 글

[SPSS] 상관관계 분석  (0) 2020.02.18
[SPSS] 일원 분산분석(One-way ANOVA)  (0) 2020.02.13
[SPSS] 카이제곱 검정  (2) 2020.02.11
[SPSS] 왜도, 첨도의 구분  (0) 2020.02.10
[SPSS] 빈도분석 방법  (0) 2020.02.07