본문 바로가기
SPSS 통계 프로그램

[SPSS] 일원 분산분석(One-way ANOVA)

by 쫑아's 2020. 2. 13.

 안녕하세요 풍요로운 쫑아입니다. 오늘은 일원배치 분산분석(One-way ANOVA)에 대해 알아보도록 하겠습니다. 분산분석은 우리가 앞서 배운 T-test와 실질적으로 다를게 없는 분석입니다. 다만 독립변수가 3개이상인 경우에는 분산분석을 쓴다는 차이점이 있죠

 다시말해 T-test는 두 집단간의 차이를 분석한다면 분산분석은 세 집단이상 간의 차이를 분석합니다. 예를들면 독립변수가 경제수준으로 상,중,하로 되어있다고 했을 경우가 있겠습니다. 이때 종속변수가 연속변수로 우울증 정도라고 봤을 때 '경제수준에 따른 우울증의 변화'가 우리가 알고자 하는 내용이 됩니다. 여기서 영가설은 '경제수준에 따른 우울증의 차이는 없다'라고 할 수 있습니다.

그림1

 위의 그림을 보시면 경제수준과 우울증 변수가 보입니다. 경제수준은 상(3), 중(2), 하(1)로 데이터 값이 입력되어 있습니다. 우울증은 0점부터 100점 사이의 점수를 말하며 점수가 높을수록 우울증이 심하다는 것을 의미합니다. 

 자 이제 본격적으로 경제수준에 따라서 우울증에 차이가 있는지 알아봅시다.

그림2

  위의 그림과 같이 분석 -> 평균비교 -> 일원배치 분산분석 순으로 마우스를 클릭해 줍니다. 앞선 T-test와 비슷한 과정인걸 느끼셨나요? 두 분석 방법 모두 평균비교를 기본으로 합니다. 

그림3

 분산분석을 클릭하면 위의 그림과 같이 작은 창이 뜹니다. 왼쪽에는 역시 모든 변수가 나타납니다. 우리는 경제수준에 따른 우울증을 보기 때문에 요인에는 경제수준을 종속변수에는 우울증 변수를 넣어줘야 합니다. 먼저, 왼쪽 박스에서 경제수준을 한번 클릭하여 활성화 해준 뒤, 녹색박스 안에 화살표 버튼을 눌러 넣어줍니다. 다음, 마찬가지로 왼쪽 박스에서 우울증을 한번 클릭하여 활성화 해준 뒤, 빨간박스 안에 화살표 버튼을 눌러 넣어줍니다.

그림4

 위의 그림처럼 각각의 변수가 알맞게 들어간 걸 확인할 수 있습니다. 그런 뒤 우리는 '사후분석'과 '옵션'을 클릭하여 몇 가지 설정을 해주도록 합니다. 먼저, 사후분석을 클릭해보도록 하겠습니다.

그림5

 위의 그림과 같이 작은 창이 하나 뜨는데 체크할 것들이 정말 많습니다. 이중에서 일반적으로 사후분석에 많이 쓰이는 Scheffe 분석을 체크해줍니다. 그리고 계속을 눌러줍니다. 그리고 다시 "그림4"로 넘어가 다시 옵션을 클릭해줍니다.

그림6

 위의 그림처럼 옵션이라는 작은 창이 뜨게 됩니다. 일반적으로 기술통계를 보고자 하므로 눌러주고, 평균 도표도 한번 눌러줍니다. 그리고 최종적으로 확인을 눌러줍니다.

그림7

 위의 그림과 같이 결과창이 출력되어서 나옵니다. 먼저, 우리가 옵션에서 기술통계를 클릭했으므로 기술통계 표가 첫번째로 나타납니다. 표에서는 경제수준이 하,중,상으로 나뉘어져 있고 각각의 우울증 평균, 표준편차 등이 나타납니다. 한번씩 살펴보시면 됩니다. 

 다음으로 실제로 분산분석의 결과가 나온 표가 ANOVA 표입니다. 여기서 우리가 눈여겨 볼 것은 F값과 유의확률입니다. 그 중에서도 유의확률이 0.000으로 0.05보다 작으므로 우리가 최초에 세운 영가설 '경제수준에 따른 우울증의 차이가 없다'는 기각이 됩니다. 결론적으로 경제수준에 따른 우울증의 차이가 통계적으로 유의미하게 있음을 밝혀낸 것입니다. 

그림8

 일원 분산분석에서는 사후검증을 해주는 것이 중요합니다. 왜냐하면 3개이상의 집단을 비교 분석하기 때문입니다. 예를들어 3개 집단 A,B,C가 있다고 생각해 봅시다. 분산분석으로 이들 집단의 우울증을 분석해본 결과 차이가 있다고 나타났습니다. 그런데 SPSS에서는 A와 B집단은 차이가 나고, A와 C집단은 차이가 없는 경우에도 분산분석 결과에는 차이가 난다고 결과 값을 나타낸줍니다. 즉, 여러 개의 집단 중에 특정 집단만 차이가 나도 분산분석 결과 상에는 차이가 난다고 보는 것입니다. 이 문제를 해결하기 위해 사후검증을 실시합니다. 

 설명이 너무 길어졌네요 다시 위의 그림을 보시면 각 집단별로 1:1로 대응했을 때 차이가 있는지를 나타내주는 표입니다. T-test를 여러번 한 것이라고 생각하면 쉽습니다. 전체 유의확률이 0.000으로 0.05보다 모두 작으므로 각각의 집단이 전부 차이가 난다고 할 수 있습니다. 혹시 문의사항있으면 댓글주세요

그림9

 끝으로 평균도표를 "그림6"에서 클릭해준 값입니다. 경제수준별로 우울증의 평균이 어떻게 달라지는지 도표를 통해 직관적으로 보여줍니다. 

 

 

'SPSS 통계 프로그램' 카테고리의 다른 글

[SPSS] 회귀 분석  (0) 2020.02.20
[SPSS] 상관관계 분석  (0) 2020.02.18
[SPSS] T-검증(T-test)  (0) 2020.02.12
[SPSS] 카이제곱 검정  (2) 2020.02.11
[SPSS] 왜도, 첨도의 구분  (0) 2020.02.10