본문 바로가기
SPSS 통계 프로그램

[SPSS] 왜도, 첨도의 구분

by 쫑아's 2020. 2. 10.

 안녕하세요 쫑아입니다. 오늘은 지난 빈도분석 포스팅에서 말씀드린데로 왜도와 첨도의 개념에 대해 알아보겠습니다.

우리가 예를 들어 모 고등학교 재학생의 수학점수 데이터를 갖고 있다고 한다면 각각의 학생들이 받은 수학점수의 분포를 하나의 곡선형태로 나타낼 수 있습니다. 그리고 일반적으로 그 점수의 분포 형태는 정규성을 가지고 있습니다. 

정규분포

 위의 그림처럼 가운데를 중심으로 좌우대칭인 곡선이 그려집니다. 좀 더 쉽게 설명하면 수학점수가 가장 낮은 사람부터 가장 높은 사람까지의 숫자의 분포를 그려보니 위의 그림처럼 그려진다는 것입니다. 즉, 상식적으로 수학점수가 가장 낮거나 높은 사람은 거의 없겠죠? 그리고 난이도에 따라 다르겠지만 평균적으로 특정 점수대에 사람들이 몰릴 것이라 예상됩니다. 그것이 평균점수가 될 테고 정규분포의 경우 가장 많은 값(최빈값)이 저 중앙에 가장 많이 몰린 값을 의미할 것입니다.

 하지만 세상에는 완전하게 정규분포를 이루는 경우는 거의 없다고 봐도 됩니다. 따라서 왜도와 첨도를 살펴봐야하는 경우가 생기죠

 

1. 왜도(Skewness)

 왜도는 어느한쪽으로 치우친 상태를 말합니다. 우리가 주로 활용하는 SPSS 통계 프로그램에서는 이 왜도를 계산해줍니다. 왜도는 2가지로 나눠볼 수 있는데 첫째, 왜도(S)값이 0보다 작은 경우 입니다. 이 경우 왼쪽으로는 긴 꼬리모양이 형성되며 오른쪽으로 치우친 분포가 나타납니다. 머리를 오른쪽으로 갸우뚱하고 있다고 생각하면 쉽습니다. 

왜도, S<0

 수학점수로 설명하자면 수학점수가 낮은 사람들이 많은 경우를 말합니다. 왼쪽 극단으로 가면 갈수록 수학점수가 낮은 사람이 많다는 것을 의미하며 이때는 평균점수가 더 낮아지게 됩니다. 

둘째, 왜도(S)값이 0보다 큰 경우 입니다. 이 경우는 오른쪽으로 긴 꼬리모양이 생기며, 왼쪽으로 치우친 분포가 됩니다. 역시 머리를 왼쪽으로 갸우뚱하고 있다고 보면 쉽습니다. 

왜도, S>0

 수학점수로 설명하면 이번에는 반대로 수학점수가 높은 사람들이 많이 분포될 경우입니다. 일종의 수학 영재집단이라고도 할 수 있겠네요 여기서는 전체적인 수학 평균점수가 높습니다. 

 

 

2. 첨도(Kurtosis)

 첨도는 일종의 높낮이를 말합니다. 다른말로 하면 분포가 평균값에 얼마만큼 모여있는지를 의미합니다. 즉 수학점수의 평균점수가 80점이라고 생각해봅시다. 그렇다면 이 80점에 얼마나 많은 사람들이 가까이 붙어있는지 의미합니다. 예를들면 고등학고 A반과 B반이 수학시험을 봤다고 생각해봅시다. 두 반 모두 50명이며, 평균 수학점수가 70점이 나왔습니다. 그런데 A반의 경우 모든 학생이 60점부터 80점사이로 점수를 받았고, B반은 30점부터 100점까지 점수대가 다양한 상태에서 평균 70점이라고 합시다. 이 경우 A반은 좀 더 평균점수에 전부 몰려있으므로 첨도가 매우 높은 형태를 가질 것입니다. 아래 그림을 보면 쉽게 이해가 가능합니다.

첨도

 일반적으로 수학점수는 50점에서 90점사이에 평균적으로 분포하고 있고, 평균은 70점이라고 생각해봅시다. 위의 그림에서 가운데 검정색 그래프(첨도=0)가 그것을 나타내는 정규분포라고 할 수 있습니다. 이를 기준으로 삼으면, A반의 경우는 좀 더 가운데로 볼록 솟은 형태인 파란색 그래프(첨도>0)로 표현이 가능합니다. 한편, B반은 양옆으로 퍼지면서 가라앉은 상태인 빨간색 그래프(첨도<0)로 표현이 됩니다. 다시말해 첨도는 우리가 일반적으로 생각하는 정규분포 곡선에서 얼마만큼 몰려있는지 퍼져있는지를 파악하는 것으로 생각하시면 쉽습니다. 

 

 여기까지 왜도와 첨도의 구분에 관한 포스팅이었습니다. 긴 글 읽어주셔서 감사합니다. 앞으로 저의 포스팅은 초심자의 마음으로 하나하나 개념적인 부분만 알고 가자라는 컨셉으로 작성되어질 것입니다. 그럼 다음 포스팅에서 뵙도록 하겠습니다. 감사합니다. 

'SPSS 통계 프로그램' 카테고리의 다른 글

[SPSS] 상관관계 분석  (0) 2020.02.18
[SPSS] 일원 분산분석(One-way ANOVA)  (0) 2020.02.13
[SPSS] T-검증(T-test)  (0) 2020.02.12
[SPSS] 카이제곱 검정  (2) 2020.02.11
[SPSS] 빈도분석 방법  (0) 2020.02.07