'2표준편차'만 알아도 통계의 달인   

2010. 4. 8. 09:00
반응형

여러분이 어느 학교 학생들의 몸무게를 조사한다고 가정해 보십시오. 그 학교 학생 수가 아주 많은 탓에 모든 학생을 조사하기가 곤란해서 일부(예를 들어 300명 정도)만 무작위로 뽑아 몸무게를 조사했다고 하겠습니다. 그래서 다음과 같은 통계치를 얻었습니다.

몸무게 평균 = 53 Kg
표준편차 = 5 Kg

이런 통계치는 무엇을 의미할까요? 어떤 의미가 통계치 안에 숨어 있는 걸까요? 많은 사람들이 평균과 표준편차를 보고 '그냥 그런가보다'라며 넘어가고 맙니다.

평균과 표준편차에 숨은 의미는 다음과 같습니다.

[정규분포를 따를 경우]
"임의의 표본이 [평균 + 2표준편차]와 [평균 -  2표준편차] 사이에 해당할 확률은 95%다"  
(여기서 2표준편차는 표준편차에 2를 곱한 값을 말함)

말이 좀 어렵죠? 쉽게 말해 이런 뜻입니다. 표준편차가 5 Kg 이므로 2표준편차는 10 Kg 이죠. 그렇다면, 몸무게를 조사한 학교에 찾아가서 처음 만나는 학생을 저울 위에 올려놓을 경우 그 학생의 몸무게가 43 Kg과 63 Kg 사이에 해당할 확률이 95%가 된다는 의미입니다. 그러니까 그 학생의 몸무게가 43 Kg 보다 작거나 63 Kg 보다 클 확률은 5% 밖에 안 된다는 뜻이죠.

정당지지율이나 후보 지지율 등을 위한 설문조사에서 언급하는 '95% 신뢰구간'이라는 말은 바로 실제의 지지율이 '[평균 + 2표준편차]와 [평균 -  2표준편차] 사이에 놓일 확률이 95% 임'을 지칭하는 문구입니다. 이와 같은 평균-표준편차-신뢰구간 사이의 관계를 '2표준편차의 법칙'이라고 외우면 기억하기 좋을 겁니다.

이제 곧 지방선거가 실시될 텐데요, 여러분은 신문이나 방송에서 이렇게 이야기하는 걸 들을지도 모릅니다.

" 총 1000 명의 유권자에게 출구 조사를 실시한 결과, A후보의 지지율은 45%, B후보의 지지율은 43%로 나타났습니다. 95% 신뢰구간에서 표본 오차는 공히 ± 2% 입니다.
따라서 두 후보가 표본 오차 내에서 막상막하의 지지율을 보이는 것으로 해석됩니다."

이 뉴스를 들은 B후보는 오차범위인 2%를 자신의 지지율인 43%에 더하면 45%가 되기 때문에 A후보에게 결코 밀리는 것이 아니라며 안심할지 모릅니다. 어디까지나 1000 명에게만 설문조사해서 얻은 결과이기 때문에 개표가 진행되면 A후보를 따돌리고 더 많이 득표하리라 기대할지도 모릅니다.

그러나 B후보는 이런 뉴스를 듣고 낙담을 해야 옳습니다. 왜 그럴까요?

표본오차는 바로 2표준편차를 의미합니다. 따라서 A후보와 B후보는 각각 다음과 같은 지지율 분포를 갖습니다.

A후보 : 지지율이 43% ~ 47% 일 확률이 95%

B후보 : 지지율이 41% ~ 45% 일 확률이 95%

이 두 개의 분포를 그림으로 보면 다음과 같습니다. (손으로 그려서 보기가 어려울지 모르겠네요. ^^)


이 그림에서 빗금 친 부분이 A후보가 B후보보다 앞서는 상태입니다. 빗금 친 부분의 면적은 정규분포에서 84%에 해당합니다. 통계를 아시는 분들은 금세 계산할 텐데요, '더보기'를 눌러보면 단서가 나옵니다. 이것을 가지고 간단한 일차방정식을 풀면, 빗금 친 부분의 면적이 얼마인지 구할 수 있을 겁니다.


여하튼, 이 말은 바로 A후보가 B후보를 이길 확률이 84%나 된다는 이야기입니다. 84%라는 확률은 대단히 큰 확률입니다. 따라서 B후보는 웬만해서는 A후보를 이길 수 없죠. 특정 투표함에서 몰표가 나오지 않는 한 힘든 일입니다.

평균과 표준편차, 신뢰구간과 오차범위(또는 표본오차)의 관계를 올바르게 알면, 통계 결과를 잘못 해석하는 일이 대폭 줄어들 테고 좀더 올바르게 의사결정하는 데에 도움을 얻으리라 생각됩니다. 통계와 친하게 지내십시오. 평균과 표준편차의 의미만 잘 알아도 통계는 50% 먹고 들어갑니다. ^^

*참고도서 : 'Super Crunchers', Ian Ayres, 2007


인퓨처컨설팅 & 유정식의 포스트는 아이폰 App으로도 언제든지 볼 수 있습니다. 다음의 링크를 눌러서 여러분의 아이폰에 inFuture App(무료)을 설치해 보세요
               여기를 클릭!


반응형

  
,