통계, 그 새빨간 거짓말   

2010. 9. 10. 09:00
반응형


며칠 전, 지하철을 타기 위해 플랫폼에 서있다가 이런 광고를 봤습니다. 정확한 토씨는 잊었지만, 거기엔 이렇게 적혀 있더군요.

"우리 회사 FC(파이낸셜 컨설턴트, 보험영업인)들 중 4분의 1은 월 500만원 이상을 법니다"

보험회사의 핵심역량은 보험상품의 설계보다는 보험영업인들의 영업력에 달렸습니다. 사실 보험상품에서 차별화를 꾀하기가 어렵다고들 말합니다. 그렇기 때문에 능력있는 보험영업인을 잘 모집하고 교육시켜서 그들을 오랫동안 영업을 하도록 해야 회사로서 이득이죠.

그래서 보험영업인들이 얼마나 회사에 오래 남아 일하느냐를 측정하는 '정착율'이란 지표는 보험회사에서 매우 중요한 지표로 관리됩니다. 당연히 위의 광고 카피는 우수한 영업인력을 유인하려는 목적으로 만들어졌겠죠?

헌데, 보험영업인의 4분의 1, 즉 25%가 월수입 500만원 이상이란 말을 문자 그대로 믿어야 할까요? 전 좀 의심이 들더군요. 그래서 통계에 젬병이지만, 한번 따져보기로 했습니다.

우선 그 회사 보험영업인들의 월수입 분포가 '정규분포'를 따른다고 가정해 봤습니다. 하지만 정규분포를 그리려면 월수입의 평균과 표준편차를 알아야 합니다. 위의 광고문구만 보고는 어떤 분포를 따르는지 알기가 불가능하죠.

그래서 전 '표준정규분포(평균이 0이고 표준편차가 1인 정규분포)'를 먼저 상정한 다음에 이렇게 저렇게 해서(trial & error 방식으로) 대략 다음과 같은 정규분포를 따를 것이라 결론을 내렸답니다.

 월수입 분포 추정 결과 

평균 : 약 300만원    
표준편차 : 약 300만원인 정규분포

이걸 그림으로 그리면 다음과 같습니다.

(정규분포로 추정한 월수입 분포)


이 그림에서 오른쪽에 파랗게 빗금쳐진 부분이 전체의 25%, 즉 4분의 1을 나타냅니다. 그들은 500만원 이상의 월수입을 올리는 사람들입니다. 문제는 왼쪽에 빨갛게 빗금쳐진 부분입니다. 그것도 전체의 25%를 차지하는데 그들의 수입은 보다시피 100만원 이하입니다. 게다가 월수입이 마이너스인 사람도 상당히 많이 존재합니다(약 16%의 사람들에 해당).

월수입이 500만원 이상인 사람이 4분의 1이나 된다는 광고 카피의 이면에는 월수가 100만원도 안 되거나 오히려 회사에 돈을 내고 다니는(즉 월수입이 마이너스인) 사람도 있음을 이 그림이 보여줍니다. 물론 애초에 정규분포를 잘못 추정했기 때문에 이런 결과가 나왔을지 모르죠. 하지만 통계를 유리한 쪽으로만 해석해서 광고를 보는 사람들을 현혹시킬 의도가 없다고 장담할 수 있을까요?

그런데, 보험영업인들의 월수입 분포가 정규분포를 따를 거라는 위의 가정이 과연 옳을까요? 우리는 보통 아주 잘 버는 사람과 아주 못 버는 사람들은 소수이고, 중간 정도 버는 사람들이 가장 많으리라는 '정규분포식 고정관념'을 가지고 있습니다. 위의 그림처럼 '종 모양'의 그래프를 머리 속에 그리곤 하죠.

하지만 실제의 분포는 다른 양상으로 나타나는 경우가 많습니다. 예를 들어 블로그들의 RSS구독자수 분포를 그려보면, 극소수의 블로그는 구독자수가 매우 많은 반면, 대부분의 블로그들은 구독자수가 거기서 거기인 모양이 나타납니다. 소위 '승자 독식 현상'이 그림으로 그려지죠. (이와 같은 현상을 예전에 포스팅한 적이 있으니 참고하세요)

보험영업인들의 월수입 분포도 RSS구독자수 분포처럼 '승자 독식 현상'으로 나타나진 않을까요? 만약 그렇다면 아래의 그림처럼 분포가 그려집니다. 

(손으로 그리다보니 그림이 이상하네요. '승자독식형' 분포를 가정하여 그린 그래프)


먼저 이 그래프가 매끄럽게 연속선으로 그려진 탓에 월수입이 100~500만원 사이에 있는 사람도 꽤 많다고 착각할 수 있다는 점에 유의하세요. 이 부분(100~500만원 사이)에 찍히는 점들은 조밀하지 못합니다. '밀도'로 본다면 100만원 이하인 쪽(빨갛게 표시된 부분)이 더 조밀하게 점들이 모여 있지요.

데이터가 없기 때문에 이 그림도 역시 추측에 불과하지만, 정규분포로 추정할 때보다 월수입이 100만원에 미치지 못하는 사람들(빨갛게 빗금쳐진 부분)이 더 조밀하게 존재함을 암시합니다. 500만원 이상 버는 사람이 25%나 된다는 선전의 뒷면에는 '100만원도 못버는 사람들이 50% 혹은 60% 이상이나 된다'는 사실이 숨어있을지 모릅니다. 어디까지나 짐작이지만, 의심을 거두기가 어렵습니다.

마크 트웨인은 "세상에는 3가지의 거짓말이 있다. 그럴듯한 거짓말, 새빨간 거짓말, 그리고 통계"라고 말한 적이 있습니다. 사실 통계는 거짓말을 하지 않습니다. 그걸 자기 입맛대로 재단하는 사람들이 거짓말을 하는 것이죠.

대부분의 사람들이 100만원도 제대로 못 버는데도, 상위 25%인 사람들이 500만원을 버니까 중간 정도만 하면 3~400만원은 벌 거라면서 잘못된 환상을 심어주는 건 아닌지 경계해야 합니다. "우리 회사 직원들은 평균 연봉이 1억 원입니다."라는 말은 그 자체가 거짓은 아닙니다. 평균이란 통계치가 쓰이지 말아야 할 곳에 쓴 사람이 바로 거짓말쟁이입니다.

통계에 속지 마십시오.


inFuture 아이폰 앱 다운로드       inFuture 안드로이드 앱 다운로드 

반응형

  
,