많은 기업에서 직원들 스스로 자신의 역량을 평가하는 '자기평가' 과정이 있습니다. 자기평가의 목적은 지난 1년 간의 역량 개발 과정을 반성하면서 자신의 장단점을 다시금 성찰하고 향후 역량 개발의 방향을 설정하는 데 도움을 얻기 위해서입니다. 하지만 현장에서 부하직원들과 관리자들이 이러한 목적을 올바르게 인식하고 이행하는 경우는 애석하게도 그리 많지 않습니다. 자기평가는 평가 절차 중 하나의 요식 행위로 여겨지거나, 부하직원들이 관리자들에게 자신의 역량을 어필하고 정당화하는 수단으로 사용하는 것이 현실이죠.

보통 자기평가 결과는 최종 평가점수에 반영하지 않는 것이 일반적입니다. 이에 대한 반론은 별로 없습니다. 그런데 관리자(팀장)가 부하직원의 역량을 평가할 때 자기평가 결과를 참조해야 하는가를 놓고서는 종종 의견이 대립되곤 합니다. 자기평가 결과를 참조하거나 혹은 옆에 나란히 놓고 평가하는 방식(수기로 이뤄지든 PC를 통하든)을 찬성하는 사람들은 부하직원이 스스로 느끼는 자기의 '역량 수준'을 인정해 주어야 한다고 말합니다. 팀장이 부하직원 개개인의 역량 개발 과정과 단계를 모두 알지 못하는 게 현실이기 때문에 자기를 잘 아는 사람은 바로 자신이라고 말합니다. 자기평가 결과를 참조하지 않을 바에야 왜 자기평가라는 소모적인 과정을 진행하느냐고 반문하기도 합니다.



이와 반대측에 서있는 사람들은 반드시 팀장이 부하직원의 역량을 독자적으로 평가해야 한다고 말합니다. 자기평가 결과는 대개 '관대하게' 나온다는 이유 때문입니다. 과대평가된 자기평가 결과를 참조하면 아무리 관리자가 주관을 가지고 평가하려 해도 영향 받기 마련이라고 주장하죠. 능력이 출중하지만 겸손한 직원들은 상대적으로 불리하고, 능력이 없으면서 자기PR에는 능한 직원들에게 높은 점수를 줄지도 모른다고 염려합니다. 그래서 평가의 왜곡을 막으려면 자기평가 결과는 일체 들춰보지 못하도록 해야 한다고 말합니다.

여러분은 이 상반되는 주장 중에서 어떤 것이 옳다고 생각합니까? 이 질문에 답을 하기 위해 코넬 대학교의 저스틴 크루거(Justin Kruger)와 데이비드 더닝(David Dunning)이 수행한 유명한 실험을 살펴보는 것이 좋겠군요. 크루거와 더닝은 실험에 참여하면 학점에 유리한 점수를 주겠다고 하고  45명의 코넬대 학생들을 모았습니다. 그들은 학생들에게 20개로 이루어진 논리적 사고 시험을 치르도록 했습니다. 그런 다음, 크루거와 더닝은 학생들에게 질문을 던졌습니다. 첫 번째 질문은 "자신의 논리적 사고 역량 수준이 어느 정도라고 생각하는가?(percentile)"였고, 두 번째는 "시험 점수가 다른 학생들과 비교하여 몇 등이라고 생각하는가?(percentile)"였습니다.

답변 결과를 평균하니 학생들은 자신의 논리적 사고 역량을 상위 34%라고 답했습니다. 또한 시험 점수도 상위 39%에 해당할 거라고 말했죠. 학생들이 자신의 역량과 시험점수를 객관적으로 판단했다면 평균이 상위 50% 라고 나왔겠지만, 실험 결과는 학생들이 자신을 과대평가하는 경향이 있음을 드러냈습니다. 과대평가하는 경향은 시험 점수가 저조한 학생(하위 25% 이하)들에게서 가장 크게 나타났습니다. 논리 문제를 못 풀었으면서도 자신의 논리적 사고 역량 수준이 높고 시험도 잘 봤을 거라고 착각한다는 의미입니다. 이를 '자신감 착각'이라고 부릅니다.

크루거와 더닝은 유머 감각과 문법 실력 등에 대해서도 비슷한 실험을 수행했는데 결과는 비슷하게 나왔습니다. 먼저 학생들의 유머 감각을 테스트해서 상위자부터 하위자까지의 '유머 감각 서열'을 만들어냈습니다. 그런 다음 코미디 작가들이 쓴 우스운 이야기 30개를 골라서 코미디언들에게 메일로 보냈죠. 코미디언들이 30개의 이야기를 읽고 전혀 재미있지 않음(1점)부터 아주 재미있음(11점)까지 평가해 주길 요청하기 위해서였습니다. 8명의 코미디언이 답변을 보내왔는데 이야기의 재미에 대한 그들의 의견은 거의 일치했습니다. 일관성이 있다는 뜻이었죠.

크루거와 더닝은 학생들에게 똑같은 30개의 이야기를 평가해달라고 했습니다. 그랬더니 유머 감각 테스트에서 고득점을 얻은 학생들은 코미디언들의 판단과 78퍼센트 정도 일치했습니다. 하지만 유머 감각 테스트에서 하위 25%에 해당하는 저득점자들은 코미디언들이 재밌다고 평가한 이야기 중에서 44퍼센트만 재미있다고 생각하고, 재미없는 이야기 중 56퍼센트를 재미있다고 평가 내렸습니다. 본래 유머 감각 테스트에서 하위 그룹에 랭크됐으니 이같은 불일치는 예상된 결과였습니다.

학생들에게 자신의 유머 감각이 평균보다 얼마나 높냐는 질문을 던졌더니 66퍼센트의 학생들이 다른 사람보다 유머 감각이 좋다는 평가를 내렸습니다. 그리고 유머 감각 테스트에서 하위 25%에 해당하는 학생들이 자신의 유머 감각을 평균보다 높게 평가한다는 결과가 나왔습니다. 다시 말해 객관적으로 능력이 처지는 사람들이 '자신감 착각'을 더 강하게 보였습니다.

이 실험은 우리 인간에게 '자신의 능력을 인식하는 능력'이 진화되지 않았음을 시사합니다. 자신의 능력을 실제보다 과대하게 인식하는 능력이 환경 적응에 유리했기 때문일지 모르겠네요. 어쨌든 크루거와 더닝의 실험에서 나타나는 소위 '더닝-크루거 효과'는 자기평가를 참조하거나 열람하는 일이 평가의 왜곡을 가져올 수 있다는 점을 경고합니다. 또한 '더닝-크루거 효과(Dunning-Kruger Effect)'가 관리자의 '관대한 평가 경향'을 부추겨 이득을 보는 직원들은 역량이 부족한 사람들일지 모른다는 점도 시사합니다. 결과적으로 역량을 높게 평가 받아 마땅한 직원들은 상대적으로 손해를 입습니다. 게다가 겸손하기까지 하면 더욱 그렇겠죠. 

서두에 언급했듯이 자기평가는 반성과 계획을 위한 보조장치이지, 점수에 반영한다거나 관리자의 평가에 영향을 주는 견제장치가 아닙니다. 평가의 왜곡을 막으려면 직원들의 심리가 어떠하고, 평가의 과정에서 어떠한 심리적 오류가 발생하는지 면밀히 검토할 필요가 있습니다. 적어도 지금의 평가제도가 '더닝-크루거 효과'를 방관하여 직원들의 '자신감 착각'에서 헤어나오지 못하는 일은 없어야겠습니다. 
 
(*참고논문 : Unskilled and Unaware of it )