통계는 기만적일 수 있는가?
「깨어라!」 ‘오스트레일리아’ 통신원 기
통계 하면 인상적으로 들린다. 너무나 근거가 확실하고, 명확하여 반박할 수 없어 보인다. 수치는 거짓말을 하지 않는다고들 한다. 그러나 경계해야 한다. 정직하게만 사용된다면, 수치는 매우 유익하고 유용할 수 있다. 하지만, 또한 통계는 기만적인 방식으로도 제시될 수 있다.
인류는 수천년 동안 통계를 사용해 왔다. ‘모세’ 시대에 과세, 군 복무, 제사직 임무 등의 목적을 위해 통계가 작성되었다. (민수 1:2, 3; 3:15; 31:25-41) ‘로마’ 제국은 인구 조사를 행하여 통계를 작성했고, 이런 인구 조사 중 하나는 중요한 예언을 성취시키는 데 한몫을 했다. “사람들은 등록을 하러 저마다 본고장을 찾아 길을 떠나게” 되었기 때문에, ‘마리아’와 ‘요셉’이라는 이름의 한 젊은 부부도 ‘베들레헴’에 가야 했고, 그때 예수께서 태어나셨다.—누가 2:3, 공동 번역.
왜곡된 수치
통계는 백분율, 평균, 도표, 비율 등 여러 가지로 표시될 수 있다. 그런데, 그것이 우연이든 고의이든 간에, 본질적으로는 정확한 수치를 사용하여 편파적이거나 왜곡된 인상을 제시하는 경우가 있다.
예를 들면, 백분율 기호는 안정되고 설득력이 있어 보임으로 믿음직하고 결정적이라는 느낌을 준다. 그러나 백분율이 언제나 공정하게 사용되는 것은 아니다. 2개 주택 건설 회사의 생산 수치를 고려해 보자:
1981 1982 증가율
‘노오들레익스 건축 회사’ 30 60 100%
‘코티지 건설 회사’ 208 312 50%
백분율만을 사용하면 잘못된 인상을 줄 수 있다. 즉 이 둘 가운데 ‘노오들레익스 건축 회사’가 더 성공적인 경영을 했다는 생각이다. 실상, ‘코티지 건설 회사’가 생산 증가량은 ‘노오들레익스’의 그것보다 3배 이상이나 되었다.
비율의 개념 역시 기만적일 수 있다. 어떤 광고에서 “의사 10명 중 9명은 이 방법을 좋아하고 있다”고 자랑스럽게 선전할지 모른다. 그러나, 우리는 그 나라에 있는 의사들 중 의견을 요청받지 않은 수많은 의사들이 그에 관해 어떻게 생각하는지 궁금해 하는 것이 이치적일 수 있다. “지도적인 치과의사들이 이 상표의 치약을 추천하고 있다”는 것이 사실이라면, 또한 오늘날 시판되고 있는 상표의 치약들 중 다는 아니라도 거의 대부분을 그 의사들이 추천하고 있음도 마찬가지로 사실일 수 있다. 어떤 책의 표지에 실린 요약 문귀가 책의 전체 내용을 알려줄 수 없는 것처럼, 수치를 비율화하여 표시하는 이런 방법이 완벽한 보고가 될 수는 없다.
또한 “다른 어느 곳보다도 침대에서 죽는 사람이 많다”는 말을 생각해 보자. 그 말이 맞을지 모르지만, 그렇다고 해서 침대에서 시간을 보내는 일이 위험하다는 뜻인가? 보다 자세히 알아보면, 아마도 이것은 주로, 심하게 병들어 죽게 될 사람들이 침대에서 지내기 때문임을 알게 될 것이다. 또한, ‘오스트레일리아’의 오지 마을인 ‘앨리스 스프링즈’에는 대 도시 ‘시드니’보다 문맹자가 적다는 통계를 보았다고 하자. 그렇다고 해서, 그 오지에 있는 시골 교사들이 ‘시드니’에 있는 도시 교사들보다 더 유능하다는 결론을 내릴 수 있겠는가? 그렇게 보일지는 몰라도, 실상은 ‘시드니’에 더 많은 사람들이 살고 있기 때문일 뿐이다. ‘앨리스 스프링즈’에는 ‘시드니’보다 또한 비문맹자도 적다!
부언하자면, 통계를 실제로 제시하는 일은 설득의 수단이 될 수 있다. 정확하게 35‘퍼센트’라는 비율도, 제시되는 방법에 따라 좋게도, 나쁘게도 들릴 수 있다. “최소한 35‘퍼센트’는 참석했다”고 주장하는 것이, “겨우 35‘퍼센트’가 참석했다”고 불평하는 것보다 듣기에 훨씬 더 좋다. 하지만 잘 생각해 보면 그 두 말은 본질적으로 같은 것을 이야기하고 있다.
때때로 통계는 보다 명확한 이해를 위해 ‘그래프’나 도표로써 표시되는 경우가 있다. 하지만 도표가 사용되는 이유가 명확한 이해를 위한 것이라기보다는 보는 이를 어떤 결론으로 이끌기 위한 것일 수도 있다. 좌단 아래의 ‘그래프’는 노력파 판매 요원 두 명의 4년 간의 실적을 알려 주고 있다. 어느 쪽이 더 성공적으로 일한 것 같은가?
[그래프]
(온전한 형태의 본문을 보기 원한다면, 출판물을 참조하십시오)
600
500
400
300
200
100
1979 1980 1981 1982 1983
[그래프]
(온전한 형태의 본문을 보기 원한다면, 출판물을 참조하십시오)
260
250
240
230
220
210
1979 1980 1981 1982 1983
실상, 면밀히 살펴보면 이 둘은 똑같다! 두 경우 다 판매액은 다음과 같다:
(1980) 220
(1981) 235
(1982) 248
(1983) 250
어떤 종류의 도표에는 잘못된 인상을 줄 가능성이 내재해 있어서, 비양심적인 사람들이 이를 이용하는 경우가 있거나, 독자에게 좀더 안내를 해줄 필요가 있는 경우가 있다. 다음 삽화를 고려해 보자:
[도해]
(온전한 형태의 본문을 보기 원한다면, 출판물을 참조하십시오)
A.
B. C. D.
두 선 중 어느 쪽이 더 긴가? 길이를 재 보면, 두 선의 길이가 똑같음을 알게 될 것이다.
평민의 평균
대부분의 사람들은 평균을 막상 사용하기 전까지는 이를 이해하고 있다고 생각한다. 평균에는 여러 종류가 있으며, 각 평균은 각기 다른 문제에 사용되게 된다. 독자가 바늘과 실로 재봉하는 일을 잘 한다고 하자. 하지만 감자 부대를 만드는 데 사용하는 바늘은 외과 수술에는 별 가치가 없을 것이다. 이와 비슷하게, 어느 계산에서 잘못된 종류의 평균을 사용하면 혼란에 빠질 수 있다.
청과물 상인인 ‘샘 조운즈’를 고려해 보자. 그는 두 등급의 ‘토마토’를 팔고 있었는데, 한 종류가 다른 것보다 약간 더 좋았다. A급품은 2‘킬로그램’당 3‘달러’에 팔았다. 그는 이 물건을 60‘킬로그램’ 팔아 90‘달러’를 받았다. B급품은 3‘킬로그램’당 3‘달러’에 팔았다. 그는 이 물건을 60‘킬로그램’ 팔고 60‘달러’를 벌어서, ‘토마토’ 120‘킬로그램’에 합계 150‘달러’를 벌었다.
다음 주에 ‘샘’은 A급품과 B급품을 섞어 비슷해 보이는 금액에 팔기로 하고 5‘킬로그램’당 6‘달러’로 값을 정했다. 그는 전번과 같은 양인 120‘킬로그램’을 팔았다. 하지만 영수증을 합산해 보니 ‘샘’은 이번 주에 자기 현금통에 144‘달러’만이 들어왔음을 알게 되었다. 그전 주에는 150‘달러’였었다. 무엇이 잘못되었는가? ‘샘’은 진짜 평균 즉 상가 평균(相加 平均)을 계산하지 않았다. 그는 ‘킬로그램’당 가격을 산출하여 이를 평균으로 삼았어야 했다.
2‘킬로그램’에 3‘달러’=’킬로그램’당 1.50‘달러’
3‘킬로그램’에 3‘달러’=’킬로그램’당 1.00‘달러’
평균=’킬로그램’당 1.25‘달러’
이렇게 하면, 5‘킬로그램’은 6.25‘달러’에 팔려야 했다. ‘샘’은 평균 개념을 이해하지 못했기 때문에 손해를 보았다.
통계의 활용
통계는, 주의깊이 전문적으로 잘 다루어지면, 가치가 있다. 또한 어떤 사람들이 이를 악용한다고 해서, 이를 올바로 이용할 때의 가치가 줄어드는 것도 아니다.
교통 사고에 관해 수집된 통계의 도움을 받아 당국에서는 어느 주말이나 계절에 경찰력을 증강시켜 운전 습관을 감독할 필요가 있는지를 결정한다. 바로 사고 통계로 인하여, 어떤 나라에서는 자동차에 타면 안전 ‘벨트’를 강제적으로 착용하게 하며, 운전수의 호흡을 검사하여 ‘알코올’ 성분이 있는지를 알아내는 제도를 도입한 바 있다. 통계를 내본 결과, 사기, 문서 위조, 사취 등의 범죄가 크게 증가하고 있음이 밝혀지면, 당국에서는 이의 도움을 받아, 이용 가능한 경찰력을 어떻게 배치하는 것이 최상책인지를 결정한다. 자동차 절도나 자살률이 10‘퍼센트’ 증가했다는 보고 역시 경찰의 결정에 도움을 준다.
병원을 더 많이 지어야 할 것인가? 만일 그렇다면, 어디에? 대부분의 자동차 사고에는 어느 연령층이 관련되어 있으며, 이에 따라 특별한 주의를 기울일 필요가 있는가? 가장 널리 번져 있는 병으로서 다루고 예방하기 위해 우선적인 주의를 기울여야 할 질병 및 질환은 무엇인가? 이런, 저런 광고 운동은 얼마나 성공을 거두어 왔는가? 전문가들에 의해 작성되었고 정직하게 제시된 통계라면, 이같은 분야에서 의사를 결정하는 데 가치가 있다.
세계의 모든 선진국들은 이용할 수 있는 통계가 거의 무진장하다. 예를 들어, ‘오스트레일리아’에서는 연간 출생자 수가 약 25만명임에 비해 연간 사망자 수는 그 수의 반이 못 된다. 인구의 25‘퍼센트’가 15세 미만이다. 모든 교통 사고 사망자 수의 41‘퍼센트’가 25세 미만이다. 전체 자동차 사고의 반은 ‘알코올’이 관련돼 있다. 전국의 전체 사망자 중 70‘퍼센트’가량은 심장병이나 암으로 죽는다. ‘오스트레일리아’인들은 1년에 2,800만 ‘킬로그램’의 담배를 피운다. 그밖에 많이 있다.
분별력 있게만 다루어지면, 이런 통계는 우리가 현명한 결정을 내리는 데 도움이 될 수 있다. 하지만 경계해야 한다. 통계는 또한 사기적으로 다루어져, 기만적인 것이 될 수 있기 때문이다.
[16면 삽입]
통계를 악용하는 사람들이 있기는 하지만, 그렇다고 해서 통계가 올바로 이용될 때의 가치가 줄어드는 것은 아니다