통계가 뭐길래...조작 막으려면 품질관리 체계화 필요

통계는 일상생활이나 다양한 사회현상에 대한 자료를 알아보기 쉽게 수치로 나타낸 자료다. 통계와 통계지표는 급변하고 복잡한 우리사회를 진단하고 그에 따른 정책 처방을 내리는 자료로 활용된다. 그만큼 잘못된 통계는 진단과 처방의 오류를 가져온다. 특히 통계작성에 있어 정치적 의도나 이해관계가 얽혀 왜곡된다면 심각한 사회문제를 초래할 수 있다. 통계작성기관인 통계청이 높은 품질의 통계를 생산하고 자율성과 독립성을 지켜야하는 이유이기도 하다. 하지만 최근 논란이 된 가계동향조사는 통계의 신뢰를 무너트렸다. 통계의 기본인 표본 추출과 구성의 변화를 대수롭지 않게 생각한 결과였다. 가계동향조사 결과를 토대로 문제점과 부족한 것은 무엇이었는지 분석해 보고 무너진 신뢰를 되찾기 위한 방안을 함께 고민해보고자 한다.

통계가 뭐길래...조작 막으려면 품질관리 체계화 필요

◇통계 논란 불씨가 된 가계동향조사 = 지난달 통계청장이 경질됐다. 논란을 자처한 가계동향조사 통계 자료 발표가 화근이었다.

통계청은 지난 5월 2018년 1분기 가계동향조사 결과를 내놨다. 2018년 1분기 1분위(소득 하위 20% 계층)의 가계소득(명목기준·2인 이상 전국 가구)이 월평균 128만6700원으로 1년 전(2017년 1분기)보다 8.0% 감소했다는 내용이다. 이는 2003년 관련 통계가 작성된 뒤 가장 큰 감소폭이었다.

근로소득(47만2900원)과 사업소득(18만7800원)이 각각 13.3%와 26%나 줄어든 것이 가장 큰 이유로 꼽혔다.

반면 5분위(소득 상위 20% 계층) 가계소득은 한 해 전보다 9.3% 늘어난 월평균 1000만원(1015만1700원)을 넘어서며 1분기 기준 가장 높은 증가폭을 기록했다.

그 결과 소득 5분위 배율(균등화 가처분소득 기준)은 역대 최고치인 5.95배로 벌어졌다. 5분위 배율은 2016년 1분기부터 2017년 3분기까지 7분기 연속 악화됐다가 지난해 4분기 다소 개선됐지만 1분기 만에 다시 뒷걸음질 했다.

통계청이 지난달 2018년 2분기 가계동향조사를 발표하자 1분기와 비슷한 결과가 나왔고, 청와대 소득주도성장정책에 대한 비난과 정치공세까지 가속화되면서 급기야 통계청장 경질이라는 사태까지 치달았다.

2018년 2분기 1분위 가계소득은 132만4900원으로 역시 전년 동기 대비 7.6% 감소했다. 1분기와 비교해 감소폭은 완화됐으나 관련 통계가 집계되기 시작한 2003년 이후 2분기 가운데 감소폭이 가장 컸다.

하지만 5분위 가계소득은 913만 4900원으로 전년동기 대비 10.3%나 증가했다. 1분위와 5분위 소득격차 심화되면서 빈곤층이 더 빈곤해지고 있음을 나타냈다.

하지만 일부 전문가는 가계동향조사의 객관성에 대해 문제를 제기했다.

이우진 고려대 경제학과 교수는 가계동향조사 표본수와 표본구성이 달라 2017년과 2018년을 직접 비교하는 것은 문제점 많다고 지적했다.

통계청은 사실 지난해 4분기를 끝으로 가계동향조사를 마무리할 예정이었다. 고소득층의 응답률은 갈수록 떨어지고 통계 정확성도 문제가 많았기 때문이다.

이에 지난해 표본수는 4000여개에 불과했다. 다른 연도 표본수가 6500~7000여개였던 것과 비교하면 크게 줄어든 셈이다.

하지만 정부가 지난해 4분기 가계 실질소득 증가 결과에 힘입어 조사를 계속하기로 결정하면서 혼란을 초래했다.

보통 전체표본의 3분의 1정도를 교체하는데 지난해는 교체표본이 전혀 없었던 반면 올해 전체 표본의 3분의 2가 신규표본이 됐다.

올해 모두 6610개 표본 중 지난해부터 계속된 표본은 2703개에 불과했고, 3907개가 새롭게 표본이 된 것이다. 2016년부터 올해까지 공통 표본도 1600개에 불과하다.

이 교수는 엄밀하게 말해 가계동향조사 구계열은 2016년으로 끝나는 것이고 신계열은 올해부터 시작되는 것으로 파악해야한다고 주장했다.

예를 들어 지난해 사과 수확량과 올해 배 수확량을 비교한 후 지난해와 비교해 올해 과일농사가 잘됐는지를 따지는 것과 마찬가지라는 설명이다.

물론 표본이 늘어나며 통계도 그만큼 정확해지기 때문에 이 같은 논리에 반박하는 의견도 적지 않다.

특히 신규표본이 늘어나도 통계 정확성에 큰 영향을 주지 않는다는 의견도 있다. 실제 올해 2분기 가계동향조사 상대표준오차는 1.8%로, 통계청 상한선인 2.5%보다 낮았다.

통계가 이상이 없다고 주장하는 측은 이를 근거로 표본 증가로 오히려 정밀성이 높아졌다고 주장했다.

통계청은 논란이 지속되자 가계동향조사를 전면 개편하기로 했다. 조사방식과 표본추출 등 개편이 이뤄질 전망이다.

우선 지난해 시작한 면접조사 방식을 이전 가계부조사 방식으로 전환할 예정이다.

통계청은 2016년까지 가계부조사 방식으로 벌어들인 돈과 쓴 돈을 파악해 왔다. 하지만 지난해 정확성을 높이겠다며 면접조사 방식으로 바꿨다. 올해 면접조사 방식도 논란이 일자 다시 가계부 방식으로 전환하기로 결정했다.

이원화 돼 있는 소득과 지출 부분도 2020년부터 통합해 공표한다. 당장 내년부터 일원화하면 소득부문 결과를 두고 시계열 비교가 다시 논란이 될 수 있는 만큼 일단 동일 방식으로 추진하기로 했다.

박상영 통계청 복지통계과장은 “개선 내용을 담은 정부안이 현재 국회 심의과정에 있어 결과를 지켜봐야 하지만 조사방식을 바꾸고 표본도 8000가구로 늘려 비슷한 수준을 유지할 예정”이라면서 “표본은 어찌보면 중복성보다 대표성이 더 중요하다고 본다. 학계나 내부 협의 등을 통해 신뢰를 높일 수 있도록 노력하겠다”고 말했다.

◇통계조작 가능 한가 = 이번 가계동향조사 결과를 계기로 통계 수치를 조작할 수 있는 가에 대한 관심도 높아지고 있다. 결론부터 말하자면 통계는 얼마든지 조작이 가능하다.

인구변화 등 단순한 사항은 조작대상이 아닐지 모르지만 가계동향처럼 조사방식의 통계는 원하는 결과를 도출해 내기 위한 트릭(trick)을 사용할 수 있다.

정치권이나 정책 등 관련한 여론조사의 경우 통계 조작의혹 논란에 쉽게 휩싸여 통계의 신뢰성을 뚝 떨어트리기도 한다.

이는 통계 표본이 대표성을 지니지 않고 있기 때문이다.

만약 100명의 주민이 사는 마을에 100명을 대상으로 설문조사를 진행한다면 그 통계의 정확성은 매우 높을 것이다.

하지만 우리 사회현실에서 모든 국민이나 대상자를 두고 통계 수치를 뽑을 수 없는 경우가 많아 이를 대표할 수 있는 표본을 잘 선정해 통계를 진행해야 한다.

한 쪽에 치우치거나 상황과 성향이 비슷한 사람들만 표본으로 선정해 통계조사를 진행한다면 그만큼 신뢰도는 낮아질 수밖에 없다.

예를 들어 무상급식을 반대하는 집단에 가서 찬·반 조사를 진행해 봤자 결과는 이미 정해진 거나 마찬가지다.

객관적인 통계 자료를 가지고 특정 기간이나 부분만 자르거나 어떻게 해석하느냐에 따라 자신의 입맛에 맞는 결과를 도출할 수도 있다.

한국은행 등이 정기적으로 발표하는 BSI(기업경기실사지수)는 기업체가 느끼는 체감경기를 나타내는 수치다.

100을 기준으로 이보다 낮으면 경기악화를 예상하는 기업이 호전될 것으로 보는 기업보다 많음을 의미하고 100보다 높으면 경기호전을 예상하는 기업이 더 많다는 것을 의미한다.

최근 경제침체와 내수부진 등으로 대부분 기업은 경기악화에 더 무게감을 주고 있고 결과도 기준치를 넘어서지 못하고 있다. 매년 기업들은 국내 경기를 부정적으로 바라보고 있는 것이다.

그러나 이 수치를 시계열로 분석하다 보면 새로운 해석도 가능하다. 예를 들어 지난해 1분기때 BSI가 80이었고 2분기 때 90을 기록할 경우 이전보다 수치가 높아졌기 때문에 단순히 경기가 좋아질 것으로 예상된다고 해석할 수 있다.

또 해당 기관들도 이 같은 자료를 배포하기도 한다. 엄밀히 말해 틀린 것은 아니지만 기준 수치를 넘어서지 않았기 때문에 여전히 경기가 좋아지지 않을 것이라 생각하는 기업이 더 많다는 전제가 깔려 있어야 한다.

어떤 수치가 전반적으로 하락세지만 잠시 증가했던 특정 구간만을 추출해 통계를 해석하는 경우로 심각한 오류를 가져올 수 있다.

◇국가 운명도 좌지우지..품질관리 체계화 필요 = 통계는 정부 정책수립 등에 주요 근거자료가 되기 때문에 잘못된 결과물은 심각한 사회문제를 낳기도 하고 더 나아가 국가의 운명마저 뒤바꿀 수 있다.

아르헨티나는 크리스티나 전 정부가 경제실정을 가리기 위한 실적압박에 통계조작을 했다가 2013년 국제통화기금(IMF)으로부터 불신임 조치를 당했다.

아르헨티나의 빈곤율은 키르치네르 정권 초기인 2003년 꾸준히 감소했으나 국가 부도와 함께 2007년 집권한 크리스티나 정권 이후 다시 상승세를 보였다.

하지만 크리스티나 정권은 실질적 빈곤 문제가 해결됐다고 주장하며 공식 집계를 중단했다.

당시 아르헨티나 통계청은 조작된 자료를 바탕으로 2015년 빈곤층과 극빈층 비율이 1970년대 이후 가장 낮은 4.7%와 1.4%로 추산했다. 노동자총연맹이나 공공정책연구소 발표 자료와는 극명한 차이를 나타냈다.

이에 아르헨티나는 '통계조작국'이라는 오명을 쓰게 됐고, 국제 신용도는 땅바닥에 떨어졌다.

그리스도 마찬가지로 통계조작으로 '국가부도'라는 엄청난 직격탄을 맞았다.

그리스는 2000년 유로존 가입 기준을 맞추기 위해 연간 재정적자 규모를 국내총생산(GDP)의 6%로 낮춰 발표했다. 실제 수치는 GDP 대비 13.6%로 통계조작 수치의 2배를 넘었다.

해당 사실을 숨겨오던 그리스는 2009년 국가부도 위기에 처하자 지난 정부 때 통계조작이 있었다고 밝혔다. 당시 발표한 연간 재정적자도 GDP 대비 12.7%로 유럽연합(EU) 실사 결과보다 낮았다. 그리스는 통계조작으로 대외신뢰도와 신용등급까지 떨어져 경제위기를 벗어나지 못했다.

이처럼 통계는 한 국가를 심각한 위기에 빠트릴 수 있는 만큼의 위험성을 지니고 있다.

이 때문에 전문가들은 통계의 품질관리를 체계화해 신뢰도를 높일 필요가 있다고 조언하고 있다.

정치나 정책 목적 등에 의한 의도적인 통계가 작성되지 않도록 독립성을 강화하고, 생산 프로세스마다 엄격한 품질관리가 되도록 체계를 갖춰야 한다는 것이다.

김충락 한국통계학회 회장(부산대 통계학과 교수)은 “통계는 4차 산업혁명 핵심 기술인 인공지능, 빅데이터 등 모든 부문에 활용되고 있고 데이터 종교라는 말도 붙을 만큼 중요한 학문”이라면서 “의도적으로 원하는 결과를 도출하기 위한 수단이 되지 않도록 전체를 대변하는 표본 선정부터 전 과정이 독립성을 기반으로 체계화 시켜 폭넓은 분야에서 활용될 수 있도록 설계 해야한다”고 말했다.

가계동향조사 개편 전후 비교(표)

통계가 뭐길래...조작 막으려면 품질관리 체계화 필요


대전=양승민기자 sm104y@etnews.com