[이재형의 통계이야기] ⑫

▲ 이재형 박사

통계는 사회나 자연 현상에 관한 수치 정보로서 그 자체는 아무런 생명력이 없는 사실(fact)에 불과하다. 이것을 의미있는 정보로 활용하는 것이 바로 통계의 해석이다. 어느 지역 초등학교 6학년 어린이들 키를 측정했더니 평균 140㎝로 나타났다. 이 통계 자체로는 그다지 큰 의미를 갖지 못한다. 그런데 우리나라 전체 초등학교 6학년 어린이 키 평균 145㎝와 비교해보니 이 지역 어린이들의 발육상태가 부진한 것으로 판명되었다. 그러면 원인이 무엇인가? 음식물 섭취와 운동량, 기타 환경적 특성 등 여러 요소를 종합적으로 분석하면 이 지역 어린이들의 발육부진 원인을 찾아내고 적절한 개선방안을 제시할 수 있다. 이처럼 통계는 합리적인 해석이 뒷받침될 때 비로소 생명력을 갖는다.

‘전투기 날개에 총알 구멍 많다’고 날개 보강? 

통계해석과 관련하여 가끔 이야기되는 일화가 있다. 2차대전 때 출격한 미군 전투기들의 피해가 상당하여, 전투기 성능을 개선해야 한다는 주장이 힘을 얻었다. 조사반을 구성해 전투에서 돌아오는 비행기들을 대상으로 어느 부분에 총알을 많이 맞았는지 조사해 통계를 작성했다. 그 결과 날개 쪽에 총탄을 맞는 비행기가 압도적으로 많은 것으로 나타났고, 결과 보고회에서는 자연스레 날개 부분의 강도를 높여야 한다는 데 의견이 모아졌다. 이때 한 젊은 장교가 입을 열었다. “다른 부분에 총알을 맞은 비행기들은 모두 어디로 갔을까요? 날개 부분에 총알을 맞은 비행기들은 다른 부분에 총알을 맞은 비행기들에 비해 추락 가능성이 적었다는 의미가 아닐까요?“

통계는 현실(fact)을 정확히 알려주지만, 해석 잘못으로 통계가 갖는 정보의 의미를 손상시킬 수 있고, 나아가 사회현상에 대한 잘못된 인식과 잘못된 처방을 초래하기도 한다. 잘못된 통계 해석은 왜 나타나는가?

인과관계 억지 연결하거나 거꾸로 통계해석

첫 번째는 두 개의 현상이 시차를 두고 발생했을 때 인과관계를 논리적 근거 없이(물론 나름대로 견강부회식의 논리는 있겠지만) 연결하는 경우가 있다. 예를 들면 최근 1년 반 동안 북한에서 핵과 미사일 실험을 하지 않았다. 그리고 최근 자영업자의 형편이 어려워지고 있다고 한다. 직접 관계가 없는 두 사실을 두고 “북한이 핵실험을 하지 않으니까 자영업자의 형편이 어려워졌다”고 주장할 수도 있다. 이 주장에 수긍할 수 있는 사람은 거의 없을 것이다. 그렇지만 현실에서는 이런 종류의 통계해석이 종종 발견된다.

두 번째는 두 사실 사이에 밀접한 인과관계가 성립하지만, 이것을 거꾸로 해석하는 경우다. 예를 들어 주택가격이 폭등해 정부가 부동산 규제정책을 도입했는데도 주택가격은 관성에 따라 계속 폭등한다면 이런 해석이 가능하다. “거봐. 정부가 부동산 규제를 하니까 주택가격이 폭등했잖아.” 실제로 그런 ‘전문가’와 그런 이들의 말을 받아쓰는 언론이 있다. 소득불평등이 악화하자 정부가 이를 개선하기 위한 정책을 도입했는데도 소득불평등이 지속되고 있다고 치자. 이를 두고 소득불평등 개선 정책이 도리어 소득불평등을 악화시켰다고 주장하는 이가 있다. 감기에 걸려 감기약을 먹었는데, 감기약을 먹어서 감기가 심해졌다고 주장하는 것과 무엇이 다른가?

▲ 일부 언론은 '최저임금 과속이 실업과 소득양극화만 불렀다'고 보도했다. ⓒ 최저임금위원회

주택정책과 주택가격의 진정한 인과관계 

두 번째 유형의 통계해석 오류는 우리 현실에서 자주 발견된다. 왜 이런 통계해석의 오류가 현실에서 버젓이 힘을 얻는가? 이는 대부분 사회현상이 다양한 요인에 의해 매우 복잡한 인과관계로 얽혀 있는데도 여러 요인을 고려하지 않고 두 사실의 인과관계로 단순화해버리는 데서 발생한다. 앞서 예를 든 주택가격도 주택의 수요·공급 상황, 통화정책, 이자율, 수요자의 기대심리, 경제의 호‧불황 등 다양한 요인에 의해 결정된다. 주택가격이 폭등하여 정부가 이를 억제하기 위한 정책의 하나로 신도시개발을 통한 주택 공급확대를 들고 나왔다고 하자. 이 정책으로 주택공급은 나아졌을지 모르지만 다른 요인은 여전히 주택가격을 상승시키는 쪽으로 작용할 것이다. 그리고 정부가 새로 도입한 정책이 효과를 보기까지는 상당한 시차가 필요하다. 그러므로 정부 정책에도 불구하고 주택가격은 당분간 계속 상승할 수 있다. 이를 두고 신도시개발이라는 정부정책이 오히려 주택가격을 상승시켰다는 주장이 나올 수 있는 것이다.

두 번째 유형의 오류는 어떻게 교정해야 할 것인가? 심층적인 데이터 분석이 필요하다. 주택가격에 영향을 미치는 다른 여러 요인에 따른 효과를 제거하고, 단지 정부가 새로 도입한 신도시개발이 주택가격에 미친 영향만을 분석하고, 이를 토대로 정책효과를 평가해야 할 것이다. 마치 우리가 구운 생선을 먹을 때 불필요한 뼈와 내장을 발라내고 살만 먹듯이, 정책효과의 통계분석도 불필요한 부분을 발라내고, 정책 그 자체에 따른 효과만을 대상으로 평가가 이루어져야 할 것이다.

통계 이용하기 전에 의심해봐야 할 것들

세 번째 유형의 통계해석 오류는 성질이 다른 통계를 동일선상에 놓고 비교하는 데서 나타난다. 특히 경제 분야 통계는 얼핏 보기는 같아 보이지만, 내용에서는 다른 통계가 많다. 같은 통계일지라도 조사방식이 바뀌거나, 조사대상 즉 표본에 중요한 변화가 있을 경우, 이를 직접 비교하면 부적절한 통계해석으로 이어질 수 있다.

이런 통계 해석상 오류는 어떻게 예방할 것인가? 먼저 문제가 되는 요인들 간에 나타날 수 있는 인과관계를 논리적으로 추론하고, 이에 바탕을 둔 통계 분석을 해야 한다. 이와 아울러 통계가 갖는 특성 정보, 즉 메타데이터(metadata)에 관해 충분히 이해해야 한다. 통계를 이용하기 전에 통계의 조사대상, 조사방법, 조사범위, 통계기준 등에 관한 충분한 정보를 습득해야 한다. 통계를 이용하기 전에 통계숫자를 한번쯤 의심해보는 것도 필요하다. 특히 경제 현상은 단기간에 급격한 변화가 나타나기 어렵다. 우리가 감각적으로 크게 느끼는 변화와 달리 경제지표는 그렇기 급격하게 변화하지 않는다. 경제성장률이 3%에서 2%로 1%포인트 낮아진 걸로도 경제 전반에 큰 충격이 발생한다.

통계지표를 통해 특이한 변화를 찾아냈을 때 연구자나 정책담당자, 언론인 등 통계이용자들은 내가 새로운 현상을 발견했구나 하고 뿌듯해 하는 경우가 적지 않다. 이에 앞서 해야 할 일은 일단 통계를 의심해보는 것이다. 통계의 작성방법이나 조사대상, 통계기준 등 통계 내용 자체에 어떤 문제가 없는지를 점검한 뒤 통계의 의미를 해석하는 것이 중요하다.

소득불평등 원인이 최저임금 상승 때문이라고? 

2월 21일 통계청이 발표한 가계동향조사에 따르면 2018년 4/4분기 소득불평등은 최악으로 나타났다. 전체 가구소득이 약간 늘어난 가운데 고소득층 소득은 크게 늘어났고, 최하 소득층인 1분위 소득층(하위 20% 소득계층)의 소득은 전년동기(2017년 4/4분기) 대비 17.7% 줄어든 참담한 결과가 나타난 것이다. 최하위 계층 소득 가운데, 근로소득은 36.8%, 사업소득은 8.6% 정도 낮아진 것으로 나타났다. 반면에 최상위 계층인 5분위 소득층(상위 20% 소득계층)은 근로소득이 14.2%, 사업소득이 1.2% 증가한 것으로 나타났다. 이 결과를 두고 주류언론은 소득불균형의 원인이 소득주도성장, 특히 최저임금의 급격한 상승에 있다고 주장하고 이를 폐기하라고 주장한다. 이들 언론의 인터뷰에 응한 소위 ‘전문가’들도 최저임금인상이 소득불균형을 가져왔다고 나름대로 시나리오를 만들어 설명한다.

▲ <파이낸셜뉴스>는 2월 21일 '123만8000원 vs. 932만4000원... 가계소득 격차 통계작성 이래 15년 만에 '최악''이라는 내용의 기사를 내보냈다. ⓒ 파이낸셜뉴스

이들의 주장을 소개하기에 앞서 용어의 정의에 관해 알아보자. 근로소득이란 다른 사람이 운영하는 사업장에서 일을 하고 받는 대가, 즉 주로 임금소득을 말한다. 그리고 사업소득이란 자기가 스스로 사업을 해 얻은 소득을 말한다. 주로 자영업자들이 장사를 해서 얻는 소득이다.

최저임금의 과도한 상승이 소득불균형을 가져왔다고 주장하는 이들의 논거를 살펴보자. 먼저 근로소득에 관해서는 빈곤가구(1분위 소득층)는 알바 등 저임금 일자리에서 주로 일하는데, 최저임금으로 임금부담이 높아진 자영업자들이 근로자를 해고하거나 고용시간을 줄여 빈곤층의 임금소득이 줄어들었다고 한다. 그리고 사업소득에 관해서는 자영업자들이 최저임금상승 때문에 할 수 없이 종업원들에게 더 많은 임금을 지불했기 때문에 소득이 줄어들 수밖에 없었다고 한다. 그러니까 빈곤층의 근로소득이나 사업소득의 하락이 모두 최저임금 상승 때문에 나타난 결과라는 것이다.

그럴듯한 설명이다. 과연 그럴까? 독자들도 함께 통계분석을 해보도록 하자. 먼저 근로소득을 살펴보자. 근로소득의 변화는 3가지 요인, 즉 노동시간당 임금, 노동시간, 가구구성원에 의해 결정된다. 첫째 시간당 임금(노동단가)에 관해서는 더 설명할 필요가 없다. 시간당 임금이 올라가면 근로소득은 증가하며 그 반대면 근로소득은 감소한다. 최저임금 상승은 시간당 임금을 높이는 효과를 갖기 때문에 이 요인은 저소득층의 근로소득 하락과는 관계가 없다. 두 번째 요인, 즉 노동시간 축소와 관련해서는 최저임금 상승이 노동시간 축소로 연결될 수 있다. 최저임금이 상승하면 고용비용이 증가하고, 이에 따라 사업주가 고용을 축소하는 효과는 충분히 예상할 수 있다. 세 번째 요인인 가구 구성원의 변화란 조사대상 가구 구성에서 경제활동인구의 수가 변화하는 현상을 말한다. 사회 전체로 노동시간이나 실업률에 변화가 없더라도, 고령화가 진행되어 조사대상 가구의 가구원 중에서 일하는 사람의 수가 줄면 근로소득도 줄게 된다. 이것은 사회변화에서 초래된 것으로서 최저임금 상승과 특별한 관계가 없다.

“표본 확대됐으니 작년 동기 비교 말라”는 ‘일러두기’ 무시 

통계청의 <가계동향조사 보도자료>를 보면, 맨 앞 페이지 ‘일러두기’에서 이 통계의 특징을 설명하면서 ‘이번 통계는 작년 동기의 통계에 비해 표본을 확대·개편하였는데, 새로 편입된 표본가구에서 고령층 가구가 크게 증가하였으므로, 2017년 통계와 이번 통계를 직접 비교하여 결과를 해석하는 데 주의가 필요하다”고 밝혔다. 즉, 앞에서 말한 세 번째 요인이 통계에 큰 영향을 미쳤을 가능성이 있다는 말이다.

통계청에 확인해보니 전체 조사대상 가구 중 고령층 가구(가구주가 70세 이상인 가구)의 비중은 2017년보다 1%포인트를 약간 웃도는 정도 늘어났으나, 제1분위 소득계층에서는 6%포인트 가까이 늘어났다. 즉, 소득1분위 계층에서 가구주가 70세 이상인 가구가 2017년에는 37%였으나 2018년에는 43%를 차지하는 것으로 나타났다. 70세 이상 고령자 가운데는 자기 사업을 하는 사람은 종종 있지만, 임금노동자로서 일하는 사람은 매우 적다. 이 때문에 많은 고령자들의 근로소득이 0으로 나타난다. 이것은 소득1분위 계층의 근로소득 감소에 결정적 영향을 미친다. 통계청 보도자료에서는 이 사실을 가장 먼저 알렸고, 또 이것이 소득1분위 계층의 근로소득 하락에 결정적 영향을 미쳤는데도 대부분 언론이나 전문가들은 이를 언급하지 않았다. 이 사실을 몰랐으면 전문가로서 자질 문제이며, 알고도 이를 무시했다면 고의로 왜곡한 통계해석이라 할 수 있다.

다시 두 번째 요인, 즉 최저임금 상승에 따른 근로시간 축소 및 실업증가 효과에 관해 검토해보자. 앞에서 언급했듯이 최저임금 상승은 분명히 단기로는 근로시간 축소 및 실업증가 효과를 갖는다. 그렇지만 통계에 나타난 근로시간 축소 및 실업증가는 최저임금 상승뿐 아니라 다양한 경제‧사회적 효과가 복합된 결과이다. 크게는 사회구조 변화, 국민들의 생활습관 및 패턴 변화에서부터 산업구조 변화, 경기변동, 임금수준 등 다양한 요인이 노동시간 및 실업에 영향을 미친다. 이런 많은 요인 중에서 최저임금 상승에 따른 효과만을 발라내어 최저임금이 저소득계층의 근로소득 감소에 미친 영향을 평가하는 게 타당하다. 물론 이런 심층분석은 언론이나 정책담당자들에게는 요구할 수 없으며, 전문 지식을 가진 연구자들이 담당해야 할 영역이다.

1인사업 ‘사장님’들이 최저임금 영향 받는다고? 

다음으로 사업소득에 관해 알아보자. 앞에도 말했듯이 사업소득이란 주로 자영업자, 즉 ‘사장님’들이 사업을 영위해 얻은 소득을 말한다. 2015년 경제총조사에 따르면 우리나라에는 약 380만개 사업체가 있는 것으로 조사됐다. 또 통계에 포착되지 않는 사업자가 200만개 정도로 추산되므로 약 600만개 사업자가 있는 것으로 추산된다. 경제총조사에 포착된 380만 사업체 가운데 약 40%에 해당하는 사업체가 피고용인 0, 즉 사람을 쓰지 않고 사장님 혼자서 사업을 하는 1인사업자다. 통계에 포착되지 않은 200만 사업자들은 이보다 훨씬 더 영세해 거의 대부분 1인사업자다. 즉, 우리나라 전체 사업자 가운데 2/3 정도가 1인사업자인 셈이다. 필자가 몇 년 전 연구한 결과에 따르면 1인사업자들은 사람을 고용하고 있는 사업자들에 비해 소득이 크게 낮은 것으로 나타났으며, 누구나 예상할 수 있는 결과다.

▲ <TV조선>이 보도한 '최저임금 인상에 문 닫는 자영업자 100만 넘는다' 자료 화면. ⓒ TV조선

그러면 여기서 다시 가계동향조사 통계로 돌아가보자. 저소득계층에 속하는 ‘사장님’들은 1인사업자가 많고, 고소득계층에 속하는 사장님들은 종업원을 거느리고 사업하는 사람이 많을 것이라고 자연스럽게 추리할 수 있다. 그러면 최저임금이 올라 ‘사장님’의 소득이 줄어들었다고 한다면, 당연히 사람을 많이 고용하고 있는 고소득 계층 ‘사장님’들의 소득이 많이 줄어들어야 한다. 사람을 고용하지 않는 저소득 계층의 ‘사장님’들은 최저임금이 오르든 내리든 아무런 관계가 없다. 그런데 가계동향통계에서는 저소득계층의 사업소득은 크게 줄어든 대신, 고소득계층의 사업소득은 오히려 늘어난 것으로 나타났다. 최저임금 상승으로 소득불균형이 확대됐다고 주장하는 이들은 이것을 어떻게 설명할 것인가?

소득불평등 악화 요인은 인구 노령화 

그러면 2018년 4/4분기에서 소득불평등이 급속히 악화한 원인이 무엇인가? 일차적으로 가장 큰 원인은 인구의 노령화에 따른 가구구성의 변화라고 할 수 있다. 그 외에도 여러 가지 복합된 원인이 상호 작용하여 나타난 결과라 할 수 있을 것이다. 최저임금의 급격한 상승도 중요한 요인 가운데 하나일 수도 있을 것이다. 이들 요인이 소득불평등에 끼친 정확한 효과는 심층적인 데이터분석, 특히 마이크로데이터 분석을 통해 확인할 수 있을 것이다. 이 단계에서 말할 수 있는 것은 ‘최저임금 상승→소득불균형 심화’라는 단선적 논리는 사실과 거리가 있을 가능성이 높다는 점이다.


민주주의는 건전한 공론장 없이는 성립되지 않는다. 공론장이 건전해지려면 객관적 현실 인식을 공유해야 하며 그 바탕이 되는 게 통계다. 통계가 흔들리면 정책도 여론도 왜곡될 수밖에 없다. 가짜뉴스도 통계 왜곡에서 출발한다. 언론인은 통계 해석을 잘못하면 ‘사회의 공적’이 될 수 있지만 잘하면 ‘해석특종’을 할 수 있다. 통계전문가인 이재형 박사가 통계에 얽힌 재미있는 얘기들을 풀어낸다. 한국개발연구원(KDI)에서 일하는 그는 <국가통계시스템발전방안> <한국의 산업조직과 시장구조> 등 많은 연구와 저술을 해왔고 통계청 통계개발원장을 역임했다. [편집자]

편집 : 조현아 PD

저작권자 © 단비뉴스 무단전재 및 재배포 금지