메뉴 건너뛰기

KBlog

유선 RDD 조사와 표본오차?

by B&W posted Mar 25, 2016
r0.png


공영방송인 KBS가 주요 관심지역에 대한 여론조사 결과를 발표했습니다. 정확성이야 그 누구도 단언할 수는 없겠지만 몇 가지 문제가 눈에 보여 적어봅니다.


r1.png


우선  유선 RDD라는 것이 아마도 유선전화를 자동으로 생성해 전화를 걸고 조사원이 조사를 하는 시스템인듯 합니다. 예전 전화번호부를 이용한 조사에서 요즘 전화번호부가 갖는 대표성의 한계 때문에 나온 고육지책의 방법인듯 합니다만 이 또한 문제점을 안고 있습니다. 070으로 시작하는 인터넷 전화가입자를 확인할 수 없다는 점과 가정용 전화가 설치되어 있지 않은 가구에 대한 조사가 아예 배제될 수 있다는 점입니다.


두 번째는 '응답률'이라는 게 정확히 언급되지 않아서 단정할 수는 없겠지만 아마도 전화를 받은 비율이거나 전화를 받은 사람 중에 조사에 응한 비율을 뜻하는 듯 합니다. 응답률에서 볼 수 있듯이 상당부분 생각을 드러내지 않으려는 사람들도 꽤 많아 보입니다. 그만큼 생각을 드러내는 사람들만의 의견이 조사에 반영될 확률이 높아지게 됩니다.


세 번째는 표본추출 방법이 인구비례에 따른 할당 표본추출이라 하였는데 가중치는 왜 주는 것인지 모르겠습니다. 가중치를 준다는 말은 성, 연령, 지역별로 할당된 표본만큼 조사가 이루어지지 않고 계획보다 표본이 많거나 적었기 때문인 것으로 추론됩니다. 정확한 수의 표본이 추출 되었다면 거기에 가중치를 줄 이유가 전혀 없기 때문입니다(ARS 조사에서 주로 활용하는 방업이 모자라거나 넘치는 표본에 대해 가중치를 주는 방법을 사용합니다). 아무튼 ARS 조사의 문제점에서도 지적했듯이 예를 들어 20대 남자가 30명이 필요한데 10명밖에 조사되지 않아, 가중치를 줘서 30명분의 값을 얻는다 할지라도 결과적으로는 10명의 생각이기 때문에 그만큼 신뢰도가 낮아질 수 밖에 없습니다.


네 번째는 표본오차의 문제입니다. 정상적인 통계라면 표본오차를 언급할 수 없기 때문입니다. 무작위 조사가 아닌데도 표본오차를 구할 수가 있군요. 대단단한 통계적 기술입니다. 물론 가중치까지도 주고 있는 상황인데 말입니다. 도대체 이 조사에서 표본오차의 의미는 어떤 뜻으로 쓰이는 것일까요? 


여론조사 전문기관이라는 곳도 이런식으로 조사를 하는군요. 안타깝지만 아무래도 이번 선거에서도 이런 식의 조사가 판을 칠듯 합니다.