황수경 통계청장
통계조사를 할 때도 지역마다 용어가 달라 조사원들이 애를 먹기도 한다. 방언이 많이 사용되는 수산물 통계조사가 대표적이다. 예컨대 ‘농어’의 경우 경기 강화 및 경남 삼천포 지역에서는 ‘깔때기’, 전남 여수·완도 지역에서는 ‘깔따구’, 부산·경남 지역에서는 ‘깡다구’, 강원 속초 지역에서는 ‘스쯔끼’로 불린다. 조사원들은 정확한 통계조사를 위해 수산물 방언집을 참고해 조사를 하지 않으면 안 된다. 이처럼 표준화는 스포츠에서는 경기력 향상을, 통계조사와 데이터 수집에서는 효율성을 높일 수 있는 핵심 키워드가 된다.
공공데이터 분야는 표준화가 시급한 또 다른 영역이다. 공공데이터란 공공기관이 만들어내고 관리하고 있는 텍스트, 수치 및 통계자료, 이미지, 동영상, 오디오 등 다양한 형태의 자료 및 정보를 말한다. 공공데이터는 정부의 정책결정이나 민간의 의사결정에서 중요하고 신뢰할 수 있는 자료이기 때문에 타 기관이나 민간으로부터 지속적으로 공유 및 개방 요구가 있어 왔다.
2013년 10월 공공데이터의 제공 및 이용 활성화법이 제정된 이래 정부가 공공데이터 개방을 크게 확대하면서 2017년 우리나라의 공공데이터 개방지수는 경제협력개발기구(OECD) 국가 중 1위로 평가됐다. 하지만 기업과 정부부처의 실제 공공데이터 활용수준은 기대에 크게 못 미친다. 한국정보화진흥원의 2016년 기준 정보화통계조사에 따르면 공공데이터를 활용하는 기업 비율은 12.4%에 불과했다. 정부·지자체의 공공데이터 활용 비율도 43.7%에 그쳐 2014년의 47.2%에서 오히려 하락했다. 공공데이터 개방이 대폭 확대됐음에도 이처럼 활용 실적이 여전히 저조한 이유는 무엇일까.
현재 공개되는 공공데이터의 활용 가능성이 그다지 높지 않다는 점에서 원인을 찾을 수 있다. 특히 개별 데이터가 수요자가 원하는 정보인지를 판단하기 위한 상세정보가 부족하고 표준화가 이뤄지지 않아 확장성이 떨어진다는 것이 문제로 지적된다. 예를 들어 국세청의 ‘사업자’, 중소벤처기업부의 ‘기업체’, 통계청의 ‘사업체’ 간의 개념 차이가 존재해 각각의 정보를 결합하고 연계해 활용하는 데 장애가 되고 있다.
정부는 지난달 제3기 공공데이터전략위원회를 출범시키고 국민 삶과 밀접한 공공데이터의 경우 국가안보·개인정보 등이 포함된 데이터를 제외하고는 원칙적으로 국민에게 전면 개방하기로 했다. 민간 부문이 개방된 공공데이터를 자유롭게 활용해 혁신적인 서비스를 개발할 수 있도록 하겠다는 것이다. 또한 정부는 공공데이터의 소재와 연관관계를 한눈에 파악할 수 있는 국가데이터 맵(지도)을 구축하기로 했다.
맵 작성과 더불어 공공데이터의 확장성을 제고하기 위한 공공데이터 표준화 작업도 함께 진행돼야 한다. 국가데이터 맵은 원하는 데이터가 어디에 있는지를 알려줄 뿐만 아니라 서로 다른 용어와 개념을 쓰고 있는 데이터에 대한 비교 정보가 파악될 수 있어야 한다. 이처럼 비교가 가능한, 충실한 기초자료가 있어야 다른 데이터와 연계하고 융합하기 용이한 표준화된 공공데이터를 작성해 나갈 수 있을 것이기 때문이다.
통계청은 활용성이 큰 통계데이터를 연계·통합해 이용자가 편리하게 사용할 수 있도록 ‘통계빅데이터센터’를 설립할 예정이다. 통계빅데이터센터는 다양한 통계데이터와 민간데이터를 안전하게 연계·활용하고 분석할 수 있는 데이터 샌드박스 역할을 담당할 것이다. 통계청은 공공데이터를 적극 활용한 인구주택총조사와 경제총조사를 실시해 통계작성 비용을 획기적으로 줄이고 통계품질을 향상시킨 경험이 있다. 통계청의 공공데이터 활용 확대를 위한 제안과 노력이 정부뿐만 아니라 기업의 의사결정을 지원해 경제성장과 국민 삶의 질 향상의 결실로 이어지길 바란다.
2018-03-23 29면
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지