뷰페이지

[이기철의 노답 인터뷰]“정형 데이터 분석은 ’장님 코끼리 만지기’···비정형까지 분석해야 빅데이터라 할 수 있죠”

[이기철의 노답 인터뷰]“정형 데이터 분석은 ’장님 코끼리 만지기’···비정형까지 분석해야 빅데이터라 할 수 있죠”

이기철 기자
이기철 기자
입력 2018-07-25 16:23
업데이트 2018-08-01 15:20
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14
변정한 오피스데브 대표가 말하는 ‘빅데이터’
변정한 오피스데브 대표는 24일 서울신문과의 인터뷰에서 “빅데이터의 처리 관건의 비정형 데이터”라고 강조했다.
변정한 오피스데브 대표는 24일 서울신문과의 인터뷰에서 “빅데이터의 처리 관건의 비정형 데이터”라고 강조했다.
제4차 산업혁명이 발등에 불이 된 가운데 이 산업의 ‘석유’에 해당하는 빅데이터의 신속하고 효율적인 처리가 시급해졌다. 이런 와중에 자료 처리의 가장 대중적인 프로그램인 ‘엑셀’을 활용해 문서와 PDF, 소셜네트워킹서비스(SNS), 클라우드 문서와 같은 비정형(非定型) 데이터를 빅데이터로 분석하는 기술이 개발됐다. 이를 개발한 오피스데브 변정한(55) 대표는 마이크로소프트(MS)도 인정하는 전문가다. 올해 전세계 MS최고의 커뮤니티 및 지식 공유 전문가인 MVP(엑셀 부문)로 선정되는 등 과거 몇 차례 뽑힌 바 있다. 고난도의 엑셀이나 액세스를 익히는 이들의 한번쯤은 접했을 닉네임 ‘하늘소’가 바로 그다. 기존에서 더 나아가 혁신을 추구하는 변 대표는 “빅데이터 구성을 보면 기업자원전산화(ERP)와 비즈니스 인텔리전스(BI) 같이 형식이 정해진 정형 데이터는 30%에 불과합니다. 이걸 분석해서는 ‘장님 코끼리 만지기’입니다. 웹과 SNS, PDF 문서 등 비정형 테이터를 분석해야 그 속에 숨은 함의를 파악할 수 있습니다”고 강조했다.

24일 그가 이사로 참여하는 서울 강남구 압구정동에 있는 한국빅데이터협회 사무실을 찾았다. 사무실 문을 열고 들어가자 변 대표는 노트북으로 작업에 몰두하고 있었다. 회사 서버실에서 보던 것과 같은 대형 컴퓨터나 PC가 있을 것이란 예상과는 달리 노트북 몇 대만 테이블 위에 덩그렇게 놓여 있었다. 화분과 프린터가 있는 평범한 회의실 분위기였다.

- 변 대표가 생각하는 빅데이터란 무엇입니까.
☞ 많은 사람이 ‘빅데이터’ ‘빅데이터’ 하지만 실제로는 그 개념을 잘 모르는 것 같아요. 저는 우리 생활을 반영하는 것이 빅데이터라 생각합니다. 과거엔 기업이 경제 환경에 맞춰 제품을 생산하였죠. 그땐 ERP와 BI만 있어도 됐지요. 하지만 앞으로는 소비 성향, 날씨, SNS 등 다양한 데이터를 분석해 제품 생산에 반영해야 하는 세상으로 변하고 있습니다. 즉 틀에 박힌 데이터 분석 보다는 신기루와 같은 비정형 데이터를 어떻게 분석하고 통합 운영하느냐에 따라서 결과가 완전히 달라지는 다면화된 세상에 산다고 생각합니다. 주변의 맛집 검색이나 여행지 검색 등도 빅데이트라 할 수 있죠.

●“신기루와 같은 비정형 데이터에 따라 결과 완전 달라져”

한 조직에서 생산된 다면화된 다양한 문서들을 데이터베이스(db)화하고, 이런 데이터가 다른 조직의 것과 유기적으로 통합되고, 경영 자료로 사용될 때, 진정한 빅데이터의 의미가 있다고 봅니다.

예컨대 공무원 인사근무 주기 2년 내에 작성된 문서들이 클라우드 서버에 저장되어 있다고 해서 빅데이터인 것은 아닌거죠. 해당 비정형 문서를 db로 사용할 수 있을 때, 빅데이터의 가치가 있습니다. 그런데 현실적으로 공무원들이 근무하는 동안 문서를 자신의 PC 폴더나 클라우드 서버에 넣는 수준이라서 후임자가 이런 데이터를 찾아 업무에 재활용하거나 이를 참고하여 부가가치를 높일 가능성은 매우 낮습니다. 이런 것은 혹평하면 ‘쓰레기 더미’이죠.
스마트팜을 위해 변정한 대표가 엑셀을 활용한 빅데이터 기술로 개발한 PLC 프로그램의 일부. 오피스데브 제공
스마트팜을 위해 변정한 대표가 엑셀을 활용한 빅데이터 기술로 개발한 PLC 프로그램의 일부. 오피스데브 제공
- 그러면, 왜 사람들이 빅데이터를 잘 못 알고 있나요.
☞ 그건 빅데이터를 너무 시스템적으로 접근하려는 경향 때문이라 생각합니다. 일반적으로 빅데이터는 데이터가 방대하고, 처리 속도가 빨라야 하며, 다양한 데이터를 분석해야 한다고 받아들입니다. 시스템적으로 받아들이는 이런 현상은 다국적 기업의 서버나 장비 판매 영업 전략입니다. 요즘 핫한 하둡(대용량 데이터를 분산 처리할 수 있는 오픈소스 프레임워크)이나 클라우드(데이터를 인터넷과 연결된 중앙컴퓨터에 저장해서 인터넷에 접속하기만 하면 언제 어디서든 데이터를 이용할 수 있는 시스템) 이런 고가의 장비 및 시스템 판매 전략 때문이죠.

●“빅데이터가 왜곡된 것은 장비 판매 업체들 전략 탓”

이런 건 진정한 빅데이터라고 할 수가 없습니다. 그 이유는 빅데이터가 마치 특정 전문가에 의해 활용되는 전용물이면서도 엄청난 비용을 동반하기 때문입니다.이런 업체들 탓에 국내 전문가들이 손쉬운 빅데이터처리 솔루션 개발에 등한했던 겁니다.

- 빅데이터를 대중적 데이터 처리 프로그램인 엑셀로도 할 수 있다는 건가요.
☞ 네. 엑셀과 MS SQL(마이크로소프트에서 개발한 프로그래밍 언어로, db 서버를 관리하는데 사용되는 언어)을 다룰 수 있으면 됩니다. 비싼 통계 처리 패키지 프로그램을 구매할 필요가 없죠. 그래서 저렴하지만 빅데이터를 기업의 특정한 한 두 사람이 아니라 엑셀이나 액세스를 어느 정도 다룰 수 있는 직원이면 누구나 처리할 수 있지요. 효율이 아주 높아질 것입니다. 엑셀은 각 시트마다 가로 1만 6000개, 세로 100만개로 구성되 었습니다. 이 칸마다 하나의 데이터가 들어갑니다. 방대한 자료의 처리가 가능한 것이죠. (빅데이터 처리 과정에 대한 이해가 부족한 기자를 위해 과거 그가 참여했던 전국 수백개 대학의 평가 관련 아래한글 자료들을 엑셀로 일목요연하게 불러오는 것은 시연해 보여줬다. 그리고 이런 컨버전스 방식을 자신의 카페에 공개해 올려놓았다고 말한다.)
변정한 대표가 개발한 프로그램인 PLC와 스마트팜에 필요한 아날로그 센서를 연결해 실험하는 모습. 오피스데브 제공
변정한 대표가 개발한 프로그램인 PLC와 스마트팜에 필요한 아날로그 센서를 연결해 실험하는 모습. 오피스데브 제공
- 이런 기술을 왜 특허신청을 하지 않았나요.
☞ 특허를 신청하고자 지인인 변리사와 상의했습니다. 그러나 그는 지식재산권 보장이 약한 우리나라에서 특허출원보다 시장 선점을 권고했습니다. 특허출원에 시간도 걸리고, 누군가가 특허를 침해했을 경우 이를 지키는데 법적 노력과 시간도 많이 들어 차라리 시장을 선점하는 것이 더 낫다는 것이었죠.

- 스마트팜(Smart-Farm)의 국산화를 한다던데.
☞ 농업의 스마트팜 프로그램 개발도 하고 있습니다. 엑셀을 활용한 빅데이터 처리 기술을 응용한 것이죠. 국내 스마트팜은 네덜란드 업체가 장악하고 있습니다. 이를 대체할 한국형 스마트팜을 개발하는 것이죠.

●“빅데이터 처리기술 응용해 스마트팜 운영 프로그램 개발”

작물을 재배하는 데 필요한 온도·수분·바람·영양제 공급 등과 같은 것을 제어하는 프로그램인 제어계측(PLC)을 개발해 농촌진흥청을 통해 농가에 보급하고 있다. 강원도 철원의 파프리카농가 등에서 운영 중이고, 여기저기 문의가 많이 들어오고 있습니다.

제가 개발한 PLC는 MS 오피스에 연결한 것으로, 기존의 글로벌 기업인 지멘스, AB와 같은 HMI(인간과 기계의 인터페이스)에 비교하면 아주 저렴합니다. 글로벌 기업은 호환이 안되는 반면 제가 개발한 것은 범용으로 호환이 잘 되는 것이 특징이죠.

- 농부들이 ‘어려운’ 오피스나 엑셀을 제대로 쓸 수 있나.
☞ 처음엔 저도 그게 걱정이었습니다. ‘시골’ 노인들이 컴퓨터를 만질 수 있나하고 걱정반 고민반으로 현장에 갔습니다. 가서 보니 스마트팜을 하는 이들은 30~40대였습니다. 컴퓨터에 친숙해서 놀랐죠. 컴퓨터나 휴대폰으로 프로그램(또는 앱)을 실형시킨 다음 마우스를 움직여 해당 칸에 클릭해 숫자를 입력하면 되는 것입니다. 예컨대 창문 개폐 칸에 ‘60’이란 숫자를 넣으면 창문이 60%만 열리는 것이죠. ‘0’을 입력하면 완전히 닫히고.
변정한 대표가 자신이 개발한 프로그램으로 파프리키를 재배하고 있는 강원도 철원의 스마트팜 농장을 둘러보고 있다. 오피스데브 제공
변정한 대표가 자신이 개발한 프로그램으로 파프리키를 재배하고 있는 강원도 철원의 스마트팜 농장을 둘러보고 있다. 오피스데브 제공
●“작물별 생육 조건 db 자료 없어···지금부터 축적할 터”

문제는 작물별 생육 조건 즉 수분이나 습도 등에 대한 자료가 없어 농부들의 경험치에 의존하는 것이죠. 농업 당국도 이런 자료를 갖고 있지 않았습니다. 잘되는 농가는 ‘영업 비밀’이어서 공개를 꺼리죠. 그래서 제가 개발한 PLC는 30초 단위로 작물 별로 스마트팜의 각종 내외부 환경을 저장합니다. 이런 자료를 모아 최적의 생육조건을 찾아내 다른 농가에 보급하기 위해서죠.

- 장애인 정보기술(IT) 교육도 했다지요. 성과는?
☞ 2011년 장애인관리공단이 국제 장애인기능올림픽 개인 db 부문 출전 선수들을 위해 재능기부를 해달라고 요청하더군요. 그해 9월 서울에서 열린 제8회 국제 장애인기능 올림픽대회인데, 솔직히 말씀드리면 거절하고 나오는데, 국가 대표선수 두 명이 현관 문을 잡고 있더군요. 한 친구는 휠체어에 앉아 있고, 한 친구는 겨우 손가락 하나만 움직이는 상태인데, 그게 눈에 밟혔습니다.

●“장애인 선수들과 합숙 훈련···올림픽서 금·은 획득”

아무리 국가대표 선수라도 입상해 상금을 타야 그런대로 보람이 있다 싶어 “매회 우승국이 어디냐”고 물어보니, “일본, 대만”이라고 하더라구요. 제가 일본에서 사업하면서 고생했던 경험 때문에 일본을 한번 이겨보자고 결심했습니다. 보상 없이 두달 동안 IT 재능기부를 했죠.

말이 100일 훈련이지, 이런 상태로는 안 되겠기에 대회 두 달 전부터 모든 업무를 내팽개치고 국가 대표 선수 2명과 같이 지내며 교육시켰습니다. 그 결과 박정우 선수는 금메달, 한 손가락만 겨우 움직일 수 있는 이수정 선수는 은메달을 획득했죠. 일본은 동메달로 밀려났습니다. 얼마나 기쁘던지. 그 감격은 아직도 쟁쟁합니다. 저도 덤으로 국무총리상을 받았습니다.

이후 박정우 선수는 2016년 종목을 바꿔 PC 조립부문 대표 선수로 출전해 프랑스 국제장애인 기능대회에서 금메달을 따냈습니다. 연속 2관왕을 차지하는 신기록을 남겼던거죠. 지금은 모 대기업에 잘 다니고 있습니다. 요즘도 주말엔 장애인들에게 재능기부 교육차 갑니다.
2011년 제8회 서울 국제 장애인 기능 올림픽대회 데이터베이스 부문 금메달을 딴 박정우(앞 왼쪽)과 이수정 선수. 오피스데브 제공
2011년 제8회 서울 국제 장애인 기능 올림픽대회 데이터베이스 부문 금메달을 딴 박정우(앞 왼쪽)과 이수정 선수. 오피스데브 제공
- IT 교육에 대해 할 말이 많은듯 한데.
☞ 메달 획득 이후 지방에 있는 학교 등에서 장애인 지도를 계속했습니다. 2015년에는 서울전자고 기능반 담당 교사가 찾아와 학생들 IT 지도를 해 달라고 부탁하더라구요. 학생들의 해맑은 모습을 위해서, 특정 특성화고에 편중된 기득권의 IT 진입장벽을 제거해 보자는 생각으로 도전했죠. 2년만에 서울지역 우승 및 전국 대회 준우승했습니다. 언론은 잘 모르시겠지만 이쪽 분야에서는 일대 사건을 만들었던거죠.

●“대회 ‘노메달’ 어린 선수들도 사회 진출 문호 더 넓혀야”

그런데 메달을 획득한 선수들은 취업도 되지만, 떨어진 어린 선수는 어디에도 갈 자리가 없습니다. 참으로 안타까운 모습을 많이 봤습니다. 해당 교사는 기능 성적 잘 받아서 부장이 교감 되고, 교감이 교장으로 승진하지만, 학생들은 성적에 따라 줄을 서야하는 악순환을 보면서, 떨어진 학생들의 일자리를 생각하는 정부 정책이 있었으면 합니다. 학생들이 3년간 밤낮으로 전산과 컴퓨터와 씨름합니다. 메달과 노메달은 사실 종이 한장 차이 아닌가 생각됩니다. 사회적으로 이런 어린 기능 IT 학생들이 회사의 업무에 참여할 수 있는 그런 사회를 기대합니다.

덧붙여 대학에도 한마디 하겠습니다. 대학들이 돈이 된다 싶어 빅데이터학과를 만들고 있답니다. 그렇지만 현업 경험이 전혀 없는 교수들이 빅데이터를 가르친다고 제대로 될까하는 의구심이 듭니다. 통계 처리를 가르치는 것이 제대로 된 빅데이터 교육인가는 하는 것은 고민해볼 문젭니다.

- 프로그램 개발 아이디어는 어떻게 얻나.
☞ 제가 이 일을 시작한지는 어떻게 보면 30년이 넘었습니다. 1997년 모 대기업에서 MS SQL 기반의 ERP를 자체 개발을 시작하면서 첫발을 내딛은 것이죠. 대학원에서 통계 공부할 때 엑셀을 익혔던 거구요. 그러다가 독립해 나와서 2002년 프로그램을 개발하는 오피스데브라는 회사를 차렸습니다. MS의 파트너사로 지정됐죠.

●“개발하다 막히면 조용히 산행··갑자기 아이디어 번쩍하죠”

개발과 관련해 일하다 막히면 산으로 갑니다. 등산이 취미이자 우울한 마음을 달래주는 위안입니다.(그는 백두대간을 세번 종주했단다). 어떤 방해도 받지 않고 하루종일 걷거나 하룻밤 비박을 하다보면 재미난 아이디어가 번쩍 떠오를 때가 있죠. 이런 착상을 붙잡고 개발하면 새로운 뭔가가 탄생하죠. 그런데 요즘 앱 마켓을 보면, 젊은 친구들의 기발하고 참신한 아이디어를 보면 정말 놀랍더라구요.

인터뷰를 마치자 그는 기자에게 주말에 등산을 같이 하자고 제안했다. 요즘 서울 아닌 전국이 재난 수준의 폭염으로 섭씨 35도면 ‘시원하는’ 느껴지는 날씨인데···나가면 개고생일듯해 산행에 동행하겠다는 답을 선뜻 하지 못하고 사무실을 나왔다.

글·사진 이기철 선임기자 chuli@seoul.co.kr

많이 본 뉴스

의료공백 해법, 지금 선택은?
심각한 의료공백이 이어지고 있습니다. 의대 증원을 강행하는 정부와 정책 백지화를 요구하는 의료계가 ‘강대강’으로 맞서고 있습니다. 현 시점에서 가장 먼저 필요한 것은 무엇일까요?
사회적 협의체를 만들어 대화를 시작한다
의대 정원 증원을 유예하고 대화한다
정부가 전공의 처벌 절차부터 중단한다
의료계가 사직을 유예하고 대화에 나선다
광고삭제
위로