수퍼톤 이교구(왼쪽) 대표와 허훈 최고기술책임자.
국내 인공지능(AI) 오디오 기업인 수퍼톤 이교구 대표와 허훈 최고기술책임자(CTO)는 지난해 세계 처음으로 적용한 드라마 카지노의 ‘음성 디에이징’ 작업 과정을 이렇게 설명했다.
지난 21일 서울 강남의 수퍼톤 본사에서 만난 이 대표는 “수퍼톤은 소량의 음성 데이터만으로 무한대에 가까운 목소리를 만들어 낼 수 있다”고 자신했다. 허 CTO는 “10초 분량의 음원으로도 다양한 목소리의 재현이 가능해 노래와 연기에 활용할 수 있다”고 덧붙였다.
두 사람이 평가하는 국내의 AI 오디오 기술력은 미국과 중국 다음인 세계 3위 수준이다. 특히 AI 음성 융합 기술과 K콘텐츠와의 결합은 미래의 주목할 만한 성장 동력이 될 것으로 본다.
수퍼톤은 전 세계에 방송된 넷플릭스 시리즈 ‘마스크걸’을 통해 구현한 ‘다화자 음성 모핑’ 기술로 화제를 모았다. 배우 이한별과 나나의 연기 톤과 음색 등 분석해 합성한 김모미의 ‘부캐’ BJ의 목소리가 기대 이상으로 자연스럽고 완벽하다는 평가를 받았다.
올초 하이브에 인수된 수퍼톤은 ‘K팝의 세계화’를 위한 다양한 프로젝트를 시도하고 있다. 그룹 에이트 출신의 가수 이현의 가창과 창법을 다국어 음원으로 변환한 ‘미드낫’(MIDNATT) 프로젝트가 대표적이다. 미드낫으로 발표된 디지털 싱글 ‘마스커레이드’는 한국어, 영어, 일본어, 중국어, 스페인어, 베트남어 등 총 6개국 언어로 불린 음반이다. 이 프로젝트는 수퍼톤의 ‘다국어 발음 교정 기술’과 ‘보이스 디자이닝 기술’이 활용됐다.
이 대표는 “지금까지 없던 음악의 더빙이라는 아이디어를 실제로 구현한 것”이라며 “라이브 공연에서 실시간 다국어 변환이 가능하기 때문에 아티스트와 팬을 강하게 묶어주고, 글로벌 팬덤을 확장하는 역할을 할 것”이라고 기대했다.
이 대표는 무엇보다 수퍼톤 기술의 가치를 음악·영화·드라마 등 창작자에 대한 지원에 둔다. 그는 “하이브와 AI 오디오 기술을 통한 다양한 엔터 사업 확장을 논의 중”이라며 “음향·영상 부문의 K콘텐츠 솔루션을 확대하고 기업 이미지를 담아낸 ‘브랜드 보이스’ 개발에도 나설 것”이라고 말했다.