AI에 감성을 담다…KT, ‘낄끼빠빠’하는 초거대AI 만든다

AI에 감성을 담다…KT, ‘낄끼빠빠’하는 초거대AI 만든다

나상현 기자
입력 2022-05-22 09:04
수정 2022-05-22 11:37
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0
기술력 응집체 KT 융합기술원 참관
언어·청각·시각지능 갖춘 초거대AI
맥락을 이해하고 사람처럼 대답까지
“낄 때 끼고 빠질 때 빠지줄 알아야”
“똑똑한 AI를 넘어서 공감하는 AI”
이미지 확대
KT 융합기술원 KT 융합기술원 Large AI 기술개발 Project 서영경 전임연구원이 Large AI 패러프레이징 기술 활용해 대화록을 요약하는 시연을 진행하고 있다. KT 제공.
KT 융합기술원 KT 융합기술원 Large AI 기술개발 Project 서영경 전임연구원이 Large AI 패러프레이징 기술 활용해 대화록을 요약하는 시연을 진행하고 있다. KT 제공.
#1.“명의자분의 성함과 생년월일 확인해도 될까요?” 통신사 고객센터에 전화했을 때 쉽게 들을 수 있는 상담사의 멘트. KT 초거대AI에 넣자 순식간에 100여가지 변형 문장이 나타났다. 동의어를 사용하거나 어순을 변경하는 등 우리가 자연스럽게 말할 수 있는 변주들이다. 이를 통해 AI는 기계처럼 똑같은 대답을 하지 않고 진짜 사람처럼 매번 다른 대답을 할 수 있게 된다. 

#2.약 3분간 이어지는 상담사와 고객 간 대화록. 인사말부터 시작해 부연설명까지 있어 한눈에 맥락을 파악하기엔 쉽지 않다. 초거대 AI를 통하니 긴 대화록이 수초만에 ‘일반전화의 전화요금 확인을 요청하여 수납 처리가 되었음을 안내했다’라는 한 문장으로 요약됐다. 사람이 직접 맥락을 파악하고 요약 문장을 정리하는 것에 비해 훨씬 정확하고 빨랐다.

KT는 지난 19일 서울 서초구에 위치한 융합기술원에서 진행한 디지코 스터디를 통해 이 같이 ‘감성’과 ‘공감’을 담은 초거대AI 기술을 공개했다. 이날 KT는 언어지능, 청각지능, 시각지능 등 신체 각 능력으로 통용되는 초거대AI 기술 일부를 취재진에 공개했다.

초거대AI란 대용량을 스스로 학습해 인간처럼 종합적인 추론을 할 수 있는 차세대 AI를 의미한다. 오픈AI인 GPT-3를 비롯해 네이버의 하이퍼클로바, LG의 엑사원이 대표적이다. 여기에 KT도 초거대AI 산업에 출사표를 던졌다.

언어지능 시연에서 초거대AI는 문장을 생산하고 요약하는 기술을 선보였다. 문장생성은 AI가 어휘를 변용한 문장을 자동 생성해 스스로 학습 성능을 높일 수 있는 기술로, 학습데이터 구축 시간과 비용을 기존과 비교해 1/3 수준으로 단출할 수 있다. 문양 요약 기술도 긴 상담과 대화 내용의 맥락을 순식간에 파악해 한 줄로 요약하는 기능이 구현된다. 서영경 전임연구원은 “상담사가 내용을 이해하고 응대하는 시간을 초거대AI를 통해 획기적으로 단축할 수 있다”고 설명했다.
KT 융합기술원 AI2XL연구소 Speech Recognition Project 이정한 전임연구원이 E2E음성인식 AI 기술 활용해 영상 음성을 텍스트로 옮기는 시연을 진행하고 있다. KT 제공.
KT 융합기술원 AI2XL연구소 Speech Recognition Project 이정한 전임연구원이 E2E음성인식 AI 기술 활용해 영상 음성을 텍스트로 옮기는 시연을 진행하고 있다. KT 제공.
청각지능 측면에선 ‘E2E(End to End) 음석인식’ 기술을 공개했다. 통상 3개의 모델로 구현되는 기존 음성인식AI와 달리 KT는 하나의 딥러닝 모델로만 구현했다. 이를 통해 자유발화에 높은 성능을 보이고, 사용자가 말하는 순간의 음성을 실시간으로 처리할 수 있었다. 빠른 시간에 맥락을 파악하기 때문에 가능한 것이다. 이날 시연에 나선 이정한 전임연구원이 ‘한동훈’을 말하니 바로 ‘법무부 장관’이라고 AI가 문장을 이어가는 모습을 확인할 수 있었다.

이외에도 뉴스나 긴 대화를 실시간으로 텍스트로 바꾸기도 했다. 이 연구원이 유튜브에서 뉴스 영상을 가져와 실행하자 빠른 속도로 텍스트가 나타났다. ‘기자’를 ‘기제’로, ‘취재’를 ‘추재’로, ‘석유공사’를 ‘서귀공사’로 출력하는 등 오타가 다수 보이기도 했다. 하지만 데이터가 쌓일수록 AI가 맥락을 파악할 수 있어 불분명한 발음도 추후엔 정확하게 인식할 수 있다는 것이 이 연구원의 설명이다.
KT 융합기술원 AI2XL연구소 로봇비전 Projrct 박진욱 책임연구원이 C-TIS 솔루션에 활용되는 객체검출 AI 기술을 설명하고 있다. KT 제공.
KT 융합기술원 AI2XL연구소 로봇비전 Projrct 박진욱 책임연구원이 C-TIS 솔루션에 활용되는 객체검출 AI 기술을 설명하고 있다. KT 제공.
시각지능 시연에선 AI가 이미지와 영상 등 시각 정보를 읽어내는 기술을 확인할 수 있었다. 도로교통 폐쇄회로(CC)TV 영상 C-ITS 솔루션은 눈, 비, 역광, 가려짐 등 제한된 상황에서도 도로의 작은 개체를 높은 정확도로 검출했다. 실제로 박진욱 책임연구원이 직접 짠 코드로 흐릿한 도로교통 영상을 돌리자, 자동차·트럭·버스·오토바이·보행자를 구분해 각각의 개체를 인식했다.

KT가 이러한 ‘사람 같은’ 초거대AI 기술을 통해 구현하고자 하는 목표는 ‘감성’이다. B2C(사업자 대 소비자) 영역에서 사용자의 감성까지 공감할 수 있는 차세대 AICC(인공지능 컨택센터)를 개발할 계획이다. 또한 육아나 법률 등 전문적인 분야에서도 AI가 사람처럼 연속적인 대화가 가능하도록 ‘멀티턴 전문 상담’ 서비스를 개발한다. 현재 330만명이 활용하고 있는 기가지니의 대화 품질도 혁신적으로 개선될 수 있다.
이미지 확대
KT 융합기술원 KT 융합기술원 AI2XL연구소 배순민 소장이 19일 오전 서울 서초구 융합기술원에 열린 <9회 KT 디지코 스터디>에서 ‘KT AI 2.0’ 연구 방향성을 발표하고 있다. KT 제공.
KT 융합기술원 KT 융합기술원 AI2XL연구소 배순민 소장이 19일 오전 서울 서초구 융합기술원에 열린 <9회 KT 디지코 스터디>에서 ‘KT AI 2.0’ 연구 방향성을 발표하고 있다. KT 제공.
이렇듯 감성 있는 AI, 공감하는 AI가 필요한 이유는 무엇일까. 배순민 연구소장은 “KT의 AI 기술력은 어느 정도 수준에 올라왔고, 이젠 그 이상이 필요하다”면서 “외로움도 AI를 통해 극복이 됐으면 싶다. 다정한 AI를 통해 좀 더 따뜻한 세상이 되었으면 한다”고 설명했다. 이어 “이젠 정보를 얻기 위해서나 편리함을 위해서 AI를 쓰는 것이 아니고, 정말 자신한테 위로가 될 수 있고 어려움을 같이 공감해주는 AI를 통해 삶을 풍성하게 만드는 단계”라고 덧붙였다.

배 소장은 ‘낄끼빠빠’(낄 때 끼고 빠질 때 빠지는)할 줄 아는 AI로봇도 강조했다. 그는 “AI가 단순히 똑똑하게 대화를 하는 것이 아니라 더욱더 상대방을 이해해서 해야 될 말과 하지 말아야 될 말을 구분할 수 있어야 한다. 낄때 끼고 빠질 때는 좀 빠지는 것”이라며 “앞으로 똑똑한 AI 이상의 그런 따뜻한 공감하는 AI가 필요하다”고 말했다.

아울러 KT는 홈 메타버스 ‘지니버스’도 조만간 공개할 계획이다. 기존의 메타버스가 게임이나 소셜네트워크서비스(SNS) 기반이라면, 지니버스는 홈 서비스를 기반으로 한다. 배 소장은 “KT는 조금 더 생활에 밀접한 편의도 제공하는 그런 메타버스를 제공하려고 하고 있다“면서 “지니버스는 대화를 자연스럽게 하는 NPC들도 지니버스 안에서 만나볼 수 있을 것이고 ‘통화비서’의 넥스트 버전이라고도 할 수 있을 것”이라고 말했다.
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
광고삭제
광고삭제
위로