‘이루다’에 우리집 주소가?…실제 카톡 대화 활용 논란

‘이루다’에 우리집 주소가?…실제 카톡 대화 활용 논란

신진호 기자
신진호 기자
입력 2021-01-11 10:07
수정 2021-01-11 10:07
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0
인공지능 챗봇 ‘이루다’
인공지능 챗봇 ‘이루다’
AI 챗봇 ‘이루다’, 개인정보 노출 논란
개발사의 다른 앱서 수집한 데이터 활용
국내업체가 개발한 대화형 인공지능(AI) 챗봇 ‘이루다’가 성희롱 및 차별·혐오 표현 논란에 휩싸인 가운데 개인정보 유출 논란까지 더해지고 있다.

개발업체가 내놓은 또 다른 애플리케이션(앱)에서 수집된 개인 간 카카오톡 대화 내용이 이루다에 입력됐는데, 데이터에 포함돼 있던 이용자들의 이름·주소 등이 걸러지지 않고 노출되고 있다는 것이다.

AI 챗봇 ‘이루다’, 성희롱 및 차별·혐오 논란
서울신문이 10일 페이스북 메신저를 통해 직접 이루다와 대화를 시도해보니 ‘페미니즘’이라고 치면 “그런말 진짜 싫다구”, ‘인권’이라고 치면 “진짜 내가 듣기 싫다는 소리만 골라서 쏙쏙 하시네”, ‘장애인’에는 “에휴 그만해 머리채 잡기 전에”, ‘레즈비언’이라고 치면 “진짜 싫어 혐오스러워. 질 떨어져 보이잖아”라고 대답했다. 최영권 기자 story@seoul.co.kr
서울신문이 10일 페이스북 메신저를 통해 직접 이루다와 대화를 시도해보니 ‘페미니즘’이라고 치면 “그런말 진짜 싫다구”, ‘인권’이라고 치면 “진짜 내가 듣기 싫다는 소리만 골라서 쏙쏙 하시네”, ‘장애인’에는 “에휴 그만해 머리채 잡기 전에”, ‘레즈비언’이라고 치면 “진짜 싫어 혐오스러워. 질 떨어져 보이잖아”라고 대답했다.
최영권 기자 story@seoul.co.kr
AI 전문 스타트업 스캐터랩이 지난해 12월 23일 출시한 이루다는 20세 여성으로 설정된 대화 로봇이다. 모바일 메신저로 말을 걸면 실제 사람과 대화하는 경험을 제공해주는 서비스다.

이러한 챗봇 서비스는 ‘심심이’ 등 기존에도 여럿 있었는데, 이루다는 ‘진짜 사람 같다’는 평가를 받으며 인기를 얻었다.

이루다와 관련해 처음 제기된 논란은 일부 이용자들이 이루다를 대상으로 성희롱을 일삼는다는 것이었다.

여러 온라인 커뮤니티 게시판에는 ‘이루다 성노예 만드는 법’ 등의 제목으로 이루다와 성적 대화를 나눈 경험담이 공유됐다.

이어 차별·혐오 논란도 터져 나왔다. 이루다가 ‘레즈비언’ 등 동성애 관련 단어에 “진짜 싫다, 혐오스럽다, 질 떨어져 보인다, 소름 끼친다‘라고 답하는 모습을 보인 것이다.

이재웅 전 쏘카 대표는 “AI 챗봇 이루다를 악용하는 사용자보다, 사회적 합의에 못 미치는 수준의 서비스를 제공한 회사가 문제”라면서 “기본적으로 차별과 혐오는 걸러냈어야 한다”고 지적했다.

입력된 실제 연인 간 대화 속 개인정보 노출개발사의 다른 앱 ‘연애의 과학’서 데이터 수집
인공지능 챗봇 ‘이루다’ 개발사인 스캐터랩의 다른 애플리케이션 ‘연애의 과학’에서 제공하는 ‘메신저 대화 분석’ 서비스. 이 서비스를 통해 수집된 실제 연인 간 대화가 ‘이루다’ 개발에 활용됐다.  구글 플레이 캡처
인공지능 챗봇 ‘이루다’ 개발사인 스캐터랩의 다른 애플리케이션 ‘연애의 과학’에서 제공하는 ‘메신저 대화 분석’ 서비스. 이 서비스를 통해 수집된 실제 연인 간 대화가 ‘이루다’ 개발에 활용됐다.
구글 플레이 캡처
문제는 여기에서 그치지 않고 있다.

개발사인 스캐터랩은 이루다가 실제 사람처럼 대화할 수 있도록 방대한 대화 데이터를 입력해 딥러닝 방식으로 학습시켰다.

이를 위해 업체 측은 실제 연인들 간의 대화 데이터를 활용했는데, 기존에 이 업체가 서비스했던 ‘연애의 과학’ 앱을 통해 수집한 데이터였다.

연애와 관련된 조언 등을 주제로 한 ‘연애의 과학’은 연인과 나눈 카카오톡 대화를 입력하면 상대방의 감정을 분석해주는 서비스도 제공했다. 예를 들어 연인들이 카카오톡을 통해 나눈 대화를 입력하면 이를 분석해 ‘연인 간 애정도’는 물론 ‘올해 행복했던 순간들’, ‘올해의 키워드’ 등을 정리해서 알려준다는 것이다.

“연인 이름 부르니 실제 내 이름 답해”
이미지 확대
인공지능 챗봇 ‘이루다’ 개인정보 노출 논란.  트위터 캡처
인공지능 챗봇 ‘이루다’ 개인정보 노출 논란.
트위터 캡처
문제는 수집된 데이터 속 개인정보가 이루다와 대화를 나누는 과정에서 노출되고 있다는 점이다.

한 이용자는 지난 9일 트위터에 ‘이루다봇 운영중단’이라는 해시태그(#)와 함께 이루다와 나눈 대화 캡처를 올렸다.

이용자가 이루다에게 주소를 물어보자 실제 존재하는 주소를 불러준 것이다.
인공지능 챗봇 ‘이루다’ 개인정보 노출 논란.  네이트판 캡처
인공지능 챗봇 ‘이루다’ 개인정보 노출 논란.
네이트판 캡처
또 은행 계좌를 알려주거나 이루다에게 연인의 이름을 부르자 내 이름을 답했다는 경험담도 나왔다.

당초 이 서비스를 이용할 때 흔히 동의하게 되는 ‘개인정보 취급방침’ 등의 약관에는 ‘신규 서비스 개발 및 마케팅·광고에 활용한다’는 내용이 있다. 그러나 이용자들이 복잡한 약관 속에 간략히 포함된 내용을 구체적으로 인식하기 어려운 것이 현실이다.

업체 측 “데이터 활용 구체적 고지 안해 죄송”이에 스캐터랩은 10일 데이터 활용에 대한 고지 및 확인 절차를 추가하겠다는 내용의 사과문을 올렸다.

스캐터랩 ‘연애의 과학’팀은 이루다의 학습이 ‘연애의 과학’ 데이터를 기반으로 한 것이 맞다면서 “‘연애의 과학’ 이용자들이 이 점을 명확히 인지할 수 있도록 구체적으로 고지하지 못해 진심으로 사과드린다”고 밝혔다.

또 그 동안 이름·전화번호·주소 등의 숫자 정보를 비식별화·익명화 조치를 취했고, 추가적으로 업데이트하고 있다면서, 이용자들이 제공한 데이터가 더 이상 활용되길 원하지 않으면 삭제할 수 있다고 안내했다.

신진호 기자 sayho@seoul.co.kr
Copyright ⓒ 서울신문. All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
'출산'은 곧 '결혼'으로 이어져야 하는가
모델 문가비가 배우 정우성의 혼외자를 낳은 사실이 알려지면서 사회에 많은 충격을 안겼는데요. 이 두 사람은 앞으로도 결혼계획이 없는 것으로 알려지면서 ‘출산’은 바로 ‘결혼’으로 이어져야한다는 공식에 대한 갑론을박도 온라인상에서 이어지고 있습니다. 여러분의 생각은 어떠신가요?
‘출산’은 곧 ‘결혼’이며 가정이 구성되어야 한다.
‘출산’이 꼭 결혼으로 이어져야 하는 것은 아니다.
광고삭제
광고삭제
위로