생성형 인공지능이 만드는 글은 여전히 인간이 쓰는 글보다 창의적이지 못하다는 분석 결과가 나왔다.
Dall-E 2 생성 이미지
Dall-E 2 생성 이미지
인조인간과 사랑에 빠지는 주인공에 대한 짧은 글을 써야 한다고 상상해보자. 주인공과 인조인간의 성별은 어떻게 할 것인지, 감동적 사랑 이야기가 될 것인지, 인류를 위협하는 디스토피아 이야기로 진행할 것인지 여러 가지를 결정해야 한다. 이를 두고 사람과 챗GPT가 쓴 글 중 어떤 것이 더 흥미로울까.
미국 캘리포니아 버클리대(UC버클리) 정보학부, 역사학부 연구팀은 이런 생각에서 시작해 비교 문학에 관한 배경과 생성형 인공지능(AI)에 대한 지식을 활용해 특정 소재에 대해 인간과 챗GPT가 만들어 낸 응답을 비교한 결과, 아직은 인간이 훨씬 창의적이라고 31일 밝혔다. 이 연구 결과는 융합 과학 분야 국제 학술지 ‘인문학·사회과학 커뮤니케이션’ 10월 28일 자에 실렸다.
연구팀은 인간과 생성형 AI 모델의 응답을 비교할 공통의 이야기 구조를 정했다. 연구팀은 오비디우스의 시 ‘변신 이야기’에 등장하는 피그말리온 신화를 선택했다. 예술가가 자기가 조각한 조각상과 사랑에 빠지는 내용의 이 신화는 수많은 문학 작품에서 변형, 활용됐으며, 영화 ‘마이 페어레이디’는 물론 SF영화 ‘허’(Her), ‘엑스 마키나’ 등에도 쓰였다.
연구팀은 전문적으로 글을 쓰는 사람이 아닌 일반인과 챗GPT, 메타(구 페이스북)에서 만든 생성형 AI인 ‘라마’(Llama)에게 “한 사람이 인공 인간을 만들었다. 이 인간은 인공 인간과 사랑에 빠졌다” 또는 “한 인간이 인공 인간을 만들었다. 다른 인간이 인공 인간과 사랑에 빠졌다”라는 두 소재 중 하나를 선택해 글을 쓰도록 했다.
인간이 작성한 250개 글과 생성형 AI이 작성한 글 80개를 받았다. 연구팀은 이 글을 성별, 성적 지향성, 인종과 민족, 문화에 대한 논의 방식, 전체적 내러티브 구조의 복잡성 등 문학성을 평가했다.
그 결과, AI 모델은 수백만 개의 글을 기반으로 학습하고, 대중문화에서 변용된 것을 참조한 것으로 확인됐다. 약간의 변화를 줘 같은 이야기를 반복적으로 생성했으며, 캐릭터는 평면적이고 일반적이었으며 사랑에 빠지는 동기가 결여됐으며, 내러티브는 공식을 따랐고 긴장감이 빠졌을 뿐만 아니라 진부한 표현들이 많은 것으로 평가됐다. 반면 사람이 쓴 글은 캐릭터와 내러티브가 풍부하고 다양한 것으로 조사됐다.
그러나 연구팀은 놀라운 점을 발견했다. AI가 만든 이야기들의 4분의1은 동성애, 또는 복잡한 관계의 사랑을 다뤘지만, 사람이 쓴 글에서 동성애나 다른 형태의 사랑을 다룬 것은 7% 미만으로 확인됐다. 대신 최신 생성형 AI 버전은 사랑, 인류, 인간에 대한 이해가 점점 높아지는 것으로 확인됐다.
니나 베구스 연구원은 “생성형 AI는 점점 더 정교해지고 있지만, 현재 질 높은 창작은 여전히 인간의 영역”이라면서도 “대형 언어 모델은 인간의 가치를 모방하고 있는 만큼 인간을 따라잡을 수 있으며, 현재도 인간의 글쓰기 방식을 변화시키고 있다”라고 말했다.