뷰페이지

국내 첫 AI 한문 번역기…유네스코 유산 ‘승정원일기’ 번역 빨라지나

국내 첫 AI 한문 번역기…유네스코 유산 ‘승정원일기’ 번역 빨라지나

김기중 기자
김기중 기자
입력 2020-06-02 14:04
업데이트 2020-06-03 16:26
  • 글씨 크기 조절
  • 프린트
  • 공유하기
  • 댓글
    14

고전번역원 3년 연구 결실, 일반인에 PC, 태블릿, 스마트폰 서비스도

한국고전번역원의 한문 자동번역 시스템 PC용 화면. 고전번역원 제공
한국고전번역원의 한문 자동번역 시스템 PC용 화면. 고전번역원 제공
한문 문장을 우리말로 번역해주는 인공지능(AI) 번역기가 3년간의 개발을 마치고 곧 공개된다. 조선왕조실록, 승정원일기 등 막대한 분량의 고전 번역에도 새 길이 열렸다.

한국고전번역원 관계자는 “지난 3년 동안 진행한 인공지능 고문헌 자동번역 확산 서비스 사업을 완료했다. 이번 달 전문가 시연을 거친 뒤 다음 달 이후부터 일반인에게도 서비스를 제공할 예정”이라고 2일 밝혔다.

고전번역원은 승정원일기 번역 기간을 단축할 인공지능 번역기를 만들겠다며 2017년 과학기술정보통신부의 ‘정보통신기술(ICT) 기반 공공서비스 촉진사업’에 신청했다.

●방대한 ‘승정원 일기’…매년 56권 번역해 현재 27% 완료

유네스코 기록유산인 승정원일기는 조선왕조의 행정과 왕명의 출납 등을 맡은 승정원(현재의 대통령 비서실에 해당)의 사무 기록이다. 소실한 부분이 많지만, 남아 있는 것만 따져도 단일 사료로서 가장 방대한 수준이다. 1623년(인조 1년) 음력 3월부터 1910년(순종 4년)까지 기록이 남았는데, 전체 분량이 3243권으로 글자 수만 2억 2256만자에 이른다.

고전번역원이 매년 56책씩 번역해 현재 27%까지 완료했다. 고전번역원은 인공지능 번역기로 2062년까지 예정된 완료 기간을 2035년까지로 단축할 수 있을 것으로 보고 있다.

한자를 국문으로 번역해주는 서비스가 있지만, 한문 문장을 번역하는 서비스는 현재 없다. 무수히 나열한 한자 사이사이에 문장부호를 찍어 구분하기 쉽도록 하는 표점 작업을 비롯해 사라진 표현이나 고유명사 등에 색인을 추가하는 작업 등을 해야 하기 때문이다.

고전번역원은 3년 동안 43억원을 받아 인공지능을 구축하고 고도화하는 작업을 거쳤다. 승정원일기 번역문 가운데 122만 문장을 넣어 학습을 시켰고, 그 결과 2017년 5점 만점에 3.00점이었던 번역 점수가 최종적으로 4.09점을 기록했다. 이는 300자 이하 100문장을 번역한 뒤 번역자 2인이 평가한 점수다.

●고전번역원, 전문가 시연 뒤 새달 쯤 일반인에게도 공개

4.09점은 상급 번역자에는 못 미치는 수준이지만, 번역기를 활용해 초벌번역을 한 뒤 이를 번역가가 수작업으로 보완하는 식으로 활용할 수 있을 것으로 보인다. 이에 따라 번역 속도도 단축될 전망이다.

고전번역원 측은 이번 달 말쯤 전문가들을 대상으로 집담회를 연 뒤 이후 일반인에게 베타 서비스 모델을 공개한다. PC, 태블릿, 스마트폰으로 활용할 수 있도록 서비스 모형을 다양화했다. 고전번역원에 따르면, 고전문헌 번역 성과물 정보이용률은 연평균 2200만건에 이른다.

김기중 기자 gjkim@seoul.co.kr

많이 본 뉴스

22대 국회에 바라는 것은?
선거 뒤 국회가 가장 우선적으로 관심 가져야 할 사안은 무엇일까요.
경기 활성화
복지정책 강화
사회 갈등 완화
의료 공백 해결
정치 개혁
광고삭제
위로