공유하기
지난해 3월 구글 딥마인드 ‘알파고’에 무릎을 꿇었던 인간이 21일 서울 광진구 세종대학교 광개토관에서 열린 ‘인간 번역사와 AI의 번역대결행사’에서 복수에 성공했다.
압도적인 속도를 보인 AI 번역기지만 비유적인 표현에서 약점을 드러냈다. 채점결과 30점 만점에 인간 번역사들이 24~25점을 받은 반면 AI 번역기는 9.3~10.6점을 받는데 그쳤다.
곽중철 한국외국어대 통번역대학원 교수는 “AI는 꼬아서 말하면 알아차리지 못한다”며 “문학적인 표현에서 한계를 드러냈다”고 말했다.
이번 대결로 언어번역 분야에서는 인간이 앞서있다는 것이 증명됐지만 동시에 미진한 국내 AI 인프라가 적나라하게 드러났다.
AI 번역의 핵심은 말뭉치(Corpus)다. 말뭉치란 컴퓨터가 언어를 이해할 수 있도록 한국어 텍스트를 추출, 컴퓨터가 이해할 수 있는 코드로 변환한 것이다. 말뭉치가 많을수록 AI 번역의 질이 높아지고 머신러닝을 통해 AI가 스스로 학습하는 범위도 넓어진다.
현재 한국어 말뭉치는 약 5억 어절 수준이다. 영어 말뭉치가 2000억 어절, 일본어 말뭉치가 100억 어절이라는 점을 감안하면 턱없이 부족하다.
국립국어원은 지난 2007년 1차 말뭉치 사업인 세종계획을 2007년 마무리한 후 10년동안 2차 사업을 진행하지 못하고 있다. 전문가들은 디지털 세계의 10년은 현실세계의 100년에 해당한다며 관련분야의 개발을 서둘러야 한다고 조언한다.
국립국어원 관계자는 “한국어 정보화 사업을 적극적으로 홍보할 필요가 있다”며 “말뭉치 변환 작업이 늦어진다면 미래먹거리인 AI의 주도권을 놓치는 것은 물론 우수한 언어로 평가되는 한국어도 미래에는 그 효용가치가 하락할 것”이라 말했다.
<저작권자 ⓒ ‘존중받는 개인, 부강한 대한민국’ 시대, 무단전재 및 재배포 금지>
<보도자료 및 기사 제보 ( [email protected] )>