어린이 모델들이 KT 인공지능(AI) 보이스 스튜디오를 활용해 콘텐츠를 제작하고 있다. /사진=뉴스1(KT 제공)
KT가 인간의 감정을 표현할 수 있는 '감정 더빙' 기술을 접목한 인공지능(AI) 음성 서비스를 제공한다. 해당 기술을 바탕으로 이용자는 생동감 있는 AI 음성을 만들 수 있다.
20일 통신업계에 따르면 KT는 AI 음성합성 콘텐츠를 제작할 수 있는 'AI 보이스 스튜디오' 서비스를 출시했다.

AI 보이스 스튜디오는 100개의 AI 목소리를 기반으로 즐거움, 침착함, 중립, 슬픔, 화남 등 5가지 감정으로 합성할 수 있는 'AI 보이스'와 이를 활용해 영상 등 오디오 합성 콘텐츠를 제작할 수 있는 '스튜디오'로 구성됐다. KT AI 보이스 스튜디오는 한국어, 영어, 중국어, 일본어 4개 국어로 다국어 합성도 가능하다.


유명인들의 음성을 AI로 제공하는 '셀럽 AI 보이스'도 마련됐다. 첫 번째 목소리는 가수 윤도현이다. 이를 통해 오디오북을 제작할 수 있도록 윤도현의 낭독체와 대화체가 담겼으며 행복·슬픔·분노 등 감정 표현도 제공한다.

KT AI 보이스 스튜디오 웹 버전은 월별 AI 보이스 제공량에 따라 ▲프리(무료, 4000자) ▲베이직(1만2000원, 2만4000자) ▲프로(4만8000원, 12만자) ▲프로맥스(12만원, 38만4000자) 4종의 요금제로 구성됐다. API 버전은 KT클라우드를 통해 월 기본료 10만원에 제공된다.

최준기 KT AI·빅데이터사업본부장은 "다양한 파트너와 협력해 더 혁신적인 AI 보이스 스튜디오 서비스를 지속 출시하겠다"고 말했다.