공유하기
김일두 카카오브레인 대표는 20일 온라인 기자간담회를 통해 "내년에 글과 이미지를 함께 이해할 수 있는 초거대 AI모델을 공개할 것"이라며 "이를 위해 글로벌 최대 규모의 이미지 텍스트 멀티모달(multi-modal) 데이터세트를 구축해 공개하겠다"고 전했다.
멀티모달이란 텍스트뿐 아니라 이미지나 음성도 함께 이해할 수 있는 AI 모델이다. 이미지를 글로 표현하거나 글에 알맞은 이미지를 검색하고 찾아낼 수 있다. 김 대표는 "멀티모달 AI가 완성되면 포털 다음과 카카오톡의 이미지 검색이나 카톡 내 다양한 쇼핑 서비스에 우선 적용할 예정"이라고 밝혔다.
'검색', '커머스' 외 '교육'과 '헬스케어' 영역에도 카카오브레인 AI가 적용된다. 김 대표는 "카카오브레인의 기술들이 세상의 중요한 문제에 쓰여지게 할 것"이라며 "교육과 헬스케어 정도 분야에서는 난제성 이슈들을 해결할 수 있을 것 같다"고 강조했다.
이를 위해 카카오 공동체와의 연계도 강화한다. 신약 설계 플랫폼 기업 '갤럭스'와 공동연구를 진행하면서 카카오의 헬스케어 사내독립기업(CIC)과도 협업도 이어갈 계획이다. 앞으로 카카오브레인은 '디지털 휴먼(가상인간)' 개발까지 도전할 전망이다.
김 대표는 "접근성이 상당히 떨어지지만, 부가가치가 아주 큰 영역을 중심으로 혁신을 이어갈 것이다. 교육과 헬스케어가 전략섹터지만 향후 다른 섹터들도 발굴되지 않을까 생각한다"며 "디지털 휴먼에 다가가면서 말씀드린 분야에서(낮은 접근성, 높은 부가가치) 수백개 이상의 혁신을 일으키는 회사가 되는 것이 목표"라고 강조했다.
지난 2017년 설립된 카카오 AI 연구 자회사 카카오브레인은 약 20억건에 달하는 이미지-텍스트 쌍으로 구성된 데이터를 바탕으로 '사람 같은 AI'를 구현하는 데 집중하고 있다.
<저작권자 ⓒ ‘존중받는 개인, 부강한 대한민국’ 시대, 무단전재 및 재배포 금지>
<보도자료 및 기사 제보 ( [email protected] )>
-
양진원 기자
안녕하세요 양진원 기자입니다. 많은 제보 바랍니다.