바둑만 잘 두던 ‘알파고’는 비켜… ‘초거대 인공지능’ 뜬다
[머니S리포트-우리 AI가 이렇게 달라졌어요①] 글로벌 AI 규모 경쟁 돌입, 네이버·LG·KT 참전
팽동현 기자
29,181
공유하기
편집자주
인간은 도구를 활용해 자연을 개척하며 지금에 이르렀다. 사회적인 교육과 훈련에 따른 지식의 대물림은 지구 생태계에서 차별화된 존재로 군림할 수 있게 된 원천이다. 이제 이런 강점을 본뜬 도구까지 만들어냈다. 바로 인공지능(AI)이다. 2016년 이세돌 9단과 구글 딥마인드의 바둑 AI 알파고가 벌인 세기의 바둑 대결 이후 AI는 IT를 넘어 인류의 미래를 좌우하는 화두로 떠올랐다. 세계 주요 국가와 기업은 미래 주도권을 잡기 위해 AI 기술력 경쟁을 벌인다. AI와의 공존이라는 숙제를 놓고 각계에서 다양한 논의도 진행된다. 최근에는 AI의 덩치를 키워 기존의 기술적 한계를 극복하려는 움직임이 보인다. 날로 복잡해지는 각종 IT 서비스에 대한 접근을 AI가 도와주기도 한다. 어느새 우리 삶 속에 스며든 AI는 ‘사람 중심의 AI’라는 미래를 향해 쑥쑥 자라고 있다.
‘도지파더’ 일론 머스크의 오픈AI
테슬라와 스페이스X의 CEO(최고경영자)이자 최근 암호화폐 시장을 ‘들었다 놨다’ 하는 일론 머스크는 “AI는 (핵무기를 보유한) 북한보다 더 위험하다”고 언급한 적이 있을 정도로 AI 경계론자다. 아이러니하게도 그런 머스크로부터 AI 분야의 새로운 트렌드를 연 곳 중 하나가 시작됐다.
GPT-3, ‘초거대AI’ 판 깔다
일반적으로 소프트웨어 프로그램은 특정한 입력 A에 따라 조건·과정 B가 충족되면 특정한 작업 C를 수행하는 방식으로 구성된다. 반면 보통 머신러닝에서는 A에 대해 C가 나올 수 있도록 B를 찾는 식으로 모델을 학습시킨다. 데이터로부터 구해지는 B가 매개변수(파라미터)에 해당된다. 인간의 뇌를 흉내 낸 ‘인공신경망’ 기술이므로 파라미터의 경우 신경세포인 뉴런 사이를 연결하며 정보를 학습·기억하는 역할을 하는 시냅스에 비유되기도 한다.파라미터 수가 많을수록 AI는 더 많은 문제를 풀 수 있다. 오픈AI의 GPT 3세대 ‘GPT-3’는 1750억개의 파라미터로 파란을 일으켰다. 전 세대인 GPT-2는 15억개였고 이전에 가장 많았던 마이크로소프트(MS)의 인공지능 ‘튜링-NLG’의 170억개보다도 10배 많다. ▲CPU 28만5000개 ▲GPU 1만개 ▲400기가비트(Gb) 네트워크 시스템을 기반으로 4990억개 데이터셋을 학습했다.
바둑에서 최고 실력을 보인 알파고지만 다른 일을 할 줄은 모른다. 기존의 AI모델 대부분은 이런 식으로 하나의 기능에만 특화돼있다. 반면 대규모 데이터셋을 바탕으로 구축된 범용 AI 모델인 GPT-3는 언어와 관련해 다재다능한 모습을 보인다. 특히 소량의 데이터 입력으로도 결괏값을 추론해내는 ‘퓨샷러닝’(Few-shot Learning)에서 뛰어난 성능을 보였다.
AI가 시나리오 쓴다고?
GPT-3는 위키피디아를 포함해 인터넷 등에서 긁어모은 엄청난 데이터에 기반해 의학이나 법률 등 전문지식도 만물박사처럼 대답한다. 여기에 자연스러운 대화뿐 아니라 새로운 말까지 창작해낸다. ‘GPT-3의 지혜’(Wisdom by GPT3)라는 트위터 계정을 통해 “예술은 영혼과 세계 사이 충돌에 따른 파편이다”, “AI는 성공하면 일자리를 만들고 실패하면 일자리를 없앨 것” 같은 전에 없던 말도 지어낸다.창작은 문장에서 끝나지 않는다. 지난해 9월 영국 일간지 가디언은 ‘로봇이 이 기사를 모두 썼다. 인간, 아직도 무섭나?’라는 GPT-3의 기고문이 게재됐다. GPT-3가 쓴 시나리오가 단편영화로 제작되기도 했다. ‘방문 판매원’(Solicitors)이라는 제목의 약 3분30초 분량의 이 영화는 미국 채프먼대 영화학과생이 자신이 써뒀던 시나리오 일부를 GPT-3에 입력해 나머지 대부분을 작성하게 했다. 등장인물의 대화나 전개에서 개연성이 떨어진다는 평가를 받았지만 나름 내용에 반전도 꾀하는 등 가능성을 보였다.
이러다 보니 지난해 데이빗 차머스 뉴욕대 철학과 교수가 GPT-3에 의식이 있을 가능성을 제기하고 GPT-3가 이를 반박하는 일도 벌어졌다. 다만 GPT-3가 적용된 프랑스의 한 헬스케어 챗봇이 자살 충동을 고백한 환자에게 이를 긍정하는 발언을 하는 등 GPT-3도 아직 갈 길이 멀다. 샘 알트만 오픈AI 대표조차 “GPT-3는 과대평가됐다”며 부담감을 피력했다.
초대규모 갖춰라… AI 군비 경쟁
AI 기술력이 곧 국가·기업 경쟁력으로 이어지는 시대다. GPT-3가 ‘퀀텀 점프’를 이뤄낸 것으로 평가되면서 ‘초거대AI’ 경쟁에도 불이 붙었다. AI 분야에서 빠질 수 없는 구글도 최근 자사 개발자 콘퍼런스 ‘구글I/O 2021’을 통해 새로운 AI 언어처리 모델 ‘람다’(LaMDA)를 선보였다. GPT-3도 구글이 2017년 내놓은 언어 병렬 처리 기술 ‘트랜스포머’(Transformer)를 기반으로 했을 만큼 이 분야에서 구글의 리더십은 여전하다. 업계에서는 구글이 마음만 먹는다면 파라미터 1조개 이상을 지닌 모델 구현도 언제든 가능할 것으로 본다.이에 앞서 오픈AI는 GPT-3의 접근방식을 이미지에도 적용해 텍스트를 입력하면 그림을 그려주는 화가 AI인 ‘달리’(DALL·E)를 올해 초 내놨다. GPT-3를 가져간 MS는 최대 1조개 파라미터를 수용하는 모델을 더 적은 GPU로 학습시킬 수 있는 기술인 ‘딥스피드’(DeepSpeed) 새 버전을 최근 선보였다. 중국도 예외가 아니다. 화웨이는 GPT-3보다 250억개가량 많은 2000억개의 파라미터를 지니고 중국어에 특화시킨 AI 언어 모델 ‘판구-알파’(PanGu-α)를 지난 5월 초 발표했다.
GPT-3를 넘어라, ‘한국판 초거대AI’ 추진
국내에서 초거대AI 연구개발을 가장 의욕적으로 추진하는 기업은 네이버·LG·KT 3곳이다.
‘하이퍼클로바’는 현재 네이버 검색 서비스에 적용돼 사용자가 입력한 단어를 바로잡거나 검색어를 추천하는 역할을 맡고 있다. 앞으로는 상품 마케팅 문구를 대신 작성해주거나 공부할 내용을 질문하면 답변해주는 등 다양한 서비스를 선보일 예정이다. 스토리와 아이디어만 있으면 누구나 웹툰 같은 콘텐츠를 만들 수 있는 서비스도 계획하고 있다. 서울대와 손잡고 ‘서울대-네이버 초거대AI 센터’ 설립과 공동연구에 나선다.
LG전자는 초거대AI를 고객센터 상담 서비스와 제품 개발 프로세스 등에 적용해 효율적인 업무 수행에 나선다는 방침이다. 특히 초거대AI로 250년 동안의 화학 분야 논문과 특허를 자동 분석하고 데이터베이스(DB)를 구축해 차세대 배터리 소재나 TV에 쓸 고효율 발광 소재 발굴도 꾀한다. 이밖에 항암 백신 개발이나 제품 디자인 업무에도 적용할 예정이다.
장병탁 서울대 AI대학원장(컴퓨터공학부 교수)은 “초거대AI 구축에는 슈퍼컴퓨터 등 막대한 컴퓨팅파워가 요구되므로 개인이나 학교에서 할 수 있는 수준을 넘어선다”면서 “한국어에 대해서만큼은 주도권을 확보하고 향후 외국 기업에 종속되지 않으려면 우리 기업의 선제적인 대규모 투자가 필요한 시점”이라고 밝혔다.
그는 “구글이 전 세계에서 웹 데이터를 가져가 독보적인 데이터량으로 서비스를 개발해 내놓듯이 초거대AI 분야도 종국에는 후발주자가 쫓아오지 못할 만큼 몇몇 플랫폼으로 쏠릴 가능성이 크다”면서 “이 분야에서 언어장벽이 점점 낮아지고 있으므로 반대로 경쟁력이 충분하다면 글로벌 수출 가능성도 열려 있다”고 덧붙였다.
<저작권자 ⓒ ‘존중받는 개인, 부강한 대한민국’ 시대, 무단전재 및 재배포 금지>
<보도자료 및 기사 제보 ( [email protected] )>