바둑만 잘 두던 ‘알파고’는 비켜… ‘초거대 인공지능’ 뜬다

[머니S리포트-우리 AI가 이렇게 달라졌어요①] 글로벌 AI 규모 경쟁 돌입, 네이버·LG·KT 참전

팽동현 기자

29,181

2021.06.09 | 06:30:00

편집자주

인간은 도구를 활용해 자연을 개척하며 지금에 이르렀다. 사회적인 교육과 훈련에 따른 지식의 대물림은 지구 생태계에서 차별화된 존재로 군림할 수 있게 된 원천이다. 이제 이런 강점을 본뜬 도구까지 만들어냈다. 바로 인공지능(AI)이다. 2016년 이세돌 9단과 구글 딥마인드의 바둑 AI 알파고가 벌인 세기의 바둑 대결 이후 AI는 IT를 넘어 인류의 미래를 좌우하는 화두로 떠올랐다. 세계 주요 국가와 기업은 미래 주도권을 잡기 위해 AI 기술력 경쟁을 벌인다. AI와의 공존이라는 숙제를 놓고 각계에서 다양한 논의도 진행된다. 최근에는 AI의 덩치를 키워 기존의 기술적 한계를 극복하려는 움직임이 보인다. 날로 복잡해지는 각종 IT 서비스에 대한 접근을 AI가 도와주기도 한다. 어느새 우리 삶 속에 스며든 AI는 ‘사람 중심의 AI’라는 미래를 향해 쑥쑥 자라고 있다.

빅데이터에 이어 이를 먹고 크는 인공지능(AI)에도 ‘빅’ 흐름이 도래했다. ‘초거대(hyper-scale) AI’라는 단어가 심심찮게 등장하고 네이버·LG·KT 등 국내 굴지의 기업들도 이런 초대규모 AI 연구개발에 전사적인 역량을 쏟아붓는다. 어느새 이 분야에서 ‘핫’한 주제로 자리한 모습이다.

‘도지파더’ 일론 머스크의 오픈AI

테슬라와 스페이스X의 CEO(최고경영자)이자 최근 암호화폐 시장을 ‘들었다 놨다’ 하는 일론 머스크는 “AI는 (핵무기를 보유한) 북한보다 더 위험하다”고 언급한 적이 있을 정도로 AI 경계론자다. 아이러니하게도 그런 머스크로부터 AI 분야의 새로운 트렌드를 연 곳 중 하나가 시작됐다.

‘오픈AI’(OpenAI)는 머스크가 유명 스타트업 육성기관 와이콤비네이터 대표였던 샘 알트만과 함께 안전하고 개방적인 AI 연구개발을 위해 2015년 설립한 비영리기관이다. 경제적으로 가치 있는 작업에서 사람을 능가하는 자율적인 시스템으로 ‘범용 인공지능’(AGI) 구현을 목표한다. 여기서 만든 딥러닝 모델이 인기 온라인게임 ‘도타2’ 프로게이머팀을 상대로 연승을 거둬 화제가 되기도 했다.

GPT는 이곳에서 만든 AI 언어 생성 모델이다. 입력된 자료를 바탕으로 머신러닝 알고리즘 기반 분석을 통해 구문론·문법·정보적 일관성을 갖춘 텍스트를 생성하는 자연어처리(NLP) 모델이다. 즉 말하고 글 쓰는 AI다. 지난해 5월 선보인 3세대 GPT는 ‘초거대AI’ 트렌드를 연 것으로 평가된다.

GPT-3, ‘초거대AI’ 판 깔다

일반적으로 소프트웨어 프로그램은 특정한 입력 A에 따라 조건·과정 B가 충족되면 특정한 작업 C를 수행하는 방식으로 구성된다. 반면 보통 머신러닝에서는 A에 대해 C가 나올 수 있도록 B를 찾는 식으로 모델을 학습시킨다. 데이터로부터 구해지는 B가 매개변수(파라미터)에 해당된다. 인간의 뇌를 흉내 낸 ‘인공신경망’ 기술이므로 파라미터의 경우 신경세포인 뉴런 사이를 연결하며 정보를 학습·기억하는 역할을 하는 시냅스에 비유되기도 한다.

파라미터 수가 많을수록 AI는 더 많은 문제를 풀 수 있다. 오픈AI의 GPT 3세대 ‘GPT-3’는 1750억개의 파라미터로 파란을 일으켰다. 전 세대인 GPT-2는 15억개였고 이전에 가장 많았던 마이크로소프트(MS)의 인공지능 ‘튜링-NLG’의 170억개보다도 10배 많다. ▲CPU 28만5000개 ▲GPU 1만개 ▲400기가비트(Gb) 네트워크 시스템을 기반으로 4990억개 데이터셋을 학습했다.

바둑에서 최고 실력을 보인 알파고지만 다른 일을 할 줄은 모른다. 기존의 AI모델 대부분은 이런 식으로 하나의 기능에만 특화돼있다. 반면 대규모 데이터셋을 바탕으로 구축된 범용 AI 모델인 GPT-3는 언어와 관련해 다재다능한 모습을 보인다. 특히 소량의 데이터 입력으로도 결괏값을 추론해내는 ‘퓨샷러닝’(Few-shot Learning)에서 뛰어난 성능을 보였다.

AI가 시나리오 쓴다고?

GPT-3는 위키피디아를 포함해 인터넷 등에서 긁어모은 엄청난 데이터에 기반해 의학이나 법률 등 전문지식도 만물박사처럼 대답한다. 여기에 자연스러운 대화뿐 아니라 새로운 말까지 창작해낸다. ‘GPT-3의 지혜’(Wisdom by GPT3)라는 트위터 계정을 통해 “예술은 영혼과 세계 사이 충돌에 따른 파편이다”, “AI는 성공하면 일자리를 만들고 실패하면 일자리를 없앨 것” 같은 전에 없던 말도 지어낸다.

창작은 문장에서 끝나지 않는다. 지난해 9월 영국 일간지 가디언은 ‘로봇이 이 기사를 모두 썼다. 인간, 아직도 무섭나?’라는 GPT-3의 기고문이 게재됐다. GPT-3가 쓴 시나리오가 단편영화로 제작되기도 했다. ‘방문 판매원’(Solicitors)이라는 제목의 약 3분30초 분량의 이 영화는 미국 채프먼대 영화학과생이 자신이 써뒀던 시나리오 일부를 GPT-3에 입력해 나머지 대부분을 작성하게 했다. 등장인물의 대화나 전개에서 개연성이 떨어진다는 평가를 받았지만 나름 내용에 반전도 꾀하는 등 가능성을 보였다.

코딩도 할 줄 안다. C·파이썬·자바 등 프로그래밍 언어를 GPT-3가 학습해 소스코드를 짤 수 있다. 지난해 9월 오픈AI와 계약을 맺고 GPT-3 독점 라이선스를 획득한 MS는 최근 자사 개발자 콘퍼런스 ‘빌드 2021’에서 엑셀 기반 로우코드(비전문가용 SW개발) 플랫폼 ‘파워앱스’에 GPT-3를 적용했다. 일상에서 대화하듯이 요청사항을 입력하면 프로그래밍 언어(파워FX)로 자동 변환된다.

이러다 보니 지난해 데이빗 차머스 뉴욕대 철학과 교수가 GPT-3에 의식이 있을 가능성을 제기하고 GPT-3가 이를 반박하는 일도 벌어졌다. 다만 GPT-3가 적용된 프랑스의 한 헬스케어 챗봇이 자살 충동을 고백한 환자에게 이를 긍정하는 발언을 하는 등 GPT-3도 아직 갈 길이 멀다. 샘 알트만 오픈AI 대표조차 “GPT-3는 과대평가됐다”며 부담감을 피력했다.

초대규모 갖춰라… AI 군비 경쟁

AI 기술력이 곧 국가·기업 경쟁력으로 이어지는 시대다. GPT-3가 ‘퀀텀 점프’를 이뤄낸 것으로 평가되면서 ‘초거대AI’ 경쟁에도 불이 붙었다. AI 분야에서 빠질 수 없는 구글도 최근 자사 개발자 콘퍼런스 ‘구글I/O 2021’을 통해 새로운 AI 언어처리 모델 ‘람다’(LaMDA)를 선보였다. GPT-3도 구글이 2017년 내놓은 언어 병렬 처리 기술 ‘트랜스포머’(Transformer)를 기반으로 했을 만큼 이 분야에서 구글의 리더십은 여전하다. 업계에서는 구글이 마음만 먹는다면 파라미터 1조개 이상을 지닌 모델 구현도 언제든 가능할 것으로 본다.

이에 앞서 오픈AI는 GPT-3의 접근방식을 이미지에도 적용해 텍스트를 입력하면 그림을 그려주는 화가 AI인 ‘달리’(DALL·E)를 올해 초 내놨다. GPT-3를 가져간 MS는 최대 1조개 파라미터를 수용하는 모델을 더 적은 GPU로 학습시킬 수 있는 기술인 ‘딥스피드’(DeepSpeed) 새 버전을 최근 선보였다. 중국도 예외가 아니다. 화웨이는 GPT-3보다 250억개가량 많은 2000억개의 파라미터를 지니고 중국어에 특화시킨 AI 언어 모델 ‘판구-알파’(PanGu-α)를 지난 5월 초 발표했다.

조성배 연세대 AI대학원 원장(컴퓨터과학과 교수)은 “대규모 데이터와 컴퓨팅파워를 동원해 사전에 학습시키는 방식이 언어 AI 분야 위주로 떠오르고 있다. 전산 자원도 많이 들고 조건도 붙지만 이게 가능하다면 성능은 어느 정도 보장된다는 점에서 점차 영상 등 다른 분야에도 적용이 시도되고 있다”며 “인지과학이나 신경과학 등 다양한 접근방식을 통해 더 적은 자원으로 효율적으로 문제를 해결하기 위한 연구도 병행되고 있다”고 설명했다.

GPT-3를 넘어라, ‘한국판 초거대AI’ 추진

국내에서 초거대AI 연구개발을 가장 의욕적으로 추진하는 기업은 네이버·LG·KT 3곳이다.

네이버는 지난해 10월 국내 기업 최초로 700페타플롭(PF·연산 속도 단위로 초당 1000조번 계산) 성능의 슈퍼컴퓨터를 도입하고 5600억개 토큰의 한국어 데이터셋을 구축했다. 이를 바탕으로 지난달 말 선보인 AI 언어 모델 ‘하이퍼클로바’는 세계 최대 규모인 2040억개 파라미터로 개발됐다. 데이터 90% 이상을 영어로 학습한 GPT-3에 비해 한국어 데이터를 6500배 이상 학습했다.

‘하이퍼클로바’는 현재 네이버 검색 서비스에 적용돼 사용자가 입력한 단어를 바로잡거나 검색어를 추천하는 역할을 맡고 있다. 앞으로는 상품 마케팅 문구를 대신 작성해주거나 공부할 내용을 질문하면 답변해주는 등 다양한 서비스를 선보일 예정이다. 스토리와 아이디어만 있으면 누구나 웹툰 같은 콘텐츠를 만들 수 있는 서비스도 계획하고 있다. 서울대와 손잡고 ‘서울대-네이버 초거대AI 센터’ 설립과 공동연구에 나선다.

LG는 그룹 차원에서 AI에 역량을 집중한다. 전담조직인 LG AI연구원은 지난 5월 개최한 온라인 행사에서 초거대AI 구축을 위한 대규모 컴퓨팅 인프라 확보 및 개발에 향후 3년간 1억달러(약 1100억원) 이상을 투자하겠다는 계획을 내놨다. 1초에 9경5700조번 연산을 처리할 수 있는 글로벌 톱3 수준의 AI 컴퓨팅 인프라를 구축하고 올 하반기에는 GPT-3의 3배가 넘는 파라미터 6000억개를 갖춘 모델을 내놓고 내년에는 조 단위의 모델을 선보일 계획이다.

LG전자는 초거대AI를 고객센터 상담 서비스와 제품 개발 프로세스 등에 적용해 효율적인 업무 수행에 나선다는 방침이다. 특히 초거대AI로 250년 동안의 화학 분야 논문과 특허를 자동 분석하고 데이터베이스(DB)를 구축해 차세대 배터리 소재나 TV에 쓸 고효율 발광 소재 발굴도 꾀한다. 이밖에 항암 백신 개발이나 제품 디자인 업무에도 적용할 예정이다.

KT는 올해 초 AI연구소 AI2XL(AI To Everything Lab)와 AI로봇사업단을 신설하고 로보틱스 분야 세계적 권위자인 데니스 홍 미국 UCLA 교수를 영입하는 등 AI 사업에 속도를 내고 있다. 국내에서 가장 많은 가입자를 보유한 AI스피커 ‘기가지니’로 데이터를 축적했으며 현재 초거대AI 모델 개발을 위해 각 분야 전문가와 협업을 추진하고 있다. KT가 보유한 대덕2연구센터에서 한국과학기술원(KAIST)과 손잡고 ‘AI·SW 기술 연구소’를 공동 설립해 연내 출범시킬 계획이다.

장병탁 서울대 AI대학원장(컴퓨터공학부 교수)은 “초거대AI 구축에는 슈퍼컴퓨터 등 막대한 컴퓨팅파워가 요구되므로 개인이나 학교에서 할 수 있는 수준을 넘어선다”면서 “한국어에 대해서만큼은 주도권을 확보하고 향후 외국 기업에 종속되지 않으려면 우리 기업의 선제적인 대규모 투자가 필요한 시점”이라고 밝혔다.

그는 “구글이 전 세계에서 웹 데이터를 가져가 독보적인 데이터량으로 서비스를 개발해 내놓듯이 초거대AI 분야도 종국에는 후발주자가 쫓아오지 못할 만큼 몇몇 플랫폼으로 쏠릴 가능성이 크다”면서 “이 분야에서 언어장벽이 점점 낮아지고 있으므로 반대로 경쟁력이 충분하다면 글로벌 수출 가능성도 열려 있다”고 덧붙였다.

<보도자료 및 기사 제보 ( [email protected] )>