/사진=이미지투데이
약 13만건에 달하는 증권사 리포트를 챗GPT와 같은 인공지능(AI) 알고리즘으로 분석한 결과 경제성장률 등 거시경제 지표 예측이 수월해지고 설문조사 없이도 전문가 견해를 파악할 수 있었다는 연구 결과가 나왔다.
한국은행은 16일 공개한 'AI 알고리즘을 이용한 산업 모니터링: 증권사 리포트 텍스트 분석' 제하의 BOK이슈노트를 통해 "AI 등 통계 기법을 이용하면 무수히 많은 사람의 언어를 종합해서 빠르게 분석하는 것이 가능하다"고 설명했다.

보고서를 작성한 서범석 한국은행 조사국 거시모형팀 과장은 52개 증권사에 종사하는 애널리스트 1079명이 작성한 기업평가보고서 12만8000건을 수집해 자연어처리 기법을 활용, 분석했다.


이를 통해 산업별 기업 업황과 기업 경영환경 변동 요인 등의 정보를 산출했다.

서 과장은 "새롭게 제시한 텍스트 업황지수는 국내총생산(GDP), 기업경기실사지수(BSI) 등 거시경제 지표를 예측하는 데 유용한 것으로 나타났다"며 "산업별 변동요인 파악에도 효과적인 것으로 나타났다"고 분석했다.

특히 텍스트 지표와 경기선행지수 순환변동치와 인과관계를 분석하면, 코스피 컨센서스 전망치에는 나타나지 않는 경기선행지수로의 일방향적 인과관계가 텍스트 지표에는 존재하는 것으로 한은은 분석했다.


서 과장은 "애널리스트들이 제시하는 텍스트 정보에 숫자가 전달하지 못하는 새로운 정보가 반영되고 있을 가능성을 시사한다"고 설명했다.

증권사 리포트에 나타나는 텍스트 데이터는 가공하는 방식에 따라 다양한 미시적·거시적 연구가 가능하며 산업 관련 동향 파악과 요인분석에 효과적으로 활용될 수 있다고 한은은 설명했다.

특히 텍스트 데이터는 발간일 기준으로 취합이 가능하므로, 여타 공식 통계보다 신속하게 분석할 수 있는 장점이 있다.

또한 텍스트 데이터는 수치화하기 힘든 여러 주제에 대한 전문가들의 견해를 취합해 보여준다. 이러한 점에서 텍스트를 바탕으로 작성한 지표들은 숫자가 반영하지 못하는 새로운 정보를 정량화해 제공할 여지가 크다는 게 한은의 분석이다.

서 과장은 "향후 텍스트 업황 지표를 산업 전망 모형에 외생변수로 추가해 활용하는 방안이나 산업간 유사도 지표를 바탕으로 경제분석 모형을 개발하는 방안 등 다양한 연구를 지속적으로 검토할 필요가 있다"고 설명했다.

이와 함께 이번 연구에선 신종 코로나바이러스 감염증(코로나19), 러·우 전쟁, 환율, 금리 등 주요 경제 이슈에 대한 전문가들의 견해를 취합해 영향도 및 평가 지표로 정량화했다.

통상 특정 이벤트의 산업별 영향을 정량화해 비교하는 것이 어렵다는 점에서 해당 지표들의 효용성이 매우 높다는 분석이 나왔다.

서 과장은 "텍스트는 정보를 주고받는 가장 기본적인 수단"이라며 "전달하는 정보 범위에 한계가 없다는 점에서 텍스트 분석 기술은 경제 분야에서도 활용 가치가 매우 높다"고 말했다.

이어 "방대한 양의 텍스트 정보를 알고리즘으로 취합할 수 있다면 기업정보의 1차 생산자인 애널리스트들의 생각을 실시간으로 취합할수 있다"며 "이는 정보의 2차 가공자인 경제 분석 연구자들의 업무 효율을 크게 개선시킬 수 있을 것"이라고 덧붙였다.