한국은행이 기사 속에 등장하는 경제 단어를 기반으로 경제 지표를 나타내는 '텍스트 지표'를 내놓은 가운데 텍스트 지표는 공식 통계와 비교해 최대 9개월 선행하는 것으로 나타났다./사진=머니S
한국은행이 기사 속에 등장하는 경제 단어를 기반으로 경제 지표를 나타내는 '텍스트 지표'를 내놓은 가운데 텍스트 지표는 공식 통계와 비교해 최대 9개월 선행하는 것으로 나타났다.
16일 한은이 발간한 '뉴스 텍스트를 이용한 경기 예측: 경제 부문별 텍스트 지표의 작성과 활용' 보고서에 따르면 한국은행은 2005년 이후 연간 약 100만건(문장기준 1800만 문장)의 경제뉴스를 분석해 생산, 물가, 고용, 주가, 주택가격 등 경제적으로 관심이 높은 15개 부문의 뉴스 텍스트 기반 경제지표를 작성했다.

한국은행은 뉴스 텍스트 기반 경제지표의 작성을 위해 2005년부터 올 3월까지 인터넷 포털 사이트에 게재된 경제분야 뉴스 기사를 수집했다. 이번 연구에서 사용한 기사는 70여개 언론사의 평일 기준 일평균 약 4000건(연평균 약 100만건)의 기사다.


그 결과 텍스트 지표는 대부분 관련 공식 통계와 높은 상관관계를 보이며 공식 통계 대비 0~9개월 선행하는 것으로 나타났다.

특히 '전망'과 '예측' 단어를 포함해 작성한 물가전망, 주가전망, 주택가격전망 지표의 경우 선행시점이 3~9개월로 높게 나타났다. 이는 텍스트 지표가 뉴스 본문에 나타나는 전문가의 견해와 전망을 반영한 결과이다.

물가의 경우 약 반기 앞을 전망한 전문가 인터뷰가 텍스트 지표에 반영된 것으로 해석할 수 있다. 주가의 경우 약 3개월, 주택가격의 경우 약 9개월 앞에 대한 전망이 뉴스에 많이 나타났을 것으로 한국은행은 유추했다.

서범석 한국은행 경제통계국 통계연구반 과장은 "이들 선행시점은 각 텍스트 지표의 주제를 고려할 때 매우 합리적"이라며 "주가의 경우 관심이 높은 전망시점이 비교적 짧은 약 3개월 정도며 물가의 경우 약 3~6개월, 주택가격의 경우 약 반기에서 1년 정도인 것으로 보는 것이 자연스럽기 때문"이라고 설명했다.


이어 서범석 과장은 "뉴스 텍스트 기반 경제지표가 경기 예측을 위한 중요한 정보를 내포하고 있음을 보여준다"고 말했다.

특히 한국은행은 뉴스 텍스트 기반 경제지표를 이용해 경기 예측모형을 구축한 결과 텍스트 지표를 예측모형에 반영할 경우 분기 GDP(국내총생산)에 대한 예측 정확도가 유의미하게 높아지는 것을 확인했다.

서 과장은 "뉴스 텍스트 기반 경제지표는 실시간으로 작성 가능하므로 속보성 지표로 활용할 수 있고 신속하고 정확한 경기동향 파악 및 경기 예측에도 유용하다"며 "뉴스 기사를 정량화하고 통계 모형을 통해 체계적으로 뉴스 정보를 활용하는 방식은 연구자가 개별적으로 습득한 뉴스 정보를 정성적으로 활용하는 방식에 비해 휴먼 에러를 줄이는 데도 기여할 것"이라고 기대했다.

다만 이러한 경우 특정 의도가 담긴 뉴스가 많이 발간된다면 경기 예측에 의도가 반영될 가능성이 있는 점에는 주의가 필요하다는 게 한은의 설명이다.

서 과장은 "향후 뉴스 텍스트 기반 경제지표의 활용도를 높이기 위해서는 경기 예측에 유용한 텍스트 지표의 주제 발굴, 텍스트 지표의 정도 개선 등이 필요하다"며 "이를 위해 경기 예측에 중요한 새로운 부문의 텍스트 지표를 개발하고 필터링 기법 등을 통해 텍스트 지표의 노이즈를 감소하는 연구를 발전시켜 나갈 필요가 있다"고 부연했다.