EZ EZViwe

[인터뷰] '국내 로봇저널리즘 초석 다지다' 김동환 서울대학교 HCI+D랩 연구원

"로봇기자, 인간 인지 능력 뛰어넘는 무언가 아닌 문제해결의 도구"

임희빈 인턴기자 기자  2016.07.30 10:01:12

기사프린트

[프라임경제] "로봇저널리즘이 '기자의 밥벌이를 뺏을 것인가' '인턴기자는 다 죽으란 얘기냐' 이런 얘기를 많이 듣는데 꼭 그런 관계는 아닐 것이라고 생각합니다."

김동환 서울대학교 HCI+D랩 연구원의 말이다. 기술적인 부분이 불가피한 미래라면 이런 것들을 산업에서 어떻게 활용할 수 있을지 생각해보는 것이 필요하다는 지적이다. 

국내 로봇저널리즘은 서울대학교 HCI+D(Human Computer Interaction+Design) 연구실에서 시작됐다고 해도 과언이 아니다. 지난해 서울대학교 이준환 연구팀이 기사작성 알고리즘 로봇을 개발하면서 국내 로봇저널리즘 연구가 본격적으로 활성화됐다. 

이후 연구팀은 기사 작성 알고리즘 로봇을 기반으로 프로야구 뉴스 로봇을 개발해 페이스북을 통해 야구 기사를 보도해왔다. '무시무시한 타격전 끝에' '결과에 아쉬움을 남겼다' 등 실제 사람이 작성한 것과 같은 표현들이 눈길을 끌었다.

로봇저널리즘의 등장에 기자가 대체되는 것 아닌가 하는 우려의 목소리도 있지만, 현재로서는 보완하는 역할을 할 것이라는 예상이 우세하다.

김 연구원은 "연구는 문제해결의 관점에서 접근한다"고 강조했다. 기존의 저널리즘에서 발생할 수 있는 문제를 기술적으로 해결하는 방식으로 로봇저널리즘을 연구한다는 것이다.

그는 로봇저널리즘이 오히려 기자가 취재, 분석을 바탕으로 하는 휴먼사이드 스토리의 기사에 집중할 수 있도록 도울 것이라고 예측했다.

다음은 김동환 서울대학교 HCI+D랩 연구원과의 일문일답.

-로봇저널리즘을 연구하게 된 계기는 무엇인가.
▲HCI(Human Computer Interaction) 석사를 졸업했는데 원래 공대 베이스의 지식이 있다 보니 컴퓨테이션 저널리즘(컴퓨터기술을 이용해서 저널리즘의 여러 가지 부분을 보완하는 것)에 관심이 많았다.

-프로야구 뉴스로봇은 혼자 만든 것인가.
▲지난해에는 혼자 만들었고 올해는 연구진과 함께했다. 지난해 경기 요약 정도만 했다면 올해는 요약이 1문단, 점수가 날 수 있었던 상황묘사가 2문단, '승리한 팀은 어땠고 순위는 몇 위다'와 같은 경기 총평은 3문단으로 구성된다.

-로봇기자는 어떤 과정을 거쳐 기사를 작성하나.
▲데이터의 수집, 데이터의 분석, 중요 이벤트 추출, 기사의 분위기 결정, 기사작성 이렇게 다섯 가지 단계를 거친다.

-프로야구 뉴스로봇에서 매번 경기결과와 과정이 바뀌는데 이 데이터들을 로봇이 어떻게 인식하나.
▲데이터 소스는 문자중계를 통해서 보고 있다. 야구는 결승타, 결승점이 존재하기 때문에 어떤 선수가 낸 점수로 인해서 이긴 경기인지 하나하나 기록이 되고 산술적으로 계산이 된다. 이것을 인식해서 기사화할 수 있는 것이다.

-스포츠 기사에서 눈에 띄는 표현들은 어떤 것들이 있나.
▲사람이 쓴 것 같은 표현이 몇 가지 있다. '아슬아슬한 승부 끝에 승리를 거두었다'와 같은 표현은 과연 기계가 쓴 것일까라고 생각하는 사람들도 많았다. 표현뿐만 아니라 전체적으로 기사구성이 자연스럽고 정보량이 충분하기 때문에 인간이 쓴 기사와 많이 헷갈려 하는 것 같다.

-로봇 기자가 어떻게 자연스럽게 기사를 작성할 수 있나.
▲비유해서 설명하자면 사람도 상황과 맥락에 따라 무슨 말을 해야 하는지 어렸을 때부터 배우고 행동하듯 로봇도 동일하게 어떤 상황과 맥락에서는 이런 말을 해야겠다는 것을 학습한다. '대승'이라고 하면 그것과 관련된 단어를 선택해서 사용할 수 있다. 반은 생성하고 반은 기존에 있는 것들을 선택해서 사용하는 것이다.

-프로야구 뉴스를 페이스북에서 운영 중인데 사람들이 많이 읽나.
▲포탈 정도의 인기는 아니지만 꾸준히 읽히는 정도다. 지속적으로 '좋아요'를 누르는 사람도 있고 댓글을 달아주는 사람도 있다. 재미있는 경기의 경우 많이 읽기도 한다. 한화 경기는 많이 읽히는 편이다.

-왜 많은 스포츠 중 야구뉴스를 쓰나.
▲야구는 한 구 한 구가 다 기록이 되고 그것이 볼인지 스트라이크인지 안타인지 다 기록이 되는 통계 스포츠다. 야구 통계기법을 설명할 때 '스토리 스태츠(Stats)'라고 설명을 많이 하는데 스토리를 끄집어내기 유리한 형태의 통계학이라는 의미다. 기록된 데이터를 기반으로 기사로 작성하기 좋기 때문에 야구뉴스를 쓰고 있다.

-다른 언어로도 기사작성이 가능한가.
▲영어나 중국어도 가능할 것이다. 전에 중국 CCTV에서 촬영을 온다고 해서 중국어로 기사를 만들어봤다. 한국어로 생성한 후에 번역하는 것이 아니라 처음부터 알고리즘이 중국어로 글을 쓰는 원리다. 따라서 번역 상에 생길 수 있는 오해를 방지할 수 있고, 새로운 정보를 만드는 것이 유리하다.

-개발자로서 로봇기자에 대한 생각은?
▲과도하게 인간의 인지적인 능력을 넘어서는 무언가를 만들어보겠다는 개념이 아니다. '너무 데이터가 많아서 사람이 시간이 없어서 보지 못하는 부분이 있거나, 충분한 주의를 쏟을 수 없을 때 알고리즘으로 어떻게 해결해 볼 수 있을까' 하는 문제해결의 관점이다. HCI를 연구하면서 컴퓨터는 수단이나 방법이 아닌 문제해결을 위한 도구가 돼야 한다고 항상 생각한다.