• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

[아하!] 맥락 있는 번역…확대되는 '인공신경망 번역기술'

 

황이화 기자 | hih@newsprime.co.kr | 2016.11.01 17:39:03

[프라임경제] SF 영화를 보면 간혹 의아해지는 대목이 있습니다. 영화에 흠뻑 빠져 인지하지 못했지만, 영화가 끝나고 난 뒤 생각해보면 언어가 다른 사람끼리(또는 외계인과 지구인)이 자유롭게 대화를 나누는 장면은 이상하지 않을 수 없습니다.

그러나 최근 IT업체들이 영화 속 이 장면을 구현하는 데 한 발짝 더 다가간 모습인데요. 지난달 국내 최대 포털업체 네이버는 자사 모바일 통번역 애플리케이션 '파파고'에 인공신경망 번역(Neural Machine Translation·NMT) 방식을 적용해 번역 정확도를 높였다고 밝혔습니다.

또 40년 이상 전통의 자국어 자동 통번역업체 시스트란 인터내셔널은 인공신경망 방식을 적용한 번역 엔진 'PNMT(Pure NMT)'를 지난 8월 상용화한데 이어 이달부터 본격적으로 판매망을 확대하겠다는 계획을 내놨습니다.

이처럼 기계 번역 분야에서 인공신경망 번역이 화두인데요. 인공신경망이란 생물의 신경망, 특히 인간의 두뇌처럼 만든 통계학적 학습 알고리즘으로, 인공신경망 번역은 기계 번역에 보다 고도화된 인공지능(AI) 방식을 도입했다는 의미라고 할 수 있습니다.

사람이 번역하더라도 단순히 단어 뜻만 해석해서는 제대로 된 의미를 전달할 수 없는데요. 특히 '잘한 번역'이라고 평가받기 위해선 뜻풀이를 넘어 맥락에 맞는 의미를 번역해야 합니다.

이에 따라 번역의 정확도를 높이기 위한 기계의 학습은 계속돼왔는데요. 구글 번역기 등 지금까지의 번역 엔진들은 통계 기반 번역(Statistical Machine Translation·SMT) 방식에 따른 학습을 통해 정확도를 높여왔습니다. 이들의 학습 방식은 많은 데이터가 낸 결과값을 반영하는 방식이었던 거죠.

예를 들어 '아침'을 영어로 번역하려 할 때 'Breakfast'보다 'Morning'이라는 결과값이 많으면, 'Breakfast'가 적절한 문장에서도 'Morning'으로 번역하는 '학습'을 하고, 결과값 'Morning'을 도출하는 식이죠.

물론 '아침=Breakfast'라는 데이터가 지속적으로 입력되면 이런 결과를 반영합니다만, 그 과정은 여전히 일정한 알고리즘에 따르는 것이 아닌 무수한 반복에 따른 결과라고 할 수 있죠.

아울러 통계 기반 번역 방식은 문장 전체가 아닌 단어나 구 단위를 중심으로 번역한다는 점도 인간의 번역 방식과 달랐던 점인데요. 인공신경망 번역은 이러한 통계 기반 번역 방식의 한계를 극복하고 보다 인간의 번역과정과 흡사하게 했습니다.

즉 인공신경망 번역은 '맥락'을 고려하는 자체 알고리즘을 통해 번역의 완성도를 높이는 게 핵심인데요. 시스트란 인터내셔널의 PNMT는 문장 전체를 놓고 먼저 맥락을 확인한 뒤 문장에서 중요한 부분에 초점을 맞춰 문장이 의문문인지 평서문인지 등을 판별합니다.

'북한 핵무기'라는 말 뒤에 '문제'라는 말을 넣었을 때 전체 문맥상 자연스럽다는 학습 결과에 따라 이를 반영한 번역 결과를 보여주기도 하죠.

공개되지 않았지만, 네이버의 인공신경망 번역도 단어나 구 중심이 아닌 문장 전체 맥락을 고려하는 점에서 같습니다.

시스트란 인터내셔널은 PNMT 엔진 확대 전략을 발표하면서 지속적인 연구를 통해 인간을 넘어서는 번역 기술을 선보이길 바라며, 특정 부문에서는 인간의 번역 능력을 넘어서는 측정치도 나왔다고 전했는데요.

아직 초기 수준임에도 인공신경망 번역의 '번역 솜씨'를 직접 확인해본 이들은 '기대 이상'이라는 반응입니다. 영화에서만 봐왔던 '자유로운 의사소통'이 실현될 날이 코앞으로 다가온 기분입니다.

  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지