[프라임경제] 새롭게 등장한 전문용어와 신조어 등 영어 표제어를 네이버에서 발 빠르게 확인할 수 있게 됐다.
NHN㈜(035420)이 이용자들의 전문 용어에 대한 사전 검색 수요가 증가함에 따라, 종이 사전에 수록된 표제어를 제공하는 방식에서 '지식백과' 등 전문 정보를 제공하는 웹 문서 내 포함된 단어들 간의 패턴을 분석해 의미 있는 표제어를 자동으로 추출하는 방식을 추가했다고 5일 밝혔다.
네이버는 다양한 영역의 전문용어 등 새롭게 등장하는 신조어에 대한 이용자들의 검색 요구에 보다 신속히 대응하고자, 전문 정보를 제공하는 웹 문서에서 표제어를 추출해내는 기술을 적극 활용했다는 설명이다.
웹 문서 내 표제어 추출은 '지식백과', '전문정보', '뉴스' 등 양질의 전문 정보들을 담은 웹 문서를 대상으로 하며, 이용자들은 그간 업데이트가 늦어 확인하기 어려웠던 전문 영역의 영어 신조어 등의 다양한 표제어까지 네이버 사전을 통해 보다 발 빠르게 확인할 수 있다.
표제어 추출은 전문 정보에 새롭게 등장하는 영어 표제어와 한글이 인접한 단어를 자동으로 1차로 추출한 뒤 여러 단계의 필터링을 거쳐 새로운 표제어로 등재하는 기술이다.
특히, 네이버는 1차로 자동 추출된 표제어 제공으로 인한 오류를 최소화하기 위해 △해당 표제어의 노출 빈도 정보를 통한 신뢰도 점검 △영어-한글 단어 간의 띄어쓰기 점검을 통한 오류 제거 △여러 단어에서의 단순 중복 사용 정도 점검 등 다중의 필터링 추가 적용했다.
NHN에 따르면 지난 2009년 종이 사전 중심의 30만건에 불과하던 네이버 영어사전의 표제어 수는 다양한 영역의 전문 용어 등을 꾸준히 업데이트한 결과 지난해 12월 10배 가까운 300만 건까지 확보하게 됐으며, 웹 문서에서의 추출 기술을 활용해 현재는 322만 건의 표제어를 제공 중이다.
새로운 표제어 추출 기술 적용 이후 인터넷에서 찾기 어려웠던 전문용어 등의 표제어를 보다 쉽게 접할 수 있다는 점에서 이용자들로부터 호평을 얻고 있으며, 이와 함께 베트남, 터키, 러시아어 등 소수 이용 언어에 대한 사전 서비스 정교화 및 새로운 언어의 사전 출시 기대감까지 보이고 있다.
김종환 NHN 사전&전문정보실장은 "지속적으로 다양한 영역의 표제어를 추가한 결과 300만 건 이상의 영어 표제어를 확보하게 됐으며, 웹 문서에서의 표제어 추출을 통해 이용자들에게 한 단계 더 진화된 영어사전 서비스를 제공하게 됐다"고 말했다.