EZ EZViwe

원라인에이아이, AI 수학 추론 논문 ACL 2025 공식 채택

KAIST와 테스트 타임 스케일링 효과 입증

김우람 기자 기자  2025.06.04 15:53:23

기사프린트

[프라임경제] 원라인에이아이(대표 정한얼)와 KAIST AI 연구진이 공동 연구한 논문이 세계적 자연어처리 학회 ACL 2025 메인 컨퍼런스에 채택됐다. 논문은 테스트 타임 스케일링(Test-Time Scaling) 기법이 다국어 환경에서도 효과적으로 작동하는지를 분석한 연구다.


4일 원라인에이아이에 따르면 테스트 타임 스케일링은 모델이 실제 문제를 푸는 시점에서 추가 계산 자원을 활용해 성능을 높이는 기법이다.  원라인에이아이는 올해 초 해당 기술을 활용한 모델을 발표한 바 있다. 이번 논문에서는 이를 다국어 수학 문제에 적용해 언어 간 일반화 능력을 실험했다.

연구팀은 실험을 위해 총 55개 언어로 번역된 고난이도 수학 문제 데이터셋 'MCLM(Multilingual Competition Level Math)'를 개발했다. 이는 기존 벤치마크와 달리 수학 경시대회 수준의 복잡한 문제들로 구성돼, 테스트 타임 스케일링 기법의 진정한 성능을 검증할 수 있는 자료로 주목받는다.

연구팀은 세 가지 방식을 비교 분석했다. 특히 자체 개발한 MR1-1.5B 모델이 Budget Forcing 방식에서 뛰어난 성능을 보였다. MR1-1.5B는 Qwen2.5-Math-1.5B-Instruct(23.98), DeepSeek-R1-1.5B(28.83) 등을 앞선 30.93점을 기록해, 소형 모델임에도 고난이도 수학 문제에서 경쟁력을 입증했다.

연구는 또한 영어 외의 다양한 언어 환경에서도 테스트 타임 스케일링의 효과가 유지되는지를 검증하며, 다국어 인공지능 모델의 실용 가능성을 뒷받침했다.

원라인에이아이는 이번 ACL 채택과 연구에 활용한 MCLM 데이터셋을 HuggingFace에 공개하며 글로벌 연구자들의 후속 연구를 독려하고 있다. 

또한 해당 기술은 자사의 글로벌 투자정보 서비스 'Finola'에도 적용될 예정이다.

Finola는 미국 주식시장 정보를 10개국 언어로 제공하는 생성형 AI 기반 투자 비서 서비스로, 각국 투자자들이 언어 장벽 없이 정밀한 인사이트를 얻을 수 있도록 지원한다. 원라인에이아이는 이번 연구 성과를 바탕으로 Finola의 다국어 수학 추론과 자연어 이해 능력을 더욱 강화할 계획이다.

원라인에이아이 관계자는 "기술 연구와 서비스 현장을 연결하는 실질적 AI 응용 사례를 늘려가겠다"며 "다국어 AI 기술의 글로벌 상용화를 주도해 나가겠다"고 말했다.

한편, 원라인에이아이는 IBK기업은행(024110)의 창업육성 플랫폼 'IBK창공(創工) 구로' 13기 육성기업으로 액셀러레이터 씨엔티테크가 함께 육성을 맡았다.