• 프린트
  • 메일
  • 스크랩
  • 글자크기
  • 크게
  • 작게

크라우드웍스, 과기정통부 '한국형 LLM 사업' KT 컨소시엄 합류

대규모 고품질 데이터 구축 파트너…국내 AI 경쟁력 강화 기여

박진우 기자 | pjw19786@newsprime.co.kr | 2025.07.23 11:08:16

ⓒ 크라우드웍스


[프라임경제] 크라우드웍스(355390)는 과학기술정보통신부가 주관하는 '한국형 초거대 인공지능(LLM) 모델 개발 사업'에 참여하는 KT 주관 컨소시엄에 데이터 구축 파트너로 합류했다고 23일 밝혔다.

이번 사업은 국내 독자적 초거대언어모델 개발을 통해 AI 경쟁력 강화를 목표로 하는 정부 주도 프로젝트다. 지난 21일 마감된 과제 신청에는 총 15개 컨소시엄이 참여했다.

KT가 이끄는 컨소시엄에는 솔트룩스, 매스프레소, 고려대학교 의료원, 경찰청, 서울대학교, 투모로 로보틱스 등 산·학·연·공 18개 기관이 포함돼 있다. 크라우드웍스는 대규모 학습용 데이터 수집, 전처리, 품질 관리 등 핵심 역할을 맡는다.

크라우드웍스는 국내 도서 2000권에 대한 저작권을 확보했으며, 소프트웨어 코드 기반 데이터셋과 의료·건강 분야 비식별화 데이터 약 30만 건도 보유 중이다. 이 데이터들은 모두 한국어 기반 LLM 학습에 적합하도록 전처리 및 가공이 완료됐다.

크라우드웍스는 데이터 수집, 가공, 검수 등을 처리할 수 있는 데이터 가공 솔루션 ‘워크스테이지’를 통해 고품질 데이터를 효율적으로 관리할 수 있는 시스템을 구축하고 있다. 또한 데이터 전처리 자동화 및 품질 관리 분야에서 120여 건의 특허를 출원·등록했다.

최근에는 북미 지역을 중심으로 해외 기업과 데이터 공급 계약을 체결하며 글로벌 사업 확장에도 속도를 내고 있다. 크라우드웍스 관계자는 “이번 컨소시엄 참여를 통해 한국어 기반 AI 모델 개발에 필요한 고품질 데이터 공급에 집중할 계획”이라고 말했다.

한편, 과학기술정보통신부는 이달 말 10개 후보 컨소시엄을 1차 선정하고, 8월 초 최종 5개 사업자를 발표할 예정이다.

  • 이 기사를 공유해보세요  
  •  
  •  
  •    
맨 위로

ⓒ 프라임경제(http://www.newsprime.co.kr) 무단전재 및 재배포금지