크라우드웍스, 고난도 LLM 데이터 구축 사례 공개

오지은

입력 : 2025.07.18 08:51:16


크라우드웍스 데이터 구축 사례
[크라우드웍스 제공.재판매 및 DB 금지]

(서울=연합뉴스) 오지은 기자 = 인공지능(AI) 기업 크라우드웍스[355390]가 고난도 대형언어모델(LLM) 학습 데이터 구축 사례를 공개했다고 18일 밝혔다.

사례에는 인포그래픽 테스트 매칭 데이터셋, 텍스트 기반 SQL(구조적 질의 언어) 데이터셋, 전문 의학지식 질의응답 데이터셋 등이 포함됐다.

이는 AI 레디 데이터(AI-Ready Data)에 대한 높은 수준의 전문성과 데이터 설계 역량이 요구되는 프로젝트다.

해당 데이터들은 텍스트 수집이나 가공을 넘어 도메인 전문 지식, 복잡한 논리 구조 분석, 텍스트와 이미지 정보 간 의미적 일치성 확보가 필요하다.

이에 일반 데이터보다 단가가 20∼30% 높고, 숙련된 인력과 고도화된 품질 관리 역량이 필요하다.

인포그래픽 테스트 매칭 데이터셋 프로젝트는 도표나 순서도 등 복잡한 시각 요소가 포함된 문서 이미지에서 구성 요소와 작업 단계를 식별하고 각 요소를 설명하는 의미 단위 텍스트를 생성하는 작업이다.

김우승 크라우드웍스 대표는 "산업별 AI 고도화를 지원하고 기업들이 데이터 경쟁력을 확보할 수 있도록 앞장서겠다"고 말했다.

built@yna.co.kr(끝)

증권 주요 뉴스

증권 많이 본 뉴스

매일경제 마켓에서 지난 2시간동안
많이 조회된 뉴스입니다.

07.18 20:57 더보기 >