크라우드웍스, 고난도 LLM 데이터 구축 사례 공개
오지은
입력 : 2025.07.18 08:51:16
입력 : 2025.07.18 08:51:16

[크라우드웍스 제공.재판매 및 DB 금지]
(서울=연합뉴스) 오지은 기자 = 인공지능(AI) 기업 크라우드웍스[355390]가 고난도 대형언어모델(LLM) 학습 데이터 구축 사례를 공개했다고 18일 밝혔다.
사례에는 인포그래픽 테스트 매칭 데이터셋, 텍스트 기반 SQL(구조적 질의 언어) 데이터셋, 전문 의학지식 질의응답 데이터셋 등이 포함됐다.
이는 AI 레디 데이터(AI-Ready Data)에 대한 높은 수준의 전문성과 데이터 설계 역량이 요구되는 프로젝트다.
해당 데이터들은 텍스트 수집이나 가공을 넘어 도메인 전문 지식, 복잡한 논리 구조 분석, 텍스트와 이미지 정보 간 의미적 일치성 확보가 필요하다.
이에 일반 데이터보다 단가가 20∼30% 높고, 숙련된 인력과 고도화된 품질 관리 역량이 필요하다.
인포그래픽 테스트 매칭 데이터셋 프로젝트는 도표나 순서도 등 복잡한 시각 요소가 포함된 문서 이미지에서 구성 요소와 작업 단계를 식별하고 각 요소를 설명하는 의미 단위 텍스트를 생성하는 작업이다.
김우승 크라우드웍스 대표는 "산업별 AI 고도화를 지원하고 기업들이 데이터 경쟁력을 확보할 수 있도록 앞장서겠다"고 말했다.
built@yna.co.kr(끝)
증권 주요 뉴스
증권 많이 본 뉴스
매일경제 마켓에서 지난 2시간동안
많이 조회된 뉴스입니다.