엔씨소프트, 한국어 특화 VLM '바르코 비전' 공개

한국어 멀티모달 벤치마크 5종도 함께 선보여
김주환

입력 : 2024.12.04 17:50:01


'바르코 비전' 관련 논문
[엔씨소프트 제공.재판매 및 DB 금지]

(서울=연합뉴스) 김주환 기자 = 엔씨소프트[036570]는 한국어 처리에 특화된 중소형 오픈소스 시각언어모델(VLM) '바르코 비전'(VARCO-VISION)을 공개했다고 4일 밝혔다.

VLM은 자연어와 이미지를 함께 활용해 입력값을 넣을 수 있는 언어모델로, 영어·중국어가 대다수인 오픈소스 VLM과 달리 한국어를 지원하는 것이 특징이다.

엔씨소프트에 따르면 '바르코 비전'은 한국어 부문에서 동종 크기 모델 중 1위의 성능을 보이며, 이미지 설명·글자 인식(OCR)·사물 위치 검출 등 기능을 활용한 멀티모달 AI 서비스에 활용할 수 있다.

엔씨소프트는 이날 한국어 인공지능(AI) 모델 연구·발전에 기여하기 위한 벤치마크 5종도 함께 공개했다.

시각언어모델(VLM) 작동 예시
[엔씨소프트 제공.재판매 및 DB 금지]

벤치마크는 언어모델의 작업 수행 성능을 평가하는 체계로, 엔씨소프트는 영미권에서 대표적으로 활용되는 객관식·주관식 벤치마크 4종을 기반으로 새로운 한국어 벤치마크 4종을 구축했다.

또 한국어 문서와 표, 차트에 대한 이해 능력을 검증할 수 있는 'K-DTCBench' 벤치마크 1종도 새롭게 추가했다.

이연수 엔씨소프트 리서치본부장은 "앞으로 VLM의 접목 분야를 오디오, 비디오까지 확대하고 콘텐츠 제작 지원 기능을 강화하는 등 다양한 산업에서 활용할 수 있도록 성능을 끌어 올릴 것"이라고 말했다.

jujuk@yna.co.kr(끝)

증권 주요 뉴스

증권 많이 본 뉴스

매일경제 마켓에서 지난 2시간동안
많이 조회된 뉴스입니다.

12.05 04:49 더보기 >