UNIST "서로 다른 AI 데이터 유형 간에도 학습 촉진 효과"

오디오·이미지 등 연관성 작은 조합에서도 AI 성능 향상
김용태

입력 : 2025.05.07 14:12:11


연구진 모습
UNIST 윤성환 교수(오른쪽)와 이재준 연구원.[울산과학기술원 제공.재판매 및 DB 금지]

(울산=연합뉴스) 김용태 기자 = 인공지능(AI)에 한 유형의 데이터를 가르쳐 다른 유형의 데이터 학습을 촉진할 수 있는 기술을 울산과학기술원(UNIST) 연구진이 개발했다.

UNIST 인공지능대학원 윤성환 교수팀은 데이터 정렬과 매칭이 필요 없는 AI 멀티모달 학습 기술을 개발했다고 7일 밝혔다.

멀티모달 학습은 오디오, 이미지, 텍스트와 같이 서로 다른 데이터 유형(모달리티)을 결합해 통합적으로 이해하고 처리하는 학습법이다.

이 학습을 위해서는 고품질의 정렬된 데이터세트가 필요하다.

또 각 유형의 데이터가 정확하게 짝을 이루면서 학습이 이뤄지기 때문에 잘 매칭된 형태의 데이터가 있어야 한다.

명확히 짝지어진 데이터가 부족하면 성능이 저하되기도 한다.

윤 교수팀이 내놓은 학습법은 짝지어지지 않은 데이터로도 멀티모달 학습이 가능하다.

연구진은 텍스트 모델이 이미지 모델 학습을 돕거나 오디오 모델이 언어 모델 성능을 높일 수 있는지 확인하는 실험을 진행했다.

그 결과 기존보다 높은 정확도로 데이터 유형 간 학습 촉진 효과가 확인됐다.

특히 오디오와 이미지처럼 직접적인 연관성이 작은 조합에서도 AI의 성능 향상이 나타났다고 연구진은 설명했다.

연구진은 서로 다른 유형의 데이터 학습에서 꼭 필요하다고 여겨졌던 데이터 정렬 작업 없이도 학습이 가능해 데이터세트 구축 비용 등을 절감할 수 있을 것으로 기대한다.

윤성환 교수는 "정렬된 데이터세트 확보가 어려운 의료, 자율주행, 스마트 AI 비서 등 다양한 분야에서 활용 가능성이 높다"고 말했다.

이런 연구 결과는 세계 3대 인공지능 학회인 'ICLR(International Conference on Learning Representations) 2025'에서 발표됐다.

yongtae@yna.co.kr(끝)

증권 주요 뉴스

증권 많이 본 뉴스

매일경제 마켓에서 지난 2시간동안
많이 조회된 뉴스입니다.

05.08 11:58 더보기 >