'천재 개발자' 제프 딘 "추론 AI 모델, 작고 빠르게 만들어야"

"AI 연산 수요 증가…하드웨어 발전이 추론 효율성 높여"
김현수

입력 : 2025.04.12 07:09:29


제프 딘 구글 수석 과학자
[촬영 김현수]

(라스베이거스=연합뉴스) 김현수 기자 = "추론은 정말 중요한 분야가 될 것입니다.

강력한 AI(인공지능) 모델이 많이 훈련되고 있는데, 더 작게 만들어 다양한 환경에서 운영할 수 있는지가 관건이죠" '구글 클라우드 넥스트 2025' 마지막 날인 11일(현지시간) 미국 라스베이거스 만달레이 베이 컨벤션센터에서 열린 AI 하드웨어 세션에서 제프 딘 구글 수석 과학자는 AI의 잠재력을 극대화하기 위한 인프라·하드웨어 분야의 과제에 대해 이같이 말했다.

1999년 구글에 입사한 딘은 구글 검색, 크롤링, 쿼리 서비스 등 핵심 시스템부터 맵리듀스·스패너 등 분산형 컴퓨팅 인프라 등을 개발한 '전설의 개발자'로 평가된다.

그의 천재성을 빗대어 '제프 딘이 코딩한 프로그램은 AI가 먼저 감동해서 자동으로 최적화된다'는 밈(인터넷 유행 콘텐츠)이 만들어지기도 했다.

그는 AI 추론 모델의 등장으로 연산 자원 수요가 높아질 것이라며, 모델 수요에 대응하기 위해 AI 칩 설계 소요 시간을 줄이는 게 과제라고 전했다.

딘 과학자는 "지금 우리가 할 일은 빠르게 발전하는 머신러닝 연구의 미래를 예측해서 2년 뒤에 어떤 연산을 해야 할지 미리 결정하는 것"이라며 "칩 설계 주기를 2년이 아닌 6∼9개월로 줄일 수 있다면 훨씬 명확하게 미래 요구사항을 예측할 수 있을 것"이라고 말했다.

세바스찬 무가잠비 구글 클라우드 시니어 프로덕트 매니저와 제프 딘
[촬영 김현수]

그는 구글 클라우드가 이번 콘퍼런스에서 공개한 7세대 TPU(텐서처리장치) '아이언우드'에 대해 "매우 인상적인 사양"이라면서도 에너지 효율 측면에서 여전히 발전할 여지가 있다고 평가했다.

구글에 따르면 아이언우드는 직전 모델인 '트릴리움' 대비 성능이 10배, 전력 효율은 2배 높아졌다.

딘은 "TPU는 지금도 훈련과 추론을 모두 처리할 수 있도록 설계된 좋은 칩"이라며 "추론이 정말 중요한 워크로드라는 점에서 추론 전용으로 더욱 특화된 하드웨어를 만든다면 지금보다 훨씬 더 높은 효율을 달성할 수 있다고 본다"고 설명했다.

AI 추론을 위한 비용을 줄이는 것도 과제라고 언급했다.

그는 "제미나이 같은 사고 모델은 실제 출력보다 10∼100배 많은 토큰을 생각하는 과정을 거치므로 더 많은 추론 연산 자원이 필요하다"며 "AI 하드웨어의 발전은 AI 훈련과 추론을 훨씬 효율적으로 만들어 낮은 비용으로 AI 혜택을 누릴 수 있도록 할 것"이라고 전망했다.

hyunsu@yna.co.kr(끝)

증권 주요 뉴스

증권 많이 본 뉴스

매일경제 마켓에서 지난 2시간동안
많이 조회된 뉴스입니다.

04.22 20:21 더보기 >