'쌩뚱 답변 논란' 오픈AI "AI 모델 안전성 평가 지속 공개할 것"

'안전성 평가 허브' 웹페이지 공개…"투명성 강화"

김태종

입력 : 2025.05.15 03:09:22

(샌프란시스코=연합뉴스) 김태종 특파원 = 챗GPT 개발사 오픈AI는 14일(현지시간) '자사 AI 모델에 대한 안전성 평가 결과를 발표하는 '안전성 평가 허브'(Safety Evaluations Hub)라는 웹페이지를 공개한다고 밝혔다.

이 웹페이지에서는 자사 AI 모델이 유해 콘텐츠 생성, 탈옥(jailbreak·안전 장치를 우회해 제한된 콘텐츠 생성), 환각(hallucination) 등의 다양한 테스트에서 어떤 점수를 받았는지를 보여주게 된다.

오픈AI는 "이 허브는 우리의 투명성 강화 노력"이라며 "지속적으로 관련 지표를 공유하고, 중요한 업데이트가 있을 때마다 갱신하겠다"고 전했다.

또 "이 허브에 안전성 평가 결과의 일부를 공개해 오픈AI 시스템의 안전성 성과를 더 쉽게 이해할 수 있고 투명성을 높이기 위한 업계 전반의 노력도 지원할 수 있을 것"이라고 덧붙였다.

오픈AI의 AI 모델 투명성 강화 노력은 최근 일부 모델을 둘러싸고 논란이 제기됐기 때문이다.

정보기술(IT) 전문 매체 테크크런치에 따르면 최근 몇 달간 오픈AI는 일부 대표 모델에 대해 안전성 테스트를 급하게 진행하고, 다른 모델에 대해서는 기술 보고서를 공개하지 않았다는 지적을 받아왔다.

또 지난 3월 말 챗GPT의 기본 모델인 GPT-4o의 업데이트 이후 사용자들의 불만이 커지면서 최근에는 업데이트를 전면 취소하기도 했다.

GPT-4o 업데이트는 챗GPT가 사용자 질문이나 말에 칭찬이나 동조를 많이 하도록 만들어졌는데, 문맥이나 상황과 맞지 않는 반응이 나올 때가 있었기 때문이다.

일부 사용자 사이에서는 동물을 죽였다거나 금주 약속을 깼다는 얘기에도 "훌륭하다"는 '생뚱맞은 칭찬'을 받았다는 경험담이 나왔다.

샘 올트먼 오픈AI 최고경영자(CEO)도 지난달 28일 엑스(X·옛 트위터)를 통해 문제를 인정했고, 공식 블로그를 통해 후속 조치를 예고한 바 있다.

taejong75@yna.co.kr(끝)

증권 주요 뉴스

'한진칼 백기사' 쟁탈전 … 거래량 10배 폭발

대한항공 경영권분쟁 점입가경한진칼 주가 이틀새 69% 급등델타 등 한진측 우호지분 많아호반 실제 인수까진 가시밭길증권가 "섣부른 매수는 금물"호반그룹의 한진칼 지분 매수로 대한항공 경영권 분쟁 가능성이 제기되면서 한진칼 주가가 이틀 연속 상한가를 기록했다. 다만 호반그룹이 한진칼 경영권 지분을 확보하긴 힘든 상황이어서 추격 매수에 주의해야 한다는 의견이 나...

증권 많이 본 뉴스

HOT이슈

코스피
인기검색

코스닥
인기검색

1

나우로보틱스

25,050

21.90%
2

쎄크

14,510

2.11%
3

한국피아이엠

17,750

-4.05%
4

우양에이치씨

19,400

-1.72%
5

TIGER 리츠부동산인프라

4,295

0.00%

05.15 08:49 더보기 >

1

현대로템

107,600

0.94%
2

KIWOOM 국고채30년액티브

66,205

0.10%
3

한국콜마

84,400

1.08%
4

종근당바이오

22,600

0.89%
5

삼성물산

125,200

0.72%

05.15 08:49 더보기 >

1

제이오

9,280

-2.83%
2

유일로보틱스

81,100

11.55%
3

CSA 코스믹

1,075

-1.01%
4

고영

18,200

3.35%
5

알테오젠

335,000

-3.74%

05.15 08:49 더보기 >

주가 정보

매일 경제

최근 검색어