“AI가 똑똑해질수록 더 거짓말한다?” 오픈AI 신모델, 환각률 폭증 논란

728x90

“AI가 똑똑해질수록 더 거짓말한다?” 오픈AI 신모델, 환각률 폭증 논란

* 오픈AI가 공개한 추론형 AI 모델 ‘o3’와 ‘o4 미니’가 성능은 향상됐지만, 환각(hallucination) 현상은 오히려 악화됐다는 평가가 나왔다.

* 환각은 AI가 실제 존재하지 않는 정보를 사실처럼 생성하는 현상이다.

* 테크크런치에 따르면, o3는 33%, o4 미니는 48%의 환각률을 기록했다. 이는 기존 모델 o1(16%)과 o3 미니(14.8%)보다 현저히 높은 수치다.

* 오픈AI는 이들 모델을 이미지까지 추론 과정에 활용할 수 있는 첫 모델로 소개했으며, 코드 성능에서는 SWE 테스트 기준 각각 69.1%, 68.1%로 이전 모델 및 경쟁작을 능가했다.

* 그러나 환각률 증가로 인해 AI의 신뢰성과 정확성에 대한 우려가 커지고 있다. 오픈AI는 환각 원인에 대해 명확한 해석은 없으며, 더 많은 연구가 필요하다고 밝혔다.

* 특히 법률·회계 등 고정확도 분야에선 추론형 AI 도입 자체가 난관에 봉착할 수 있다는 우려가 제기된다.

"믿었던 챗GPT가 환각률 48%라니...", 챗GPT 어쩌나

오픈AI가 최근 공개한 추론형 AI 모델 ‘o3’와 ‘o4 미니’가 이전 세대보다 강력해진 성능을 갖췄지만, 환각(hallucination) 현상은 오히려 더 심해졌다는 평가가 나왔다. 환각은 생성형 AI가 실제 존

n.news.naver.com

개인적으로,

챗GPT 가 인간을 대체할 수는

없다고 생각해요.

다만,

인간을 많이 도와줄 수는 있겠죠.

아직은 사람이 해야할 일이

훨씬 더 많은 듯 합니다^^

일본 쌀값 폭등에 ‘한국쌀 직구’ 열풍…공항서 쌀 들고 가는 일본인들 (0)	2025.04.22
“사람 없는 공장” 현실화…中 지커, AI·로봇이 만든 전기차의 미래 (0)	2025.04.22
김혜자X손석구X한지민. 천국에서 벌어진 충격 삼자대면 (0)	2025.04.21
멤버십 요금 올려도 ‘대박’…쿠팡이츠, 요기요 제치고 만족도·이용률 ‘1위 추격 (0)	2025.04.19
힙해진 불교, Z세대의 마음을 사로잡다 (0)	2025.04.19

뿌리 깊은 갈대