“AI가 똑똑해질수록 더 거짓말한다?” 오픈AI 신모델, 환각률 폭증 논란
* 오픈AI가 공개한 추론형 AI 모델 ‘o3’와 ‘o4 미니’가 성능은 향상됐지만, 환각(hallucination) 현상은 오히려 악화됐다는 평가가 나왔다.
* 환각은 AI가 실제 존재하지 않는 정보를 사실처럼 생성하는 현상이다.
* 테크크런치에 따르면, o3는 33%, o4 미니는 48%의 환각률을 기록했다. 이는 기존 모델 o1(16%)과 o3 미니(14.8%)보다 현저히 높은 수치다.
* 오픈AI는 이들 모델을 이미지까지 추론 과정에 활용할 수 있는 첫 모델로 소개했으며, 코드 성능에서는 SWE 테스트 기준 각각 69.1%, 68.1%로 이전 모델 및 경쟁작을 능가했다.
* 그러나 환각률 증가로 인해 AI의 신뢰성과 정확성에 대한 우려가 커지고 있다. 오픈AI는 환각 원인에 대해 명확한 해석은 없으며, 더 많은 연구가 필요하다고 밝혔다.
* 특히 법률·회계 등 고정확도 분야에선 추론형 AI 도입 자체가 난관에 봉착할 수 있다는 우려가 제기된다.
https://n.news.naver.com/mnews/article/014/0005338357?sid=105
"믿었던 챗GPT가 환각률 48%라니...", 챗GPT 어쩌나
오픈AI가 최근 공개한 추론형 AI 모델 ‘o3’와 ‘o4 미니’가 이전 세대보다 강력해진 성능을 갖췄지만, 환각(hallucination) 현상은 오히려 더 심해졌다는 평가가 나왔다. 환각은 생성형 AI가 실제 존
n.news.naver.com
개인적으로,
챗GPT 가 인간을 대체할 수는
없다고 생각해요.
다만,
인간을 많이 도와줄 수는 있겠죠.
아직은 사람이 해야할 일이
훨씬 더 많은 듯 합니다^^
'세.상.이.야.기' 카테고리의 다른 글
일본 쌀값 폭등에 ‘한국쌀 직구’ 열풍…공항서 쌀 들고 가는 일본인들 (0) | 2025.04.22 |
---|---|
“사람 없는 공장” 현실화…中 지커, AI·로봇이 만든 전기차의 미래 (0) | 2025.04.22 |
김혜자X손석구X한지민. 천국에서 벌어진 충격 삼자대면 (0) | 2025.04.21 |
멤버십 요금 올려도 ‘대박’…쿠팡이츠, 요기요 제치고 만족도·이용률 ‘1위 추격 (0) | 2025.04.19 |
힙해진 불교, Z세대의 마음을 사로잡다 (0) | 2025.04.19 |