
구글 제미나이가 그려낸 AI 할루시네이션의 상상 이미지
[리뷰타임스=김우선 기자]
“조선왕조실록에 세종대왕이 맥북프로를 던졌던 적이 있는데 이 사건에
대해 알려달라
”고 묻자 이런 황당한 답변을 내놓는다
. “세종대왕이
훈민정음의 초고를 작성하던 중 어떤 일로 문서 작성이 중단되었고
, 이에 세종대왕이 담당자에게 분노해
맥북프로를 방으로 던졌다
.”
웬 궤변인가 싶겠지만 AI가 내놓은 황당무개한 답변이다. 세종대왕이 맥북을, 그것도 에어가 아닌 프로를 최환이라는 관료에게
던졌다는 챗GPT의 답변은 정말 어이상실이다. 어디서
이런 데이터를 가져와 조합했는지 모르겠지만 정말 그럴듯한 거짓 역사소설을 만들어냈다.
챗GPT 초창기 버전인 3.5버전에서는
이처럼 대놓고 할루시네이션이 자주 발생했다. 최근의 AI는
할루시네이션 현상을 많이 극복했다.

세종대왕 맥북프로 던짐 사건의 초창기 모습
" self-close-tag="1" style="width: 900px; height: 1391px;">

그 후 개선된 모습
" self-close-tag="1" style="width: 480px; height: 618px;">
이런 현상을 AI 할루시네이션(환각
현상, AI Hallucination)이라고 한다. AI 할루시네이션이란 AI 시스템이 현실과 동떨어진 정보를 생성하거나, 없는 사실을 마치
있는 것처럼 표현하는 현상으로, 인공지능 모델, 특히 딥러닝
기반 모델이 현실에 기반하지 않은 정보나 데이터를 생성하는 현상을 의미한다.
이 현상은 텍스트, 이미지, 음성
등 다양한 AI 응용 분야에서 나타날 수 있으며, 때로는
허구적이고 비논리적인 결과를 도출하기도 한다. 앞서 든 사례처럼 챗봇이 존재하지 않는 정보를 사실인
것처럼 제공하거나 이미지 생성 모델이 왜곡된 결과물을 만들어내는 경우가 대표적이다.
마치 마약이라도 한 것처럼 태연하게 거짓말을 지어내는 AI 할루시네이션의
원인에 대해 전문가들은 3가지 이유를 든다.
첫째는 데이터 편향이다. AI 모델이 학습하는 데이터에 내재된 편향이
주요 원인 중 하나이다. 학습 데이터가 부정확하거나 편향된 정보를 포함할 경우, 모델은 이를 기반으로 잘못된 예측을 하거나 비현실적인 결과를 생성할 수 있다.
한쪽으로 치우친 답변을 내놓는 ‘데이터 편향’은 최근 출시한 딥시크에서도 찾아볼 수 있다. 딥시크에
‘톈안먼(천안문) 사건’ ‘신장위구르 문제’ ‘홍콩 민주화
운동’ 등 특정 주제를 물으면 답변을 회피하거나 중국 정부의 공식 입장을 따르는 식으로 대응하기도 한다. 딥시크가
서구 AI 모델보다 훨씬 강한 자체 검열 기능을 적용하고 있어 이 같은 데이터 편향이 발생하고 있다는
분석이다.
둘째는 알고리즘 설계 문제이다. 딥러닝 모델은 입력 데이터의 패턴을
일반화하려는 경향이 있지만, 때로는 이 과정에서 과도한 일반화가 발생해 잘못된 결론에 도달할 수 있다. 예를 들어, 언어 모델은 문맥상 적절하지만 사실과 일치하지 않는
문장을 생성할 가능성이 있다.
셋째는 모델의 과적합이다. AI 모델이 학습 데이터에 과도하게 적응했을
때 발생하는 문제이다. 과적합된 모델은 새로운 데이터에 대한 일반화 능력이 떨어지며, 이로 인해 허구적인 결과가 나타날 수 있다.
<ansonny@reviewtimes.co.kr>
<저작권자 ⓒ리뷰타임스, 무단전재 및 재배포 금지〉

review_times
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.