보고서는 AI 개요가 수백만 개의 오류를 퍼뜨릴 수 있다고 경고합니다.

이제 대부분의 검색 엔진은 기본적으로 AI 생성 개요를 제공하므로 정확성에 대한 우려가 높아지고 클릭률이 감소합니다. 테스트 결과 Google의 AI 개요는 대체로 신뢰할 수 있는 것으로 나타났지만, 많은 양의 쿼리로 인해 매일 수백만 건의 부정확성이 발생합니다.

The New York Times에 따르면 Google AI 검색 개요 10개 중 약 1개에는 잘못된 정보가 포함되어 있는 것으로 알려졌습니다. Google은 매년 약 5조 개의 쿼리를 처리하며 이론적으로 사용자에게 시간당 5,700만 개 이상의 부정확한 답변(분당 거의 100만 개)을 노출시킵니다.

이 통계는 Google의 AI 비서 Gemini의 정확성을 평가하기 위해 4,326건의 검색을 조사한 AI 스타트업 Oumi의 분석에서 나온 것입니다. Oumi는 Gemini 버전 2가 10월에 85%의 정확한 개요를 제공했다고 보고했습니다. 개선된 버전인 Gemini 3는 2월까지 정확도를 91%로 높였습니다.

그러나 Oumi의 분석은 AI 도구에 의존하므로 오류가 발생할 수도 있습니다. 또한 Google은 동일한 쿼리가 몇 초 간격으로 반복될 때 동일한 쿼리에 대해 서로 다른 AI 개요를 생성하는 경우가 있습니다.

Adobe, Creative Cloud 앱용 채팅 기반 인터페이스 출시

Google 대변인은 Oumi 테스트에 결함이 있으며 실제 검색 행동을 대표하지 않는다고 비판했습니다. Google의 내부 평가에 따르면 Gemini 3는 Google 검색과 독립적으로 작동할 때 28%의 시간 동안 환각을 경험하는 것으로 나타났습니다.

소싱에도 심각한 문제가 있습니다. Google은 관련 링크를 통해 AI 개요를 뒷받침하는 것을 목표로 합니다. 그러나 이러한 링크 중 다수는 Gemini의 주장을 뒷받침하지 않습니다. AI 개요와 인용 소스 간의 불일치는 Gemini 2의 37%에서 2월 이후 업데이트인 Gemini 3의 56%로 증가했습니다.

연구원들은 조작에 대한 AI 개요의 취약성을 강조했습니다. 한 사례에는 다음 날 Google이 허위 주장을 반복한 BBC 기자가 포함되었습니다. Google과 다른 AI 회사 모두 면책 조항에서 기술의 신뢰할 수 없는 특성을 인식하고 있습니다.

<시간 />

추천 이미지 크레딧

보고서는 AI 개요가 수백만 개의 오류를 퍼뜨릴 수 있다고 경고합니다.

Related Stories

Google, AI 사용자가 몇 초 안에 클립을 변환할 수 있는 Video Remix 출시

Amazon은 AI 에이전트와 경쟁하기 위해 더욱 강력한 Alexa 보조자를 계획하고 있습니다.

ChatGPT Voice는 전이중 GPT-Live 모델을 얻습니다.

인류가 지원하는 연구에서 AI 모델에 대한 모듈식 액세스 제어 테스트