이제 대부분의 검색 엔진은 기본적으로 AI 생성 개요를 제공하므로 정확성에 대한 우려가 높아지고 클릭률이 감소합니다. 테스트 결과 Google의 AI 개요는 대체로 신뢰할 수 있는 것으로 나타났지만, 많은 양의 쿼리로 인해 매일 수백만 건의 부정확성이 발생합니다.

The New York Times에 따르면 Google AI 검색 개요 10개 중 약 1개에는 잘못된 정보가 포함되어 있는 것으로 알려졌습니다. Google은 매년 약 5조 개의 쿼리를 처리하며 이론적으로 사용자에게 시간당 5,700만 개 이상의 부정확한 답변(분당 거의 100만 개)을 노출시킵니다.

이 통계는 Google의 AI 비서 Gemini의 정확성을 평가하기 위해 4,326건의 검색을 조사한 AI 스타트업 Oumi의 분석에서 나온 것입니다. Oumi는 Gemini 버전 2가 10월에 85%의 정확한 개요를 제공했다고 보고했습니다. 개선된 버전인 Gemini 3는 2월까지 정확도를 91%로 높였습니다.

그러나 Oumi의 분석은 AI 도구에 의존하므로 오류가 발생할 수도 있습니다. 또한 Google은 동일한 쿼리가 몇 초 간격으로 반복될 때 동일한 쿼리에 대해 서로 다른 AI 개요를 생성하는 경우가 있습니다.

  Microsoft, MAI-Transcribe-1 AI 전사 모델 출시

Google 대변인은 Oumi 테스트에 결함이 있으며 실제 검색 행동을 대표하지 않는다고 비판했습니다. Google의 내부 평가에 따르면 Gemini 3는 Google 검색과 독립적으로 작동할 때 28%의 시간 동안 환각을 경험하는 것으로 나타났습니다.

소싱에도 심각한 문제가 있습니다. Google은 관련 링크를 통해 AI 개요를 뒷받침하는 것을 목표로 합니다. 그러나 이러한 링크 중 다수는 Gemini의 주장을 뒷받침하지 않습니다. AI 개요와 인용 소스 간의 불일치는 Gemini 2의 37%에서 2월 이후 업데이트인 Gemini 3의 56%로 증가했습니다.

연구원들은 조작에 대한 AI 개요의 취약성을 강조했습니다. 한 사례에는 다음 날 Google이 허위 주장을 반복한 BBC 기자가 포함되었습니다. Google과 다른 AI 회사 모두 면책 조항에서 기술의 신뢰할 수 없는 특성을 인식하고 있습니다.

<시간 />

추천 이미지 크레딧