BBC가 주도한 새로운 연구에 따르면 AI 보조원이 계속해서 뉴스를 잘못 보고하고 있습니다.

BBC가 주도하고 유럽방송연합(EBU)이 공동으로 진행한 새로운 연구에 따르면 AI 보조원은 다양한 언어와 지역에서 뉴스 콘텐츠를 지속적으로 왜곡하는 것으로 나타났습니다. EBU News Assembly에서 시작된 광범위한 연구에는 18개국 22개의 공공 서비스 미디어 조직이 참여했으며 ChatGPT, Copilot, Gemini 및 Perplexity의 4가지 주요 AI 도구에서 생성된 3,000개 이상의 응답을 평가했습니다.

이 연구는 AI가 생성한 답변의 45%가 심각한 문제를 나타내는 등 상당한 시스템적 문제를 밝혀냈습니다. 특히 응답의 31%는 속성이 누락되거나 부정확한 등 심각한 소싱 결함을 겪었고, 20%는 오래된 정보 및 환각과 같은 주요 정확성 문제를 포함했습니다. Gemini는 응답의 76%에서 심각한 문제를 보여주며 가장 신뢰도가 낮은 도구로 확인되었습니다.

AI 비서가 뉴스 소비를 위해 점점 더 전통적인 검색 엔진을 대체하고 있기 때문에 이러한 허위 표현은 매우 중요합니다. Reuters Institute의 2025년 디지털 뉴스 보고서에 따르면 온라인 뉴스 소비자의 7%가 뉴스를 위해 AI에 의존하고 있으며, 이 수치는 25세 미만 개인의 경우 15%로 증가했습니다. EBU 미디어 디렉터인 Jean Philip De Tender는 이러한 발견이 뉴스 소스에 대한 대중의 신뢰를 약화시키는 시스템적 문제를 시사한다고 강조했습니다.

Generative AI의 BBC 프로그램 디렉터인 Peter Archer는 AI를 둘러싼 흥분을 인정하면서도 제공된 정보에 대한 신뢰의 필요성을 강조했습니다. 그는 AI 도구의 개선이 심각한 문제를 해결하기에는 여전히 불충분하다고 지적했습니다.

Microsoft는 GitHub Copilot을 토큰 기반 가격 모델로 전환합니다.

연구팀은 확인된 과제에 대한 솔루션을 개발하고 응답 정확도를 향상하고 사용자의 미디어 활용 능력을 향상시키는 데 초점을 맞춘 AI 보조자 툴킷의 뉴스 무결성을 출시했습니다. 또한 EBU와 그 회원들은 EU 및 국가 규제 기관에 정보 무결성 및 디지털 서비스에 대한 기존 법률을 시행하는 동시에 AI 도구에 대한 지속적인 독립적 모니터링을 옹호할 것을 촉구하고 있습니다.

이 연구는 2025년 2월 BBC가 발표한 이전 연구를 기반으로 하며 이러한 문제가 다양한 언어와 시장에 걸쳐 지속된다는 점을 확인했습니다. 참여 방송사에는 캐나다, 독일, 이탈리아, 영국과 같은 국가의 조직이 포함되었습니다.

별도의 보고서에서 BBC는 많은 영국 성인이 AI가 정확한 뉴스 요약을 생성한다고 신뢰하며, 3분의 1이 AI 정확성에 대해 자신감을 표현했다고 밝혔습니다. 이 수치는 35세 미만 성인의 거의 절반으로 증가했습니다. AI 뉴스 요약에 대한 대중의 인식과 AI로 인해 생성된 부정확성에 대해 뉴스 제공자를 잘못 비난할 가능성에 대한 우려가 제기되었습니다. 이는 언론 기관에 대한 신뢰에 부정적인 영향을 미칠 수 있습니다.

OpenAI, 새로운 이미지 모델 GPT 이미지 2 출시 임박

<시간 />

추천 이미지 출처

BBC가 주도한 새로운 연구에 따르면 AI 보조원이 계속해서 뉴스를 잘못 보고하고 있습니다.

Related Stories

OpenAI는 Atlas 브라우저를 종료하여 새로운 ChatGPT 앱의 기능을 통합합니다.

OpenAI, 수요 급증 후 GPT-5.6 Sol 사용 제한 해제

Anthropic은 Fable 5 페이월을 세 번째로 연기했습니다.

OpenAI, GPT-5.6 기반 ChatGPT 업무 생산성 앱 출시