Reddit은 이번 주에 콘텐츠가 허가 없이 도용되는 것을 방지하기 위해 큰 변화를 겪었습니다. 그들은 컴퓨터 프로그램(예: 검색 엔진에서 사용되는 프로그램)이 웹사이트를 볼 수 있는지 여부를 알려주는 robots.txt 파일이라는 파일을 업데이트했습니다. 이 파일은 사용자가 무언가를 검색할 때 검색 엔진에서 웹 사이트를 표시하는 데 중요합니다.
그러나 이제 인공 지능이 등장하면서 일부 회사에서는 원본 작성자에게 묻거나 출처를 밝히지 않고 Reddit과 같은 웹사이트에서 콘텐츠를 가져와 AI 시스템을 교육하고 있습니다. 이는 콘텐츠를 만든 사람이나 이를 호스팅하는 웹사이트를 존중하지 않기 때문에 큰 문제가 되었습니다.
레딧은 무엇을 하고 있나요?
Reddit의 robots.txt 파일 업데이트는 해당 콘텐츠가 사용되는 방식을 제어하는 것을 목표로 합니다. 또한 Reddit의 규칙을 따르지 않거나 콘텐츠 사용 권한이 없는 경우 알려지지 않은 컴퓨터 프로그램과 봇이 사이트에 액세스하는 것을 제한하고 차단할 것입니다.
Reddit은 이러한 변경 사항이 대부분의 사람들이나 연구원이나 인터넷 기록을 저장하는 그룹(예: Internet Archive)과 같은 좋은 조직에 영향을 미치지 않을 것이라고 말합니다. 대신 그들은 AI 회사들이 Reddit의 콘텐츠를 허가 없이 사용하는 것을 막으려고 노력하고 있습니다. 그러나 이러한 AI 프로그램은 여전히 Reddit의 규칙을 무시할 수 있습니다.
최근 조사 및 대응
이 발표는 Perplexity라는 AI 기반 검색 회사가 robots.txt 파일에 금지 명령이 있음에도 불구하고 웹사이트에서 콘텐츠를 가져오고 있다는 사실을 발견한 Wired의 보고서에 따른 것입니다. Perplexity의 CEO는 이러한 규칙이 법적 요구 사항이 아니라고 주장하면서 웹사이트가 콘텐츠를 어떻게 보호할 수 있는지에 대한 논쟁을 촉발시켰습니다.
Reddit 데이터는 현재 Google에 속합니다.
Reddit의 새로운 규칙은 이미 그들과 계약을 맺은 회사에는 영향을 미치지 않습니다. 예를 들어 Reddit은 Google과 6천만 달러 규모의 계약을 체결하여 Google이 AI 프로젝트에 Reddit의 데이터를 사용할 수 있도록 허용했습니다. 이는 Reddit이 데이터를 사용할 수 있는 사람에 대해 주의를 기울이고 있으며 이들이 신뢰할 수 있는 파트너인지 확인하기를 원한다는 것을 보여줍니다.
Reddit은 블로그 게시물에서 “Reddit의 콘텐츠를 사용하는 모든 사람은 Reddit 사용자를 보호하기 위해 우리의 규칙을 따라야 합니다.”라고 밝혔습니다. “우리는 Reddit 콘텐츠에 대한 액세스 권한을 갖고 협력할 사람을 신중하게 선택합니다.”
앞을 내다보며
Reddit의 이러한 변화는 특히 상업적 이유로 회사가 데이터를 사용하는 방식을 제어하려는 노력의 일환입니다. 이는 AI와 빅데이터 시대에 웹사이트에서 콘텐츠를 보호하려는 추세가 커지고 있음을 보여줍니다.
Reddit의 움직임은 분명한 메시지를 보냅니다. AI는 큰 잠재력을 갖고 있지만 데이터의 출처를 존중하고 허가를 받는 것이 정말 중요합니다. 인터넷이 변화함에 따라 Reddit의 행동은 다른 웹사이트가 콘텐츠와 사용자 권리를 보호하는 방식에 영향을 미칠 수 있습니다.
모든 이미지는 Eray Eliaçık/Bing에 의해 생성되었습니다.
Source: Reddit은 데이터 비용을 지불하게 합니다








