Google은 티켓 예약이나 쇼핑과 같은 자동화된 작업을 지원하고 잠재적인 데이터 및 재정적 위험을 해결하는 Chrome의 에이전트 기능에 대한 보안 접근 방식을 자세히 설명했습니다. Google은 에이전트 작업을 관리하기 위해 여러 모델을 사용합니다. Gemini로 구축된 User Alignment Critic은 플래너 모델에서 생성된 작업 항목을 면밀히 조사합니다. 비판 모델이 계획된 작업이 사용자 목표와 일치하지 않는다고 판단하면 기획자는 전략을 재평가해야 합니다. 비평 모델은 실제 웹 콘텐츠가 아닌 제안된 작업의 메타데이터에만 액세스합니다. 허용되지 않거나 신뢰할 수 없는 사이트에 대한 에이전트 액세스를 제한하기 위해 Google은 에이전트 원본 세트를 활용합니다. 이러한 세트는 모델을 특정 읽기 전용 및 읽기/쓰기 가능 원본으로 제한합니다. 읽기 전용 출처는 Gemini가 소비할 수 있는 콘텐츠를 정의합니다. 예를 들어 쇼핑 사이트의 제품 목록은 관련성이 있지만 배너 광고는 그렇지 않습니다. 에이전트는 페이지의 지정된 iframe과만 상호작용할 수 있습니다. 블로그 게시물에서 회사는 “이 설명은 제한된 원본 세트의 데이터만 에이전트에 제공되며 이 데이터는 쓰기 가능한 원본으로만 전달될 수 있음을 강제합니다. 이는 원본 간 데이터 유출의 위협 벡터를 제한합니다. 이는 또한 읽을 수 있는 세트 외부에 있는 모델 데이터로 전송하지 않는 등 일부 분리를 강제할 수 있는 기능을 브라우저에 제공합니다.”라고 밝혔습니다. Google은 유해한 모델 생성 URL에 대한 액세스를 방지하기 위해 다른 관찰자 모델을 통해 페이지 탐색을 모니터링합니다. 민감한 작업의 경우 Google에서는 사용자 동의가 필요합니다. 에이전트가 은행이나 의료 플랫폼과 같은 민감한 사이트에 액세스하려고 시도하는 경우 사용자 권한을 요청합니다. 사이트에 로그인이 필요한 경우 Chrome은 사용자에게 비밀번호 관리자 활용 권한을 요청하는 메시지를 표시합니다. 에이전트 모델은 비밀번호 데이터에 액세스하지 않습니다. 상담원이 구매나 메시지 보내기 등의 작업을 시작하기 전에 사용자에게 묻는 메시지가 표시됩니다. 또한 Google은 원치 않는 작업을 방지하기 위해 프롬프트 주입 분류기를 사용하고 연구원이 개발한 공격에 대한 에이전트 기능을 평가하고 있습니다. 이달 초, 당황 에이전트에 대한 신속한 주입 공격에 대응하기 위해 오픈 소스 콘텐츠 탐지 모델을 출시했습니다.

  침묵하거나 잠금 해제 된 경우에도 iPhone 플래시 알림을 얻는 방법

주요 이미지 크레딧

Source: Google은 Gemini를 사용합니다. "비평가" Chrome 에이전트를 모니터링하는 모델