OpenAi는 Chatgpt 내에서 사용자를위한 다양한 컴퓨터 기반 작업을 자동화하도록 설계된 새로운 일반 목적 AI 에이전트를 출시했습니다. ChatGpt Agent라는이 고급 도구는 운영자 및 심층 연구와 같은 이전의 OpenAI 에이전트 도구의 기능을 통합하여 웹 사이트를 탐색하고 정보를 보고서로 합성하고 캘린더를 관리하고 프리젠 테이션을 생성하며 코드를 실행할 수 있습니다.

Chatgpt 에이전트는 목요일 Openai의 Pro, 그리고 팀 계획의 가입자에게 출시되고 있습니다. 사용자는 Chatgpt의 드롭 다운 메뉴에서 “에이전트 모드”를 선택 하여이 기능을 활성화 할 수 있습니다. 이 런치는 OpenAI의 가장 야심 찬 노력을 질문 응답 시스템에서 실행 가능한 작업 분류 에이전트로 전환하려는 가장 야심 찬 노력을 나타냅니다.

Openai는 종종 복잡한 작업으로 어려움을 겪고있는 초기 AI 에이전트와 달리 Chatgpt 에이전트가 훨씬 더 능력이 있다고 주장합니다. Chatgpt 커넥터에 액세스하여 Gmail 및 Github와 같은 응용 프로그램과 통합되어 프롬프트의 관련 정보를 검색 할 수 있습니다. 에이전트는 또한 터미널에 대한 액세스를 보유하고 있으며 API를 사용하여 다양한 응용 프로그램과 상호 작용할 수 있습니다.

  Vivo는 X 시리즈에 대해 3년 동안 Android 업데이트를 약속합니다.

OpenAi는 식사를위한 계획 및 구매 재료를 계획하거나 슬라이드 데크를 만들기 위해 경쟁사 분석과 같은 ChatGpt 에이전트를위한 실제 응용 프로그램을 강조합니다. 이러한 작업은 에이전트가 웹 사이트를 구문 분석하고 행동 계획을 공식화하며 도구를 사용하여 이전 에이전트 기능에 비해 복잡성을 나타냅니다.

기본 모델 파워링 Chatgpt 에이전트는 여러 벤치 마크에서 최첨단 성능을 보여줍니다. “인류의 마지막 시험”(Pass@1)에서 수백 가지가 넘는 주제에 걸쳐 수천 개의 질문을 포함하는 엄격한 테스트 인이 모델은 41.6%의 점수를 얻었습니다. 이것은 OpenAI의 O3 및 O4-Mini 모델의 점수의 대략 두 배입니다. 도전적인 수학 벤치 마크 인 “Frontiermath”의 경우 Chatgpt 에이전트는 코드 실행을위한 터미널과 같은 도구를 제공하면 27.4%를 기록하여 O4-MINI의 이전 최신 점수 6.3%를 훨씬 능가했습니다.

OpenAI는 ChatGPT 에이전트 개발에서 안전 고려 사항을 강조하여 고급 기능에 의해 제기 된 위험이 높아지는 것을 인정했습니다. Chatgpt 에이전트의 안전 보고서에서 OpenAi는 모델을 생물학적 및 화학 무기 영역에서 “높은 기능”으로 분류했습니다. OpenAI의 준비 프레임 워크에 의해 정의 된이 분류는 직접적인 증거를 아직 이용할 수 없지만 “기존 경로를 심각한 피해로 증폭시킬 수있는 모델의 잠재력을 나타냅니다. 결과적으로 OpenAI는 예방 조치로 새로운 보호 조치를 구현했습니다.

  MW3 좀비 충돌 문제를 해결하는 방법은 무엇입니까?

주요 안전 조치에는 실시간 모니터링 시스템이 포함됩니다. 분류기는 Chatgpt 에이전트에 입력 된 모든 프롬프트를 분석하여 생물학 관련 요청을 감지합니다. 식별되면 에이전트의 반응은 두 번째 모니터를 통과하여 내용이 생물학적 위협에 기여할 수 있는지 확인합니다.

또한, OpenAI는이 에이전트에 대한 ChatGpt의 메모리 기능을 일시적으로 비활성화하여 즉각적인 주입 공격을 통한 민감한 데이터 추출과 같은 잠재적 오용을 방지했습니다. 메모리 기능은 일반적으로 Chatgpt가 과거의 대화를 참조 할 수 있지만 Openai는이 에이전트의 위험으로 간주했지만 향후 포함 시설을 재고 할 수 있습니다.

OpenAI가 요약 한 인상적인 기능에도 불구하고 ChatGpt 에이전트의 실제 실제 성능은 여전히 남아 있습니다. 역사적으로, 에이전트 기술은 복잡한 실제 시나리오와 상호 작용할 때 취약성을 보여주었습니다. 그럼에도 불구하고 Openai는 더 유능한 모델이 AI 에이전트의 오랜 비전을 제공 할 수 있다는 확신을 표명합니다.

Source: Chatgpt는 이제 실제 작업을 수행합니다