Google의 Gemini 2.0 출시: 다중 모드 및 강력함

Google은 사용자의 기술 상호작용 능력을 향상시키는 정교한 AI 모델인 Gemini 2를 출시했습니다. 언론 행사에서 발표된 이 발표는 Gemini 2의 작업 실행, 대화 능력 및 다중 모드 이해 능력을 강조하며 AI 기술의 중요한 발전을 나타냅니다.

Google, Gemini 2 출시: AI 비서의 새로운 시대

Google DeepMind의 CEO인 Demis Hassabis는 Gemini 2가 “사용자의 컴퓨터와 웹에서 작업을 계획하고 실행”할 수 있는 가상 비서 역할을 한다고 언급했습니다. 이 모델은 사용자가 다양한 활동을 원활하게 관리할 수 있도록 돕고 잠재적으로 인간과 유사한 인지 기능을 모방하여 인공 일반 지능(AGI)을 향한 길을 닦는 것을 목표로 합니다. Google의 CEO인 순다르 피차이(Sundar Pichai)는 세상을 보다 효과적으로 이해하고 행동할 수 있는 ‘에이전트 모델’ 개발에 대한 회사의 의지를 강조하며 지난 한 해 동안 상당한 투자를 했음을 나타냅니다.

Gemini 2에는 향상된 “멀티모달” 기능이 포함되어 있어 AI가 정교한 대화에 참여하면서 오디오와 비디오를 보다 효과적으로 구문 분석할 수 있습니다. 이러한 기능을 시연함으로써 Gemini 2는 개인 컴퓨팅 작동 방식을 재정의하고 항공편 예약 및 문서 관리와 같은 자동화된 작업을 통해 잠재적으로 시간을 절약할 수 있습니다. 그러나 오류 없이 개방형 명령을 처리하는 기술 능력과 관련하여 문제가 남아 있으며, 이로 인해 비용이 많이 드는 실수가 발생할 수 있습니다.

코딩 및 데이터 과학을 위한 전문 AI 에이전트도 Gemini 2 도구 상자의 일부이므로 사용자는 이전 모델의 기능을 뛰어넘는 복잡한 프로그래밍 작업을 처리할 수 있습니다. 기본 코드 완성에 초점을 맞춘 일반적인 AI 도구와 달리 이러한 에이전트는 코드를 리포지토리에 체크인하고 데이터 분석을 촉진하는 등의 포괄적인 작업을 수행할 수 있습니다.

2022년 가장 긴 YouTube 동영상

Project Mariner: 웹 탐색에 대한 새로운 접근 방식

Gemini 2의 기능을 선보이기 위해 Google은 사용자의 웹 탐색을 지원하는 실험적인 Chrome 확장 프로그램인 Project Mariner를 도입했습니다. 최근 시연에서 AI 에이전트는 자동으로 슈퍼마켓 웹사이트를 탐색하고 로그인한 후 장바구니에 항목을 추가하고 특정 항목을 사용할 수 없을 때 대체품을 제안하는 등 식사 계획을 세우는 임무를 맡았습니다. Hassabis는 Mariner를 일상 작업을 대상으로 AI와의 사용자 상호 작용을 재구상하는 연구 프로토타입으로 설명했습니다.

Gemini는 AI 지원 경험에서 유용성으로 호평을 받은 OpenAI의 ChatGPT와 경쟁하기 위한 Google 전략의 일환으로 2023년 12월에 처음 출시되었습니다. Gemini 2의 도입으로 Google은 이제 AI 기반 기능을 통해 검색 경험을 향상시키는 것을 목표로 자사 모델을 OpenAI의 제품만큼 유능한 위치에 놓았습니다.

Google은 또한 Gemini 2가 스마트폰 카메라를 통해 사용자 주변 환경을 해석할 수 있도록 하는 실험적 계획인 Project Astra의 최신 버전을 공개했습니다. 테스트 중에 Gemini 2는 와인병을 인식하고 웹에서 제공되는 지리적 정보, 가격 및 맛 특성을 제공하는 기술을 보여주었습니다. Hassabis는 Astra가 다양한 영역의 관심사를 연결하여 사용자 경험을 향상시킬 수 있는 최고의 추천 시스템으로 발전하기를 원한다고 밝혔습니다.

Google Go 앱은 5억 번 다운로드되었습니다.

Gemini 2의 메모리에 중점을 두어 AI는 사용자 선호도에 대한 통찰력을 유지할 수 있으며 Google은 사용자가 삭제 기능을 포함하여 데이터를 관리할 수 있도록 보장합니다. Astra를 사용한 테스트에서 AI는 방해에 응답하면서 대화 컨텍스트를 유지함으로써 인상적인 적응성을 보여주었습니다.

AI 에이전트의 안전성과 신뢰성

Gemini 2의 기능이 확장됨에 따라 Google은 안전성과 신뢰성 보장의 중요성을 강조합니다. 에이전트는 가능성을 보여주지만 잠재적인 위험은 사용자가 시스템 및 제공하는 데이터와 상호 작용하는 방식에서 비롯됩니다. Project Mariner는 민감한 작업을 실행하기 전에 사용자 확인을 요구하는 프롬프트를 통합하여 무단 거래로부터 보호합니다.

Google은 내부 및 외부 전문가와 협력하여 AI 사용과 관련된 위험을 평가함으로써 안전 문제를 해결하는 데 적극적으로 참여해 왔습니다. 여기에는 악의적인 프롬프트나 지시를 통해 플랫폼의 오용을 방지하고 이를 통해 사기나 피싱 공격과 같은 잠재적인 위협으로부터 사용자를 보호하기 위한 조치를 모색하는 것이 포함됩니다.

Google의 Gemini 2 출시는 회사가 사용자 경험과 피드백을 지속적으로 추적함에 따라 AI 발전의 중추적인 순간을 의미합니다. AGI를 향한 여정은 각 개발 단계마다 점진적으로 전개되어 향후 기술 반복에 영향을 미칠 수 있는 지속적인 연구를 강조합니다. 사용자 상호 작용 및 응답에 대한 조사가 계속됨에 따라 Gemini 2 및 관련 프로젝트의 다음 단계가 면밀히 모니터링되는 것으로 보입니다.

Google 코드 레드: ChatGPT vs Google vs You.com

이미지 출처: 구글

Google의 Gemini 2.0 게시물은 다음과 같습니다. Multimodal 및 Mighty가 TechBriefly에 처음 등장했습니다.

Source: Google의 Gemini 2.0 출시: 다중 모드 및 강력함