Google Gemini는 GPT-4o와 경쟁하기 위해 준비하고 있습니다.

인공 지능(AI) 패권 경쟁이 Gemini와 ChatGPT 사이에 가열되고 있으며, 거대 기술 기업들은 가장 강력하고 다재다능한 AI 모델을 개발하기 위해 경쟁하고 있습니다.

OpenAI의 인상적인 GPT-4o 공개에 이어 Google은 엄청난 인기를 누리고 있는 챗봇 Gemini의 자체 프로토타입을 매혹적인 시연으로 선보이며 AI 경쟁에 뛰어들었습니다.

동영상: 구글의 X 계정 다가오는 Google I/O 개발자 컨퍼런스를 준비하는 동안 촬영된 것으로 추정되는 실시간 영상을 분석하는 Gemini를 실행하는 Pixel 휴대폰을 선보였습니다.

데모를 통해 Gemini의 대화 능력이 드러났습니다.

공개된 영상에서 사용자는 음성 안내를 통해 AI에게 화면 활동에 대해 질문합니다. 자연스러운 목소리로 전달되는 Gemini의 반응은 시각적 맥락에 대한 이해를 보여줍니다. 무대 건설을 대규모 행사를 위한 준비로 정확하게 식별합니다. 화면에 글자가 표시된다는 메시지가 표시되면 Gemini는 이를 Google I/O의 간판으로 인식하고 이벤트에 대한 간략한 설명을 제공합니다.

해커들이 DeFi 프로토콜 BadgerDAO에서 1억 2천만 달러 상당의 암호화폐를 훔쳤습니다.

OpenAI의 최근 ChatGPT 시연과 유사하게 Google의 Gemini 비디오는 대화의 자연스러운 흐름이 주목할 만합니다. 사용자 상호 작용은 거의 인간과 같은 느낌을 주며, Gemini의 반응은 친근한 대화의 리듬을 반영합니다.

앞으로 하루 더 #구글IO! 우리는 느끼고 있어요 . AI, 검색 등에 관한 최신 소식을 내일 만나보세요. pic.twitter.com/QiS1G8GBf9
— 구글(@Google) 2024년 5월 13일

이러한 대화형 접근 방식은 이전 AI 모델에서 경험했던 부자연스러운 상호 작용과는 크게 다릅니다. 앞뒤로 교환하고, 정보를 명확하게 하고, 사용자 쿼리에 따라 응답을 조정하는 기능은 보다 직관적이고 사용자 친화적인 AI 경험을 위한 길을 열어줍니다.

그리고 Gemini와 ChatGPT라는 경쟁에서 다시 한 번 혁신이 탄생할 것으로 보입니다.

상황 인식은 여기서 금광입니다

데모는 가벼운 시나리오에 중점을 두었지만 Gemini의 잠재적인 응용 프로그램은 엔터테인먼트 목적을 훨씬 뛰어넘습니다. 시각적 정보를 실시간으로 분석하는 능력은 다양한 분야에서 획기적인 변화를 가져올 수 있습니다.

AI가 의료 이미지를 즉시 분석하고 통찰력이나 잠재적인 진단을 제공할 수 있는 환자 상담 중에 의사가 Gemini를 사용하는 것을 상상해 보십시오. 교육 분야에서 학생들은 Gemini를 활용하여 AI가 사물, 실험 또는 역사적 유물을 실시간으로 분석하여 주제에 대한 더 깊은 이해를 촉진함으로써 학습 경험을 향상시킬 수 있습니다.

iMessage에 효과를 적용하는 방법: 애니메이션 단어

프로토타입은 아직 제작 중이며 전체 성능은 아직 완전히 공개되지 않았습니다. 하지만 이 데모는 AI 상호작용의 미래에 대한 전망을 엿볼 수 있는 기회를 제공합니다. 자연어 처리와 실시간 비디오 분석을 결합함으로써 Gemini는 OpenAI의 GPT-4o처럼 우리가 정보 및 주변 세계와 상호 작용하는 방식을 변화시키고 개선할 수 있는 잠재력을 가지고 있습니다.

그럼 자세한 내용은 언제 알 수 있을까요? Google I/O 이벤트가 시작됩니다 오늘 저녁 오전 10시(태평양 표준시)/오후 1시(미국 동부 표준시) 그러니 기술의 미래를 목격하기 위해 계속 지켜봐 주시고 계속 읽어 주시기 바랍니다.

주요 이미지 크레딧: 솔렌 페이사/Unsplash

Source: Google Gemini는 GPT-4o와 경쟁하기 위해 준비하고 있습니다.