Google은 카메라 피드의 객체와보다 표현적인 대화를위한 새로운 오디오 모델을 강조하는 시각적 오버레이로 Gemini 라이브를 향상시키고 있습니다. 시각적 오버레이 기능을 사용하면 카메라의 관점에서 물체 주위에 흰색으로 된 사각형을 배치하여 항목을 식별하거나 조언을 얻는 데 도움이됩니다. 새로운 기본 오디오 모델은보다 반응적이고 표현적인 대화를 위해 설계되었습니다.

작년의 Google 이벤트에서 Google은 AI 챗봇과보다 자연스럽고 핸즈프리 대화를 위해 설계된 기능인 Gemini Live를 공개했습니다. 데뷔 이후 Google은 Gemini Live에 대한 수많은 업그레이드, 특히 카메라 피드 및 화면을 공유 할 수있는 기능을 소개했습니다.

Google은 Gemini Live의 카메라 공유 기능과 상호 작용을 더욱 자연스럽게 만들기 위해 새로운 오디오 모델에 대한 주요 향상을 ​​발표했습니다.

Google은 새로운 Google Pixel 10 시리즈에 대한 프레젠테이션에서 Android에서 Gemini Live에 몇 가지 개선 사항을 자세히 설명했습니다. 먼저, 카메라 피드를 공유하면 Gemini Live는 시각적 오버레이를 표시하여 특정 객체를 강조 할 수 있습니다. 이 하이라이트는 물체 주위에 흰색으로 된 사각형으로 나타나고 나머지보기는 눈에 띄게 만들기 위해 약간 어두워집니다.

  Facebook Gaming은 스트리머가 트롤과 싸우는 데 도움이 될 것입니다.

이 “시각적 지침”기능은 카메라의 관점에서 항목을 신속하게 찾아서 식별 할 수 있도록 설계되었습니다. 예를 들어, 기계의 올바른 버튼을 강조 표시하거나 양 떼에서 특정 조류를 가리키거나 프로젝트에 적합한 도구를 식별하는 데 사용합니다. Gemini에게 행사에 적합한 신발 한 켤레를 추천 해달라고 요청하는 것과 같은 조언을 위해 사용할 수도 있습니다.

이 기능은보다 복잡한 시나리오를 처리 할 수 ​​있습니다. 브리핑에서 Google 제품 관리자는 최근 국제 여행에서 개인적인 사례를 공유했습니다. 그는 특정 장소에 주차 할 수 있는지 알아 내고 외국어 표지판, 도로 표시 및 지역 규정을 이해할 수 없는지 알아 내기 위해 고군분투하고있었습니다. 그는 전화기를 꺼내어 Gemini Live를 열린 후 현장에서 카메라를 가리키고 주차가 허용되는지 물었다. Gemini는 지역 규칙을 찾아서 표지판을 번역 한 다음 거리에서 다음 2 시간 동안 무료로 주차 할 수있는 지점을 강조했습니다.

Gemini Live의 시각적 지침은 Google Pixel 10 시리즈의 상자에서 구할 수 있으며 다음 주에 다른 Android 장치로 출시 될 예정입니다. 이 기능은 앞으로 몇 주 안에 iOS 장치로 확장됩니다. Google AI Pro 또는 Ultra 구독은 필요하지 않습니다.

  로스트아크 신규 클래스: 모든 미공개 캐릭터

Google은 시각적 오버레이와 함께보다 반응적이고 표현적인 대화를 위해 설계된 새로운 기본 오디오 모델로 Gemini Live를 업그레이드하고 있습니다.

첫째,이 새로운 모델은 당신이 말하는 것에 더 적절하게 응답 할 것입니다. 예를 들어, 스트레스가 많은 주제에 대해 채팅하는 경우 더 차분하고 “측정 된”음성으로 응답합니다.

Google은 또한 새로운 오디오 모델이 어떻게 말하는지 제어 할 수 있다고 말합니다. 예를 들어 Gemini의 말을 따라 잡는 데 어려움을 겪고 있다면 더 천천히 말하도록 요청할 수 있습니다. 또는 서두르면 속도를 높이도록 요청할 수 있습니다.

마지막으로, 역사적 인물의 관점에서 극적인 이야기를 들려 줄 수도 있습니다. Google은 블로그 게시물에서“Julius Caesar 자신의 관점에서 로마 제국에 대해 Gemini에게 요청하고 캐릭터 악센트로 풍부하고 매력적인 이야기를 얻으십시오.

Gemini Live의 새로운 Visual Overays 기능은 Android XR 안경에 더 적합하지만, 우리는 여전히 그 안경에 손을 대지 않기 때문에 모바일에서 사용할 수있는 것이 좋습니다.

이 기사는 ET 7:50 PM에 업데이트되어 자연 오디오 모델의 섹션을 수정하고 Google 블로그 게시물의 데모 자산을 추가했습니다.

  비디오 게임을 하면 정서적 창의성이 향상됩니까?

Source: Google Gemini Live가 시각적 오버레이와 새로운 오디오 모델을 추가합니다.