지난 2 년 동안 AI 주변의 대화는 규모에 따라 지배되었습니다. 모델 크기, 매개 변수 수, 벤치 마크 결과 – 이들은 진행 상황을 측정하는 척도가되었습니다. OpenAi는 GPT-4를 출시했으며 Google은 Gemini의 언어 기능을 시각적 파이프 라인과 병합했으며 Anthropic의 Claude는 컨텍스트 창을 엄청난 길이로 확장했습니다. 각각의 새로운 출시는 언어 모델이 이해, 기억 또는 생성 할 수있는 것의 한계를 추진했습니다.

그러나이 무기 경쟁과 함께 더 조용한 추세가 나타났습니다. 즉, 권력에서 실용성으로의 전환.

대규모 모델 기능은 여전히 ​​중요하지만, 프론티어는 이러한 모델이 어떻게 사용되는지에 의해 점점 더 정의됩니다. 이러한 변화는 강점이 엄격한 마력이 아니라 제품화, 통합 및 사용자 중심의 적응성에있는 새로운 클래스의 플레이어를 일으키고 있습니다. 그리고 그 중에서, Tencent의 AI 작품의 성장하는 몸은 조용하지만 심각한 관심을 끌고 있습니다.

Tencent의 진행 상황은 전 세계 헤드 라인으로 종종 데뷔하는 회사와 달리 더 반복적이고 비하인드 스토리 방식으로 전개되었습니다. 그러나 물질은 부인할 수 없습니다. 예를 들어, Hunyuan Turbo S 모델은 최근 LMSYS가 호스팅하는 영향력있는 크라우드 리더 보드 인 Chatbot Arena에서 GPT-4 및 Claude 3 Opus와 함께 10 위를 차지했습니다. 특히, DeepSeek-V2와 함께 그 계층에 도달하는 것은 두 개의 중국 모델 중 하나가되었습니다.

기술적으로 Hunyuan Turbo S는 MAMBA의 효율적인 장기 시퀀스 처리와 변압기 스타일의 상황에 맞는 추론을 결합한 하이브리드 아키텍처를 모두 MOE (Mix-of-Experts) 구조를 기반으로합니다. 그러나 그것을 차별화하는 것은 아키텍처와 의도에 관한 것입니다. 모델은 데모가 아니라 배포에 최적화됩니다. 그것은 매일 수백만 명의 사람들이 사용하는 실제 도구 (생산성 앱, 커뮤니케이션 플랫폼, 음성 보조원)에 전력을 공급합니다. 그런 의미에서, 그것은“AI의 애플의 AI”접근법을 따릅니다. 기능에 대해 외치지 않고 사용자 경험이 말하게합니다.

  수정됨: Diablo 4가 다른 업데이트 오류를 ​​기다리고 있음

가장 매력적인 구현 중 하나는 Hunyuan의 3D 세대 시스템입니다. 원래 틈새 도구로 출시 된이 제품은 디지털 디자이너, 게임 스튜디오 및 산업 프로토 타이핑 팀 사이에서 조용히 견인력을 얻었습니다. 단일 이미지 또는 텍스트 프롬프트만으로 사용자는 이전에 수동 모델링 시간이 필요한 작업 인 기하학적 정밀도로 고해상도 3D 메쉬 출력을 생성 할 수 있습니다. 공개 데이터에 따르면이 모델은 포옹 페이스와 같은 개방형 플랫폼을 통해 160 만 회 이상 다운로드하여 전 세계에서 가장 널리 채택 된 3D AI 생성기 중 하나입니다.

CVPR 2025에서 Tencent는 개방형 Hunyuan 3D 2.1 (첫 번째 엔드 투 엔드 오픈 산업 등급 3D 세대 모델로 설명되어 있습니다. 널리 사용되는 2.0 버전과 비교하여 새로운 릴리스는 기하학적 생성 품질을 향상시키고 PBR (물리적 기반 렌더링) 재료 생성에 대한 지원을 소개하여 현실감을 향상시키고 생성 된 자산이 빛과 질감에 어떻게 반응하는지 개선합니다.

Tencent ‘s AI Ambition은 또한 규모를 처리하는 방법에 나타납니다. AI 스택은 모두 알고있는 모델을 구축하는 대신 멀티 모델 오케스트레이션을 지원합니다. Perplexity와 유사한 소비자를 향한 소비자 조수 인 Yuanbao와 같은 제품은 복잡성, 작업 유형 또는 대기 시간 요구 사항을 기반으로 사용자 쿼리를 다른 모델로 원활하게 배치합니다. 사용자에게는 브랜드 전환 또는 수동 구성이 없습니다. 경험에 대한 가장 똑똑한 점은 기계가 뒤에있는 기계를 거의 알지 못한 것입니다.

  Segment Anything 모델: Meta의 새로운 SAM은 무엇을 할 수 있습니까?

이 오케스트레이션 접근법은 또한 문서 수집, 검색 및 AI 지원 드래프팅 기능을 데스크탑 및 모바일의 단일 작업 공간에 통합하는 내부 생산성 플랫폼 인 Tencent IMA를 뒷받침합니다. Hunyuan Model 제품군 위에 세워진 IMA는 회사의 오케스트레이션 우선 접근 방식과 AI를 일상적인 워크 플로에 포함시키는 데 중점을 둡니다.

참신에 대한 유용성에 대한 강조는 Tencent의 AI 배포 전략의 특징이되었습니다. 최신 수익 전화 에서이 회사는 AI를 혁신의 계층뿐만 아니라 클라우드, 엔터프라이즈 및 소비자 포트폴리오의 기본 구성 요소 인 장기 인프라 우선 순위로 재확인했습니다. 블루 칼라 작업자를위한 AI 지원 작문 보조원부터 브라우저 앱에 포함 된 실시간 번역 도구에 이르기까지 Thingline은 분명합니다. 기술자 만 존경 할 수있는 AI를 구축하지 마십시오. 삶을 더 편하게 만드는 도구를 구축하십시오.

이 실용적인 정신은 여전히 ​​많은 AI 부문을 둘러싼 연극과 대조적입니다. Google I/O에서 Gemini의 실시간 추론 및 코딩 데모는 군중을 놀라게했습니다. GPT-4O의 OpenAi의 음성 모드 미리보기는 공상 과학 비교를 그렸습니다. 메타는 LLAMA 3의 오픈 소스 지배력을 계속 강조하고 있습니다. 그러나 실제 세계, 특히 실리콘 밸리 외부에서는 사용자가 32K 컨텍스트 창을 수행 할 수 있는지 묻지 않습니다. 그들은 묻는다 : 보고서를 요약 할 수 있습니까? 이력서를 다시 작성 하시겠습니까? 제품 프로토 타입을 설계 하시겠습니까? 메뉴를 번역 하시겠습니까?

  Twitter는 Twitter Blue 구독자를 위해 더 긴 트윗을 소개합니다.

이러한 사용 사례에서 Tencent는 혼자가 아닙니다. 한국의 Naver는 다중 모드 모델을 스마트 홈 플랫폼에 조용히 배포했습니다. 프랑스의 미스트랄은 조밀하고 낮은 격렬한 모델 서빙으로 진전을 이루고 있습니다. Cohere 및 변곡과 같은 중간 규모의 플레이어조차도 챗봇 데모에서 개발자 플랫폼으로 이동하여 인프라 수준 파트너십으로 피봇하고 있습니다.

이러한 사례가 공통적으로 가지고있는 것은 언어 나 지리가 아닙니다. 그것은 AI에서 스펙터클로서 SaaS의 의미가 아니라 인간의 의미에서 서비스로서 AI로의 전환입니다. AI는 도움이되고, 맞는 것은 사라집니다.

물론 도전은 남아 있습니다. 현지화 된 AI 성공이 항상 글로벌 관련성으로 해석되는 것은 아닙니다. Tencent ‘s를 포함한 중국 모델은 여전히 ​​해외 시장에서 개발자 채택, 인터페이스 번역 및 규제 회의론에 대한 장애물에 직면 해 있습니다. 마찬가지로, 서양 모델은 종종 영어 이외의 데이터 맥락과 문화 신호에 대한 민감도가 부족합니다.

그러나 AI의 다음 장이 아키텍처보다 애플리케이션에 관한 것이라면, 혁신뿐만 아니라 인프라와 통합을 마스터 한 회사 (혁신뿐만 아니라 진정한 열쇠가 영향을 미칠 수 있습니다. 모든 사람이 모델 레이스에서 첫 번째가 될 수있는 것은 아닙니다. 그러나 점점 더 중요한 인종은 아닐 수도 있습니다.


주요 이미지 크레딧 : Tencent

Source: 모델 전쟁에서 의미있는 AI에 이르기까지 : 실용적인 지능의 조용한 상승