Robinhood CEO Vlad Tenev가 공동 설립 한 AI 스타트 업인 Harmonic은 iOS 및 Android 용 AI Chatbot 앱의 베타 버전을 출시하여 사용자에게 AI 모델 인 Aristotle에 액세스 할 수 있도록 제공했습니다. 이 회사는 아리스토텔레스에 대한 액세스를 넓히는 것을 목표로하며, 이는 수학적 추론 질문에 대한 “환각”답변을 제공한다고 주장합니다. 현재 AI 모델의 지속적인 신뢰성 문제를 고려할 때 이것은 중요한 주장입니다.
Harmonic의 핵심 임무는 “수학적 초 고인성”(MSI)을 만드는 것입니다. 스타트 업은 아리스토텔레스의 기능을 확장하여 물리, 통계 및 컴퓨터 과학을 포함한 수학에 의존하는 다양한 분야를 사용자에게 지원할 계획입니다. 고조파 CEO이자 공동 창립자 인 Tudor Achim이 말했습니다 TechCrunch 아리스토텔레스는“아리스토텔레스가지지하는 도메인, 정량적 추론 영역 인 우리는 실제로 환각이 없다고 보장한다”고 덧붙였다.
이 회사는 또한 기업이 Aristotle에 액세스 할 수있는 API 및 앞으로 일반 소비자를위한 웹 앱을 출시 할 계획입니다. Harmonic은 Aristotle이 공식 테스트를 통해 2025 International Math Olympiad (IMO)에서 금메달 성능을 달성했다고 발표했습니다. 이 성과는 Google과 Openai가 개발 한 AI 모델과 함께 아리스토텔레스를 배치하며, 이는 자연 언어의 비공식 테스트를 통해 올해 IMO의 금메달 성능을 달성했습니다. 그럼에도 불구하고 Harmonic은 현재 Aristotle의 다른 벤치 마크를 공개하지 않았습니다.
이 베타 런칭은 Harmonic의 성공적인 시리즈 B 자금 지원 라운드의 발 뒤꿈치에 밀접한 관련이 있으며, 이는 1 억 달러를 모금했습니다. 이 라운드는 Kleiner Perkins가 이끌었고 회사를 8 억 8 천만 달러로 평가했습니다. ACHIM은 고조파가 MSI를 달성하기위한 길을 따라“매우 빠르게 발전하고있다”고 지적했으며, 투자자들은 스타트 업 야망의 범위를 감안할 때 평가가 공정하다고 생각했다.
몇몇 주요 기술 회사는 수학적 문제를 해결하기 위해 AI 모델을 훈련시키는 데 적극적으로 중점을두고 있습니다. AI가 수학을 수행 할 수있는 능력은 그 자체로 가치가 있으며, 수학은 핵심 추론 기술을 요구하는 독특하게 검증 가능한 영역으로 간주됩니다. 이러한 기술을 개발할 수있는 시스템은 다른 도메인에서도 유용 할 수 있습니다. Achim은 오픈 소스 프로그래밍 언어 인 Lean에서 Aristotle을 생산함으로써 Harmonic이 높은 정확도를 달성한다고 설명했습니다. 사용자에게 답변을 제공하기 전에 모델 알고리즘은 AI가 포함되지 않는 프로세스 인 정확성을위한 솔루션을 다시 확인합니다. ACHIM은 유사한 검증 기술이 의료 기기 및 항공과 같은 고지대 분야에서 사용된다고 지적했다.
좁은 영역 내에서도 AI 모델에서 환각이없는 성능을 달성하는 것은 매우 어려운 작업입니다. 연구에 따르면 AI 모델을 선도하는 AI 모델조차도 종종 환각을 느끼고 있으며,이 문제는 크게 개선 된 징후를 보이지 않았으며, OpenAI의 최신 추론 모델 중 일부는 이전 모델보다 환각을 더 많이 보여줍니다.
Source: 이 스타트 업은 AI의 환각 문제를 해결했다고 주장합니다








