Reflection 70B는 대기업이 할 수 없는 일을 하고 자신의 실수로부터 배웁니다. 오픈 소스 언어 모델을 갖춘 이 AI는 망상에 대한 대책을 찾았을 수도 있습니다.
공동 창립자이자 CEO인 Matt Shumer가 이끄는 스타트업 HyperWrite에서 출시한 Reflection 70B는 Meta의 Llama 3.1-70B Instruct를 기반으로 합니다. 이 모델을 다른 모델과 차별화하는 것은 자체 수정 기능인데, 이는 AI 커뮤니티의 주목을 받은 고유한 기능입니다.
세계 최고의 오픈소스 모델인 Reflection 70B를 발표하게 되어 기쁩니다.
LLM이 자신의 실수를 스스로 수정할 수 있도록 개발된 기술인 Reflection-Tuning을 사용하여 교육을 받았습니다.
405B가 다음 주에 출시됩니다. 세계 최고의 모델이 될 것으로 기대됩니다.
~로 구축됨 @글레이브AI.
계속 읽어보세요
: pic.twitter.com/kZPW1plJuo
— 맷 슈머 (@mattshumer_) 2024년 9월 5일
Reflection 70B의 뛰어난 특징
슈머는 X에서 Reflection 70B의 출시를 발표하고 오픈소스 시장의 다른 모델보다 우수함을 강조했습니다. 그는 AI가 현재 최고의 오픈소스 AI 모델이며 Meta의 Llama 시리즈를 포함한 이전 모델을 능가한다고 자신 있게 말했습니다. MMLU 및 HumanEval과 같은 벤치마크도 Reflection 70B의 높은 성능을 확인했으며 오픈소스 및 상업적 대안보다 더 나은 결과를 보여주었습니다.
Reflection 70B가 이러한 결과를 달성하는 이유이자 경쟁사에는 없는 기능은 오류를 감지하고 수정할 수 있는 능력입니다. 이는 언어 모델이 종종 “환각하다” 또는 거짓 정보를 생산하더라도, 슈머의 AI는 최종 답변을 제공하기 전에 오류를 인식할 수 있습니다. 슈머는 이 개념에 대해 수개월 동안 생각해 왔고, 이 새로운 모델로 이제 현실이 되었습니다.
Reflection 70B는 최상위 클로즈드 소스 모델(Claude 3.5 Sonnet, GPT-4o)과도 견줄 만한 성능을 자랑합니다.
(최소한) MMLU, MATH, IFEval, GSM8K 분야에서 최고의 LLM입니다.
테스트된 모든 벤치마크에서 GPT-4o보다 우수합니다.
라마 3.1 405B를 때려눕힙니다. 비교도 안 됩니다. pic.twitter.com/win7cHUOob
— 맷 슈머 (@mattshumer_) 2024년 9월 5일
Reflection 70B의 이름은 “내성적 능력”을 나타냅니다.반영하다”모델 정확도를 확인하는 추론입니다. 이 디자인에는 추론과 오류 수정을 강화하는 특수 아이콘이 포함되어 있어 사용자가 모델과 더 효과적으로 상호 작용할 수 있습니다. 이러한 추론 프로세스는 실시간 수정을 허용하는 특수 레이블의 형태로 볼 수 있습니다.
그 효과를 입증하기 위해, 사용자는 Reflection 70B와 상호 작용할 수 있습니다. 데모 웹사이트에서, 그러나 사이트에 접근하는 데 어려움이 있습니다 복잡한 교통. 9.11과 9.9 중 어느 숫자가 더 큰지 판단하는 것과 같은 일부 작업은 모델의 정확도에 도전하도록 설계되었습니다. 많은 AI 시스템이 이러한 쿼리에 어려움을 겪는 반면, Reflection 70B는 60초 이상지연에도 불구하고, 이 수준의 추론은 정밀도가 중요한 사용 사례에서 모델을 돋보이게 합니다.
Reflection 70B는 시작일 뿐입니다
Reflection 70B는 확장 시리즈의 첫 번째 모델입니다. 훨씬 더 큰 모델인 Reflection 405B가 곧 출시될 예정입니다. Reflection 모델에 대한 Shumer의 야심 찬 비전에는 OpenAI의 GPT-4와 같은 폐쇄형 소스 모델의 기능을 능가하는 것이 포함됩니다. Reflection 405B는 최고의 독점 모델보다 성능이 뛰어나고 오픈소스 AI가 달성할 수 있는 경계를 넓힐 것으로 알려졌습니다.
하지만 Reflection 70B는 단순한 독립형 프로젝트가 아닙니다. 슈머는 또한 이 모델을 HyperWrite의 쓰기 지원 플랫폼에 통합할 계획이라고 발표했습니다. 사용자가 이메일을 초안하고, 텍스트를 요약하는 데 도움이 되는 Chrome 확장 프로그램인 HyperWrite는 이미 수백만 명의 사용자를 보유하고 있습니다. Reflection 70B가 이 플랫폼에 통합되면 사용자는 새로운 수준의 정확성과 사용자 정의를 제공받아 더욱 진보된 AI 기반 타이핑이 가능해집니다.
빠르고 효율적인 교육 과정
Reflection 70B 훈련은 AI 데이터 세트를 전문으로 하는 스타트업인 Glaive와의 파트너십 덕분에 길고 지루한 과정이 아니었습니다. Glaive의 플랫폼은 사용 사례별 데이터 세트를 생성하여 언어 모델을 더 쉽고 빠르게 훈련할 수 있게 해줍니다. Reflection 70B의 경우, 이 접근 방식을 통해 단 3주 만에 모델을 5번 훈련할 수 있었으며, 이는 Glaive의 합성 데이터 생성 시스템을 사용하여 가능했습니다.
나는 매우 명확하게 말하고 싶습니다. @글레이브AI 이것이 효과가 좋은 이유입니다.
그들이 합성 데이터를 생성할 때 부여하는 통제력은 미친 짓입니다.
저는 앞으로 제가 만드는 거의 모든 모델에 이 제품을 사용할 예정이고, 여러분도 사용해보세요. https://t.co/I789UIa5Yg
— 맷 슈머 (@mattshumer_) 2024년 9월 5일
Sahil Chaudhary가 설립한 이 회사는 모델을 빠르고 비용 효율적으로 훈련할 수 있는 고품질 데이터 세트를 제공하는 것을 목표로 합니다. 소규모 모델을 훈련하는 데 있어서의 성공은 과거에 입증되었습니다. 3D 매개변수화된 모델은 특정 작업에서 많은 대규모 오픈소스 경쟁자보다 성능이 우수했습니다.
Reflection 70B가 동작 중입니다.
이 모델의 개발은 2020년에 Otherside AI로 설립된 HyperWrite에 이것이 얼마나 중요한지 보여줍니다. 원래 뉴욕 롱아일랜드에 본사를 둔 HyperWrite는 소규모 AI 쓰기 도우미에서 100만 명 이상의 사용자를 보유한 플랫폼으로 성장했습니다. 200만 명의 사용자. 초기 성공으로 인해 Shumer와 공동 창립자는 제이슨 쿠퍼버그 2023년 포브스 ’30세 이하 30인’ 목록에 이름을 올렸습니다.
2023년 3월, HyperWrite가 모금되었습니다. 280만 달러 Madrona Venture Group과 같은 투자자로부터 자금 지원을 받아 회사의 성장을 도왔습니다. 항공편 예약이나 LinkedIn에서 구직자 찾기와 같은 작업을 수행할 수 있는 브라우저 어시스턴트와 같은 새로운 기능 덕분에 HyperWrite는 AI 기반 개인 지원 분야의 최첨단을 유지했습니다. Reflection 70B의 통합은 이러한 기능을 향상시키고 AI 산업에서 HyperWrite의 입지를 더욱 공고히 할 것으로 기대됩니다.
Reflection 70B는 AI에 대한 우리의 생각을 바꿀 것입니다. 다른 어떤 모델도 하지 못하는 정밀성과 추론을 결합합니다. 이 모델은 높은 정확도가 필요한 작업에 유용하지만 잠재적인 응용 분야는 훨씬 더 광범위합니다. Reflection 405B의 출시는 Shumer와 그의 팀이 여전히 열심히 일하고 있음을 보여줍니다. HyperWrite가 플랫폼을 개선하고 새로운 기능을 만들면서 Reflection 시리즈는 아마도 매우 중요할 것입니다. Reflection 70B를 통해 AI 커뮤니티와 사용자가 모델의 고유한 기능에 어떻게 반응하고 미래 모델이 이 기반을 어떻게 구축할지 보는 것은 흥미로울 것입니다.
추천 이미지 크레딧: DC Studio / Freepik








