Meta AI의 Llama 3.1 405b는 많은 사용자에게 깊은 인상을 준 히트작입니다. 새로운 모델은 사소한 물고기가 아닙니다. 끊임없이 성장하는 언어 모델 풀에서 큰 물고기입니다. 모든 사람이 말하고 글을 쓸 수 있게 하는 AI를 살펴보겠습니다.
Meta AI의 Llama 3.1 405b는 이름에서 알 수 있듯이 4,050억 개의 매개변수를 가진 대규모 언어 모델입니다. 이는 2024년 4월에 출시된 Meta의 Llama 3 시리즈의 일부입니다. 초기 벤치마크에 따르면 이 모델은 여러 주요 AI 테스트에서 현재 선두 주자보다 성능이 우수할 수 있습니다.
다른 색상의 말: Meta AI의 Llama 3.1 405b 사양
Meta AI는 이전에 Facebook AI Research로 알려졌으며, Meta Platforms의 인공지능 연구 부문입니다. 그들은 2023년에 독점 언어 모델에 대한 오픈소스 대안으로 Llama(Large Language Model Meta AI)를 출시했습니다. Llama는 AI 커뮤니티에서 빠르게 인기를 얻었습니다. 이러한 성공을 바탕으로 Meta는 2023년에 상당한 개선을 보인 Llama 2를 출시했습니다.
이제 Llama 3를 통해 Meta는 경계를 더욱 넓혔고, 오늘 논의하는 강력한 Llama 3.1 405b 모델로 마무리되었습니다. 이 빠른 진행은 오픈소스 AI 기술을 발전시키려는 Meta의 의지를 보여줍니다.
인공지능이 우리 주변에 있는 이 시대에, 회사는 멈추지 않습니다. 오래된 게임 그래픽을 보고 얼마나 더 개선할 수 있을지 궁금해하는 시대에, 우리는 새로운 그래픽을 용서하게 되었고, 인공지능도 마찬가지입니다.
Meta AI는 성능 면에서 뒤떨어지지 않습니다. 이 모델은 4,050억 개의 매개변수를 가지고 있어 AI 분야에서 중량급 플레이어입니다. 그렇다면 405b 매개변수는 무엇을 의미할까요?
이웃은 절대 안 된다고 말한다: Meta AI의 Llama 3.1 405b 대 경쟁자
Meta AI의 Llama 3.1 405b는 초기 벤치마크에서 인상적인 결과를 보여주고 있습니다. GSM8K, Hellaswag, Boolq 및 다양한 MMLU 범주를 포함한 여러 테스트에서 GPT-4보다 성능이 뛰어납니다. 그러나 HumanEval 및 MMLU 사회 과학과 같은 분야에서는 뒤처집니다.
이 모델의 성능은 수학 및 코딩 작업에서 특히 강력합니다. 예를 들어, GSM8K 테스트에서 Meta AI의 Llama 3.1 405b는 96.8점을 받았고, 70B 대응 모델은 94.8점을 받았습니다. HumanEval에서 405B 모델은 85.3점을 받았고, 70B 버전은 79.3점을 받았습니다.
이 수치는 기본 모델을 기반으로 합니다. 명령어 튜닝은 잠재적으로 이러한 결과를 더욱 개선할 수 있습니다. 따라서 이 수치는 처리 능력을 나타낸다고 할 수 있으며, 수치가 클수록 좋지만(하지만 때로는) 때때로 모델은 부하에 짓눌립니다.

미래를 향한 Hoof It: Meta AI의 Llama 3.1 405b 및 오픈 소스 AI
Meta AI의 Llama 3.1 405b 모델이 오픈소스 AI이고, 처음으로 오픈소스 모델이 다양한 벤치마크에서 사용 가능한 최고의 폐쇄형 소스 LLM을 이길 수 있다는 사실은 아직 완전히 이해되지는 않았지만 앞으로 일어날 일의 징조일 수 있습니다. 지금은 ChatGPT에서 GPT를 만들 수 있습니다. 이 종속성은 나중에 깨질 수 있습니다.
Meta AI의 Llama 3.1 405b는 AI 분야의 강력한 신규 플레이어입니다. 다양한 벤치마크에서의 강력한 성능과 오픈소스 특성으로 인해 주목할 만한 모델입니다. AI가 계속 진화함에 따라 Meta AI의 Llama 3.1 405b는 언어 모델과 AI 기술의 미래를 형성하는 데 중요한 역할을 할 수 있습니다.
추천 이미지 출처: Meta AI 블로그





