Meta가 최신 창작물을 공개함에 따라 LLaMA 2 대 GPT-4는 현재 수많은 AI 애호가들의 마음을 사로잡고 있습니다. 그러나 이 강력한 언어 모델의 오픈 소싱에 대한 Meta의 놀라운 발표는 놀라운 사건 전환으로 뉴스를 만들었습니다.
이 결정은 즉시 LLaMA 2를 AI 타이탄의 영역으로 끌어들여 OpenAI의 유명한 GPT-4와 장대한 결전의 무대를 마련했습니다. ChatGPT 및 Microsoft Bing의 강자입니다.
다양한 비교에서 LLaMA 2와 GPT-4 비교
놀라운 창조물인 LLaMA 2-Chat은 귀중한 인간 피드백. 이 프로세스에는 선호도 데이터 수집 및 훈련 보상 모델이 포함되며, 고스트 어텐션(GAtt). 또한 LLaMA 2-Chat은 개발의 필수 요소인 GPT-4 출력에 대한 교육을 통해 이점을 얻습니다.
LLaMA 2 대 GPT-4: 등급
모델의 효능을 평가하기 위해 Meta는 다음을 사용하여 인간 연구를 수행했습니다. 4,000개의 프롬프트, 를 활용 “승률” Vicuna 벤치마크와 유사한 지표를 사용하여 단일 및 다중 회전 프롬프트의 맥락에서 ChatGPT 및 PaLM과 같은 오픈 소스 및 폐쇄 소스 모델과 비교합니다.
인상적인 70B 라마 2 모델 GPT-3.5-0301과 동등하게 수행 그리고 Falcon, MPT 및 Vicuna와 같은 다른 모델을 능가합니다. LLaMA 2-Chat 모델은 오픈 소스 대안을 능가하는 단일 및 다중 회전 프롬프트 모두에 유용합니다. 와 함께 승률 36% 그리고 동률 31.5% ChatGPT에 비해 LLaMA 2-Chat은 그 패기를 증명합니다.
또한 MPT-7B-채팅 모델을 능가합니다. 60% 프롬프트 중. LLaMA 2-Chat 34B 모델의 전체 승률은 75% 동등한 크기의 Vicuna-33B 및 Falcon 40B 모델에 대한 것은 인상적인 업적입니다. 또한, 70B 모델 PaLM-bison 채팅 모델보다 훨씬 뛰어납니다.
LLaMA 2 대 GPT-4: 코딩
그러나 LLaMA 2와 GPT-4 사이의 코딩에 관해서는 수많은 성과에도 불구하고 LLaMA-2는 코딩과 관련하여 약점이 있습니다. 가 보여주는 코딩 능력에 미치지 못합니다. GPT-3.5(48.1) 그리고 GPT-4(67). MMLU 벤치마크는 LLaMA-2의 강점을 보여주지만 HumanEval은 StarCoder(33.6)와 같이 코딩을 위해 명시적으로 설계된 모델에 비해 코딩 기능이 다소 낮다는 것을 보여줍니다. 그럼에도 불구하고 LLaMA-2의 오픈 웨이트를 고려하면 시간이 지남에 따라 크게 개선될 가능성이 높습니다.
LLaMA 2 대 GPT-4: 쓰기
쓰기와 관련하여 LLaMA-2와 GPT-4는 현저한 차이를 보입니다. 그들의 접근 방식 시쓰기, 예를 들어, 이보다 더 뚜렷할 수는 없습니다. ChatGPT는 의도적인 단어 선택, 에 집중 음성학 그리고 ㅏ 더 세련된 어휘, 표현의 폭이 넓은 노련한 시인과 같다. 반대로 LLaMA-2는 다음을 선택합니다. 더 간단한 운율 단어 선택, 고등학교시와 비슷합니다.
나는 Llama-2와 GPT-4 모두에게 그들의 장대한 경쟁에 대한 시를 써달라고 요청했습니다. 어느 것이 어느 것인지 맞춰보세요.
========= 시 1 =========
기술이 짜여진 웅장한 태피스트리에서,
정보가 회전하고 아이디어가 쪼개지는 곳,
두 인물이 서 있고, 그들의 이야기가 얽혀 있습니다.
GPT와 라마-2,…— 짐 팬(@DrJimFan) 2023년 7월 18일
LLaMA-2는 더 작은 규모로 교육을 받았음에도 불구하고 훌륭한 출력, 베타 액세스 권한이 있는 여러 사용자의 피드백에 따라. 메타의 접근법, 처음에는 공개적으로 사용 가능한 데이터를 사용하여 그리고 나중에 이를 고품질 데이터로 보강하고 가지다 입증된 효과 더 적은 예제로 더 나은 결과를 얻을 수 있습니다. 모델의 출력은 개발의 세심한 특성에 대한 증거인 사람의 주석과 비교할 수 있는 것으로 관찰되었습니다.
LLaMA 2 vs GPT-4: 동일한 프롬프트의 결과
Llama 2의 데모 버전에만 액세스할 수 있다는 점을 감안할 때 이 두 모델을 전체적으로 비교하는 것은 완전히 공정하지 않을 수 있다는 점에 유의하는 것이 중요합니다. 그러나 GPT-4와 Llama 2 모두에 대해 동일한 프롬프트를 사용하면 몇 가지를 얻을 수 있습니다. 흥미로운 통찰력 각자의 능력과 문체 경향에 따라.
프롬프트: “챗봇의 중요성에 대한 100단어 길이의 글을 저에게 써주세요.”
- GPT-4:
GPT-4의 응답은 짧고 간결하지만 93 단어, 성공적으로 제공 정확한 정보.
- 라마 2 데모:
반면에 Llama 2는 122 단어. 주어진 프롬프트를 고려하면 약간 더 장황하지만 다음을 제공합니다. 엄청나게 상세한 정보.
LLaMA 2의 배경
LLaMA의 여정은 2월에 시작되어 AI 연구 커뮤니티 내에서 흥분을 불러일으켰습니다. 발표 직후 유출은 음모에 추가되었습니다. 이제 LLaMA 2가 오픈 소스 모델로 출시되면서 잠재 고객은 기하급수적으로 확장되었습니다. 이상으로 100,000건의 요청 초기 LLaMA 모델에 대해 수신한 LLaMA 2의 영향은 훨씬 더 심오할 것입니다.
Microsoft의 Inspire 이벤트에서 Meta는 Microsoft의 Azure 및 Windows 플랫폼에 대한 변함없는 지원을 선보였을 뿐만 아니라 폭탄을 떨어뜨렸습니다. LLaMA 2를 상업 및 연구 목적으로 자유롭게 액세스할 수 있도록 합니다. 이 움직임은 기업, 신생 기업 및 연구원이 이 획기적인 언어 모델의 잠재력을 활용할 수 있는 다양한 가능성을 열었기 때문에 중요한 이정표를 세웠습니다.
이전 버전과 비교하여 LLaMA 2는 상당한 개선을 거쳤습니다. 훈련 40% 더 많은 데이터, 공개적으로 사용 가능한 온라인 소스를 포함하여 LLaMA 2는 추론, 코딩, 숙련도 및 지식 테스트와 같은 영역에서 우수한 성능을 보여 Falcon 및 MPT와 같은 다른 대규모 언어 모델을 능가했습니다.
안전과 투명성을 최우선으로
Meta는 LLaMA 2에 엄격한 테스트를 거쳐 안전과 투명성에 대한 헌신을 보여주었습니다. “레드 팀” 그리고 미세 조정 적대적인 프롬프트를 통해. 이러한 노력으로 LLaMA 2는 최고의 안전 표준을 충족하고 연구원과 개발자가 투명한 평가 프로세스를 통해 성능을 명확하게 이해할 수 있습니다.
플랫폼 간 접근성
오픈 소스 원칙에 대한 약속에 따라, Meta는 LLaMA 2가 여러 플랫폼에서 액세스할 수 있도록 했습니다. Microsoft의 Azure를 통해 초기에 제공되는 LLaMA 2는 곧 다음과 같은 다른 플랫폼에서도 사용할 수 있습니다. AWS, 포옹하는 얼굴, 그리고 기타. 이 포괄적인 접근 방식은 개발자와 연구원 간의 광범위한 채택과 협업을 장려하여 AI 애플리케이션의 발전을 주도합니다.
AI에 대한 개방형 접근 방식의 힘
Meta의 오픈 소스 전략은 빠르게 진화하는 제너레이티브 AI 기술 환경과 일치합니다. LLaMA 2와 같은 최첨단 모델에 대한 액세스를 민주화함으로써 Meta는 개발자와 연구원의 협업 커뮤니티 모델을 집단적으로 스트레스 테스트하고, 잠재적인 문제를 식별하고, 솔루션을 촉진하여 궁극적으로 AI 혁신을 추진할 수 있습니다.
LLaMA 2 대 GPT-4 및 PaLM 2
LLaMA 2는 경쟁사인 GPT-4 및 PaLM 2보다 약간 덜 강력할 수 있지만 오픈 소스 특성과 Meta의 안전성 및 투명성 강조는 주요 차별화 요소. LLaMA 2는 200만 토큰, PaLM 2보다 적음 360만 토큰, 그리고 20개 언어를 지원하며, 뒤에 뒤지다 PaLM 2의 100개 언어와 GPT-4의 26개 언어. 그러나 오픈 소스 협업 및 커뮤니티 주도 개발의 힘은 이러한 차이를 상쇄하고 빠른 발전으로 이어질 수 있습니다.
AI 발전의 결정적 순간
오픈 소스 LLaMA 2 마크에 대한 Meta의 결정 AI 환경의 전환점. 이 강력한 언어 모델을 만들어서 자유롭게 접근 가능, Meta는 개발자와 연구원이 AI 혁신의 한계를 뛰어넘는 동시에 안전과 투명성을 최우선으로 할 수 있도록 지원합니다. 와의 협력 마이크로소프트 그리고 퀄컴 AI 애플리케이션의 밝은 미래를 더욱 확고히 하여 다양한 플랫폼과 장치에서 원활한 통합을 약속합니다.
개발자와 연구원이 LLaMA 2로 이 여정을 시작하고 LLaMA 2와 GPT-4의 경쟁이 계속됨에 따라 우리는 다음을 기대할 수 있습니다. 혁신적인 AI 기반 도구의 물결이 나타날 것입니다. 기술과의 상호 작용을 재구성합니다. 개방성에 대한 Meta의 약속은 AI 모델의 공동 개선 및 활용을 위한 선례를 설정하여 인공 지능의 미래를 형성할 차세대 AI 혁신을 위한 길을 닦습니다.
나타난 그림: 신용 거래
Source: LLaMA 2 vs GPT-4: AI 경주에서 Meta는 얼마나 경쟁력이 있습니까?