메타 AI: 이번 포스팅에서는 llama 2가 무엇이고 어떻게 사용하는지에 대해 설명드리겠습니다. Meta는 가장 최근의 Llama 2 LLM(대형 언어 모델)을 공개했습니다. 이 LLM은 유용성과 안전성을 포함한 대부분의 벤치마크에서 다른 오픈 소스 채팅 모델(GPT 포함)을 능가했습니다.
새 릴리스의 일부로 3개의 대체 모델(하나는 70억 개의 매개변수, 130억 개의 매개변수, 궁극적으로는 700억 개의 모델에 대해 훈련됨)을 게시하는 것 외에도 Meta AI는 보다 세련된 변형인 “Llama 2 Chat”도 제공하고 있습니다. 대화형 사용 사례 전용으로 설계되었습니다.
이것은 그 자체로 기술적인 성취이지만 더 흥미로운 점은 Meta와 Microsoft가 협력 강화를 발표하여 Microsoft 도구를 사용하는 개발자가 AI 경험을 만들 때 Meta의 Llama와 OpenAI의 GPT 모델 중에서 선택할 수 있도록 한다는 것입니다.
메타 AI: 라마 2가 무엇인가요?
자동 회귀 언어 모델 Llama 2의 변환기 아키텍처가 최적화되었습니다. Llama 2는 영어로 된 상업적 및 학술적 사용을 목적으로 합니다. 사전 훈련되고 미세 조정된 다양한 변형과 70억에서 700억에 이르는 매개변수 크기로 제공됩니다.
Meta에 따르면 조정된 버전은 지도 미세 조정(SFT) 및 인간 피드백을 통한 강화 학습(RLHF)을 통해 안전과 유용성에 대한 인간의 선호도에 적응합니다. Llama 2를 사전 훈련하는 데 공개적으로 액세스할 수 있는 소스의 2조 개의 데이터 토큰이 사용되었습니다.
사전 훈련된 모델은 다양한 자연어 생성 작업을 위해 수정될 수 있지만 맞춤형 모델은 비서와 같은 대화를 위해 설계되었습니다. 개발자가 어떤 모델을 선택하든 메타 AI 책임 있는 사용 지침은 적절한 안전 완화로 모델을 맞춤화하고 최적화하는 데 필요할 수 있는 추가 미세 조정을 지시하는 데 도움이 될 수 있습니다.
라마 2를 사용하는 방법?
Meta AI의 Llama 2를 직접 플레이하고 싶다면 좋은 소식이 있습니다. Huggingface에는 쉽게 사용할 수 있는 데모 버전이 있습니다. 다음의 간단한 단계를 따르십시오.
- 이 페이지를 방문하십시오.
- 웹 사이트에 도착하면 “데모”라고 표시된 섹션이 보일 때까지 아래로 스크롤합니다.
- 거기에 채팅창이 있습니다. 지금 바로 메시지를 입력하세요.
- 메시지를 보내려면 Enter 키를 누르십시오.
SageMaker Studio UI 및 SageMaker Python SDK의 SageMaker JumpStart를 통해 기초 모델에 액세스할 수 있습니다. 이 섹션에서는 SageMaker Studio에서 모델 찾기에 대해 설명합니다.
SageMaker Studio라는 통합 개발 환경(IDE)은 데이터 수집에서 ML 모델 생성, 테스트 및 배포에 이르기까지 모든 ML 개발 작업을 수행하기 위해 특별히 생성된 도구에 액세스할 수 있는 단일 웹 기반 시각적 인터페이스를 제공합니다. SageMaker Studio 설치 및 설정 방법에 대한 자세한 내용은 Amazon SageMaker Studio를 참조하십시오.
SageMaker Studio에서 사전 구축 및 자동화된 솔루션을 클릭하여 사전 훈련된 모델, 노트북 및 사전 구축된 솔루션이 포함된 SageMaker JumpStart에 액세스합니다.
SageMaker JumpStart 랜딩 페이지에서 솔루션, 모델, 노트북 및 기타 리소스를 검색할 수 있습니다. Foundation Models: Text Generation 캐러셀에는 선택할 수 있는 두 가지 주요 Llama 2 모델이 있습니다. Llama 2 모델이 보이지 않으면 중지했다가 다시 시작하여 SageMaker Studio 버전을 업데이트하십시오. 버전 업데이트에 대한 자세한 내용은 Studio 앱 종료 및 업데이트를 참조하세요.
모든 텍스트 생성 모델 탐색을 선택하거나 검색 상자에 “llama”를 입력하면 나머지 네 가지 모델 변형을 찾을 수도 있습니다.
라이선스, 사용된 교육 데이터, 사용 지침을 포함하여 모델에 대한 정보를 읽으려면 모델 카드를 선택합니다. 배포 및 노트북 열기는 모델 사용에 도움이 되는 두 개의 추가 버튼입니다.
버튼을 선택할 때 나타나는 팝업에서 최종 사용자 라이선스 계약 및 허용되는 사용 정책을 인식해야 합니다.
모델을 승인한 후 다음 단계로 넘어갑니다.
다음 예제는 학습 데이터에 대한 모델 액세스 권한을 부여하여 컨텍스트 내 학습을 통해 라마 모델을 사용하는 방법을 보여줍니다. 우리는 배포된 모델에서만 결론을 도출하고 모델 가중치는 전체적으로 일정하게 유지된다는 점을 명심하십시오.
입력: 영어를 프랑스어로 번역:
해달 => 루트르 드 메르
페퍼민트 => 멘트 푸아브레
플러시 기린 => girafe peluche
치즈 =>산출:
프로마쥬
초콜릿 => 초콜릿
자동차 => 음성
햄스터 => 햄스터
맥주 => 비에르
자전거 => 자전거
바나나 => 바나나
딸기 => 프라이즈
피자 => 피자
치즈버거 => 치즈버거
파인애플 => 아나나스
당근 => 당근
수박 => 파스타
고래 => 베일린
가지 => 가지
고양이 => 채팅
펭귄 => 만초
사자 => 사자
코끼리 => 코끼리
판다 => 판다
호랑이 => 호랑이
연어 => 사우몬
다람쥐 => écureuil
캥거루 => 캥거루
거북이 => 고문
문어 => 풀페
개구리 => 그르누이
돼지 => 코촌
금붕어 => 푸아송 루즈
타이거 샤크 => 레퀸 티그레
고릴라 => 고릴라
돌
메타 AI
Azure AI 모델 라이브러리에서 Llama 2의 가용성은 Microsoft Inspire 컨퍼런스에서 Microsoft에 의해 공개되었습니다. 이제 프로그래머는 이를 사용하여 만들 수 있습니다. 또한 Windows에서 로컬로 작동하도록 설계되어 AI 개발자의 워크플로를 더 간단하게 만듭니다. AWS의 Amazon SageMaker Jumpstart 허브도 Llama 2를 제공하며 추가 공급업체가 이를 따를 것입니다.
교체 가능한 AI 프레임워크를 위해 Microsoft와 Meta AI 간의 개방형 에코시스템 출시도 공개되었습니다. 딥 러닝 모델을 위한 ONNX(Open Neural Network Exchange) 표준은 2017년 Meta AI(구 Facebook)에서 처음 발표했으며 이때 개발이 시작되었습니다.
두 사람은 특히 전 세계적으로 더 많은 기업이 근본적인 AI 기술에 접근할 수 있도록 허용함으로써 개방형 AI의 개발을 장려하겠다고 다짐했습니다.
Meta AI에 따르면 Llama 2 모델은 직원들이 모델의 보안 아키텍처에서 약점을 식별하고 안전을 보장하는 임무를 맡은 레드 팀 구성 프로세스를 거쳤습니다. 또한 모델의 미세 조정을 돕기 위해 외부 소스를 사용하여 “적대적 프롬프트”를 생성했습니다.
Llama 2를 자세히 설명하는 연구 기사의 투명성 도식은 모델의 단점과 Meta가 향후 이를 처리할 계획을 설명합니다. Llama 2 사용자는 유해한 코드 생성, 미성년자에게 정보 또는 자료의 무단 전송 또는 테러를 조장하는 콘텐츠 생성을 위해 모델을 사용하는 것을 금지하는 “사용 제한” 정책을 준수해야 합니다. 여기에서 전체 목록에 액세스할 수 있습니다.
프로그래머가 “어려운 문제를 해결하기 위해” 언어 모델을 채택하도록 장려하기 위해 Meta는 더 많은 정보와 함께 Llama Impact Challenge를 시작했습니다.
떠나기 전에 기사를 읽어보세요: 대화를 더 잘 즐길 수 있는 15가지 최고의 Character AI 아이디어
추천 이미지 크레딧: 언플래쉬.
Source: 메타 AI: 라마 2란 무엇이며 어떻게 사용합니까?