Miqu 70b와 Mistral 70b는 최근 Mistral Medium 누출로 마침내 공개되어 오랫동안 기다려온 오픈 소스 AI 모델을 밝히고 그 기능을 선보였습니다.
AI 세계는 “Miqu-1-70b” 모델과 Mistral AI의 비밀 Mistral Medium과의 잠재적인 연결로 떠들썩합니다. 1월 28일, ‘Miqu Dev’는 Hugging Face에 ‘miqu-1-70b’ 파일을 신비롭게 업로드했으며, 이어 4chan과 X에도 출연했습니다.
이 모델은 인상적이었고 일부 영역에서는 GPT-4와 경쟁하기도 했습니다. 아직 확신하지 못하셨나요? 보다 N8 프로그램‘ 아래 X에 게시하세요.
Miqu가 무엇이든 간에 그것은 일종의 특별한 소스를 가지고 있습니다. EQ-Bench(현지 평가)에서 83.5점을 획득하여 *GPT-4를 제외한 전 세계의 다른 모든 LLM*을 능가합니다. EQ-Bench는 MMLU와 0.97의 상관관계를 가지며 Arena Elo와는 0.94의 상관관계를 나타냅니다. Q4_K_M에서 Mistral Medium을 *이겼습니다*. 나… pic.twitter.com/0gOOPjxjPD
— N8 프로그램(@N8Programs) 2024년 1월 30일
Mistral Medium 누출로 Miqu 70b 및 Mistral 70b 공개
1월 28일, “Miqu Dev”라는 사용자가 AI 매니아들에게 인기 있는 플랫폼인 HuggingFace에 폭탄선언을 했습니다. 그들은 AI 세계에서 큰 화제를 불러일으키고 있는 Miqu 70B 모델을 구성하는 파일 세트를 업로드했습니다. 이 모델은 잠재적인 게임 체인저로 환영받고 있으며 일부에서는 GPT-4가 돈을 벌 수 있다고 주장합니다.
이 모델은 직원에게 필요한 실제 인증 테스트를 반영한 4가지 전문 독일 데이터 보호 교육 시험을 사용하여 테스트되었습니다. 결과는 인상적이었습니다. Miqu 1 70B 객관식 문제 18개 중 17개를 정확하게 답함, 콘텐츠에 대한 강력한 이해를 보여줍니다. 그러나 정보를 인정하면 “OK”로 응답하라는 지시를 따르지 않아 지시 준수가 부족했다.
다른 모델과 비교했을 때, Miqu 70B는 능숙한 언어 능력과 이중 언어 능력을 보여주었습니다.. 그러나 Mixtral-8x7B-Instruct-v0.1 모델이나 GPT-4, Goliath-120B-GGUF 및 Tess-XL-v1.0-GGUF와 같은 기타 상위 모델보다 성능이 뛰어나지는 않았습니다. 두 테스트 라운드 모두에서 만점을 받고 “OK” 지시를 준수했습니다.

Miqu 70B는 정말 Mistral Medium 유출인가요?
Miqu-1-70B의 기원은 미스터리로 남아 있으며 일부에서는 이것이 Mistral-Medium의 유출된 버전이거나 오래된 실험 버전이라고 추측하고 있습니다. 이 모델의 성능은 기술 커뮤니티에서 논쟁과 토론을 촉발시켰으며, 일부에서는 이것이 실제라고 주장하는 반면 다른 일부에서는 회의적이었습니다.
아서 멘쉬Mistral의 사장인 가 마침내 소문에 대해 언급했습니다. 그는 얼리 액세스 군중의 열성적인 비버가 약간 흥분하여 오래된 모델을 유출했음을 확인했습니다. 그러나 Mensch는 또한 그 이후로 잠재적으로 GPT-4를 능가할 수 있는 더 나은 모델을 준비하고 있음을 암시했습니다.
초기 액세스 고객 중 한 명의 열정적인 직원이 우리가 교육하고 공개적으로 배포한 이전 모델의 양자화된(워터마크가 포함된) 버전을 유출했습니다.
선택된 소수의 고객과 신속하게 작업을 시작하기 위해 우리는 Llama 2에서 이 모델을 재교육했습니다.
— 아서 멘쉬(@arthurmensch) 2024년 1월 31일
Mistral이 GPT-4와 동등한 오픈 소스 모델을 출시하면 AI 장면을 통해 충격파를 보낼 수 있습니다. 현재 상황에 도전할 준비가 된 새로운 경쟁자가 등장함에 따라 OpenAI는 뒤를 조심해야 할 수도 있습니다. 이번 유출은 AI의 완전히 새로운 시대를 밝히는 불꽃이 될 수 있습니다.
그렇다면 Mistral이 ChatGPT보다 나은가요?
Mistral이 ChatGPT보다 “더 나은”지 여부를 결정하는 것은 LLM에서 원하는 것과 “더 나은”을 정의하는 방법에 따라 다르기 때문에 어렵습니다. 다음은 귀하의 요구 사항에 더 적합한 것을 결정하는 데 도움이 되는 강점과 약점에 대한 분석입니다.
미스트랄
강점:
- 오픈 소스: Mistral은 일부 오픈 소스 모델을 포함하여 여러 모델을 제공하므로 개인 및 연구 목적으로 더 쉽게 접근할 수 있습니다.
- 능률: Mixtral-8x7B와 같은 Mistral 모델은 효율성이 뛰어난 것으로 알려져 있어 GPT-4와 같은 동급 모델에 비해 계산 능력이 덜 필요합니다.
- 투명도: 모든 모델이 오픈 소스인 것은 아니지만 Mistral은 ChatGPT를 사용한 OpenAI의 폐쇄 소스 접근 방식에 비해 개발 프로세스 및 연구에 대해 더 투명한 경향이 있습니다.
약점:
- 성능: 전반적으로 Mistral 모델은 텍스트 생성 및 번역과 같은 작업에 대한 벤치마크에서 GPT-4와 같은 상위 모델보다 약간 낮은 점수를 받는 경향이 있습니다.
- 접근성: Mistral의 가장 강력한 모델 중 일부(예: Mistral Medium)는 공개적으로 제공되지 않거나 대기자 명단 및 액세스 비용이 필요합니다.
- 제한된 커뮤니티: ChatGPT에 비해 Mistral은 사용자 기반과 커뮤니티가 더 작기 때문에 사용 가능한 리소스와 지원이 제한될 수 있습니다.

채팅GPT
강점:
- 성능: GPT-4는 현재 많은 벤치마크, 특히 창의적인 텍스트 생성 및 복잡한 대화와 같은 분야에서 최고의 성능을 보여줍니다.
- 접근성: OpenAI는 베타 프로그램과 API를 통해 ChatGPT에 대한 무료 액세스를 제공하므로 개인 용도로 더욱 쉽게 사용할 수 있습니다.
- 대규모 커뮤니티: 대규모 사용자 기반과 커뮤니티는 ChatGPT 사용을 위한 광범위한 리소스, 가이드 및 애플리케이션을 만듭니다.
약점:
- 비공개 소스: ChatGPT의 비공개 소스 특성으로 인해 모델의 투명성과 잠재적 편견에 대한 우려가 제기됩니다.
- 계산 비용: GPT-4는 상당한 컴퓨팅 성능을 요구하므로 제한된 리소스를 가진 개인이 접근하기 어렵습니다.
- 윤리적 우려: OpenAI의 액세스 제어 및 제한된 투명성으로 인해 책임 있는 개발 및 기술 오용 가능성에 대한 우려가 제기됩니다.
궁극적으로 “더 나은” 옵션은 우선순위에 따라 달라집니다. 효율성과 투명성이 뛰어난 오픈 소스 모델이 필요한 경우 Mistral이 적합할 수 있습니다. 최고의 성능과 광범위한 커뮤니티 지원을 우선시한다면 ChatGPT가 더 나은 선택일 수 있습니다.
주요 이미지 크레딧: 미스트랄 AI.
Source: Mistral AI가 AI 커뮤니티에 폭탄을 투하합니다.








