Meta Cicero AI, 보드 게임 Diplomacy에서 인간 수준의 성능 달성

잘 알려진 보드 게임 Diplomacy에서 Meta Cicero AI는 인간과 비슷한 수준의 성능을 발휘할 수 있었습니다. GPT-3와 유사한 모델을 사용합니다.

Meta AI는 화요일 전략 보드 게임 Diplomacy에서 인간 수준에서 수행하는 최초의 AI라고 주장하는 Cicero의 생성을 공개했습니다. 강력한 대인협상능력이 요구되는 게임이라는 점과 시세로가 일정 수준의 언어능력을 갖춰야 승리할 수 있다는 점에서 주목할만한 성과다.

보드 게임은 Deep Blue가 1997년 체스에서 Garry Kasparov를 상대로 승리하기 전부터 오랫동안 AI 개발의 효과적인 척도 역할을 해왔습니다. 2015년 알파고가 바둑 고수 이세돌을 꺾으면서 또 하나의 장벽이 무너졌다. 이 두 게임 모두 합리적으로 명시적인 일련의 분석 규칙을 준수합니다(그러나 Go의 규칙은 일반적으로 컴퓨터 AI에 맞게 수정됨).

Meta Cicero AI는 Diplomacy라는 보드 게임에서 인간 수준의 성능에 가깝습니다.

그러나 Diplomacy 게임 플레이의 중요한 요소는 사회적 기술을 요구합니다. 성공하려면 플레이어는 공감 능력을 발휘하고 자연스럽게 말하고 관계를 발전시켜야 합니다. 이는 컴퓨터 플레이어에게 어려운 일입니다. 이에 메타는 “인간과 유사한 방식으로 전략적 목표를 달성하기 위해 언어를 사용하여 사람들과 협상하고 설득하고 협력할 수 있는 보다 효과적이고 유연한 에이전트를 구축할 수 있을까?”라고 질문했습니다.

SEC, 코인베이스 고소: 법적 전투가 암호화폐 산업을 뒤흔들다

Meta Cicero AI, 보드 게임 Diplomacy에서 인간 수준의 성능 달성 — **Meta Cicero AI는 보드 게임 Diplomacy에서 인간 플레이어와 매우 유사하게 수행되었습니다.**

Meta에 따르면 대답은 ‘예’입니다. Meta Cicero AI는 webdiplomacy.net에서 온라인 외교 게임을 하면서 기술을 개발했습니다. 시간이 지남에 따라 인간 플레이어의 “평균 점수의 두 배 이상”을 달성했으며 결국 여러 게임에서 플레이어의 상위 10%에 들어가 게임을 마스터했음을 증명했습니다.

Meta AI Cicero는 전략적 추론(AlphaGo와 유사) 및 자연어 처리(GPT-3와 유사) 방법을 사용하여 개발되었습니다. Cicero는 게임판의 상태와 대화의 역사를 관찰하여 각 게임 동안 다른 플레이어의 행동을 예측합니다. 사람처럼 들리는 대화를 생성할 수 있는 언어 모델을 사용하여 다른 참가자와 함께 작업할 수 있도록 하는 전략을 만듭니다.

Cicero 성격의 핵심은 그의 자연어 능력에서 찾을 수 있으며 Meta는 이를 “제어 가능한 대화 모델”이라고 합니다. Cicero는 GPT-3과 유사한 방대한 웹 스크랩 텍스트 모음을 사용합니다.

“제어 가능한 대화 모델을 구축하기 위해 우리는 인터넷의 텍스트로 사전 훈련되고 webDiplomacy.net에서 40,000개 이상의 인간 게임에 대해 미세 조정된 27억 개의 매개변수 BART와 같은 언어 모델로 시작했습니다.”라고 Meta는 말했습니다.

최종 모델은 도전적인 게임의 뉘앙스를 파악했습니다. Meta에 따르면 Cicero는 “예를 들어 게임 후반에 특정 플레이어의 지원이 필요할 것이라고 추론할 수 있습니다.”라고 Meta는 말합니다. 그 선수는 그들의 특정한 관점에서 본다.”

설명: Apple의 iPhone 15 AAA 긴급 출동 서비스

Meta Cicero AI의 연구는 “언어 모델과 전략적 추론을 결합하여 외교 게임에서 인간 수준 플레이”라는 제목 아래 사이언스 저널에 게재되었습니다.

더 넓은 적용 측면에서 Meta는 Cicero 연구가 예를 들어 누군가에게 새로운 기술을 가르치기 위해 장기간의 토론을 지속함으로써 사람과 AI 사이의 “커뮤니케이션 장벽을 완화”할 수 있다고 주장합니다. 또는 NPC가 사람처럼 대화할 수 있는 비디오 게임의 원동력일 수도 있고 플레이어의 의도를 파악하고 진행함에 따라 변경될 수도 있습니다.

동시에 이 기술은 상황에 따라 사람을 사칭하고 잠재적으로 위험한 방식으로 사람을 속임으로써 사람을 조종하는 데 사용될 수 있습니다. 이와 함께 Meta는 다른 연구자들이 “책임감 있는 방식으로” 코드를 구축할 수 있기를 바라며 “이 새로운 영역에서 유해한 메시지”를 탐지하고 제거하기 위한 조치를 취했다고 말했습니다. 이는 Meta Cicero AI가 인터넷에서 학습한 대화를 의미할 가능성이 높습니다 수집한 텍스트는 항상 대규모 언어 모델의 위험입니다.

이 회사는 Meta Cicero AI의 작동 방식을 설명하는 자세한 사이트를 제공했으며 GitHub에서 Cicero의 코드를 오픈 소스로 제공했습니다. 온라인 외교 팬과 어쩌면 우리 모두가 조심해야 할 수도 있습니다.

그럼에도 불구하고 상황에 따라 이 기술은 사칭을 통해 개인을 속이고 조작하는 데 사용될 수 있습니다. Cicero가 수집한 인터넷 텍스트에서 수집한 대화(항상 큰 언어 모델의 위험이 있음)를 언급할 가능성이 있는 Meta는 “이 새로운 영역에서 독성 메시지”를 탐지하고 제거하기 위한 조치를 취했으며 다른 연구자들이 이를 기반으로 구축하기를 희망한다고 말했습니다. “책임감 있는 방식으로” 코드를 작성합니다.

NVIDIA GeForce Now는 웹 앱과 함께 iOS에 도착합니다.

GitHub에 Meta Cicero AI의 소스 코드를 게시하는 것 외에도 이 회사는 작동 방식을 설명하는 포괄적인 웹 사이트를 유지 관리합니다. 온라인 외교의 팬들은 우리 모두와 마찬가지로 주의를 기울여야 합니다.

webDiplomacy는 어떻게 플레이하나요?

게임에서 공급 센터의 절반을 통제하는 첫 번째 국가가 되는 것이 외교의 목표입니다. 보드 주위로 군대를 이동하고 다른 플레이어와 전투에 참여하여 공급 센터를 장악함으로써 이를 수행할 수 있습니다. 연말에 당신이 통제하는 각 공급 센터에 대해 더 많은 공급 센터를 인수하고 대의를 승리로 이끄는 데 사용할 수 있는 새로운 유닛을 건설하게 됩니다. 공급 센터를 다른 플레이어에게 빼앗기는 대신 유닛을 해체해야 더 많은 공급 센터를 놓고 경쟁할 수 있는 유닛이 더 적어집니다.