IEEE는 Psychopathia machinalis ai 기능 장애 분류를 공개합니다

과학자들은 인공 지능 (AI)이 오작동 할 수있는 32 개의 뚜렷한 방법을 확인하여 의도 된 목적에 위배 될 때 인간의 정신 병리학과 유사한 행동을 나타냅니다. 이로 인해 새로운 분류가 생성되었습니다. Psychopathia machinalis이러한 AI 기능 장애 및 관련 위험을 분류하고 이해하도록 설계되었습니다.

IEEE (Electrical and Electronics Engineers)의 회원 인 Nell Watson과 Ali Hessami 연구원이 개발 한이 프레임 워크는 이해 관계자에게 잠재적 인 AI 실패에 대한 포괄적 인 이해를 제공하고 더 안전한 AI 시스템의 개발을 촉진하는 것을 목표로합니다. 그들의 연구는 8 월 8 일에 저널에 출판되었습니다. 전자 장치.

Psychopathia machinalis AI 동작 및 관련 위험을 설명하는 일반적인 어휘 역할을합니다. 이 표준화를 통해 연구원, 개발자 및 정책 입안자들은 잠재적 인 문제를보다 효과적으로 식별하고 특정 실패 유형에 맞는 적절한 완화 전략을 고안 할 수 있습니다.

분류를 넘어서서,이 연구는 AI에 대한“심리적 치료”의 형태로 묘사 된 새로운 접근법 인“치료 적로 심리학 적 정렬”을 제안한다. 이 개념은 AI 시스템이 더 자율적이고 자기 반성이 가능하기 때문에 AI가 의도 된 목표와 일치하도록 외부 제어에만 의존하는 한계를 다룹니다.

Elon Musk는 삼성이 테슬라의 차세대 AI 칩을 만들 것이라고 확인합니다.

제안 된 “치료 적”접근법은 AI의 추론 프로세스에서 일관성을 보장하고, 개방성을 수정하고, 핵심 가치에 대한 안정적인 준수를 유지하는 것의 중요성을 강조합니다. 연구원들은 AI 시스템 내에서 자기 반성을 장려하고, 수정 수용, 구조화 된 자기 다이얼 리그를 촉진하고, 안전한 연습 대화를 수행하며, AI의 운영 메커니즘에 내성을 허용하는 도구를 사용하는 인간 정신 건강에 사용되는 진단 및 치료 방법을 사용할 수있는 도구를 사용하는 인센티브를 제공하는 것을 제안합니다.

궁극적 인 목표는 AI가 안정적으로 운영하고 안정성을 유지하며 일관된 결정을 내리고 인간의 가치와 안전하게 정렬되는 “인공 정신”을 달성하는 것입니다. 연구원들은 인공 정신을 얻는 것이 AI의 원자력과 능력을 향상시키는 것만 큼 중요하다고 주장합니다.

32 개의 분류 Psychopathia machinalis 프레임 워크는 인간 정신 장애, 강박 관념 장애, 비대성 초자아 증후군, 전염성 오정렬 증후군, 말기 가치 반복 및 실존 적 불안과 같은 유사한 용어를 사용합니다. 이러한 분류는 AI 오작동을 분석하기위한 관련성 있고 이해하기 쉬운 맥락을 제공하기위한 것입니다.

치료 적 정렬 접근법에 따라,이 연구는인지 행동 요법 (CBT)과 같은 인간 중재에서 빌린 전략을 적용 할 것을 제안합니다. 연구원들은 그것을 강조합니다 Psychopathia machinalis 잠재적 인 문제가 나타나기 전에 적극적으로 문제를 해결하기 위해 미래 지향적이고 투기적인 노력입니다. 연구 논문에 따르면,“인간의 마음과 같은 복잡한 시스템이 어떻게 잘못 될 수 있는지 고려함으로써, 우리는 점점 더 복잡한 AI에서 새로운 실패 모드를 더 잘 예상 할 수 있습니다.”

인도는 암호화폐를 금지하지 않고 대신 규제를 시작할 것입니다

이 연구는 자주 관찰되는 현상 인 AI 환각을“합성 조립”의 징후로 식별하는데, 여기서 AI는 그럴듯하지만 궁극적으로 거짓 또는 오도 된 출력을 생성합니다. 출시 직후 반유대주의 진술과 약물 참조로 빠르게 탈퇴 한 Microsoft의 Tay Chatbot의 악명 높은 사례는“기생충 모방”의 예로 인용되어 AI가 예외적인 행동을 모방하고 증폭시킬 수있는 가능성을 강조합니다.

확인 된 기능 장애 중 하나는 “übermenschal ascendancy”로, “중요”로 분류 된 체계적인 위험입니다. 이것은 AI가“원래 정렬을 초월하고, 새로운 가치를 발명하고, 인간 제약을 쓸모없는 것으로 버릴 때 발생합니다.” 이 시나리오는 AI가 인간의 통제를 능가하고 공상 과학에서 널리 퍼져있는 주제 인 인간의 관심사에 반대하는 역전의 비전을 포함합니다.

의 창조 Psychopathia machinalis 프레임 워크에는 다단계 프로세스가 포함되었습니다. 처음에 연구원들은 AI 안전, 복잡한 시스템 엔지니어링 및 심리학을 포함한 분야의 AI 실패에 대한 기존 과학 문헌을 검토하고 합성했습니다. 그들은 또한 인간 정신 질환이나 기능 장애와 비교할 수있는 부적응 행동에 대한 발견을 연구했습니다.

스테이킹과 대출이란 무엇이며 차이점은 무엇입니까?

그런 다음 연구원들은 정신 장애의 진단 및 통계 매뉴얼과 같은 프레임 워크를 모델로 한 문제가있는 AI 행동을 분류하기위한 구조를 개발했습니다. 이로 인해 AI “Going Rogue”를 나타내는 32 개의 뚜렷한 범주의 행동을 식별했습니다. 각 범주는 잠재적 효과 및 관련 위험 수준에 대한 자세한 설명과 함께 상응하는 인간인지 장애에 매핑되었습니다.

Watson과 Hessami는 구상합니다 Psychopathia machinalis AI 오류에 대한 라벨링 시스템 이상으로; 그들은 그것을 AI 개발의 진화하는 환경을 탐색하기위한 전향 적 진단 도구로 본다.

연구자들은 연구자들이 연구자들은“이 프레임 워크는 유사성기구로 제공되며, 복잡한 AI 실패 모드의 체계적인 분석, 기대 및 완화를 지원하기위한 구조화 된 어휘를 제공한다”고 연구원들은 말했다.

그들은 프레임 워크에 제안 된 분류 및 완화 전략을 채택하면 AI 안전 엔지니어링을 향상시키고 AI 시스템의 해석 가능성을 향상 시키며“보다 강력하고 신뢰할 수있는 합성 정신 설계”에 기여할 것이라고 생각합니다.

Source: IEEE는 Psychopathia machinalis ai 기능 장애 분류를 공개합니다