Apple은 계속해서 최고 속도로 인공 지능을 개발하고 있습니다. 마지막으로 OpenELM(.dll)이라는 새로운 오픈소스 인공지능 모델 시리즈를 출시했습니다.
클라우드 서버 없이 사용자에게 인공 지능의 성능과 기능을 제공하는 것을 목표로 하는 Apple은 이러한 모델의 가장 중요한 특징은 장치에서 작업할 수 있다는 것이라고 말합니다.
그 사이에 우리는 최근 iOS 18의 AI LLM에 대한 Bloomberg의 Mark Gurman의 진술과 세부 사항을 공유했습니다. 새로운 인공 지능 모델에 대해 우리가 알고 있는 모든 것은 다음과 같습니다.
OpenELM이란 무엇입니까?
OpenELM은 8개의 모델로 구성되어 있습니다. 4개는 사전 훈련되어 있고 나머지는 특정 지침과 입력을 통해 맞춤설정될 수 있습니다. 모델은 상대적으로 작으며(2억 7천만 ~ 30억 개의 매개변수) 장치에서 실행되도록 최적화되어 있습니다.
Apple은 레이어 기반 확장 전략을 사용하여 모델의 정확성과 효율성을 향상합니다.
반면 OpenELM 모델을 사용하면 많은 이점을 얻을 수 있습니다.:
- 온디바이스 AI 처리: OpenELM 모델을 사용하면 클라우드 서버 없이 AI 기능을 기기에서 직접 수행할 수 있습니다. 이는 개인 정보 보호와 데이터 보안을 크게 향상시킵니다.
- 비용 절감: 클라우드 서버에 대한 의존도가 낮아져 비용 절감 효과가 있습니다.
- 더 빠른 응답 시간: 온디바이스 데이터 처리를 통해 응답 시간이 빨라지고 사용자 경험이 더욱 원활해집니다.
- 더 많은 연구와 개발: OpenELM 모델은 오픈 소스이므로 연구원과 개발자가 이를 연구하고 개선할 수 있습니다. 이는 AI 기술의 발전과 차세대 애플리케이션 개발을 가속화합니다.
Apple은 새로운 언어 모델에 대해 다음과 같은 성명을 발표했습니다.:
대규모 언어 모델의 재현성과 투명성은 공개 연구를 발전시키고 결과의 신뢰성을 보장하며 데이터 및 모델 편향과 잠재적 위험에 대한 조사를 가능하게 하는 데 매우 중요합니다. 이를 위해 최첨단 개방형 언어 모델인 OpenELM을 출시합니다. OpenELM은 레이어별 스케일링 전략을 사용하여 변환기 모델의 각 레이어 내에 매개변수를 효율적으로 할당함으로써 정확성을 향상시킵니다. 예를 들어, 약 10억 개의 매개변수로 구성된 매개변수 예산을 사용하는 OpenELM은 OLMo에 비해 정확도가 2.36% 향상되는 동시에 사전 훈련 토큰이 2배 더 적게 필요합니다.
모델 가중치와 추론 코드만 제공하고 비공개 데이터 세트에 대한 사전 훈련을 제공하는 이전 관행과 달리, 우리 릴리스에는 훈련 로그, 다중 체크포인트 및 사전 훈련을 포함하여 공개적으로 사용 가능한 데이터 세트에 대한 언어 모델을 훈련하고 평가하기 위한 완전한 프레임워크가 포함되어 있습니다. 구성. 또한 Apple 장치에서 추론 및 미세 조정을 위해 모델을 MLX 라이브러리로 변환하는 코드도 출시합니다. 이 포괄적인 릴리스는 개방형 연구 커뮤니티에 권한을 부여하고 강화하여 미래의 개방형 연구 노력을 위한 길을 닦는 것을 목표로 합니다.
또한, OpenELM에 대해 더 자세히 알아보고 싶다면 상세 보고서를 확인해보세요.
Apple의 계획에는 iOS 18 운영 체제에서 OpenELM 모델을 사용할 수 있도록 하는 것이 포함됩니다. iOS 18은 AI에 초점을 맞춘 중요한 개선 사항을 포함하고 대규모 언어 모델을 실행할 것으로 예상됩니다. (LLM) 장치에서.
OpenELM 모델은 인공지능의 미래를 위한 중요한 단계로 간주됩니다. 새로운 모델을 통해 AI는 더욱 개인화되고 안전하며 접근 가능해질 것으로 예상됩니다.
애플의 움직임은 인공지능을 확산시키고 이를 일상생활의 모든 측면에 통합시키는 데 중요할 수 있다.
주요 이미지 출처: Keming Tan / Unsplash