Apple은 최신 연구 혁신인 ReaLM(Reference Resolution As Language Modeling)을 통해 상당한 진전을 이루고 있습니다. 이 혁신은 Siri를 단순한 이미지 인식을 뛰어넘는 이해의 영역으로 끌어올려 잠재적으로 음성 비서와 상호 작용하는 방식에 혁명을 일으킬 것을 약속합니다.
스포일러 경고: Apple의 벤치마크 테스트에 따르면 이미 GPT-4를 능가합니다.
| 모델 | 전환 | 신디사이저 | 화면 | 보이지 않는 것 |
|---|---|---|---|---|
| 마르스 | 92.1 | 99.4 | 83.5 | 84.5 |
| GPT-3.5 | 84.1 | 34.2 | 74.1 | 67.5 |
| GPT-4 | 97.0 | 58.7 | 90.1 | 98.4 |
| ReALM-80M | 96.7 | 99.5 | 88.9 | 99.3 |
| ReALM-250M | 97.8 | 99.8 | 90.6 | 97.2 |
| REALM-1B | 97.9 | 99.7 | 91.4 | 94.8 |
| REALM-3B | 97.9 | 99.8 | 93.0 | 97.8 |
Apple의 ReaLM: Siri의 지능에 혁명을 일으키다
논문에 따르면 Apple의 ReaLM은 Siri에게 슈퍼 두뇌를 제공하는 것과 같습니다. 이는 Siri가 훨씬 더 스마트한 방식으로 말하는 내용을 이해하는 데 도움이 됩니다. 이에 대한 초기 인상은 다음과 같습니다.
- 화면을 보면: ReaLM은 텍스트나 그림 등 화면에 표시된 내용을 확인하여 도움이 필요한 것이 무엇인지 파악합니다.

- 대화 듣기: 또한 사용자가 Siri를 통해 말하는 내용에도 주의를 기울입니다. 따라서 앞서 언급한 내용을 Siri가 더 잘 기억하고 도와줄 것입니다.
- 주변에서 일어나는 일을 알아차리기: RealM은 어디에나 눈과 귀가 있는 것과 같습니다. 알람이 울리거나 음악이 재생되는지 여부를 파악하고 이에 따라 응답을 조정할 수 있습니다. 다음은 논문의 대화 예시입니다.
| 스피커 | 대화 |
|---|---|
| 사용자 | 근처 약국을 보여주세요. |
| 대리인 | 제가 찾은 목록은 다음과 같습니다. |
| 대리인 | … (목록 제시) |
| 사용자 | (예: 1) Rainbow Rd에 있는 전화로 전화하세요. |
| 사용자 | (예 2) 아래쪽에 전화를 겁니다. |
| 사용자 | (예: 3) 이 번호(화면에 표시됨)로 전화를 겁니다. |
- 일을 정말 잘하는 것: Apple은 다른 스마트 시스템과 비교하여 ReaLM을 테스트한 결과, ReaLM이 상황을 파악하는 데 정말 뛰어나다는 사실을 발견했습니다. 심지어 다른 시스템보다 훨씬 뛰어났습니다.
- 귀하의 장치에서 바로 작업: ReaLM은 iPhone이나 기타 Apple 장치에서 이 모든 스마트 기능을 수행합니다. 이는 귀하의 정보가 비공개로 유지되고 모든 것이 매우 빠르게 작동한다는 것을 의미합니다.
간단히 말해서, ReaLM은 당신이 하고 있는 일과 말하는 것에 대해 더 많이 이해하도록 도와줌으로써 Siri를 훨씬 더 똑똑하게 만들어 줄 것입니다.
Apple의 ReaLM 출시 날짜는 아직 발표되지 않았습니다. 그러나 ReaLM의 요소는 iOS 또는 macOS와 같은 Apple 소프트웨어의 향후 업데이트에 통합될 수 있습니다. 6월 세계 개발자 컨퍼런스(WWDC)와 같은 이벤트에서 더 많은 정보를 확인할 수 있습니다. 업데이트를 주목하세요!
주요 이미지 출처: Cottonbro studio/Pexels








