AI 추론 모델의 탄소 발자국은 크게 다릅니다

최근에 발표 된 연구 의사 소통의 프론티어 인공 지능의 환경 영향에 비판적인 빛을 발산하여 모든 AI 프롬프트가 탄소 배출과 관련하여 모든 AI 프롬프트가 동일하게 생성되는 것은 아닙니다. 이 연구는 대형 언어 모델 (LLMS) 내에서보다 복잡한 “추론 모델”이 “간결한”상대보다 훨씬 더 많은 COS를 생성 할 수 있으며, AI의 에너지 요구에 관한 연구원과 기후 옹호자들 사이에서 우려를 불러 일으킨다는 것을 강조합니다.

다양한 주제 영역에서 표준화 된 500 개의 질문 세트를 사용하여 14 개의 다른 LLM을 세 심하게 평가 한이 연구는 쿼리 당 모델에 의해 생성 된 “사고 토큰”의 수와 관련 COS 배출량 사이의 직접적인 상관 관계를 발견했습니다. Hochschule München University of Applied Sciences University의 박사 과정 학생 이자이 논문의 주요 저자 인 Maximilian Dauner는“훈련 된 LLM의 질문에 대한 환경 적 영향은 추론 접근법에 의해 강력하게 결정되고 있으며, 명백한 추론 과정은 에너지 소비와 탄소 감정을 크게 유발합니다.

구체적으로, 결과는 더 큰 훈련 세트를 가지고 있고 더 많은 처리 시간이 필요한 추론 모델이 실질적으로 더 높은 COS 출력을 생성했음을 나타냅니다. 경우에 따라, 이러한 정교한 모델은 간결한 모델의 배출량의 최대 50 배까지 생성되었습니다. 이 불균형은 제기 된 질문의 복잡성에 의해 더욱 악화된다. 고급 대수 또는 철학적 개념과 같은 개방형 또는 복잡한 쿼리는 고등학교 역사 질문과 같은 단순한 프롬프트에 비해 탄소 발자국이 더 커졌습니다.

때때로 “사고 모델”이라고도하는 추론 모델은 논리, 단계별 분석 또는 상세한 지침을 필요로하는 복잡한 작업을 해결하기 위해 최적화됩니다. OpenAI의 GPT-4O 및 O1/O3-MINI와 같은 버전으로 예시 된이 모델은 LLM 연구원이 “사슬의 생각”처리라는 용어를 사용합니다. 이를 통해 처리 시간 증가와 결과적으로 더 높은 에너지 소비의 절충에도 불구하고 더 의도적으로 반응하고 인간과 같은 반응을 생성 할 수 있습니다. 반대로, 일반화 된 모델은보다 간단한 작업을 위해 속도와 명확성을 우선시합니다.

Alexa로 구동되는 Amazon의 새로운 바퀴 달린 로봇, Astro

연구원들은 두 단계로 테스트를 수행했습니다. 처음에는 객관식 질문과 함께 자유 응답 프롬프트가 이어졌습니다. 평균적으로 추론 모델은 질문 당 놀라운 543.5 토큰을 생성했으며, 이는 간결한 모델로 생성 된 37.7 토큰과는 대조적입니다. 예를 들어, 가장 정확한 추론 모델로 확인 된 “Cogito”는 간결한 응답을 위해 최적화 된 유사하게 크기의 모델보다 3 배 많은 COS를 생성했습니다. 이 논문은“환경 적 관점에서, 추론 모델은 주로 토큰 생산량이 높아진 것에 의해 주로 추론 된 추론 모델이 일관되게 더 높은 배출량을 보여 주었다”고 명시 적으로 명시 적으로 명시했다.

개별 프롬프트 당 배출량의 차이는 한계처럼 보일 수 있지만 규모의 누적 효과는 중요합니다. 이 연구는 DeepSeek의 R1 모델 600,000 질문을 요청하면 런던에서 뉴욕까지의 왕복 비행과 거의 같은 양의 COS를 생성 할 것입니다. 이에 비해 비 계급 Qwen 2.5 모델은 동등한 배출 수준에 도달하기 전에 많은 질문에 3 배 많은 질문에 대답 할 수 있습니다. 이는 “모델 크기가 증가함에 따라 정확도가 향상되는 경향이 있기 때문에 LLM 정확도와 환경 지속 가능성 사이의 중요한 트레이드 오프를 강조합니다. 그러나”이 게인은 또한 공동 배출 및 생성 된 토큰의 수의 실질적인 성장과 관련이 있습니다. “

테슬라, 캘리포니아에서 텍사스로 본사 이전

이러한 결과는 기술 거인들 사이의 치열한 글로벌 경쟁 속에서 점점 더 진보 된 AI 모델을 개발하기 위해 등장합니다. AI 중심 인프라에 대한 증가하는 수요는 기존 에너지 그리드에 상당한 긴장을 가질 준비가되어 있습니다. 지난 1 년 동안 애플은 향후 4 년간 5 천억 달러의 제조 및 데이터 센터를 투자 할 계획을 발표했다. 마찬가지로 OpenAi, SoftBank 및 Oracle과 관련된 공동 작업 이니셔티브 인 Project Stargate는 AI 중심 데이터 센터에 5 천억 달러를 약속했습니다. MIT Technology Review의 최근 보고서에 따르면 2017 년 이래로 데이터 센터는 복잡한 AI 계산을 위해 특별히 설계된 에너지 집약적 인 하드웨어를 점점 더 많이 통합하여 에너지 소비가 급증했습니다.

EPRI (Electric Power Research Institute)는 고급 AI 모델을 지원하는 데이터 센터가 10 년 말까지 미국 총 에너지 수요의 최대 9.1 %를 차지할 수 있다고 추정하고 있으며, 이는 오늘날 약 4.4 %에서 크게 증가한 것으로 추정됩니다. 이러한 급성장하는 에너지 수요를 충족시키기 위해 주요 기술 회사는 다양한 발전 전략을 탐색하고 있습니다. Meta, Google 및 Microsoft는 원자력 발전소와의 모든 위조 파트너십을 보유하고 있습니다. 특히, Microsoft는 펜실베이니아 주 3 마일 섬 원자력 시설에서 에너지를 공급하기 위해 20 년간의 계약을 체결하여 성장하는 데이터 센터 함대에 힘을 발휘했습니다. Meta는 또한 지열 기술에 상당한 투자를하고있는 반면, Openai CEO Sam Altman은 실험 핵 융합에 투자하여 AI의 시대가“에너지 혁신”이 필요하다는 것을 인정했습니다. 이러한 노력에도 불구하고 최근의 연구에 따르면 AI의 대규모 에너지 요구 사항을 완전히 충족시키기 위해서는 더 많은 화석 연료, 특히 천연 가스가 필요할 것이라는 것이 거의 확실합니다.

SF6 캐릭터: 필요한 스트리트 파이터 6 가이드

그러나 연구자들은 그들의 연구 결과가 일상적인 AI 사용자가 탄소 충격을 완화 할 수 있도록 힘을 실어 줄 수 있다고 생각합니다. 추론 모델의 에너지 강도가 상당히 높음을 이해함으로써 사용자는 웹 검색 및 기본 질문 응답과 같은 일반적인 일상 작업에 간결한 모델에 의존하여 더 드물게 사용하도록 선택할 수 있습니다. Dauner는이 점을 강조하면서“사용자가 자신을 액션 피겨로 바꾸는 등 AI 생성 출력의 정확한 비용을 알고 있다면 이러한 기술을 언제 어떻게 사용하는지에 대해 더 선택적이고 사려 깊을 수 있습니다.” 에너지 효율적인 AI 설계의 지속적인 발전과 함께이 사전 예방 적 행동은 인공 지능의 빠른 확장으로 제기 된 환경 문제를 탐색하는 데 중요 할 것입니다.

Source: AI 추론 모델의 탄소 발자국은 크게 다릅니다

AI 추론 모델의 탄소 발자국은 크게 다릅니다

Related Stories

AMD는 Newegg Q3 독점으로 Ryzen 7 7700X3D를 329달러에 출시합니다.

Google, 미국 내 타사 Android 스토어에 Play 카탈로그 공개

Spotify, 무료 어린이 관리 계정을 6개 주요 시장으로 확대

OpenAI, 230달러짜리 Codex Micro 키보드 공개