젠슨 황 엔비디아 CEO(EPA=연합뉴스)
네모트론3 슈퍼는 총 1200억개 파라미터를 갖춘 하이브리드 전문가혼합(MoE) 구조 기반 모델이다. 추론 과정에서는 120억개의 파라미터만 활성화해 효율성을 높였다.
엔비디아에 따르면 해당 모델은 이전 세대 ‘네모트론 슈퍼’ 대비 최대 5배 높은 처리량과 2배 향상된 정확도를 제공한다.
또 최대 100만 토큰 컨텍스트 윈도를 지원해 복잡한 멀티 에이전트 작업에서 문맥 유지 능력을 강화했으며, 다중 토큰 예측 기술을 통해 추론 속도를 약 3배 높였다.
이 모델은 엔비디아의 최신 블랙웰(Blackwell) GPU에서 NVFP4 정밀도로 작동하며 이전 세대 호퍼(Hopper) GPU 대비 최대 4배 빠른 추론 성능을 제공한다.
현재 모델은 허깅페이스(Hugging Face), 오픈라우터(OpenRouter) 등을 통해 다운로드할 수 있다. AI 검색엔진 퍼블렉시티(Perplexity) AI도 해당 모델을 서비스에 적용한 것으로 알려졌다.
엔비디아는 같은 날 네덜란드 암스테르담에 본사를 둔 AI 클라우드 기업 네비우스에 20억 달러를 투자한다고 발표했다.
양사는 협력을 통해 2030년까지 5기가와트(GW) 규모의 엔비디아 시스템 기반 AI 인프라를 구축할 계획이다. 이는 약 400만 가구에 전력을 공급할 수 있는 수준의 컴퓨팅 인프라 규모다.
네비우스는 이번 파트너십을 통해 엔비디아의 차세대 플랫폼인 ‘루빈(Rubin)’을 포함한 최신 가속 컴퓨팅 기술에 대한 조기 접근 권한도 확보한다.
엔비디아(EPA=연합뉴스)
이번 투자는 엔비디아가 최근 광통신 장비 기업 루멘텀(Lumentum)과 코히어런트(Coherent)등에 각각 20억 달러를 투자한 데 이은 AI 생태계 확대 전략의 일환으로 풀이된다.
한편 이번 발표는 엔비디아 연례 개발자 행사인 엔비디아 GTC 개막을 약 일주일 앞두고 나왔다. 오는 16일 개막하는 GTC에서는 차세대 GPU 플랫폼을 포함한 추가 AI 전략이 공개될 것으로 전망된다.









