Google. (REUTERS)
구글은 젬마 4에 대해 ‘용량 대비(Byte for byte)’ 전례 없는 수준의 지능을 제공하도록 설계됐으며, 특히 고급 추론과 에이전트 기반 워크플로우(Agentic workflows)에 최적화된 성능을 갖췄다고 강조했다.
구글 딥마인드에 따르면 젬마 시리즈는 첫 출시 이후 개발자 커뮤니티에서 4억회 이상의 다운로드를 기록했고, 10만개 이상의 변형 모델이 생성되는 등 이른바 ‘젬마버스(Gemmaverse)’라는 거대한 생태계를 구축했다. 젬마 4는 이러한 전 세계 혁신가들의 피드백과 요구를 적극적으로 반영해 탄생한 결과물이라고 구글은 설명했다. 성능 지표인 ‘아레나 AI(Arena.ai) 텍스트 리더보드’에서 젬마 4 31B 모델은 오픈 모델 기준 세계 3위, 26B 모델은 6위를 기록하며 압도적인 기술력을 입증했다. 특히 젬마 4는 자신보다 20배나 큰 대형 모델들을 능가하는 파라미터 효율성을 보여주며 적은 자원으로도 최첨단 기능을 구현할 수 있음을 증명했다.
이번 젬마 4 제품군은 총 네 가지 크기로 제공돼 사용 목적에 따른 선택의 폭을 넓혔다. 구체적으로는 △Effective 2B(E2B) △Effective 4B(E4B) △26B 전문가 믹스(MoE) △31B Dense 모델이 포함된다. 26B MoE 모델은 레이턴시 최적화에 집중해 전체 파라미터 중 약 38억개만을 활성화함으로써 매우 빠른 응답 속도를 자랑하며, 31B Dense 모델은 출력 품질에 초점을 맞춰 미세 조정(Fine-tuning)을 위한 기반 모델로 활용하기에 적합하다. 엣지 컴퓨팅을 위한 E2B와 E4B 모델은 온디바이스(On-device) 환경에서 멀티모달 기능을 구현하는 데 최적화되어 스마트폰이나 IoT 기기에서도 강력한 인텔리전스를 제공한다.
젬마 4의 가장 큰 특징 중 하나는 ‘에이전트 기반 워크플로우’의 전면적인 지원이다. 다단계 계획 수립과 깊은 논리적 사고가 가능한 고급 추론 기능을 바탕으로, 함수 호출(Function-calling), 구조화된 JSON 출력, 네이티브 시스템 지침 등을 기본 제공한다. 이를 통해 개발자는 다양한 API 및 툴과 상호작용하며 복잡한 업무를 자율적으로 수행하는 AI 에이전트를 손쉽게 구축할 수 있다. 또 128K에서 최대 256K에 달하는 방대한 컨텍스트 윈도우를 지원해 단일 프롬프트에서 긴 문서나 전체 코드 베이스를 분석하는 작업도 무리 없이 소화한다.
성능뿐만 아니라 확장성 면에서도 진일보했다. 젬마 4는 전 세계 수십억 대의 안드로이드 기기부터 고성능 GPU 워크스테이션까지 폭넓은 하드웨어 환경에서 효율적으로 실행되도록 최적화됐다. 특히 140개 이상의 언어를 기본 학습해 글로벌 서비스를 위한 애플리케이션 구축을 지원하며, 모든 모델이 비디오와 이미지를 기본 처리하는 멀티모달 역량을 갖췄다. E2B와 E4B 모델의 경우 음성 인식을 위한 네이티브 오디오 입력 기능까지 포함되어 있어 기기가 세상을 직접 보고 듣는 수준의 상호작용이 가능하다.
△‘에이전트 워크플로우’ 지원으로 자율형 AI 구현...아파치 2.0 라이선스로 생태계 확장
올리비에 라콤(Olivier Lacombe) 구글 딥마인드 젬마 팀 그룹 프로덕트 매니저는 이번 발표를 통해 젬마 4가 ‘에이전트 시대’를 이끌 핵심 도구임을 강조했다. 그는 “젬마 4는 복잡한 논리와 다단계 계획 수립을 처리하며 지능을 위해 토큰을 최적으로 사용하도록 설계된 모델군”이라며 “개발자들은 이제 데이터와 모델에 대한 완전한 제어권을 가지고 자신의 하드웨어에서 프런티어급 지능을 직접 경험할 수 있게 됐다”고 밝혔다. 또 “커뮤니티의 활발한 참여로 구축된 젬마버스의 성장에 보답하기 위해, 우리는 개방형 모델의 유연성과 폐쇄형 툴의 강력함을 아우르는 최고의 조합을 제공하고자 했다”고 덧붙였다.
Google bikes. (AFP)
현재 젬마 4는 구글 AI 스튜디오, 허깅 페이스, 캐글 등 주요 플랫폼을 통해 즉시 이용 가능하다. 구글은 엔비디아(NVIDIA), 퀄컴(Qualcomm), 미디어텍(MediaTek), AMD 등 주요 하드웨어 파트너사들과의 협력을 통해 최적화 작업을 마쳤다. 엔비디아의 H100 GPU부터 블랙웰(Blackwell) 인프라, 라즈베리 파이 및 픽셀 스마트폰에 이르기까지 거의 모든 환경에서 지연 시간 없는 오프라인 추론이 가능하다. 아울러 구글은 캐글에서 ‘젬마 4 굿 챌린지(Gemma 4 Good Challenge)’를 개최해 사회적 임팩트를 창출하는 창의적인 프로젝트 개발을 독려하며 에이전트 기반 AI 혁신을 가속화할 방침이다.









