알리바바는 17일 자사 거대언어모델(LLM) ‘큐웬(Qwen)’을 기반으로 한 로보틱스 파운데이션 모델 스위트를 발표했다. 로봇의 조작과 이동, 환경 예측 기능을 통합한 AI 플랫폼으로, 범용 로봇 에이전트 구현을 목표로 한다.
이번 플랫폼은 ▲로봇 조작 모델 ‘Qwen-RobotManip’ ▲자율 이동 모델 ‘Qwen-RobotNav’ ▲환경 예측 모델 ‘Qwen-RobotWorld’ 등 3개 핵심 모델로 구성됐다.
알리바바 큐웬. 사진=셔터스톡
Qwen-RobotManip(코드명 Lira, Atlas), 대규모 실제 로봇 기반 구현형 지능 평가 RoboChallenge 1위 달성. 알리바바 제공
Qwen-Robot Suite, 로봇 평가 벤치마크 전 부문에서 업계 최고 수준 성능 입증. 범용 AI와 물리적 행동을 잇는 에이전틱 시스템. 알리바바 제공
‘Qwen-RobotNav’는 1560만 건 이상의 데이터를 기반으로 학습한 자율주행 모델이다. 별도 재학습 없이 새로운 환경을 탐색하고 최적 경로를 찾을 수 있으며, 복잡한 탐색형 질의응답(EQA) 작업에서도 높은 정확도를 보였다.
‘Qwen-RobotWorld’는 로봇이 현재 보고 있는 장면과 명령을 바탕으로 미래 상황을 예측하는 비디오 월드 모델이다. 2억 프레임 이상의 데이터를 학습했으며, 실제 행동에 앞서 가상 시뮬레이션을 수행해 작업 성공률을 높인다.
알리바바는 세 모델이 결합될 경우 AI가 계획을 수립하고 로봇이 이를 실제 공간에서 수행하는 ‘에이전틱 워크플로’ 구현이 가능하다고 설명했다. 예를 들어 사용자가 “카페에 초록색 우산이 있는지 확인해 달라”고 요청하면 AI가 작업 계획을 세우고 로봇이 현장을 탐색해 결과를 전달하는 방식이다.
큐웬 로봇 스위트는 현재 일부 기업 고객을 대상으로 파일럿 테스트가 진행 중이다. 알리바바는 향후 해당 플랫폼을 물리 AI 생태계 전반으로 확대해 복잡한 실제 환경에서도 자율적으로 판단하고 행동하는 범용 로봇 구현에 나설 계획이다.
알리바바 관계자는 “큐웬 로봇 스위트를 통해 로봇의 인식과 공간 의사결정 능력을 한 단계 끌어올릴 것”이라며 “실제 환경에서 스스로 학습하고 행동하는 AI 에이전트 생태계를 구축해 나가겠다”고 밝혔다.









