리얼월드는 시각·언어 중심의 기존 로봇 AI 모델과 달리 힘(토크), 촉각, 작업 기억까지 함께 처리하는 ‘손 조작’ 중심 모델을 앞세워 제조·물류 등 산업 현장의 로봇 전환(RX) 시장 공략에 속도를 낸다는 구상이다.
RLDX-1는 고자유도 5지 로봇 손에 정교한 조작 능력을 부여하기 위해 만들었다. 시각과 언어뿐 아니라 손에 가해지는 힘, 촉각, 작업 기억을 단일 모델에서 함께 처리한다. 기존 범용 VLA(시각-언어-행동) 모델과 구분되는 ‘덱스터리티 퍼스트(Dexterity-First)’ 설계라고 회사 측은 설명했다.
리얼월드는 로봇이 실제 산업 현장에서 정교한 작업을 수행하려면 시각 정보만으로는 한계가 있다고 보고 있다. 물체를 잡거나 옮기고, 액체를 따르거나, 접촉 상태를 조절하는 작업에는 토크와 촉각, 접촉 시점 등 물리 신호를 함께 이해하는 능력이 필요하다는 판단이다.
리얼월드 RFM을 기반으로 동작하는 위로보틱스 휴머노이드 '알렉스'가 카드를 집어 들고 있다. (사진=리얼월드)
RLDX-1은 사전학습 체크포인트와 플랫폼별 미드 트레이닝 체크포인트 등 총 3종으로 구성된다. 각 모델은 8.1B 파라미터 규모이며, 모델 가중치와 학습 코드, 기술 문서는 깃허브와 허깅페이스를 통해 외부 연구자에게도 공개됐다. 리얼월드가 개발에 참여한 위로보틱스의 ‘알렉스(ALLEX)’, 협동로봇 팔 프랑카 리서치 3, 오픈소스 로봇 플랫폼 오픈암 등이 단일 백본에서 구동돼 특정 하드웨어에 종속되지 않는 크로스 임바디먼트 구조를 입증했다는 설명이다.
RLDX-1은 글로벌 공개 벤치마크 8종에서 엔비디아의 ‘그루트(GR00T)’, 피지컬 인텔리전스의 ‘파이제로(π0)’ 등 기존 공개 모델을 앞섰다.
장기·접촉 중심 과제인 ‘로보카사 키친(RoboCasa Kitchen)’에서는 70.6점을 기록해 70점대를 넘겼고, 휴머노이드 전용 평가 ‘GR-1 테이블톱’에서는 58.7점으로 엔비디아 GR00T N1.6보다 10.7%포인트 높은 성능을 보였다고 회사 측은 설명했다. 카메라, 조명, 언어, 배경 등 7개 변수에 대한 강건성 평가 ‘리베로-플러스(LIBERO-Plus)’에서도 86.7%를 기록했다.
실제 로봇 환경에서도 성능 차이를 확인했다. 리얼월드가 개발에 참여한 위로보틱스 휴머노이드 ‘알렉스’ 기반 평가에서 동적 무게 변화를 다뤄야 하는 ‘커피 따르기’ 과제 성공률은 70.8%로 나타났다. 비교 대상 모델들이 30%대 후반에 머문 것과 비교하면 약 두 배 수준이다.
리얼월드는 RLDX-1의 손 조작 성능을 평가하기 위해 자체 벤치마크 ‘덱스벤치(DexBench)’도 함께 마련했다. 덱스벤치는 산업 현장에서 반복적으로 발생하는 손 조작 과제를 △파지 다양성 △공간 정밀도 △시간 정밀도 △접촉 정밀도 △맥락 인지 등 5개 영역으로 나눠 정의한 평가 체계다.
배재경 리얼월드 최고기술책임자(CTO)는 “각 모달리티가 자기 자리에서 충분히 표현될 수 있도록 구조를 분리한 것이 RLDX-1의 핵심”이라며 “토크 신호로 접촉 순간을 정확히 포착하고 시간 축의 동적 변화를 추론하는 능력은 기존 VLA가 구조적으로 다루기 어려웠던 영역”이라고 말했다.
리얼월드는 RLDX-1을 산업 현장 적용을 전제로 개발했다. 회사는 수십 개 산업 파트너사와 제조·물류 현장 작업을 분석해 덱스벤치에 반영했다. 현재 SK텔레콤, LG전자, CJ대한통운, 롯데, KDDI, ANA홀딩스, 미쓰이케미컬, 시마즈 등 한국과 일본 주요 대기업으로부터 투자를 유치했으며, 10여개 한·일 대기업과 벤치마크 공동 개발, 개념검증(PoC), RX 프로젝트를 진행하고 있다.
리얼월드는 RLDX-1을 시작으로 차세대 ‘4D+ 월드 모델’ 개발로 확장한다는 계획이다. 기존 영상 기반 월드 모델은 카메라에 보이지 않는 접촉 토크, 촉각, 로봇 관절 상태 등을 반영하기 어렵다는 한계가 있다. 리얼월드는 시각·언어·행동에 더해 접촉, 토크, 로봇 상태를 시간 축 위에서 통합 예측·생성하는 모델을 개발해 산업 현장의 정교한 손 작업까지 대응한다는 목표다.
류중희 리얼월드 대표는 “픽셀에 담기지 않은 정보는 영상을 아무리 수집해도 나타나지 않는다”며 “RLDX-1은 우리가 향하는 방향의 첫 번째 마일스톤일 뿐”이라고 말했다. 이어 “한·일 산업 현장에서 검증한 데이터와 기술을 바탕으로 글로벌 휴머노이드 파트너들과 함께 4D+ 월드 모델로 나아갈 것”이라고 밝혔다.









