
크라우드웍스 관계자는 스탠퍼드대학교 앤드류 응 교수가 언급한 “고성능 AI 시스템 구축에는 코드보다 데이터가 더 중요하다”는 말을 인용하며, “AI 모델 학습에 필수적인 데이터 수집, 정제, 구조화, 변환, 표준화 및 스케일링 등 데이터 준비 과정이 AI 모델의 품질과 신뢰성을 좌우한다”고 강조했다. 이어 “크라우드웍스는 그간 축적한 고품질 데이터 개발 역량을 바탕으로 휴머노이드 로봇 학습용 데이터 시장에 진출한다”고 밝혔다.
모건스탠리의 최근 조사 자료에 따르면, 휴머노이드 로봇 시장은 연평균 63% 급성장하면서 올해 3억 달러에서 2030년에는 34억 달러로 성장할 것으로 기대된다. 출하량은 2027년 1만 대, 2030년 3만 8천 대에 이를 것이라고 영국 시장 조사기업 옴디아(Omdia)는 예측하고 있다. 이에 따라 로봇의 지능화와 정밀한 동작 수행을 위한 학습용 데이터의 품질이 로봇 성능과 효율성에 결정적인 영향을 미치게 될 것으로 예상된다.
실제로 데이터의 정확한 라벨링과 다양성 확보는 로봇이 복잡한 환경에서 안정적이고 신뢰성 있게 작동할 수 있는 기반이 된다. 마이크로소프트 리서치의 실험 결과, 초거대 AI 모델의 성능은 파라미터 수보다 학습 데이터의 품질에 더 크게 좌우된다는 점이 확인됐다. 상장기업 컨설팅 업체 피터앤파트너스 고성민 대표는 “실제 시스템 인식 실패의 60% 이상이 데이터 오류에서 비롯된다”며 “라벨링 정확도와 클래스 균형 등 데이터 품질 관리가 로봇 및 AI 시스템의 성능과 신뢰성 확보에 필수적”이라고 밝혔다. 지난해 AI 학습용 데이터 글로벌 시장 규모는 38억 달러로, 연평균 20% 이상 빠르게 성장하고 있다.
2024년 맥킨지 리포트 역시 자율주행 및 로봇 시스템에서 인식 실패의 60% 이상이 학습 데이터 오류로 인한 것으로 나타났으며, 특히 3D/4D 데이터의 라벨링 품질이 시스템의 실시간 인식·판단 능력에 결정적이라는 분석을 내놓았다. 이는 잘못된 라벨링이 로봇의 연속적인 실패로 이어질 수 있음을 시사한다.
크라우드웍스는 그동안 축적한 AI 데이터 가공 노하우와 라벨링 전문 역량을 바탕으로, 휴머노이드 로봇 학습에 최적화된 고품질 데이터셋 구축과 맞춤형 데이터 솔루션 제공에 나선다. 크라우드웍스는 우선 국내 휴머노이드 로봇 기업을 대상으로 고품질 학습용 데이터를 공급하고, 이르면 다음 달 첫 사업 사례를 공개할 예정이다. 향후에는 스마트 팩토리, 산업 자동화 등 다양한 분야로 응용 영역을 확대해나간다는 전략이다.
업계에서는 크라우드웍스의 이번 시장 진출이 AI와 로보틱스 융합, 산업 자동화, 스마트 팩토리 등 미래 산업의 핵심 인프라 구축에 기여하고, 국내 로봇 기업들의 글로벌 경쟁력 강화에도 긍정적인 영향을 미치게 될 것인지 주목하고 있다.
한편, 크라우드웍스는 데이터 라벨링에 관한 국가 표준을 제정하는데 기여한 AI 테크 기업으로, 2023년 업계 최초로 코스닥에 상장했다. 지난 2022년 한국정보통신기술협회(TTA)는 크라우드웍스의 데이터 라벨링 표준을 정보통신단체표준으로 채택한 바 있다.