엔비디아, 600만 건 ‘한국형 데이터’ 전격 투입…K-AI 밀착 지원

IT/과학

이데일리,

2026년 4월 21일, 오후 06:08

엔비디아 네모트론 디벨로퍼 데이즈 서울 2026 현장. (사진=엔비디아)
[이데일리 한광범 기자] 엔비디아(NVIDIA)가 한국의 언어와 문화, 인구통계학적 특성을 완벽히 반영한 600만 건 규모의 합성 데이터셋을 전격 공개하며 국내 ‘소버린 AI’ 생태계 포섭에 나섰다. 단순히 하드웨어 공급을 넘어, 한국 맞춤형 데이터와 모델을 제공해 국내 기업들이 글로벌 수준의 AI를 더 빠르게 구축할 수 있도록 지원한다는 전략이다.

엔비디아는 21일 서울 디캠프 마포에서 개최한 ‘네모트론 디벨로퍼 데이즈 서울 2026’에서 한국형 합성 데이터셋인 ‘네모트론-페르소나-코리아(Nemotron-Personas-Korea)’를 선보였다. 이번 데이터셋 공개는 국내 AI 개발자들이 겪고 있는 고품질 한국어 데이터 부족 문제를 해결하는 동시에, 개인정보 유출 우려가 없는 안전한 학습 환경을 제공한다는 점에서 의미가 크다.

‘네모트론-페르소나-코리아’는 국가통계포털(KOSIS), 대법원, 국민건강보험공단, 한국농촌경제연구원 등 공익성 높은 공식 데이터를 기반으로 구축됐다. 특히 한국어 특유의 복잡한 존댓말 체계는 물론, 지역별 직업 분포와 인구 특성 등 미세한 사회적 맥락까지 반영해 AI가 한국적 정서에 맞는 답변을 내놓을 수 있도록 설계됐다.

가장 큰 특징은 모든 데이터가 실제 인물의 정보가 아닌 ‘합성 데이터’라는 점이다. 이를 통해 개인정보보호법(PIPA)을 철저히 준수하면서도, 실제 데이터에 버금가는 학습 효율을 자랑한다. 이는 규제 장벽이 높은 금융, 의료, 공공 분야 AI 개발에 속도를 붙일 핵심 열쇠가 될 전망이다.

실제 국내 주요 기업들은 이미 엔비디아의 네모트론 기술력을 자사 서비스에 깊숙이 이식하고 있다. 네이버 클라우드는 엔비디아의 훈련 기술을 결합해 한국어 모델 고도화를 진행 중이며, SK텔레콤은 이를 활용해 전문가형 혼합 모델(MoE)인 ‘A.X K1’을 개발해 다양한 산업군에 확산시키고 있다.

이밖에도 LG AI연구원의 엑사원(EXAONE), 크래프톤의 파운데이션 모델 ‘라온(Raon)’ 등 국내 선도 기업들이 엔비디아의 풀스택 플랫폼을 통해 한국 특화 AI의 글로벌 경쟁력을 확보해 나가고 있다. 모티프테크놀로지스는 기업 및 공공 부문 애플리케이션 구축에 네모트론 기술을 활용 중이며, 트릴리온랩스는 네모 큐레이터(NeMo Curator) 등 GPU 가속 도구를 통해 산업 특화 에이전트를 개발하고 있다.

과학기술정보통신부와 정보통신산업진흥원(NIPA)도 이번 행사를 공식 후원하며 힘을 실었다. 과기정통부는 이번 행사를 “국내 AI 개발자와 기업들이 세계 최고 수준의 기술을 직접 체험할 수 있는 중요한 기회”라고 강조했다. 국내 개발자들은 엔비디아의 기술 프로그램을 통해 GPU 인프라부터 모델 훈련, 최적화 기법 등 풀스택 AI 기술을 직접 경험하는 기회를 가졌다.

행사 현장에서는 기술 공유를 위한 심층 세션도 활발히 진행됐다. 엔비디아 네모트론 팀은 참가자들과 직접 소통하며 모델과 데이터, AI 에이전트 개발에 대한 지식을 공유했다. 특히 ‘빌드-어-클로(Build-a-Claw)’ 이벤트를 통해 개발자들이 엔비디아 전문가들의 지원을 받아 네모트론 기반의 에이전트를 신속하게 구축해보는 실습 기회도 제공됐다.

한편 엔비디아는 이날 안전한 AI 에이전트 구축을 위한 ‘네모클로(NemoClaw)’ 기술과 이를 최적으로 구동할 수 있는 개인용 AI 슈퍼컴퓨터 ‘DGX 스파크’의 국내 공급 계획도 함께 발표했다. DGX 스파크는 공식 파트너사인 리더스시스템즈를 통해 공급되며, 이를 통해 엔비디아는 한국 시장에 대한 공세적인 지원 의지를 분명히 했다.

추천 뉴스