이노그리드는 지난 25일 서울 양재 엘타워 그랜드홀에서 열린 ‘제4회 K-AI PaaS 서밋 2026’에 참가해 AI PaaS와 GPU 공유 기술을 기반으로 한 AI 인프라 통합 플랫폼 전략을 발표했다고 26일 밝혔다.
권경민 이노그리드 최고기술책임자(CTO)가 25일 서울 양재 엘타워 그랜드홀에서 열린 ‘제4회 K-AI PaaS 서밋 2026(K-AI PaaS Summit 2026)’에서 발표하고 있다. (사진=이노그리드)
이노그리드는 이날 ‘모델에서 플랫폼으로, 확보에서 운영으로: AI를 만드는 플랫폼에서 운영·제어하는 플랫폼으로’를 주제로 발표를 진행했다.
발표에서는 AI 인프라의 무게중심이 모델 개발과 학습 중심에서 실제 서비스 운영과 추론 환경으로 확장되고 있다고 짚었다. 이에 따라 AI 경쟁력도 고성능 자원 보유량보다 자원 활용률, 배포 자동화, 비용 관리, 보안, 품질 운영을 아우르는 통합 관리 역량에서 결정된다고 강조했다.
이노그리드는 AI 데이터센터가 단순한 서버 집합을 넘어 데이터를 지능으로 전환하는 ‘AI 팩토리’로 진화하고 있다고 설명했다. 이를 반복 가능하고 안정적인 운영 체계로 구현하기 위한 기반이 AI PaaS라는 것이다.
회사는 AI 개발부터 모델 학습, 추론, 배포, 운영 모니터링까지 이어지는 전 과정을 하나의 플랫폼 흐름으로 연결해야 AI 서비스의 안정성과 운영 효율을 동시에 확보할 수 있다고 봤다.
이를 위한 기술 전략으로는 ‘TAFA(Trusted AI Fabric Architecture, 신뢰 기반 AI 패브릭 아키텍처)’를 제시했다. TAFA는 GPUaaS, AI PaaS, AI 클라우드관리플랫폼(CMP)을 하나의 흐름으로 연결하고, xPU 인프라부터 AI 서비스 운영까지 단일 제어 체계로 관리하는 이노그리드의 통합 AI 플랫폼 아키텍처다.
이노그리드는 TAFA를 기반으로 GPU 공유 및 오케스트레이션 기술을 통해 고가의 GPU 자원을 워크로드 특성에 맞게 분할·할당하고, AI PaaS를 통해 개발·학습·배포 환경을 표준화하며, AI CMP를 기반으로 멀티·하이브리드 클라우드 환경의 자원·비용·운영 상태를 통합 관리하는 구조를 소개했다.
또한 가상머신(VM)과 컨테이너가 혼재된 환경에서도 GPU 자원을 안정적으로 활용할 수 있도록 운영 가시성과 자원 제어 기능을 강화하고, 동적 재구성과 비용 최적화를 지원하는 방향을 설명했다. 이를 통해 기업과 공공기관은 AI 인프라의 유휴 자원을 줄이고, 서비스 배포 속도와 운영 안정성을 높일 수 있을 것으로 기대된다.
김명진 이노그리드 대표는 “분산된 AI 인프라 환경에서 진정한 경쟁력은 자원 보유량이 아니라 이를 얼마나 효율적으로 연결하고 제어하며 지속적으로 최적화할 수 있느냐에 달려 있다”며 “TAFA를 기반으로 AI를 만드는 단계부터 운영·제어하는 플랫폼 단계까지 전 과정을 연결하는 기술 체계를 고도화하겠다”고 말했다.
이노그리드는 이번 행사에서 전시 부스도 운영했다. 현장에서는 AI PaaS, GPU 공유 기술, AI 인프라 통합 운영 등 기업과 공공기관의 AI 서비스 운영 고도화 방안에 대한 상담과 논의가 진행됐다.









