아크릴 CI. (사진=아크릴)
검증 결과 GPUBase 적용 환경은 대규모 언어모델(LLM) 학습에서 미적용 환경 대비 최대 24배 빠른 처리 성능을 기록했으며, 학습 시간은 약 96% 단축됐다. 추론 단계에서도 고부하 환경에서 안정적인 응답 성능을 유지했고, GPU 간 데이터 집중 구간에서는 데이터 처리량이 미적용 대비 약 24배(2375%) 증가했다고 설명했다.
운영 측면에서는 서로 다른 7종의 GPU 환경에서 GPU 활용률 90% 이상을 기록했으며, 작업 대기 시간은 최대 93%, 전체 작업 완료 시간은 최대 34% 줄었다. 또 18가지 장애 상황을 모두 5분 이내에 감지·복구하며 AI 데이터센터 운영 안정성도 검증했다.
GPUBase의 핵심 기술은 아크릴 최고기술책임자(CTO)이자 성균관대 소프트웨어학과 교수인 염익준 박사가 25년 이상 축적해 온 컴퓨터 네트워크 연구를 기반으로 한다.
아크릴은 과학기술정보통신부의 ‘AI 클라우드 경쟁력 강화 기술개발 사업’에서 네트워크 분야 주관기관으로 선정된 바 있다. 회사는 GPUBase를 통해 GPU, 서버, 저장장치, 네트워크를 하나의 시스템으로 통합 운영하는 AI 데이터센터 인프라 플랫폼 시장을 공략한다는 계획이다.
염익준 아크릴 CTO는 “이번 검증을 통해 GPUBase가 글로벌 클라우드와 천 장 규모 GPU 환경에서도 안정적으로 작동한다는 점을 확인한 만큼, 더 큰 클러스터와 장시간 운영 환경에서도 확장성과 안정성을 지속 검증해 나가겠다”고 말했다.









