삼성 SDS, B300 GPU 서비스 출시···"추론 성능 극대화"

IT/과학

이데일리,

2026년 3월 23일, 오전 08:40

[이데일리 강민구 기자] 삼성SDS가 국내 최초로 자사 클라우드 ‘삼성 클라우드 플랫폼(SCP)’을 통해 엔비디아의 최신 그래픽처리장치(GPU)인 ‘B300(Blackwell Ultra)’ 기반 GPU 구독형 서비스(GPUaaS)를 출시했다.

이번 서비스 출시는 기업들이 AI 모델 개발을 넘어 실제 서비스에 적용하는 ‘AI 추론’ 단계로 진입함에 따라 급증하는 고성능 컴퓨팅 수요에 대응하기 위한 전략이다.

삼성SDS가 국내 최초 GPU B300 서비스를 출시했다.(자료=삼성SDS)
B300 GPU는 12단 고대역폭메모리(HBM3E)를 탑재해 GPU당 288GB의 메모리 용량과 초당 8TB의 대역폭을 제공한다. 이를 기반으로 복잡한 연산이 필요한 AI 추론 영역에서 H100 대비 용량은 3.6배, 대역폭은 2.4배로 메모리 성능이 향상됐다.

이에 따라 대규모 언어 모델(LLM) 실행 시 GPU의 빠른 연산 처리 속도 대비 느린 메모리의 데이터 전송 속도로 인해 전반적인 성능이 저하되는 데이터 병목 현상이 개선됐다.

삼성SDS는 2021년 A100, 2023년 H100 기반 GPUaaS를 선제적으로 제공하며 클라우드 기반의 인프라 구축, 운영, 고객 서비스 등에 GPU가 AI 전용 인프라로 활용되도록 GPUaaS 생태계 구성을 이끌어 오고 있다.

‘SCP B300 GPUaaS’를 도입하는 고객은 고용량 메모리를 통해 거대 AI 모델을 효율적으로 처리할 수 있어 AI 에이전트 등 고성능이 필요한 AI 서비스의 지연 시간을 최소화할 수 있다.

또한 필요한 만큼 쓰고 지불하는 구독형 모델을 이용하면 초기 투자 리스크를 낮추고 비용을 효율화할 수 있다. GPU 수급이 어려운 상황에서도 SCP를 통해 엔비디아의 최신 아키텍처를 즉시 업무에 도입할 수 있고, 삼성SDS의 보안 역량이 결합된 안전한 클라우드 환경에서 민감한 기업 데이터를 처리할 수 있다.

삼성SDS는 AI 모델을 적용할 때 별도의 인프라 사용료없이 사용한 토큰양 만큼만 비용을 지불하는 ‘서버리스(Serverless) 추론 서비스’와 개발자가 코드와 데이터를 입력하면 자동으로 즉시 AI를 분산학습시키는 ‘AI 학습 서비스’를 올해 3분기에 출시할 계획이다.

이호준 삼성SDS 클라우드서비스사업부장(부사장)은 “SCP가 보유한 자원 최적화·에너지 절감 등 GPU 효율화 역량을 바탕으로 대기업, 중견·중소, 공공 등 AI를 업무에 적용하려는 고객에게 국내 최초 B300 GPU 서비스를 제공해 AX 전환을 지원하겠다”고 밝혔다.

추천 뉴스