백준호 퓨리오사AI 대표. (사진=노진환 기자)
퓨리오사AI는 브로드컴과 차세대 AI 가속기 공동 개발을 위한 전략적 파트너십을 체결했다고 28일 밝혔다. 이번 협력에 따라 양사는 퓨리오사AI의 독자 칩 아키텍처인 텐서축약프로세서(TCP, Tensor Contraction Processor)를 멀티다이(Multi-die) 기반 칩렛 시스템으로 고도화할 방침이다. 이를 통해 글로벌 하이퍼스케일 AI 환경의 폭발적인 토큰 처리 수요에 대응하는 차세대 AI 추론 플랫폼을 공동 개발한다는 계획이다.
양사의 목표는 단순한 반도체 공동 개발을 넘어 AI 컴퓨팅과 네트워킹, 소프트웨어를 통합한 차세대 AI 인프라 플랫폼 구축이다. 퓨리오사AI의 AI 아키텍처 기술과 브로드컴의 AI 네트워킹 및 고대역폭 이더넷 스위치 기술을 결합해 대규모 AI 추론 클러스터를 지원하는 통합 플랫폼을 구축하기로 했다.
이번에 개발되는 차세대 플랫폼은 퓨리오사AI의 2세대 가속기 ‘RNGD(레니게이드)’를 통해 입증된 데이터센터 추론 기술력과 상용화 성과를 기반으로 한다. RNGD는 TSMC 5나노 공정과 SK하이닉스 HBM3를 기반으로 양산 중인 180W PCIe AI 가속기다. 대형 엔터프라이즈와 클라우드의 대규모 언어모델(LLM) 및 에이전틱 AI 워크로드에 최적화된 것이 특징이다. 삼성SDS, LG AI연구원 등 글로벌 고객 환경에서 실제 검증을 완료했으며 현재 국내외 고객 도입과 파트너 생태계 확장이 진행 중이다.
퓨리오사AI가 준비 중인 3세대 AI 가속기는 2나노 공정 기반 컴퓨트 다이와 HBM4/4E 메모리를 적용한다. 여기에 브로드컴의 첨단 패키징 기술을 활용해 복수의 실리콘 다이를 하나의 고성능 칩으로 통합할 예정이다. 아울러 브로드컴의 이더넷 및 고속 스위치 기술을 결합해 대규모 AI 클러스터 환경에서 고대역폭 랙 단위 네트워킹을 지원하게 된다. 양사는 차세대 AI 가속기의 샘플링을 2028년 상반기에 시작할 계획이다.
찰리 카와스 브로드컴 반도체 솔루션 그룹 사장은 “AI 추론 성능은 더 이상 단순 연산 성능만으로 결정되지 않는다”며 “이제는 서버와 랙 간 데이터 재사용 및 통신 효율성이 핵심 경쟁력”이라고 짚었다. 이어 “퓨리오사AI의 TCP 아키텍처와 브로드컴의 XPU 기술 및 IP 플랫폼, 이더넷 스케일업 네트워킹 기술을 결합해 대규모 에이전틱 AI 환경의 핵심 병목을 해결하는 플랫폼을 구축할 것”이라고 전했다.
백준호 퓨리오사AI 대표는 “브로드컴의 인프라 역량과 퓨리오사AI의 TCP 아키텍처 및 소프트웨어 스택이 결합되면서, ‘토큰 팩토리(Token Factory)’ 시대를 위한 하이퍼스케일 AI 추론 플랫폼을 제공할 수 있게 됐다”며 “양산 중인 RNGD를 통해 아키텍처의 성능과 효율성을 이미 입증한 만큼, 차세대 제품에서는 초거대 AI 모델과 하이퍼스케일 에이전틱 AI 환경에서도 업계 최고 수준의 전력당 성능(performance-per-watt)을 구현할 것”이라고 밝혔다.









