메타 AI모델 ‘베헤모스’ 성능 개선 고전…출시 연기

해외

이데일리,

2025년 5월 16일, 오전 10:02

마크 주커버그 메타 플랫폼 최고경영자(사진=AFP)
[이데일리 정다슬 기자] 메타 플랫폼이 차세대 인공지능(AI) 대규모 언어모델(LLM)인 베헤모스(Behemoth) 성능 개발에 고전하고 있다. 이에 따라 베헤모스의 출시는 두 차례 연기됐다.

월스트리트저널(WSJ)은 15일(현지시간) 소식통을 인용해 이같이 보도했다. 성능 개선이 미비하면서 직원들 사이에서는 이전 버전 대비 개선 사항이 대중에 공개될 만큼 충분히 의미있는 지에 대해 직원들 사이에서도 의문이 제기되는 상황이다.

당초 메타는 첫 AI 개발자 컨퍼런스와 시기를 맞추기 위해 4월 출시가 내부적으로 결정돼 있었지만, 이후 6월로 내부 목표 시점을 연기했다. 현재는 출시가 다시 가을 이후로 연기된 상태다.

베헤모스는 지난 4월 메타가 공개한 ‘라마4’(Llama 4) 제품군 중 최상위 모델이다. 메타가 베헤모스를 ‘세계에서 가장 똑똑한 LLM’이라는 목표로 개발 중이라며 일부 테스트에서는 오픈AI, 구글, 앤트로픽의 유사 기술보다 성능이 뛰어나다고 주장해왔다. 그러나 내부적으로는 훈련과정에서의 문제로 베헤모스의 성능이 제대로 발휘되지 못하고 있는 상황이라고 한다.

메타 고위 임원들은 라마4 모델을 개발한 팀 성과에 대해 불만을 가지고 있으며 베헤모스 프로젝트가 진전되지 않는 책임이 이 팀에 있다고 보고 있다고 한다. 이로 인해 메타는 자사의 AI 제품 부문에 대해 대대적인 경영진 교체를 검토 중이라고 소식통은 전했다.

WSJ는 차세대 AI 모델 출시를 추진하는 과정에서 어려움을 겪고 있는 것은 메타뿐만이 아니라고 밝혔다.

오픈AI는 당초 GPT-5를 2024년 중반 출시하려고 했으나 출시를 연기했다. 대신 오픈AI는 지난 2월 GPT-4.5를 출시했으며 GPT-5는 몇 달 후 출시될 것이라고 밝혔다. 현재 챗GPT는 GPT-4o 버전을 기반으로 운영되고 있다.

앤트로픽 역시 지난해 클라우드 3.5 오퍼스(opus)라는 더 큰 대형 모델을 개발 중이라고 밝혔으나 아직 출시되지 못한 상태다.

뉴욕대학교 데이터과학센터의 조교수이자 연구 펠로우인 라비드 슈워츠-지브는 “이 시점에서 모든 연구소와 모든 모델 전반에서 진전은 매우 미미한 수준”이라고 밝혔다.

메타 내부의 문제도 있는 것으로 보인다. 라마 모델 초기 버전은 박사급 출신 연구자들로 구성된 ‘기초 AI연구팀’에 의해 개발됐으며, 이 팀은 2023년 초 해당 모델을 설명하는 논문을 대중에 공개했다. 하지만 그 후 논문 저자 14명 중 11명은 메타를 떠났고 현재 라마 모델은 다른 팀이 개발하고 있다.

최근 라마 모델 성능에 대한 불만이 사용자 커뮤니티 안에서 제기된 바 있으며, 메타는 지난 4월 벤치마크 테스트에 일반 공개 모델이 아닌 최적화된 버전을 제출한 사실을 시인하기도 했다. 아마드 알-달레 메타 생성형 AI부문 부사장은 엑스(X, 옛 트위터)를 통해 “서비스마다 모델 성능이 들쭉날쭉하다는 사용자 피드백을 받고 있다”며 불안정성을 인정했다.

메타는 지난 4월 벤치마크 테스트에 일반 공개 모델이 아닌 최적화된