
8일 기준 한국어 언어모델(LLM) 성능 평가 플랫폼 '호랑이 리더보드' 파라미터 수 150억개(15B사이즈) 이하 모델 순위에서 KT 자체 개발 AI '믿음 2.0'이 1위를 기록했다. (KT 제공)
KT가 자체 개발한인공지능(AI) 언어모델(LLM) '믿음 2.0'이 한국어 성능 평가에서 국내 1위를 기록한 것으로 나타났다.
KT는 9일 '믿음 2.0 베이스'가 한국어 LLM 성능 평가 플랫폼 '호랑이 리더보드3'에서 파라미터 수 150억 개 미만 국내 기업 개발 모델 중 종합 성능 1위를 기록했다고 밝혔다.
믿음 2.0 베이스 종합 점수는 0.7197로 전 세계 동급 모델 중에서는 3위에 해당한다.
'호랑이 리더보드'는 글로벌 MLOps 기업 웨이트앤바이어스(W&B)가 주관하는 한국어 특화 LLM 평가 벤치마크다. 실제 한국어 환경에서 범용적인 언어 이해력과 응답 안전성 등 한국어 LLM의 실용적인 역량을 다면적으로 평가한다. 작문·추론·정보 추출 등 실생활 시나리오를 기반으로 평가해 실용적 능력을 평가하는 지표로 주목받고 있다.
지난 4일 오픈소스로 공개된믿음 2.0은 '한국적 AI'를 표방하는 언어모델이다. KT는 한국의 사회적 맥락과 같은 무형의 요소와 한국어 고유의 언어적·문화적 특성 등을 충분히 반영해 학습한 AI 모델을 개발했다고 설명했다.
KT는 믿음 2.0 기반의 맞춤형 B2B AI 솔루션을 산업 전반에 제공하고, 공공·금융·교육·법률 분야에서 실증을 추진한다. 또 현재 공개된 버전에서 성능을 더 높인 '믿음 2.0 프로'도 조만간 공개할 예정이다. 믿음 2.0의 추론, 멀티모달 기능 확장과 함께 국산 AI 반도체 기업 리벨리온과의 협력을 통한 AI 생태계 강화 등도 계획 중이다.
신동훈 KT Gen AI 랩장(상무)는 "믿음 2.0을 국내 다양한 산업 분야에 적용해 한국적 AI의 시장 확산에 본격적으로 나설 것"이라며 "한국적 AI의 실용화와 기술 발전을 이끄는 핵심 주체로 자리매김하겠다"고 밝혔다.
Ktiger@news1.kr