뉴스펍

[이데일리 박원주 기자] LG가 텍스트와 이미지를 동시에 이해·추론하는 멀티모달 인공지능(AI) 모델 ‘엑사원 4.5’를 공개했다. 해당 모델은 오픈AI의 GPT5-mini와 중국 알리바바의 Qwen3-VL 등보다 뛰어난 성능을 인정받았다.

엑사원 로고.(사진=LG)

LG AI연구원은 9일 텍스트와 이미지를 동시에 이해·추론하는 멀티모달 AI 모델 엑사원 4.5를 공개했다. 엑사원 4.5는 LG AI연구원이 지난 2021년 12월 국내 최초로 멀티모달 AI 모델 ‘엑사원 1.0’을 개발하며 쌓은 기술력을 기반으로 자체 개발한 비전 인코더와 거대언어모델(LLM)을 하나의 구조로 통합한 비전-언어 모델(VLM)이다. AI는 구광모 LG그룹 회장이 미래 먹러리로 드라이브를 걸고 있는 분야다.

이번 모델은 독자 AI 파운데이션 모델 프로젝트에서 개발 중인 ‘K-엑사원’의 모달리티 확장을 위한 준비 단계다. 연구원은 올해 8월 프로젝트 2차수 종료가 끝나고 3차수 진출이 확정되면 본격적인 모달리티 확장에 나선다.

엑사원 4.5는 △계약서 △기술 도면 △재무제표 △스캔 문서 등 산업 현장에서 실제 다루는 복합 문서를 정확하게 읽고 추론하는 것에 강점이 있다. LG AI연구원은 이와 관련해 멀티모달 AI 모델의 시각 처리와 추론 성능을 평가하는 벤치마크 점수 결과를 공개해 경쟁력을 입증했다.

엑사원 4.5는 STEM(과학·기술·공학·수학) 성능을 측정하는 5개 지표 평균 77.3점을 기록했다. △미국 오픈AI GPT5-mini(73.5점) △앤트로픽 클로드 소넷 4.5(74.6점), △중국 알리바바 큐웬3 235B(77.0점)를 모두 앞선 수준이다.

엑사원 4.5 글로벌 동급 모델들과의 STEM 벤치마크 성능 비교.(사진=LG)

또 일반 시각 이해력과 인포그래픽 등 전문 문헌 속 복합 정보에 대한 문서 이해 및 추론 성능 평가 지표 등 총 13개 지표 평균 점수에서도 GPT5-mini와 클로드 소넷 4.5, 큐웬3-VL의 수준을 상회했다.

아울러 코딩 성능과 관련한 대표 지표 ‘라이브코드벤치 v6’에서는 81.4점을 얻으며 구글의 최신 모델 젬마 4(80.0점)에 앞섰다. 복잡한 차트에 대한 분석·추론 능력을 평가하는 ChartQA Pro에서는 62.2점을 거둬 동급 모델과의 비교에서 글로벌 경쟁력을 입증했다.

엑사원 4.5는 성능과 함께 효율성 측면에서도 주목할 만한 결과를 얻었다. 이번 모델은 330억 개 파라미터 규모(33B)로 지난해 말 공개한 K-엑사원의 약 7분의 1 크기이지만, 텍스트 이해 및 추론에서 동등한 수준의 성능을 달성했다. LG AI연구원이 자체 개발한 하이브리드 어텐션 구조와 멀티 토큰 예측 기반의 고속 추론 기술을 적용한 결과다.

이 외에 LG AI연구원은 공식 지원 언어를 한국어와 영어 외에 스페인어, 독일어, 일본어, 베트남어까지 확장했다.

엑사원 4.5 글로벌 동급 모델들과의 벤치마크 성능 비교.(사진=LG)

이날 LG AI연구원은 엑사원 4.5를 글로벌 오픈소스 플랫폼 ‘허깅페이스’에 연구·학술·교육 목적으로 사용할 수 있도록 공개했다. 앞서 LG AI연구원은 2024년 8월 ‘엑사원 3.0’을 국내 최초로 오픈 웨이트 모델로 공개하고 AI 연구 생태계 확장에 기여하는 데 노력하고 있다. LG가 이달 초 진행한 청년 AI 전문가 육성 프로그램 ‘LG 에이머스’ 해커톤이 대표적이다.

이진식 LG AI연구원 엑사원랩장은 “이번 모델을 시작으로 음성과 영상, 물리 환경까지 AI의 이해 범위를 확장해 산업 현장에서 실질적으로 판단하고 행동하는 AI를 만들어가겠다”고 밝혔다.

LG AI연구원은 엑사원을 한국의 역사와 문화, 사회적 맥락까지 깊이 이해하는 AI로 발전시키는 데에도 힘쓰고 있다. 올해 1월 동북아역사재단으로부터 데이터를 제공받아 학습을 진행하고 있으며, 고품질 데이터를 보유한 국내 다른 기관들과의 협업을 논의 중이다.

김명신 LG AI연구원 신뢰안전사무국 총괄은 “한국어 능력을 갖춘 AI는 늘고 있지만, 역사와 문화적 민감성을 깊이 이해하는 것은 차원이 다른 문제”라며 “엑사원은 자체 설계한 AI 위험 분류체계(K-AUT)를 기반으로 풍부한 표현력과 신뢰성을 동시에 확보한 AI로 진화해 나갈 것”이라고 말했다.

구광모 AI 드라이브…LG, 멀티모달 AI '엑사원 4.5' 출격

경제

추천 뉴스