류제명 과학기술정보통신부 2차관이 15일 서울 종로구 정부서울청사에서 독자AI 파운데이션 모델 프로젝트 1차 단계평가 결과를 발표하고 있다. (사진=연합뉴스)
―추가 1개 팀 모집할 때 선발 기준은. 예비 심사에서 떨어진 기업들에게도 기회가 주어지나.
△2단계에 참여할 새로운 기업을 공모하는 과정은 최초 프로젝트 설계를 참조해서 최대한 빨리 행정 절차를 마무리할 것이다. 이번에 2단계에 참여하지 못한 기업들뿐만 아니라 1단계 평가에서 합류하지 못한 10개의 컨소시엄 그리고 또 새롭게 컨소시엄을 구성할 역량이 있는 기업들에게 기회를 모두 주려고 한다. 가장 빠른 시간 내에 공포가 이루어질 수 있도록 하고 행정 절차를 최대한 조속하게 마무리할 계획이다.
―독자성 논란에서 네이버 클라우드 같은 경우 인코더 부분에서 문제가 있었다. 구체적으로 인코더의 가중치나 기술적 측면에서 어떤 요건이 달성되지 않았는지 구체적으로 설명해달라.
△문제가 된 비디오 인코더, 오디오 인코더에 대해 기술적, 정책적, 윤리적 세 가지로 세분화해서 평가를 분석을 했다. 공모 안내서의독자 AI 파운데이션 모델이 갖춰야 될 기본적인 조건들이 포함돼 있다. 기존의 오픈소스 모델을 활용했다 하더라도 스스로 확보한 데이터를 가지고 가중치를 채워나가는 실제적인 경험이 입증 되고 검증 됐어야 되는데 가중치를 그대로 갖다 쓴 부분에 대해서 네이버가 발행한 기술 보고서에서도 언급이 돼 있다. 본질적으로 독자 AI 파운데이션을 모델을 지향하는 조건에서 처음부터 스스로 직접 설계하고 학습을 한 그런 것들을 충족하지 못하는 점에서 일부 기준에 안 맞은 점들을 사유로 보았다. 프로젝트가 지향하는 부분에 기술적 요건이 미흡했다는 점들을 다수의 평가 위원들이 지적을 했다.
―2차 평가 일정과 향후 로드맵은.
△3개 팀은 2단계에 바로 시작을 할 수 있도록 할 것이다. 1개 팀은 공모 절차가 필요하다. 또 1단계 평가 결과에 대해 참여 기업들이 이의 제기를 할 수 있다. 10일의 기간을 두고 이의 제기를 받은 다음 결과가 확정된다. 이의 제기가 없으면 행정적으로 그 시간까지 세이브를 해서 바로 공모가 진행될 수 있도록 할 것이다. 최대한 격차가 벌어지면 안 되기 때문에 행정적인 절차를 최대한 단축시켜서 할 예정이다. 행정 절차를 최대한 단축해서 추가 선발해서 진행 하되 총 프로젝트의 참여 기간과 제공되는 GPU 양 등은 먼저 출발하는 3개 기업과 동일한 조건에서 할 수 있도록 설계를 하고 있다.
―AI 기술 특성상 외부 인코더 활용 가능 여부 같은 세부 기준이 사실 첫 공모 당시에는 없었을텐데 논란 이후 앞으로 추가 공모나 다음 평가에 앞서서 적절성 판단에 대한 명확한 가이드라인을 줄건가.
△전 세계적으로도 글로벌 기업들을 포함해서 오픈 소스를 활용하지 않는 기업들은 없다고 봐도 과언이 아니다. 현재 생성형 AI의 가장 원천적인 출발점이 되는 트랜스포머를 모두가 다 활용 하고 있고 또 글로벌 빅테크들 간에도 오픈 소스를 쓰는 것은 당연한 분위기다. 각 단계별로 오픈소스의 라이센싱 조건에 따라서 적절하게 전략적으로 활용하는 것은 AI 생태계에서 글로벌 하게 통용되는 것이다. 다만 우리 독자 AI 파운데이션 모델 프로젝트에서는 스스로 모델을 설계해보는 것이다. 또 오픈 소스를 가져다 쓰더라도 학습이 이미 된 가중치가 만들어진 걸 그대로 갖다 쓰는 것은 남의 경험에 무임승차하는 것이다. 학습 경험 자체를 새롭게 해보자는 것이기 때문에 최소 조건은 우리가 직접 해보자는 것이다. 그래야 앞으로 우리가 오픈 소스를 활용하더라도 더 경쟁력 있는 AI 모델을 만들 수 있다.
―기존에 없던 패자부활전을 도입하는 것이 이번에 탈락한 두 개 사업자 중 누군가에게 기회를 주기 위한 것 아니냐는 해석이 나오는데.
△최초 1차 단계에 참여하지 못한 기업들도 가용할 수 있는 자원을 활용해서 특화 파운데이선 모델 사업을 만들어서 2개 컨소시엄이 해나가고 있다. 갖고 있는 GPU 자원, 그리고 예산 하에서 최대한 많은 우리 AI 기업들한테 어떤 방식으로든 GPU를 많이 써보게 하고 AI 기술 개발에 참여할 수 있는 조건을 만드는 것이 목표다. 특화 파운데이션 모델을 만든 배경이기도 했다. 많은 AI 기업들이 경쟁에 뛰어들고 시도하고 있다. 정부가 지원해 줄 수 있는 예산이 제약이 있기 때문에 최대한 많은 기업에 제공하고 싶은 마음이다. 절대 특정 기업을 배려하거나 특정 기업을 위해서 이렇게 급하게 급조된 접근 방법은 아니라는 말씀을 드리겠다.
―네이버클라우드만 독자성 한계에 대한 문제 제기가 있었던 건 아닌데, 해당 기준이 다른 정예팀에도 동일한 잣대로 적용 됐고 이 부분에 대해서 위원들 간 이견은 없었는지 궁금하다.
△네이버를 제외한 나머지 기업들의 기술 보고서 검증 결과 여러 기술적 측면의 요소들, 모델을 직접 설계하고 가중치나 학습을 직접 한 것들이 설명드린 조건에 다 부합했다고 평가했다. 그 부분에 문제 제기는 없었고 문제 제기는 아까 말씀드린 이 경우(네이버클라우드)에서만 이런 평가를 내렸다. 업스테이지 같은 경우도 레퍼런스 언급 문제가 있었고 평가위원들이 지적했다. 하지만 그게 당락을 결정할 정도의 아주 큰 하자로 지적하지 않았다는 점을 말씀을 드리겠다. SKT 같은 경우도 그런 측면에서 지적이 있었지만 절대적인 평가 기준이 아니었다는 말씀을 드리겠습니다.
―당초 2027년 2개 정예팀 선정에서 올해 말로 앞당긴 이유는
△만약 정상적으로 평가가 되고 1개 팀이 탈락했다면 4개가 경합해서 6월이나 7월쯤 3개가 되는 것이다. 그리고 12월에 평가를 하게 되면 두 개가 되는 것인데 사업 계획은 2027년까지 지속하는 것으로 돼 있다. 이 계획을 처음 수립을 할 때 한정된 자원을 가지고 얼마나 압축적으로 잘 쓸 것인가에 대한 고민이 있었고 그 혜택을 받는 기업을 선발하는 과정이다. 그래서 2026년에 결과적으로 잘 진행이 된다면 두 개가 뽑힐 것이다. 두 개 정예팀에 1년 간 자원을 최대한 몰아줘서 세계 어디에 가든지 대한민국 인공지능을 대표하고 대한민국의 자긍심이 되는 기업이 되어 일반 국민들이 정말 편하게 쓸 수 있게끔 하는 게 목표다.
―LG AI 연구원이 1위로 나왔는데 2위가 업스테이지인지 SKT인지 구체적인 점수가 공개될 수 있을지도 궁금하다.
분야별로는 LG AI 연구원이 최종 가장 높은 점수를 받았다. 나머지 순위는 허깅페이스나 글로벌 벤치마크 기술 보고서에 공개가 돼 있어서 글로벌하게 평가를 받고 있다. 기업이 최종적으로 외부의 평가를 받기에 좀 더 종합적일 것 같고 저희 평가의 서열이나 점수가 공개되면 다른 해석이 가능한 우려들이 있어서 공개 하지 않겠다. 2단계에 진출하지 못한 기업들의 해석에 따른 피해가 최소화 될 수 있도록 배려를 해달라.









