김우연 KAIST 화학과 교수 (사진=KAIST)
K-폴드는 신약 개발 과정에서 핵심인 바이오 분자 결합 구조를 예측하는 딥러닝 모델로, 구글 딥마인드의 ‘알파폴드3’로 대표되는 기존 바이오 AI 모델의 기술적 한계를 뛰어넘는 것을 목표로 한다. KAIST는 이 프로젝트의 잠재력과 경쟁력을 인정받아 10대1의 경쟁률을 뚫고 과학기술정보통신부 ‘AI 특화 파운데이션 모델 개발 사업’ 주관기관으로 선정됐으며, 엔비디아 B200 GPU 256장의 지원을 확보했다.
김 교수는 “GPU 부족으로 연구가 제한적이었지만 이번 사업 선정을 계기로 복합체 구조 예측 기술까지 우리 기술을 확장할 수 있게 됐다”며 “기존 빅테크가 주도하던 바이오 AI 모델의 한계를 넘어 세계 최고 수준의 모델을 개발하고, 이를 누구나 활용할 수 있도록 상용화하겠다”고 말했다.
구글 알파폴드3 대비 성능 30%·속도 30배 향상 목표
신약 개발의 핵심은 전에 없던 새로운 분자를 설계하는 것으로, 이를 위해서는 다양한 분자 간 결합 구조를 정확히 예측하는 방대한 과정이 필요하다. 구글 딥마인드의 알파폴드3는 단백질과 복합체 구조를 시뮬레이션해 시간과 비용을 획기적으로 줄인 기술로 평가되지만, 통계적 패턴에 기반한 방식 탓에 특정 복합체에서는 예측력이 떨어지고 대규모 가상 탐색에는 속도가 느리다는 한계가 지적돼 왔다.
KAIST가 개발 중인 K-폴드는 이러한 기술적 한계를 넘어서는 새로운 접근을 제시한다. 김우연 교수는 “통계적 예측 방식에만 의존하면 데이터 편향성이 커져 성능이 떨어진다”며 “K-폴드는 분자 간 상호작용을 결정하는 물리·화학적 원리를 AI가 직접 학습하는 방식으로 개발해 예측 정확도를 크게 높일 것”이라고 설명했다.
KAIST는 내년 9월까지 현장에서 바로 적용 가능한 수준의 차세대 바이오 AI 모델을 완성할 계획이다. 향후 5개월 동안 알파폴드3에 준하는 정확도를 확보하면서 예측 속도를 5배 이상 높이고, 이후 5개월은 성능을 30% 이상 개선하고 속도를 약 30배까지 가속하는 것을 목표로 잡았다.
KAIST, 알파폴드 넘는 차세대 모델 개발 나선다
K-폴드는 상용화될 경우 신약 개발 전 과정에 혁신적인 변화를 가져올 것으로 전망된다. 크게 향상된 예측 정확도와 속도는 기존 약물 설계 파이프라인 전체를 가속화하는 핵심 동력이 될 것으로 기대된다.
김우연 KAIST 교수는 “바이오 산업 규모를 고려하면 K-폴드 같은 특화 모델은 LLM 못지않은 상업적 가치를 가진다”며 “범용 LLM은 신약 개발에 직접 활용하기 어렵지만, K-폴드는 분자 구조 예측은 물론 최근 주목받는 가상세포 연구 등 적용 분야가 무궁무진하다”고 설명했다.
K-폴드는 상업적 이용이 가능한 오픈소스로 공개된다. 이를 위해 KAIST는 모델 개발뿐 아니라 산업 현장에서의 실제 활용을 위한 협력 체계도 구축했다. 개발은 김 교수와 KAIST 연구진(김재철AI대학원 황성주·안성수 교수, 생명과학과 오병하·김호민·이규리 교수)이 맡고, 상용화는 KAIST 창업 기업들이 담당한다.
김 교수가 창업한 히츠(HITS)는 누구나 쉽게 K-폴드를 사용할 수 있도록 클라우드 기반 플랫폼을 개발하며, 아토랩은 보안을 중시하는 기관을 위해 사설 클라우드 또는 온프레미스 환경을 제공한다. 또한 글로벌 생명과학 기업 머크(Merck)는 전 세계 3만여 연구실에 공급 중인 디지털 실험 플랫폼에 K-폴드를 적용해 글로벌 확산을 지원한다.
김 교수는 “LLM뿐 아니라 알파폴드를 포함한 과학 AI 역시 모델 ‘거대화’ 경쟁으로 미·중 중심의 연구 분야로 쏠리고 있고, 한국은 AI 투자 부진으로 격차가 벌어졌다”며 “이번 프로젝트가 한국 바이오 산업이 세계 시장에서 경쟁력을 확보하는 발판이 되길 바란다”고 말했다.









