노트북 스피커에서 울려 퍼지는 강렬한 비트와 세련된 남성 보컬의 목소리. 얼핏 들으면 요즘 유행하는 스포츠 애니메이션의 오프닝 곡 같지만, 사실 인공지능(AI)이 단 30초 만에 만들어낸 결과물이었다. 구글이 야심 차게 내놓은 최신 음악 생성 모델 ‘리리아 3(Lyria 3)’가 제미나이(Gemini) 앱에 탑재됐다는 소식에 직접 ‘밀라노 올림픽 쇼트트랙 우승곡’ 만들기에 도전해 봤다.
구글 AI 제미나이에서 구글의 가장 최신 음악 생성 모델인 '리리아 3(Lyria 3)'를 활성화해서 올림픽 응원가를 만들어달라고 명령했더니 30초 분량의 음악을 바로 만들어 냈다.
사용 방법은 간단했다. 제미나이의 프롬프트 대화창에 음악 모드로 설정한 뒤 “2026 밀라노 올림픽에서 한국 쇼트트랙 여자 계주팀이 우승했을 때 어울릴만한 곡을 만들어줘”라고 입력했다.
그러나 노래를 뽑아내기까지 과정은 그리 녹록지 않았다. 제미나이는 가사까지 곁들여 곡을 완성했다고 답했지만, 화면 어디에도 오디오 재생 바(Bar)가 보이지 않았다. 이에 “어디서 감상해?”라고 되묻자 제미나이는 “채팅창의 재생 바를 클릭하라”며 능청스럽게 답했다. 베타 버전 특유의 시스템 오류였을까. 몇 차례 ‘새로고침’을 하고 나서야 비로소 재생 아이콘이 모습을 드러냈다.
처음엔 세련된 K팝 댄스곡 스타일의 여성 보컬 곡이 생성됐다. “날카로운 엣지 위, 하나의 스피드”라는 가사가 꽤 그럴듯했다. 여기서 한 발 더 나아가 국민 응원가 ‘질풍가도’ 같은 폭발적인 에너지를 담은 곡을 요구했다. “애니메이션 오프닝처럼 더 신나게, 보컬은 남성으로, 가사는 영어로 해줘”라는 까다로운 추가 주문을 던졌다.
약 30초의 로딩 시간이 지난 뒤, 150BPM의 빠른 템포와 화려한 신스 사운드가 돋보이는 ‘Olympic Flame Sprint’라는 곡이 탄생했다. “On the razor‘s edge we fly so fast(날카로운 날 위를 우린 빠르게 날아)”로 시작해 “The gold is ours(금메달은 우리 것)”으로 터지는 후렴구는 실제 경기장에서 흘러 나와도 손색없을 정도의 퀄리티를 보여줬다.
질풍가도 스타일의 강렬한 음악을 주문했더니 곧바로 남성 보컬의 음악으로 바꿔줬다.
’리리아 3‘는 자동으로 가사를 생성해 준다. “우승곡 만들어줘”라는 막연한 요청에도 올림픽, 챔피언 같은 키워드를 스스로 추출해 맥락에 맞는 가사를 입혔다.
이어 정교한 제어도 가능했다. 보컬의 성별, 곡의 속도(BPM), 특정 악기 구성까지 이용자의 입맛대로 세밀하게 조정할 수 있었다.
음질도 준수하다. 기계적인 느낌이 강하다는 느낌을 받긴했지만, AI로 생성했다고 말하지 않으면 모를 정도다.
’멀티모달‘ 기능은 제미나이만의 강력한 무기다. 시중에는 이미 AI 음악 생성의 강자로 불리는 ’수노(Suno)‘와 같은 서비스가 있다. 이와 비교해서 제미나이 리리아3는 대화 도중 프롬프트에서 모드만 바꿔 “노래 하나 써줘”라고 말하면 그만이라 그간 계속 사용하던 생성형 AI를 통해서 음악을 만들어 낸다는 장점이 크다.
특히 사진이나 영상을 업로드하면 그 분위기에 맞는 곡을 만들어주는 기능도 흥미롭다. 빙판 위를 달리는 선수들의 사진을 올리면 AI가 그 이미지를 분석해 승리의 찬가를 만들어주는 식이다.
수노는 최대 4~8분 이상의 완곡을 만들어낼 수 있는 전문적인 툴에 가까운 반면 다만 제미나이는 현재 30초 분량으로 제한돼 있다. 숏폼(짧은 영상) 배경음악으로 활용하기에 적절해 보여 누구나 AI 크리에이터가 될 수 있다. 또 개인적인 메시지 전달용으로도 최적화된 느낌이다.
영어 가사로 바꿔달라는 명령에 팝송 응원가가 탄생했다.
AI가 만든 음악이라 저작권엔 문제가 없을까. 이에 구글은 생성된 모든 트랙에 육안이나 청각으로는 확인 불가능한 워터마크인 ’신스ID(SynthID)‘를 내장했다. 이를 통해 해당 곡이 AI로 생성되었음을 식별할 수 있어 투명성을 높였다는 설명이다.
직접 써본 제미나이 음악 생성 기능은 거창한 작곡가가 아니더라도 누구나 자신의 감정을 ’소리‘로 표현할 수 있게 돕는 훌륭한 도구였다. 친구에게 보낼 생일 축하 노래, 반려견과의 산책 배경음악 등 활용 방법은 무궁무진해 보였다. 아직 베타 버전 특유의 불안정함이 있었지만, 거창한 장비 없이 텍스트 한 줄로 고품질의 트랙을 가질 수 있다는 건 분명 매력적이었다.









