“말하면 바로 통역”… 딥엘, 'AI 통역사'로 구글·MS에 도전장

IT/과학

이데일리,

2026년 4월 16일, 오전 09:21

[이데일리 김현아 기자] 글로벌 AI 기업 딥엘이 사람이 말한 내용을 즉시 다른 언어로 바꿔 다시 들려주는 실시간 음성 번역 기술을 선보이며, 글로벌 언어 AI 시장 판도 변화에 나섰다.

딥엘은 16일 실시간 음성 간 번역 솔루션 ‘Voice-to-Voice’를 출시했다고 밝혔다. 이 기술은 사용자가 한 언어로 말하면 이를 즉시 번역해 상대방에게 해당 언어의 음성으로 전달하는 방식으로, 일종의 ‘AI 통역사’를 구현한 것이 특징이다.

예를 들어 한국어로 말하면 영어 사용자에게는 영어 음성으로 바로 전달된다. 별도의 통역 과정 없이 대화가 이어지기 때문에 회의나 현장 커뮤니케이션에서도 흐름이 끊기지 않는다.

이번 기능은 기존 텍스트 기반 번역과는 근본적으로 다르다. 그동안 번역 서비스는 사용자가 문장을 입력하거나 음성을 텍스트로 변환한 뒤 번역 결과를 읽는 방식이 일반적이었다. 이 과정에서는 입력과 확인, 재전달 단계가 필요해 실제 대화에서는 속도와 자연스러움이 떨어지는 한계가 있었다.

반면 Voice-to-Voice는 음성을 곧바로 번역해 다시 음성으로 전달하는 구조로, 중간 단계를 최소화해 대화 흐름을 끊지 않는 실시간 커뮤니케이션을 구현했다. 사용자는 번역을 의식하지 않고도 자신의 언어로 자연스럽게 대화할 수 있다.

딥엘은 이번 기술을 통해 비대면 회의와 대면 대화, 고객 응대 등 다양한 환경에서 실시간 음성 번역을 지원할 계획이다. 특히 API 형태로 제공돼 기업 내부 시스템이나 고객센터 등에 직접 연동할 수 있어 활용 범위가 넓을 것으로 보인다.

제품군도 세분화했다. 화상회의 플랫폼에서 사용할 수 있는 ‘Voice for Meetings’, 모바일·웹 기반 대화용 ‘Voice for Conversations’, 다수가 동시에 참여하는 ‘Group Conversations’ 등이 순차적으로 출시된다. 기업용 서비스 확장을 위한 Voice-to-Voice API도 함께 제공된다.

이번 출시는 구글, 마이크로소프트, 줌 등 빅테크가 주도해 온 실시간 번역 시장에 본격적으로 도전장을 던진 것으로 해석된다. 이들 기업 역시 화상회의나 모바일 환경에서 번역 기능을 제공하고 있지만, 자막 중심 또는 텍스트 기반 번역에 머무는 경우가 많았다.

반면 딥엘은 강점으로 꼽혀온 고품질 번역 AI를 음성 영역까지 확장해 자연스러운 음성 출력과 문맥 정확도를 동시에 확보하는 데 초점을 맞췄다. 실제 언어 전문가 대상 평가에서도 자연스러움과 정확도 측면에서 경쟁 서비스 대비 높은 선호도를 기록한 것으로 알려졌다.

딥엘은 기존 텍스트 번역 서비스도 함께 고도화하며 단순 번역 도구를 넘어 기업 업무 시스템 전반에 통합되는 ‘엔드투엔드 언어 AI 플랫폼’으로 확장하고 있다. 번역을 별도의 작업이 아닌 업무 흐름 속 자동화된 기능으로 만들겠다는 전략이다.

야렉 쿠틸로브스키 딥엘 CEO는 “실시간 음성 커뮤니케이션은 번역 기술의 다음 단계”라며 “언어가 아닌 전문성으로 경쟁하는 환경을 만드는 것이 목표”라고 밝혔다.

업계에서는 딥엘이 텍스트 번역에서 확보한 품질 경쟁력을 바탕으로 음성 번역 시장까지 빠르게 영향력을 확대할 경우, 기존 빅테크 중심의 언어 서비스 시장에도 적지 않은 변화를 가져올 것으로 보고 있다.

추천 뉴스