인공지능(AI) 소프트웨어 전문기업 코난테크놀로지(대표 김영섬)는 대본 및 텍스트를 사람의 목소리처럼 자연스러운 AI 합성음으로 변환해주는 ‘코난보이스’ 오픈베타 서비스를 출시했다고 9일 밝혔다.
코난보이스는 텍스트만 입력해도 합성음을 생성해 동영상에 더빙할 수 있는 서비스로, 코난테크놀로지의 개인화 음성생성 전문 AI 기술을 통해 개발됐다. 고속·고완성도 음성합성 기술을 토대로 사용자가 입력한 대본 또는 텍스트 문장을 빠르게, 그리고 노이즈 없이 선명한 고음질로 전달하는 것이 특징이다.
또 AI 보이스의 속도·볼륨 조절기능도 세밀하다. 수십분에서 2시간 미만의 음성 데이터를 개인화 음성으로 생성할 수 있으며, 몇 백초 길이의 음성파형을 0.1초 이내로 합성하는 등 기존 타사 서비스에 비해서도 경쟁력을 갖췄다는 것이 회사 측 설명이다.
지연없는 고속 E2E(End-To-End) 합성기술이 적용된 것도 특징이다. 따라서 사람이 직접 목소리를 녹음하고 후속 작업하는 번거로움을 줄여 누구나 쉽게 더빙 콘텐츠를 제작할 수 있다.
코난보이스 오픈베타 웹사이트에서 회원가입 후 누구나 무료로 사용할 수 있으며, AI성우를 선택하고 직접 디렉팅해 음성 콘텐츠를 생성할 수 있다. 현재 성인과 아이, 남성과 여성 보이스 모델 18종을 제공하고 있으며, 기쁨과 슬픔, 분노, 희망 등 다양한 감정을 가진 음성모델을 개발 중이다.
유영욱 코난테크놀로지 구독사업팀장은 “유튜브, 틱톡을 비롯해 동영상 콘텐츠 제작 수요가 날로 늘어가는 만큼 고품질 AI 목소리를 손쉽게 만나볼 수 있는 코난보이스 오픈베타를 출시하게 돼 뜻깊다”며 “개인 크리에이터의 콘텐츠 제작은 물론 기업의 요구에 따라 다양한 개인화 음성 또한 제작할 수 있을 것”이라고 말했다.
강동식 기자 lavita@datanews.co.kr