▲이석진 SK㈜ C&C 채널&마케팅그룹장과 정승환 라이언로켓 대표(화면)가 화상회의로 인공지능(AI) 텍스트 음성변환(TTS) 사업 협력 협약을 체결한 뒤 기념촬영을 하고 있다. / 사진=SK㈜ C&C
20분 정도의 음성녹음 파일만 있으면 자신의 목소리를 닮은 인공지능(AI) 보이스를 만들 수 있다.
SK㈜ C&C(대표 박성하)는 23일 라이언로켓(대표 정승환)과 ‘AI 텍스트 음성 변환(TTS) 사업 협력 협약’을 체결했다고 밝혔다.
라이언로켓은 AI를 활용해 화자의 목소리와 말투를 완벽하게 모사하는 음성합성기술을 보유한 스타트업이다. 지난 4.15총선 관련 ‘선택 2020’ MBC 개표방송에서 AI 캐스터 목소리로 실시간 개표상황과 지역별 후보자들을 알려주는 ‘AI 라이브’ 방송 서비스로 큰 화제를 모았다.
양사는 각 사가 보유한 자연어 처리 및 텍스트 음성 변환 고유 기술을 결합해 문화 및 교육 분야를 중심으로 국내외 콘텐츠 시장 공동 발굴에 나선다. 시각장애인의 학습과 문화체험을 돕기 위해 활자책을 음성으로 변환하는 사업을 우선 추진한다.
양사는 먼저 문화재청 국립문화재연구소와 함께 시각장애인을 위한 천연기념물(동물) 소개용 점자감각책에 들어가는 이야기해설(내레이션) 제작을 지원했다.
AI를 활용해 시각장애인을 위한 목소리 기부 의사를 밝힌 배우 이병헌과 한지민의 목소리를 이야기 해설에 재현했다. ‘천연기념물(동물) 이야기해설’은 오는 10월 15일 ‘흰지팡이의 날(시각장애인의 날)’에 맞춰 ‘천연기념물(동물) 멀티미디어 점자감각책’에 수록돼 전국 시각장애인 단체 및 맹학교에 배포된다.
한국시각장애인복지재단에서 운영 중인 ‘모바일 소리책’ 앱을 통해서도 공개해 문화 취약계층의 문화향유 기회 확대에 기여할 예정이다.
문화재청 정부 혁신 역점 과제인 멀티미디어 점자감각책에는 천연기념물 동물에 대한 그림과 소리, 이야기해설, 음원(동요·민요) 등 시각장애인과 비장애인이 함께 이용하며 소통할 수 있는 콘텐츠들이 채워져 있다.
양사가 힘을 합친 ‘AI 텍스트 음성 변환’의 핵심은 딥러닝과 딥보이스 기술에 기반 한 빠른 음성 합성속도에 있다. 20분 분량의 음성녹음 데이터만 있으면 화자의 목소리, 톤, 억양, 발음, 속도 등의 특징을 분석해 어떤 문장이라도 자연스럽게 읽어 내려간다.
목소리 제공자가 오랜 시간 녹음한 음성을 자음, 모음으로 나누어 소리를 붙이는 기존 텍스트 음성 변환 기술과 달리 AI가 제공자의 말뭉치를 그대로 분석 학습하기 때문이다.
양사는 한류 스타 및 캐릭터를 활용한 글로벌 콘텐츠 사업 및 일반인 및 아동 대상 도서 읽어 주기 등의 신규사업 개발에도 힘을 모은다.
짧은 제작기간 덕분에 사업화에 투자되는 시간도 크게 줄일 수 있을 전망이다. 이미 녹음 파일을 보유한 한류 스타나 유명 캐릭터는 별도 녹음 없이 문자 입력과 동시에 목소리가 생성되기 때문이다.
강동식 기자 lavita@datanews.co.kr