CJ올리브네트웍스, tvN 화면 해설 방송에 ‘AI 보이스 클로닝’ 기술 제공

텍스트 입력하면 음성 자동 생성…AI 알고리즘으로 목소리 구현 제약이 없고 수천가지 목소리 재현도 가능


CJ올리브네트웍스(대표 차인혁)는 tvN과 함께 시각장애인을 위한 화면 해설 방송에 인공지능(AI) 기술을 도입해 색다른 즐거움을 선사한다고 5일 밝혔다.

화면 해설 방송은 시각장애인을 위해 해설자가 등장인물의 표정이나 몸짓, 장면전환 등 화면의 전체적인 내용을 음성으로 설명해 주는 방송을 말한다.

일반적으로 화면 해설 방송은 화면을 음성으로 해설해주는 음원을 녹음해 주음성과 믹싱한 후 부음성에 실어 음성다중으로 송출하는 방식으로, 최종 편집 후에 다시 사운드믹싱을 해야 하기 때문에 긴 제작시간이 소요된다.

CJ올리브네트웍스는 화면 소리에만 의존해 시청해야 하는 시각장애인에게 친숙한 유명인의 목소리를 통해 보다 특별하게 콘텐츠를 즐길 수 있도록 업계 최초로 AI 보이스 클로닝(AI Voice Cloning) 기술을 화면 해설 방송에 지원했다고 설명했다.

AI 보이스 클로닝은 AI 알고리즘에 의한 개인별 음성 분석 및 자동 생성이 가능한 음성합성 기술로, 음성을 학습한 뒤 텍스트를 입력하면 원하는 목소리를 자동으로 생성할 수 있다.

이 기술로 매 콘텐츠마다 전체 지문을 녹음하지 않아도 일정 시간 녹음해 둔 목소리를 기반으로 AI가 여러 프로그램의 화면 해설 음성을 자동으로 생성할 수 있어 시각장애인에게 다양한 콘텐츠를 더 빠르게 전달할 수 있다.

tvN은 AI 보이스 클로닝기술이 적용된 화면 해설 방송의 내레이션으로 배우 전미도와 함께해 시청자들에게 반가움을 더했다. 전미도는 AI 학습을 위해 다양한 예시 문장을 녹음했고 이를 활용해 전미도의 목소리로 tvN 토일드라마 ‘환혼’을 설명하는 화면 해설 방송을 만나볼 수 있다.

강동식 기자 lavita@datanews.co.kr

[ⓒ데이터저널리즘의 중심 데이터뉴스 - 무단전재 & 재배포 금지]

맨 위로