23 декабря 12:09
Синтез речи для озвучки новостей
Поделиться
twtg

Новости на ведущих медиа Rambler Group — «Газета.ru», Lenta.ru и «Чемпионате» — теперь можно не только прочитать, но и прослушать. Данная опция стала возможной благодаря искусственному интеллекту — синтезу речи от Группы ЦРТ — и стала новой моделью потребления контента на медиаресурсах. Технология преобразовывает текст сообщения в речь, максимально близкую к человеческой, включая интонационные особенности. Новости на «Газета.ru» и Lenta.ru читает мужской голос, на «Чемпионате» — женский. Функция озвучки вводилась поэтапно, с апреля 2020-го, и сегодня доступна на всех цифровых устройствах, включая компьютеры, смартфоны и планшеты.

Весной этого года на «Газета.ru» у каждого материала появилась кнопка «Прослушать новость», которая позволяет с помощью аудио ознакомиться с контентом издания. Только за первый месяц работы синтеза количество прослушиваний материалов на «Газета.ru» превысило 200 тысяч. Всего с момента запуска проекта такой возможностью воспользовалось более одного миллиона человек. При этом свыше 70% аудитории предпочитает обращаться к новой функции с мобильных устройств. Благодаря озвучке новостей с помощью синтеза ЦРТ и глобальным изменениям алгоритмов поисковой системы Google Core Update видимость материалов «Газета.ru» в выдаче Google значительно увеличилась.

В сентябре на «Газета.ru» также был запущен автоматизированный подкаст — «Новости вслух». Каждые полчаса с помощью синтеза речи создаётся свежий аудиовыпуск новостей, который неотличим от выпуска новостей с диктором на современных радиостанциях. За три месяца аудитория подкаста выросла в два раза, а совокупное количество прослушиваний уже составляет почти 500 тысяч.

В ноябре в рамках масштабирования проекта озвучка новостей была запущена и на Lenta.ru — за месяц она собрала свыше 100 тысяч прослушиваний.

С сегодняшнего дня, 23 декабря, функция активна на страницах спортивного издания «Чемпионат».

Потребление контента развивается и меняется вместе с появлением новых технологий и их доступностью пользователям. Медиа Rambler Group всегда работают над тем, чтобы читателям было удобно получать информацию. Озвучка текстов стала логичным расширением возможностей для нашей аудитории. Успешный запуск на ʺГазета.ruʺ и Lenta.ru доказал, что такое использование речевых технологий востребовано и делает наши ресурсы более привлекательными. Благодаря тому что Группа ЦРТ, как и мы, является частью экосистемы Сбера нам удаётся быстро масштабировать этот кейс на другие продукты: мы запустили озвучку текстов на ʺЧемпионатеʺ. Рост вовлечённости аудитории даёт нам однозначный ответ, что мы приняли правильное решение, внедряя этот проект в наши продукты

Особенность синтеза ЦРТ — в использовании сложных нейросетевых моделей для непрерывной генерации речевого аудиосигнала, глубокий синтаксический и лексический анализ текста, моделирование интонаций и дыхания, в том числе в коротких и вопросительных предложениях. Это позволяет добиться плавности и выразительности синтезированной речи, делает её более реалистичной и естественной. Доступность синтеза ЦРТ из облака позволяет в короткий срок озвучить подкаст, книгу или новости, повысив их доступность среди аудитории, предпочитающей потреблять контент в аудиоформате. Интеграция синтеза позитивно влияет и на UX/Accessibility/SEO. Пример Rambler Group доказывает, что реализовать такую интеграцию просто и быстро

Синтез речи (TTS, Text-to-speech) полностью дублирует редакционный текст новости и переводит его в звучащие фразы. В Группе ЦРТ эту технологию создают на стеке методов глубинного обучения, что позволяет добиться высокого качества синтезированного голоса. Благодаря мощному лингвистическому процессору прочтение текста выполняется со всеми нормами языка даже в сложных случаях. Всё это позволяет оперативно узнавать повестку не только людям с ограниченными возможностями зрения, но и каждому в ситуациях, когда контент удобнее слушать, чем читать.

По данным ООН, около 10‒15% населения Земли — люди с ограниченными возможностями, в том числе с нарушениями зрения, и большая часть из них активно пользуется интернетом. При этом в целом каждый может испытывать существенные сложности при чтении новостей с экранов смартфонов. Поэтому Rambler Group регулярно работает над увеличением доступности собственного контента для различных аудиторий, чтобы сделать процесс получения информации ещё удобнее.

Поделиться
twtg
Ещё по теме Экосистема

Мы используем файлы cookie

ПАО Сбербанк использует cookie (файлы с данными о прошлых посещениях сайта) для персонализации сервисов и удобства пользователей. Сбербанк серьезно относится к защите персональных данных — ознакомьтесь с условиями и принципами их обработки. Вы можете запретить сохранение cookie в настройках своего браузера.