26 ноября 13:35
Детские сказки «заговорили» благодаря синтезу речи

Синтез речи от группы компаний ЦРТ, входящей в экосистему Сбера, теперь используется для озвучивания сказок на сервисе MySkazka. Благодаря инновационной технологии уже «заговорили» 10 сказок — их можно воспроизводить как женским, так и мужским голосом.

Синтез речи — это перевод печатного текста в звучащую речь. В группе ЦРТ он осуществляется на стеке методов глубинного обучения, что обеспечивает высокое качество получаемого голоса.

Мы используем сложные нейросетевые модели для непрерывной генерации речевого аудиосигнала, глубокий синтаксический и лексический анализ текста, моделирование интонаций и дыхания — это позволяет добиться плавности и выразительности искусственной речи. Наш синтез встроен в сложные продукты и AI-решения в банках, телекоме, медицине и других отраслях. Совместная работа с MySkazka особенно значима для нас, поскольку связана с самой юной аудиторией. Мы рады поддержать этот проект и уверены, что он будет развиваться

MySkazka — первый в Рунете сервис персональных иллюстрированных и озвученных сказок. Все сказки сервиса написаны профессиональными детскими психологами и писателями, а для их иллюстрирования был проведён отбор среди более чем 100 специалистов. Проект стартовал в августе 2020 года — и сразу же возник вопрос озвучки.

Перед нами стояла трудная задача, поскольку сервис использует персональные переменные, которые пользователь заполняет в реальном времени. Поэтому простой вариант — пригласить профессионального диктора — нам не подошёл. Мы начали искать технологическое решение и выбрали синтез группы ЦРТ: для нас было важно не просто синтезировать речь из текстов сказок, но сделать её максимально похожей на настоящую — с интонацией, придыханием, знаками препинания, ведь наша целевая аудитория — дети. Озвучивание сказок позволит пользоваться сервисом детям, которые ещё не умеют читать или испытывают специфические трудности с чтением, а также тем, кто предпочитает формат аудиокниг. Озвучка работает всего неделю, но мы уже наблюдаем положительную динамику — retention rate сервиса (коэффициент удержания пользователей) вырос на 30%, а конверсия новых пользователей в регистрации увеличилась с 7 до 11%

Группа компаний ЦРТ — глобальный разработчик продуктов и решений на основе интеллектуальных речевых технологий, распознавания лиц. Технологический эксперт в области искусственного интеллекта и машинного обучения с 30-летним опытом. Одна из немногих компаний в мире, которая создаёт и развивает обе биометрические модальности — лицо и голос. Выявление подделок голоса и распознавание речи от группы ЦРТ занимают лидирующие позиции в мировых рейтингах NIST, ASVspoof Challenge, VOiCES. На CHiME 2020 технология распознавания речи от ЦРТ была признана лучшей в мире. Группа ЦРТ реализовала более 5000 проектов с применением искусственного интеллекта в 70 странах. Входит в экосистему Сбера.

Ещё по теме Экосистема

Мы используем файлы cookie

ПАО Сбербанк использует cookie (файлы с данными о прошлых посещениях сайта) для персонализации сервисов и удобства пользователей. Сбербанк серьезно относится к защите персональных данных — ознакомьтесь с условиями и принципами их обработки. Вы можете запретить сохранение cookie в настройках своего браузера.