В облаке VK Cloud (бывш. MCS) открыт доступ к платформе распознавания и синтеза речи на основе машинного обучения VK Cloud Voice.

Она поможет компаниям быстро внедрить речевые технологии в свои цифровые сервисы и приложения. Платформа построена с использованием технологий голосового помощника Маруся.

Платформа VK Cloud Voice способна распознавать речь и синтезировать естественный голос. Технология Voice ASR (Automatic Speech Recognition, автоматическое распознавание речи) быстро переводит звуковой файл в удобный для восприятия текст: сервис автоматически разбивает его на предложения и расставляет знаки препинания. Технология Voice TTS (Text-to-speech, генератор естественной речи) основана на машинном обучении. Благодаря этому сгенерированный программой голос не отличим от человеческой речи.

Облачный сервис VK Cloud Voice поможет компаниям проанализировать звонки клиентов, добавить голосовое управление к приложению, озвучить контент на сайте, адаптировать сервис для людей с ограниченными возможностями. Например, слабовидящие люди смогут прослушать информацию, представленную в приложении, и давать команды голосом.

В основе платформы — проверенные технологии голосового помощника Маруся, которые уже используются в сервисах экосистемы VK. В Почте Mail.ru Маруся может озвучивать и отвечать на письма, а также сообщать о непрочитанных сообщениях. Пользователи социальной сети ВКонтакте с помощью голосовых команд могут включить любимую песню или подкаст, найти пользователя или сообщество, написать сообщение или позвонить кому-то из друзей. Также Маруся помогает распознавать названия блюд из Макдоналдс при заказе в Delivery Club.

Возможности Маруси используют различные компании для взаимодействия с пользователями. Так, бренд Purina разработал голосовой навык «Питомцы» для Маруси. С его помощью владельцы домашних животных могут оперативно получать рекомендации и ответы экспертов на любые вопросы, связанные с их содержанием и здоровьем. Диктовка рецептов с помощью Маруси помогла кулинарному проекту Hi-chef стать одним из самых популярных кулинарных сайтов.

Все вычисления происходят на стороне облачного провайдера, за счет чего сервис Mail.ru Cloud Voice не требует от клиента значительных вычислительных ресурсов и обеспечивает быстродействие на любых устройствах. Это позволяет обрабатывать огромные массивы данных и демонстрировать максимальную точность распознавания, что невозможно реализовать на самих устройствах.

Речевые технологии Mail.ru Cloud Voice легко интегрируются в любые сервисы независимо от платформы и языка разработки благодаря универсальному Rest API. Достаточно наложить платформу на необходимую бизнес-логику и интегрировать в приложение или сервис. Технологии Voice ASR и Voice TTS на платформе Mail.ru Cloud Voice постоянно совершенствуются, разработчики и конечные пользователи получают улучшения автоматически.

Сервис Mail.ru Cloud Voice оплачивается по факту использования — только за количество символов озвученного текста или количество распознанных минут аудио.

«Платформа VK Cloud Voice позволяет широкому кругу компаний внедрить в бизнес речевые технологии. Не нужно разрабатывать с нуля алгоритмы распознавания речи и модели машинного обучения, разворачивать серьезную инфраструктуру и нанимать штат разработчиков. Можно взять готовую технологию и в считанные дни улучшить свои цифровые сервисы. Это поможет привлечь новую аудиторию, которая раньше не могла ими пользоваться, или автоматизировать обслуживание клиентов, ускорив процесс и сделав его удобнее».

Дмитрий Лазаренко, директор по продукту VK Cloud (бывш. MCS)

«Для команды Маруси этот шаг — новый значимый этап развития платформы. Мы сильно развили наши голосовые технологии и теперь можем не только помогать пользователям с ежедневными задачами, но и закрывать потребности бизнеса, делая его еще эффективнее».

 

 Алексей Фивинцев, менеджер продукта Маруся в VK

«Мы цифровизируем бизнес с использованием облачных сервисов VK Cloud (бывш. MCS). Компания Logijet стремится изменить привычные паттерны поведения людей в консервативной транспортной логистике и планирует применить платформу VK Cloud Voice для роботизации диалогов логистов и диспетчеров с участниками грузоперевозки. Это позволит эффективнее внедрять цифровые инструменты управления перевозками, такие как мобильное приложение водителя и портал самообслуживания без необходимости увеличивать штат сотрудников при масштабировании бизнеса наших клиентов. Мы постоянно проверяем новые гипотезы, чтобы сделать удобный сервис для наших клиентов — грузовладельцев и транспортно-экспедиционных компаний».

Рустем Искаков, генеральный директор Logijet

Компании смогут реализовать любые сценарии применения сервиса в бизнесе. Эксперты VK Cloud (бывш. MCS) помогут разработать необходимую бизнес-логику. Для этого нужно оставить заявку на консультацию на странице сервиса.

Новые пользователи VK Cloud смогут протестировать речевые технологии VK Cloud Voice бесплатно. Для этого нужно зарегистрироваться на платформе MCS и активировать аккаунт. Для тестирования сервиса будет начислено 3000 рублей.