Команда SberDevices сделала публичным доступ к своей платформе синтеза и распознавания речи SaluteSpeech. Теперь воспользоваться решением могут все желающие при реализации некоммерческих проектов. Ранее применять платформу могли только юридические лица и индивидуальные предприниматели.
SaluteSpeech позволяет решать самые разные задачи. К примеру, малый и средний бизнес может озвучить презентационные материалы или транскрибировать аудиозаписи встреч и интервью для последующей работы с текстом.
Инструмент поможет пользователям, у которых регулярно возникает потребность в переводе текста в голос и наоборот. Это могут быть всевозможные документы, лекционные материалы, видеоролики и пр. Крупный бизнес сможет оперативно протестировать технологию до принятия решения о дальнейшем сотрудничестве со «Сбером».
Платформа SaluteSpeech позволяет подключать речевые технологии в интерактивном голосовом меню, автоответчике, чатах, телемаркетинговых кампаниях, голосовых интерфейсах взаимодействия, для озвучивания контента и команд или голосового ввода на устройствах и сайтах. Важно отметить, что средства распознавания и синтеза речи можно использовать как вместе, так и по отдельности.
Правда, существуют ограничения по применению инструмента. Распознавание речи для физических лиц ограничено 100 минутами в месяц. Синтезировать текст можно на 200 000 символов в месяц — этого достаточно, чтобы создать небольшую аудиокнигу примерно на 100 страниц.
«Доступ к SaluteSpeech для реализации коммерческих проектов исключает эти ограничения. При работе с облачной версией платформы клиент платит по количеству секунд для распознавания речи и по числу символов для её генерации», — отмечает «Сбер».
Источник: