Приложение поддерживает теперь тридцать языков, для них доступны все декларированные (на момент публикации материала) документацией Google Cloud Text-to-Speech API звуковые движки: наряду с WaveNet и Basic вы можете работать с Neural2 и Studio. Использование интерактивной командной строки tty-promt включает проверку ввода данных, делая работу с программой удобной и комфортной.
Neural2 - голосовой движок премиум-класса, основанный на той же технологии, что используется и для создания пользовательского голоса. Neural2 представляет собой последнее слово в области создания синтетического голоса и позволяет любому использовать технологию Custom Voice без обучения. Голосовые движки Neural2 доступны в глобальных и однорегиональных конечных точках.
Также Google Cloud Text-to-Speech API представляет Studio. Этот тип голосовых движков разработан специально для использования с длинными текстами: повествование, чтение новостей и т.д. Голоса Studio в настоящее время (на момент публикации статьи) не поддерживают SSML.
Напоминаю, запрос к Google Cloud Text-to-Speech API не может превышать 5000 байт, конвертировать в звук возможно как текст, так и SSML, API предоставляет отличные бесплатные квоты, но требует наличия ключа, для получения которого необходима привязка банковской карты.
В любой момент вы можете клонировать / скачать Google-Cloud-Text-To-Speech-Ruby-CLI-App из репозитория GitHub.
Комментарии в блоге