Top.Mail.Ru

Синтез голоса при помощи Google Cloud TTS

Сервисы автообзвона – это быстрый и простой способ голосового оповещение абонентов. У вас проходит распродажа или планируется проведение мастер класса? Оповестить клиентов об этом событии можно при помощи Call Office, позволяющей решить ваши задачи. Программа может похвастаться рядом преимуществ, одно из которых – возможность синтеза речи посредством Google TTS.

Что такое Google Cloud TTS

Google TTS (text-to-speech) – это набор инструментов, разработанных компанией Google. Изначально технология использовалась только в Google-сервисах. Однако в 2018 году корпорация открыта доступ разработчикам приложений. TTS реализует технологию «синтеза речи» (также известную как текст-в-речь) для озвучивания текста и команда Call Office горда тем, что одной из первых внедрила её в своё программное решение.

Особенности технологии

Call Office поддерживает современную технологию синтеза речи Goole TTS, позволяющую генерировать речь прямо из напечатанного текста. Как это работает и что это за технология? Для работы программы требуется постоянный доступ к интернету. Получившийся синтетический голос максимально схож с настоящим. Технология от Google считается лучшей на данный момент. Пользователь может выбрать из 220+ голосов: мужских и женских. Все это доступно на 40+ языках. Есть возможность настройки скорости, тональности и интонации.

Целесообразность

Об «роботизации» телефонных контактов следует задуматься в случае, когда:
  • Ваша компания обрабатывает значительное количество однотипных телефонных звонков.
  • Ваши операторы перегружены. Персонал не выдерживает нагрузок и уходит.
  • Объем продающих звонков ниже объема звонков, направленных на обслуживание.
  • В случае резкого скачка нагрузки на call-центр, который сложно масштабировать.
  • Требуется частое внедрение новых скриптов, что может быть очень затратно (с учётом обучения).

Синтез речи Google TTS в Call Office

В Call Office функция синтеза речи от Google представлена двумя типами голосов: Standart и WaveNet. И если Standart - это уже технологически устаревшая версия синтезатора, то последняя представляет собой нейронную сеть, предназначенную для формирования звуковых файлов. Разработчиком выступила компания DeepMind, которая в 2014 году была куплена и перешла под крыло корпорации Гугл. Основная задача данной нейросети заключается в генерации голоса, максимально неотличимого от человеческого. Подобные вычислительные процессы требуют соответствующих мощностей, поэтому стоимость речи синтезированной посредством WaveNet будет стоить в несколько раз дороже стандартного. Но и результат будет в разы лучше, поэтому мы всегда рекомендуем нашим клиентам именно его, так как "живой" голос значительно лучше воспринимается абонентами при обзвоне, чем дребезжащий роботизированный.

Преимущества Google Cloud TTS

  • Умение работать с множеством языков и голосов. Доступно синтезирование речи 220 разными голосами на 40 языках.
  • Качество. Сходство распознавания приблизительно 95%.
  • Современные технологии. Благодаря WaveNet различия между синтезированной речью и голосом человека минимальны.
  • Гибкая настройка. Помимо большого количества языков и голосов можно настроить высоту, тональность и скорость воспроизведения речи.
  • Также можно сказать, что любая автоматизация более эффективное, дешевое и производительное решение, чем простой обзвон силами операторов. Опробовать все достоинства программы можно заполнив эту форму и получив бесплатную версию Call Office.