Публикации

Текст в речь: Чтение инструмента для IVR

Преобразование текста в речь (TTS), фундаментальное для таких технологий, как системы IVR, — это создание человеческой речи из текстовых символов. Наиболее известным является то, что говорит Стивен Хокинг, страдающий болезнью Лу Герига.

TTS восходит к Всемирной выставке 1939 года и представлению синтезатора Voder, который был первой машиной, которая создала речь в электронном виде. В 1961 году Bell Labs продемонстрировала первый синтез речи с помощью компьютера.

В середине 1980-х Стивен Хокинг впервые начал использовать собственный синтезатор речи, прикрепленный к его инвалидной коляске. Хокинг использует программное обеспечение, которое позволяет ему выбирать слова из меню, используя переключатель в руке, а затем использовать синтезатор речи, чтобы озвучить слова.

Благодаря этой технологии Хокинг смог написать несколько книг, часто читать лекции и даже рассказывать телевизионные шоу. Возможно, из-за его инвалидности, у него один из самых узнаваемых голосов вокруг.

Тем не менее, наиболее распространенное использование TTS — это индустрия IVR ( http://www.plumvoice.com ), где она долгое время являлась основным продуктом этой технологии. В системах IVR TTS переводит текст в потоках вызовов в сообщения, передаваемые вызывающим абонентам в систему. Хотя большинство систем IVR также включают технологию записи для передачи записанных сообщений, TTS позволяет разработчикам потоков вызовов быстро создавать потоки вызовов с любым текстом, в котором они нуждаются.

В то время как ранние исследователи рассматривали TTS как инструмент обучения для людей с ограниченными возможностями чтения или как способ для слепых наслаждаться книгами, современные исследователи работают над тем, чтобы найти применение во множестве отраслей, включая бизнес, развлечения и медицину, а также образование.