Поговорим с компьютером о...

Дата публикации: 07/11/2009

А неважно о чем мы будем говорить, потому что предметом нашего сегодняшнего разговора будет сам разговор! А точнее, мы поговорим о компьютерном синтезе речи, тем более что для этого есть небольшой повод. Но начнем мы с небольшой предыстории.

Проблема синтеза речи наряду с ее распознаванием до сих пор хорошо не решена и, скорее всего, прогресс в этой области будет идти эволюционно и мелкими шажками. Сегодня у меня есть возможность оценить прогресс в этой области - по крайней мере с тем, что было лет 10-15 назад, когда я впервые попробовал подобную программу. На бытовом уровне простейшие синтезаторы речи встраиваются даже в операционные системы, но качество синтеза, мягко говоря, все еще заставляет желать лучшего. В Microsoft Windows встроенный голос системы ниже всякой критики и на естественность даже не претендует. В Mac OX X входящий в состав системы синтезатор речи на порядок лучше и для английского языка звучит уже вполне хорошо.

Как вы понимаете, с русским языком ситуация сильно хуже, чем с английским. Во-первых, фонетика и грамматика русского языка совершенно другие, чем у английского, французского и итальянского, которые соответственно лучше изучены. Во-вторых, русские голоса, которые представляют собой большие базы данных фонем, встречаются гораздо реже.

Читать дальше

Теги: программы, синтез речи

О синтезаторе речи в "iPod Shuffle"

Дата публикации: 19/03/2009

После опубликования заметки про новый "iPod Shuffle", выпущенный Apple, я задумался о том, как именно в нем реализован синтезатор речи. Как вы, вероятно, помните - это основное нововведение в новом плейере, и благодаря ему теперь можно прослушать название текущей песни или выбрать нужный плейлист для проигрывания.

Технология "VoiceOver" для синтеза речи

Из той информации, которая у меня есть в голове, я знаю, что качественный синтез речи - задача очень непростая и ресуркоемкая. Современные прогрессивные способы синтеза основываются на фонетических словарях, хранящих звуки и их сочетания, а также на сложной математике формирования естественной речи. Более того, я знаю, что существуют качественные программы по синтезу речи, но база данных их фонетических словарей достигает нескольких гигабайт на один голос. Большая часть таких приложений является специализированной и на уровне операционных систем используют гораздо более простые алгоритмы и звуковые базы данных.

Речь, которую могут синтезировать и "Mac OS X", и Windows, трудно назвать естественной и на данный момент она скорее является вспомогательным средством для некоторых людей. Ситуация улучшается с выходом новых версий, ввиду доработок алгоритмов и фонетического словаря, но в общем ситуация далека от идеальной. Будем надеяться, что постепенно технологию синтеза доведут до хорошего уровня и использование синтезатора речи в "iPod Shuffle" - это один из шагов в данном направлении.

Читать дальше

Теги: iPod, VoiceOver, синтез речи

Смотри также