НОВОСТИ   БИБЛИОТЕКА   ЮМОР   КАРТА САЙТА   ССЫЛКИ   О САЙТЕ  




предыдущая главасодержаниеследующая глава

"Тахометр" синтеза речи

На рис. 6.1 изображена диаграмма, позволяющая визуально сравнить три названных типа систем. Этот "тахометр" синтеза речи показывает, как соотносятся скорости работы компьютера, необходимые для генераторов искусственной речи каждой из трех основных категорий. Сами по себе эти скорости для большинства современных персональных компьютеров вполне реальны, но скорость выборки информации (выражаемая в битах в секунду, бит/с) в неявном виде связана непосредственно с объемом памяти, необходимым для хранения речи. И если ввести некий относительный показатель, позволяющий сравнивать три названных метода синтеза речи по необходимому для каждого из них объему памяти, то идея подобного "тахометра" приобретает более глубокий смысл.

Рис. 6.1. 'Тахометр' синтеза речи
Рис. 6.1. 'Тахометр' синтеза речи

Предположим, например, что у базового персонального компьютера байт памяти содержит восемь бит (у большинства компьютеров это именно так). Поскольку на "тахометре" речи показаны скорости в бит/с, простым делением скорости на восемь можно найти объем памяти, требуемый для каждой секунды речи. Допустим теперь, что мы хотим сравнить методы синтеза речи по эффективности хранения такого слова, как hello. Время, затрачиваемое на произнесение этого слова, зависит от манеры речи каждого человека, но приблизительно его можно считать равным 0,3 с. Как видно из табл. 6.1, где три основных метода синтеза речи сопоставляются по объему памяти, необходимой для произнесения данного слова, их эффективность в этом отношении очень различна. На рис. 6.1 для каждого из методов показана область скоростей, в которой данный конкретный метод может использоваться. Нижняя граничная скорость выборки в каждом случае соответствует относительно низкому качеству речи и связанному с ним ухудшению разборчивости. Верхняя граничная скорость в каждом методе соответствует системе с очень хорошей артикуляцией, качество речи которой приближается к естественной речи человека. Объем памяти, требуемый для произнесения слова hello, меняется в пределах от 4 байт (сравнительно низкокачественный фонетический метод синтеза; см. третью колонку таблицы) до 4500 байт (метод непосредственного кодирования сигналов с высоким качеством речи). Разумеется, нижние граничные значения скоростей для каждого метода синтеза выбраны так, чтобы уровень разборчивости был примерно одинаков, а верхние граничные скорости соответствуют в каждом случае почти идеальному качеству речи.

Таблица 6.1. Сравнение методов синтеза речи
Таблица 6.1. Сравнение методов синтеза речи

предыдущая главасодержаниеследующая глава








© Злыгостев А.С., 2001-2019
При использовании материалов сайта активная ссылка обязательна:
http://informaticslib.ru/ 'Библиотека по информатике'
Рейтинг@Mail.ru
Поможем с курсовой, контрольной, дипломной
1500+ квалифицированных специалистов готовы вам помочь