§ 8.2. Экспериментальное исследование критериев нахождения системы признаков на примере опознания речевых команд
§ 8.2.1. Постановка задачи
Нахождение системы признаков является одним из наиболее важных этапов при проектировании автомата, опознающего заданный алфавит образов. Алгоритмизация этого этапа позволяет единообразно находить системы признаков для различных по своей природе задач опознания, что невозможно при эвристических методах.
При применении алгоритмических методов нахождения системы признаков предполагается, что свойства образов соответствуют некоторой модели, например, геометрической модели взаимного расположения образов в выбранном пространстве исходного описания. Очевидно, что выяснение близости постулируемой модели к реальным задачам опознания требует экспериментальной проверки. Не менее важным и не менее интересным является исследование и сравнение свойств систем признаков, найденных по различным критериям на одном и том же экспериментальном материале.
В данном эксперименте критерии нахождения системы линейных признаков, изложенные в главе IV, исследовались на речевом материале.
Речь является для человека наиболее естественной формой коммуникации. Решение задачи опознания речевого потока позволит, с одной стороны, установить более оперативную связь между человеком и машиной, а с другой - осуществить наиболее экономные линии связи [8.1-8.6].
Задачи опознания речевых образов можно разбить на три типа: опознание того, что сказано (опознание речевых команд, звуков, слитной речи), кем сказано (опознание личности говорящего), как сказано (опознание интонации и эмоционального состояния говорящего) [8.3, 8.51.
Речь человека является сложным объектом для опознания. В практических задачах опознание речевых команд, например, весьма многомерное описание реализаций (слов, наговоренных различными дикторами), сочетается с достаточно большим алфавитом опознаваемых образов.
Задачам опознания речевых команд посвящен ряд работ, например, [8.7-8.10].
В настоящем параграфе описывается экспериментальное исследование свойств критериев нахождения системы признаков на примере опознания одиннадцати речевых команд.
Для сопоставимости результатов эксперимента с предыдущим опытом работы исходное описание, словарь и сам речевой материал были взяты примерно такими же, как и в работе [8.7 ]. Словарь состоял из цифр от нуля до девяти и слова "читаю". В качестве исходного описания использовались функции мгновенных плотностей нулевых переходов (подробнее об этом будет сказано ниже). Заранее было известно, что наиболее трудно различимыми словами в этом описании являются слова "два" и "ноль" (в работе [8. 7] слово "ноль" не рассматривалось).
В работе [8.7] признаки находились эвристически: сначала на основании анализа описания образов были выдвинуты гипотезы о дифференциальных признаках группы звуков, которые затем статистически проверялись по учебной выборке. Таким способом было отобрано восемь признаков, разделяющих некоторые группы звуков (два из них использовали информацию о текущем спектре речевого сигнала, которая в эксперименте на ЭВМ отсутствовала). Далее учет временной структуры опознаваемых слов позволил с помощью достаточно простого решающего правила реализовать аналоговое опознающее устройство с надежностью распознавания 96,6% для десяти слов.
Главная отличительная особенность настоящего эксперимента состоит в полной алгоритмизации процесса нахождения признаков. При этом признаки находились по более бедному описанию и не для групп звуков, а сразу для слова в целом. Тем не менее найденные признаки позволили получить даже несколько лучшую надежность опознания, равную 97,7%.