Описанные в предыдущем параграфе попытки установить связь компьютера с пользователем носят исключительно пассивный характер, ибо они ограничиваются предупреждением о предстоящем сообщении. Чтобы действительно обрести способность к речевому взаимодействию с оператором, система должна реагировать на поступающие в нее входные сигналы. Если придерживаться концепции обмена звуковой информацией, то эта обратная связь также должна быть звуковой. Отсюда, однако, не следует, что компьютер должен непременно понимать смысл слов или обладать способностью распознавания речи. Хотя такой воспринимающий звуковые сообщения вход был бы идеальным и позволил бы вам беседовать с компьютером, для осуществления акустического взаимодействия он необязателен. Итак, для обретения некоторого "интеллекта" компьютеру потребуется микрофонный вход.
Простейшая схема звукового входного устройства, которое можно подключить к компьютеру,- это комбинация микрофона с усилителем и несложной цепочки из амплитудного детектора и пороговой схемы. Такое входное устройство "предупредит" компьютер, что в данный момент в данном помещении нет тишины и поэтому приготовленную к выводу фразу следует временно записать в память. На рис. 4.1 показана блок-схема такого простейшего, но вместе с тем действенного устройства звукового входа. Уровень интеллекта этого устройства при взаимодействии с человеком-слушателем определяется программным обеспечением устройства. Как показано на рисунке, микрофон следует установить рядом с громкоговорителем компьютера, а схему, содержащую усилитель, детектор и пороговое устройство, отрегулировать так, чтобы при тишине в помещении на его выходе был логический нуль. Если же на расстоянии слышимости выходного громкоговорителя происходит разговор, то порог надо отрегулировать так, чтобы на входе компьютера была логическая единица. Обрабатывая эту входную информацию в соответствии с заложенной программой, компьютер определяет наиболее подходящий момент для своего высказывания. Структурная схема типичной программы, позволяющей значительно повысить интеллект компьютерной речевой системы, показана на рис. 4.2.
Рис. 4.1. Простейшая схема устройства акустического взаимодействия с компьютером
Перед началом вывода речевой информации прежде всего подается тональный сигнал оповещения или речевой сигнал прерывания, предупреждающий о том, что скоро компьютер сделает свое сообщение. Сразу же после этого компьютер делает паузу приблизительно в 1 с, чтобы при помощи схемы звукового взаимодействия определить, наступила ли в помещении тишина. Если Разговор продолжается, то приготовленная фраза записывается в намять и периодические проверки на наличие тишины производятся до тех пор, пока уровень шумов не станет ниже порогового. Выявив такой момент, компьютер может начать говорить с определенной уверенностью, что речевого столкновения не произойдет. Программная реализация такого режима выдачи сообщений без прерывания других говорящих очень проста, а достижимые при этом результаты могут быть весьма впечатляющими. Несколько более сложная программа позволит даже проверять уровень шумов в помещении между определенными словами, произнесенными компьютером, и если разговор возобновился, то компьютер может начать свое сообщение снова, когда представится подходящий момент. Для слушателя компьютер, ведущий себя подобным образом, будет похож на говорящего человека, которого прервали и который замолчал, ожидая момента, когда сможет повторно высказать свою мысль.
Можно ли мне сказать это?
Иными словами, главное в описанной системе - имитировать поведение говорящего человека, проявляющего определенную степень уважения к тем, кто находится рядом с ним. На рис. 4.3 показана принципиальная схема, позволяющая реализовать описанный режим работы с акустическим взаимодействием. Эта схема собрана на трех обычных операционных усилителях интегрального типа. С их помощью производятся усиление сигнала с выхода микрофона, детектирование и пороговое ограничение, позволяющее определить уровень шумов в помещении. Предусмотрены две регулировки: усиления сигнала, получаемого с выхода микрофона, и порогового уровня окружающих шумов. Практически такая схема звукового взаимодействия может сопрягаться всего лишь с одним входом говорящего компьютера - это сигнальная линия, позволяющая определять, тихо или шумно в помещении в данный момент. Если ручку регулировки порога установить приблизительно в среднем положении, то усиление нужно отрегулировать таким образом, чтобы человек, говорящий в помещении спокойным голосом, создавал на входе компьютера сигнал, соответствующий логической единице, т. е. примерно напряжению 5 В. Когда же человек прекращает говорить, уровень сигнала на входе компьютера должен быстро падать до О В. Работа данной схемы мало зависит от разброса параметров компонентов схемы и от способа монтажа. При сборке схемы следует лишь обязательно предусмотреть экранирование микрофонного провода и соединений его с входным усилителем, чтобы избежать сетевых наводок и других помех. Собрав схему и подключив ее на вход компьютера, вы получите говорящий компьютер, ведущий себя весьма разумно и нуждающийся в исключительно малых программных средствах для реализации блок-схемы алгоритма (рис. 4.2).