Это одна из немногих чисто программных речевых систем, разработанная Аланом Севиллом, которая предназначена специально для персональных компьютеров и практически не требует дополнительной аппаратуры. Простота речевого синтезатора Чипток объясняется использованием в нем специфического процесса кодирования речевого сигнала. Система спроектирована в расчете на работу с компьютерами серии TRS-80 фирмы "Рейдио шэк" и компьютером Н-8 фирмы "Хит". Единственное, что здесь необходимо для дискретизации (преобразования аналогового сигнала щ цифровой) наговоренных слов и их последующего воспроизведения,- это наличие одного двоичного порта ввода-вывода. Для дискретизации и воспроизведения речевого сигнала можно использовать недорогой звуковой усилитель и микрофон. В случае применения любого пригодного для работы с этой системой компьютера для кодирования речевого сигнала не* обходимо выполнить простейшую модификацию аппаратных средств. При работе с машиной Н-8 фирмы "Хит" для кодирования речевого сигнала достаточно вставить одну-единственную дополнительную перемычку. Для речевого воспроизведения закодированной речи необходимо изменить соединение всего одного вывода интегральной схемы на плате передней панели. Этот вывод следует подключить к внутреннему громкоговорителю. В то же время компьютер TRS-80 фирмы "Рейдио шэк" способен воспроизводить закодированный речевой сигнал через звуковой выход кассетного магнитофона, не требуя введения в схему каких-либо изменений. Здесь кодирование речевого выхода требует небольших изменений клавишного пульта (или добавления нескольких внешних логических вентилей), что обеспечивает требуемое строби-рование речевого сигнала. Программный вариант синтезатора Чипток будет производить дискретизацию вашего голоса (с кодированием речевого сигнала) при его подключении к соответствующему входному порту, а затем воспроизводить по команде закодированную речь с помощью звуковой выходной системы.
Использованный в устройстве Чипток процесс кодирования речевого сигнала не был описан в предыдущей главе, посвященной кодированию таких сигналов. Он, однако, имеет сходство с процессом кодирования по методу дельта-модуляции, состоящее в том, что в нем по каждой выборке из речевого сигнала также запоминается всего один бит данных. Такой же процесс используется и в некоторых других чисто программных синтезаторах речи. Он получил название метода кодирования речевого сигнала с частотной модуляцией (ЧМ). Суть процесса поясняется на рис. 7.4. Поступающий на вход синтезатора речевой сигнал изображен в верхней части рисунка. Этот сигнал дискре-тизуется с частотой, равной примерно 4000 выборок в секунду. Каждая выборка является бинарной величиной, которой присваивается единичное значение, если входной сигнал больше предварительно установленного порога для единицы, и нулевое, если он меньше порога, установленного для нуля. Поскольку в качестве входных каскадов пороговой схемы используются простейшие ТТЛ-вентили, пороговый уровень для логического нуля равен 0,8 В, а для логической единицы - 2,4 В. По мере того как входной речевой сигнал изменяется по амплитуде между двумя этими пороговыми уровнями цифровой код речи меняется от 0 до 1. Изображенный в нижней части рис. 7.4 поток выходных импульсов представляет одновременно и последовательность однобитовых данных, хранимых в памяти, и выходные данные, направляемые на громкоговоритель для воспроизведения речи. Совершенно очевидно, что между входными и выходными сигналами очень мало сходства, однако получаемый таким путем искаженный речевой выход можно все же понять. Учитывая невысокую стоимость этой системы, можно считать, что она превосходно справляется с задачей получения от компьютера самых первых слов.
Рис. 7.4. Процесс бинарного ЧМ-кодирования
Для компьютера TRS-80 система Чипток выпускается в виде магнитофонной кассеты, а для компьютера Н-8 - в виде диска Н-17. Приобретаемая программа обеспечивает возможность кодирования и восстановления речевого сигнала для каждого из этих компьютеров. Оба этих программных средства содержат демонстрационную, или говорящую, программу, которая помогает обучить компьютер речи. В программе содержатся слова, наговоренные Аланом Севиллом, которые можно вывести из памяти посредством 16 отдельных распечаток голоса (дампов), а также демонстрационная алфавитная последовательность.