9-2. Модель передачи информации, использующая тезаурусы
Для исследования процесса обработки информации с помощью ЦВМ можно использовать структурную схему, показанную на рис. 5-1.
В зависимости от направленности диалога человек - машина в роли источника информации выступает последовательно то человек, то машина. При загрузке информации в ЦВМ источником информации выступает человек. Функции передатчика, канала связи и приемника выполняет комплекс устройств ввода и других машинных средств, участвующих в процессе переноса информации от человека к устройству внешней памяти - магнитной ленте, барабану или диску. Основной помехой являются ошибки перфорации.
Рис. 9-3. Структурная схема канала Физический связи с использованием тезаурусов. шум
При использовании ЦВМ и машинного банка данных в качестве информационно-справочной системы источником информации выступает банк данных. При этом модель в виде структурной схемы, приведенной на рис. 5-1, малопригодна, так как часто требуется правильно передать смысловое содержание информации, а не ее код. Поэтому более правильное представление о процессе обмена информацией в любых системах дает блок-схема на рис. 9-3, в которой используются тезаурусы источника информации и адресата. Эта схема одинаково пригодна для описания процесса передачи информации в системах человек - человек, человек - машина, машина - человек. Прежде всего для нормальной передачи семантической информации необходимо, чтобы тезаурусы источника информации и адресата пересекались. Математически тезаурус можно представить в виде множества элементов или графа. Пересечение двух тезаурусов означает пересечение множеств этих тезаурусов, т. е. наличие общих элементов (вершин или ребер графа) (рис. 9-4).
Для простоты рассмотрим с этих позиций обмен информацией в системе человек - человек. Допустим, специалист по электронике хочет объяснить с помощью видеотелефона неспециалисту, что такое полупроводник. В этом случае тезаурусы источника информации и адресата не пересекаются (рис. 9-4, а). Какие бы совершенные системы кодирования, передатчики, линии связи и приемники ни использовались, передачи семантической информации не будет или она будет ничтожно мала. Когда же передача семантической информации происходит между специалистами одного профиля (рис. 9-4, б), тезаурусы источника информации и адресата практически совпадают.
Рис. 9-4. Условия передачи семантической информации
Если следовать точке зрения Шеннона, то при совпадении тезаурусов никакой передачи информации быть не может, так как требуется так называемый элемент новизны или расширения тезауруса. Однако в инженерной практике и практике общения между людьми такая концепция часто не подтверждается. Действительно, при обмене информацией между специалистами они тем быстрее поймут друг друга, чем больше совпадают их тезаурусы знаний в данной области. Усвоение информации одним собеседником будет даже быстрее, если его тезаурус знаний больше, а тезаурус его собеседника составляет его часть. Однако следует признать, что в данном примере происходит пополнение, расширение тезауруса данных.
В результате таких рассуждений мы приходим к концепции двух тезаурусов у человека и машины: тезаурусу знаний и тезаурусу данных. Оба тезауруса не всегда резко разделены, и имеется небольшой процент их перекрытия. Но разделение всегда имеет место. Например, если человек получает какую-то информацию, то, чтобы в ней разобраться, понять ее, он должен привлечь свой тезаурус знаний. Когда специалисту по электронной технике Приходят сведения и цифровые данные по ядерной технике, соответствующий тезаурус знаний пуст или беден для того чтобы принять эту информацию. Следует заметить, что некоторое аналогичное разделение наблюдается в проблемно-ориентированных языках типа КОБОЛ для автоматизации программирования задач по обработке данных на ЦВМ, в котором имеется описание данных и сами данные, хранимые на разных магнитных лентах.