Семиотическая база знаний

Пора подвести итоги первому этапу наших построений. Мы начали с того, что термин «данные» получил широкое распространение в программировании и других сферах человеческой деятельности и что на смену этому термину в ИИ пришел термин «знания». Сейчас мы уже в состоянии показать, чем же знания отличаются от данных. Отличия, которые будут перечислены ниже, все время стираются, ибо развитие программирования, в частности, связано с расширением того, что понимается под данными. И эти расширения идут по пути приближения данных к знаниям. Во всяком случае, несколько первых требований к тому классу объектов, которые можно было бы назвать знаниями, уже реализованы и в отношении тех объектов, которые принято называть данными.

1. Именованность. Информационная единица, которая претендует на то, чтобы называться знанием, должна иметь некоторую собственную метку – имя, выделяющую ее как индивидуальность среди остальных информационных единиц. Если именованность отсутствует, то нет возможности найти информационную единицу среди других единиц. В частности, в системах, где именованность отсутствует, нет надежды получить ответы на вопросы типа: «Что ты знаешь о собаках» или «Верно ли, что Джон любит Мэри?»

2. Структурированность. Информационная единица должна обладать своей внутренней структурой. Например, эта структура такая, как показано на рис.1, то информационная единица является знаком. В этой книге структурированность информационных единиц понимается именно в данном смысле. Отсутствие структурированности приводит к тому, что имена становятся единственным отличительным признаком информационной единицы, и все ее специфические свойства становятся свойствами этого имени.

3. «Принцип матрешки». Знаки за счет связей наследования как бы вкладываются друг в друга, обеспечивая описание сущностей на различных уровнях. Это позволяет выбирать уровень описания, достаточный для решения какой-либо задачи, и не дублировать информацию о сущностях, храня ее в одном месте и распространяя по связям наследования при необходимости.

4. Связность. Знаки благодаря различным отношениям объединяются в сеть, что позволяет описывать не отдельные сущности, а целостные комплексы взаимосвязанных сущностей, отражающие сложные явления в реальном и ментальных мирах. Отсутствие этого свойства приводило бы к невозможности формирования адекватного представления об этих мирах.

5. Активность. В сетях знаков становится возможной реализация принципа «активизация знаний – источник активизации процедур», что приближает сети знаков к тем когнитивным структурам, которые есть у человека. Отсутствие этого свойства не позволило бы сделать свойство активизации «внутренним», зависящим от наличия у системы информации о внешнем мире, а потребовало бы обязательного вмешательства человека для активизации системы.

6. Рефлексивность. Появление метауровня позволяет системе рассуждать о самой себе, о характере имеющейся у нее информации об окружающем мире. Не имея способности к рефлексии нельзя было бы ставить задачу о качестве имеющейся у системы информации, ее полноте и корректности.

Перечисленные шесть особенностей информационных единиц при их наличии (конъюнкции) позволяют говорить о переходе от данных к знаниям.

Определение 2. Система информационных единиц, обладающая свойствами именованности, структурированности, иерархичности, связности, активности и рефлексивности, называется системой знаний.

Для того, чтобы реализовать некоторую систему знаний, необходимо иметь специальный язык для описания знаков и метазнаков и связей между ними. Некоторые конструкции такого языка мы уже описали, когда вводили понятие о знаках-фреймах или о продукциях. Такие языки должны быть близки к языкам представления знаний в ИИ, расширяя их возможности в тех аспектах, которые в традиционных системах ИИ явно не выделяются (например, активность и рефлексивность). Использование в качестве основной модели для системы знаков-фреймов семантической сети свидетельствует о том, что языки для описания знаков, метазнаков и конструкций из них должны быть реляционными, т.е. в явной форме допускать описание отношений с присущими им типами.

Общая структура представления системы знаний о некоторой части внешнего мира (реального или ментального) показана на рис.11. Эта структура напоминает слоеный пирог, в котором «слои» знаков различного уровня связаны со сдвинутыми «слоями» метазнаков. Связи, отмеченные цифрой 7, – это связи наследования. С их помощью из знаков более низкого уровня получаются знаки более высокого уровня. Эти двусторонние связи осуществляют обобщение знаний и, напротив, порождают за счет конкретизации из знаний более высокого уровня знания более низкого уровня. Механизмы, способствующие формированию связей такого рода в ИИ изучаются при решении задач обобщения и формирования понятий, обучения интеллектуальных систем.

Связи, отмеченные цифрой 8, обеспечивают передачу на соответствующие метауровни информации о конфигурациях, возникающих в сетях знаков на соответствующем уровне общности. Механизмы, обеспечивающие реализацию таких связей, опираются на решение довольно непростых задач по распознаванию конфигураций определенного типа. Формирование сведений о таких конфигурациях происходит либо в процессе обучения системы, либо сведения о них априорно закладываются в систему ее создателями.

Связи, отмеченные цифрой 9, отражают механизмы, ответственные за поиск нужной информации в системе знаний или формирование действий, вытекающих из внутренней активности системы знаний. В результате этих действий могут произойти изменения на тех или иных уровнях представления знаков (с помощью связей 8 воздействия передаются на нужный уровень) или произойдет воздействие на какие-то образования во внешнем мире.

На рис.11 показано три уровня представления знаков и метазнаков. В реальных системах знаний их может быть любое нужное количество.

Определение 3. Система представления знаний, структура которой такова, что в ней реализуются механизмы, обеспечивающие функционирование связей, обозначенных нами цифрами от 1 до 9, называется семиотической базой знаний (СБЗ).

Чтобы сделать это определение более содержательным, сведем характеристики основных процедур, присущих СБЗ, в таблицу 2.

Подчеркнем еще раз коренное отличие СБЗ от баз данных и многих баз знаний, встречающихся в системах искусственного интеллекта. В СБЗ элементарные информационные единицы – это не символы, не числа, не векторы или таблицы, не отдельные фреймы или продукции. В СБЗ в качестве исходных единиц выступают целостные знаки со всеми их особенностями. Из знаков генерируются более сложные образования, такие как знаки-фреймы, метазнаки, фрагменты сети, находящиеся на различных уровнях. Вместе с результатами применения базовых операций, типы которых перечислены в табл.2., они образуют содержимое СБЗ.

Термин «семиотическая база знаний» подчеркивает знаковый характер информации, хранящейся в такой базе знаний. Особый характер подобной базы требует специальных языков для описания хранящихся в ней сведений, специальных моделей для их представления на теоретическом уровне и специальных приемов для использования такого рода информации при решении конкретных практических задач.

Итак, в отличие от традиционной семиотики – науке о знаковых системах и их роли в самых различных сферах жизни людей (семиотика языка, семиотика культуры, семиотика поведения, семиотика тела, и т.п.) – прикладная семиотика интересуется вопросами использования знаковых систем при решении прикладных задач, возникающих в больших и сложных системах, созданных природой или людьми.

 

Таблица 2. Основные процедуры в СБЗ

Индекс связи

Название процедуры

Суть действия процедуры

1

поиск информации по имени

по имени в знаке-фрейме ищется вся информация, касающаяся понятия, связанного с этим именем

1

поиск имени

по информации об особенностях сущности (может быть неполной) ищется имя этой сущности

2

порождение представления

 

2

порождение представления

экземпляр сущности порождается в виде представления на основании информации об этом экземпляре

3

приписывание имени

некоторой сущности, о которой система получает информацию через представление (экземпляр), приписывается имя или находится ранее                              приписанное имя

3

порождение

представления

по имени и некоторым дополнительным условиям (если они имеются) порождается некоторое представление экземпляра сущности

4

поиск обоснования для процедуры

по имени фрагмента сети ищется информация о возможных действиях и последствиях этих действий

4

поиск имени фрагмента сети

по информации о содержании некоторой деятельности ищется имя фрагмента сети, который может активизировать эту деятельность

5

поиск нестандартного отклика

по информации о возможных действиях, являющихся следствием активизации определенного фрагмента сети, выбирается конкретная процедура

5

поиск объяснения для процедуры

ищется объяснение активизации и выполнения данной процедуры

6

поиск стандартного отклика

по имени фрагмента сети знаков активизируется стандартная для этого имени процедура

     6

поиск имени процедуры

по выполняемой процедуре определяется ее имя или имя фрагмента сети, вызвавшего ее активизацию

7

обобщение знаков

реализуется переход от знаков одного уровня к знакам большего уровня общности путем применения каких-либо процедур из имеющегося набора (агрегирования, абстрагирования обобщение по признакам и т.п.)

7

конкретизация знаков

осуществляется переход к знакам более низкого уровня общности за счет использования тех или иных процедур из имеющегося арсенала

8

поиск фрагмента в сети знаков

на основании информации об особенностях фрагмента осуществляется его поиск на   определенном уровне и ему присваивается имя

8

воздействие на фрагмент сети знаков

реализуется процедура, активизированная на определенном уровне метазнаков, целью которой является внесение в сеть знаков изменений, определяемых постусловиями продукций

9

композиция процедур

формирование процедур из более мелких процедур ниже лежащего уровня

9

декомпозиция процедур

разбивка процедуры вышележащего уровня на отдельные более мелкие процедуры

Договоренности и динамика знаков

Три стороны знака не привязаны жестко и однозначно к той сущности, для которой употребляется данный знак (или метазнак).

Для подтверждения этого утверждения, рассмотрим некоторый содержательный пример. Пусть группа из нескольких десятков человек выехала за город на поиски грибов. Перед тем как разойтись в лесу в разные стороны, члены команды грибников могут кое о чем договориться. Например, они могут договориться о том, что тот, кто первым обнаружит место с большим количеством грибов, неподалеку разведет костер. Дым от костра будет знаком того, что грибы обнаружены. Описанный договор есть договор о введении некоторого знака с именем «Здесь грибы». Синтаксис этого имени выражается в столбе дыма, семантика проста и очевидна (найдены грибы), а прагматика для тех, кто увидел дым, также однозначна – если ты сам не нашел грибное место, то надо идти в сторону костра.

Покажем теперь, что все три стороны знака могут произвольно меняться при изменении договоренности. Вместо разведения костра нашедший грибное место может сообщить об этом тремя свистками или громким криком. В таком случае сменится синтаксис знака, а его семантика и прагматика останутся прежними. Но можно договориться, что дым от костра означает, что наступила пора обеда, и вскоре на костре будет приготовлена еда. В этом случае при сохранении синтаксиса знака (дым от костра) меняется его семантика (прагматика же сохраняется, если увидевший дым собирается обедать). Можно, наконец, договориться, что дым от костра означает, что пора выходить из лесу, чтобы не опоздать на поезд. В этом случае прагматика не предписывает идти к костру. Вместо этого надо начинать движение к границе леса, например, к тому месту, где группа вошла в него.

Договоренности проявляются и тогда, когда одни и те же денотаты представляются знаками с разными именами. Например, имена знаков: «А.С.Пушкин», «Автор «Медного всадника» или «Величайший русский поэт ХIХ-го века» имеют в виду один и тот же денотат, хотя и характеризуют его с различных сторон. В возможности менять имена задействована связь с номером 1, показанная на рис.1. Согласно ей, в качестве имени знака может выступать какая-то совокупность сведений из понятия, которая отделяет данный знак от остальных.

Договоренности широко используется во всевозможных системах шифровки и тайнописи, в «эзоповом языке». Не зная договорных основ трактовки знака, весьма трудно правильно воспринять его и использовать в своей деятельности.

Метауровень описания

Сказанное выше об активности фрагментов сети знаков-фреймов требует введения некоторого метауровня по отношению к уровням иерархической сети знаков-фреймов. Для того, чтобы активизировать какие-то процедуры для устранения диссонанса, необходимо видеть сеть знаков-фреймов «сверху», как бы «с высоты птичьего полета». Другими словами, необходим некоторый метауровень, на котором фрагменты сети знаков-фреймов рассматриваются как знаки.

Для подобного метауровня уровень сети знаков-фреймов выступает в качестве того ментального мира, который содержит денотаты для формирования метазнаков. Такими денотатами могут быть определенные фрагменты сети знаков-фреймов. На рис.9 внизу показан фрагмент сети знаков-фреймов, совпадающий с тем, который был показан на рис.7а. Этот фрагмент несет в себе конфликт, который может иметь имя «Конфликт из-за собаки». На метауровне возникает знак (или метазнак) с таким именем. Ему соответствует треугольник в верхней части рис.9. Активизация вершины- имени вызывает активизацию двух других вершин треугольника. Вершина-понятие несет в себе информацию о смысле конфликта, его семантике. И прежде всего информацию о том, чем опасен подобный конфликт, чем он грозит Джону (если именно ментальные представления Джона отражены на рис.9). Наконец, вершина-представление не просто рисует нам картину последствий этого конфликта, как это было для знаков обычного уровня. Она несет в себе и информацию о способах преодоления конфликта, т.е. информацию о тех процедурах, которые можно использовать для устранения конфликта.

Таким образом, метазнаки, в отличие от знаков, несут в себе «заряд активности». Одним из примеров метазнаков можно считать правила или продукции – специальные конструкции из инструментария ИИ, связанные с выполнением определенных действий. Они обычно имеют вид [21,27]

C; Если A, то B; H

Основной частью продукции (ее обычно называют ядром) является секвенция «Если A, то B», понимаемая в ИИ значительно шире того, как понимается секвенция в логике. В системах искусственного интеллекта вполне могут встречаться, например, такие продукции [27]:

Если звезды зажигают, то это кому-то нужно.

Если враг не сдается, то его уничтожают.

Если я заболею, то к врачам обращаться не стану.

Если прошел дождь, то асфальт будет мокрым.

Легко заметить, что при одинаковой форме, приведенные в качестве примеров продукции имеют различный смысл. Первая продукция из наличия некоторого факта делает вывод о намерениях того, кто создал этот факт. Вторая продукция из некоторого факта делает вывод о необходимости выполнения некоторого действия. В третьей продукции в качестве заключения выступает информация об отказе от совершения определенного действия, а последняя продукция связывает два факта причинно-следственной связью. Напомним, что в логике секвенция говорит лишь о том, как два утверждения связаны с точки зрения их истинности.

Две остальные компоненты в задании продукции, отличные от ядра, показывают условия при которых активизируется продукция (C) и те последствия, которые возникнут после применения продукции (H).

Вернемся к рис.9. В треугольнике, показанном наверху, роль A играет информация о наличии конфликта из-за собаки. В зависимости от того, чем опасен такой конфликт, выполняется или не выполняется условие C. Информация о нем хранится в верхней вершине треугольника для метазнака. Если Джон считает, что конфликт опасен и не нужно оттеснять его из активной зоны внимания, то реализуется B, информация о котором представляется той вершиной треугольника, которая на рис.9 названа «Что делать?». В ней имеется информация о возможных (согласно рис.7) процедурах, которые могут вывести из конфликта. Анализируя постусловия применения этих процедур (т.е. результаты, к которым может привести их применение), Джон выберет для исполнения ту из них, которая соответствует наиболее благоприятному для него значению H.

Вершины, используемые в треугольниках, соответствующих метазнакам, можно назвать так, как это часто делают в семиотике, когда хотят подчеркнуть неразрывность трех сторон в каждом знаке: синтаксис, семантика и прагматика. Синтаксис определяет способ кодирования знака, семантика – его значение для субъекта, а прагматика – те процедуры, которые так или иначе связаны с этим знаком, предписываются им.

На рис.10 мы имеем ситуацию, в чем-то сходную с той, которая была показана на рис.1. Только теперь вместо денотата реального мира имеется определенный фрагмент из сети знаков-фреймов. Этот фрагмент обладает собственным именем, специальным кодом, выделяющим данный метазнак среди остальных метазнаков. Знания о свойствах выделенного фрагмента составляют понятие об этом фрагменте, т.е. определяют семантику метазнака, а рекомендации о действиях в виде записей по типу продукций позволяют реализовать тот раздел знака-фрейма, который назывался в параграфе 7 «условия активности». Каждый элемент этого раздела имеет вид: (условие i; имя процедуры). Используя обозначения, принятые для продукций, можно представить эти элементы в виде:

(Ci, Ai, Hi; Bi).

Здесь в результате анализа условий применимости продукции Ci, когда Ai активизировалось, и с учетом оценки последствий Hi принимается решение об активизации процедуры с именем Bi .

Метауровень в знаковых представлениях нужен не только для реализации активности. Наличие метауровня позволяет делать гораздо большее. С помощью метазнаков можно проводить рассуждения о знаках, отвечать на вопросы о том, как устроена знаковая система (например, как выглядит или насколько сложна сеть из знаков-фреймов). Таким образом, появление метауровня позволяет реализовать свойство рефлексии или способности к самонаблюдению и самоанализу. Возможность рефлексивных рассуждений [28] существенно приближает знаковые системы к тем, которыми пользуется в своей повседневной практике человек.

Вернемся к рис.10. Как и в базовом треугольнике, определяющем знак, в треугольнике, определяющем метазнак, имеются внутренние связи. Связь, обозначенная цифрой 4, позволяет по имени (синтаксическому выражению знака) получать всю имеющуюся информацию о той сущности, с которой субъект столкнулся. И наоборот, некоторое описание, хранящееся в метазнаке, может получить при необходимости соответствующее ему синтаксическое выражение.

Связь, отмеченная цифрой 5, позволяет делать объяснения причин выполненных процедур («я хотел, чтобы Мери полюбила собак»), а в обратную сторону эта связь позволяет формировать действия на основании анализа той ситуации, которая характеризуется данным знаком (и, в частности, планировать наиболее целесообразную последовательность действий).

Наконец, связь, обозначенная на рассматриваемом рисунке цифрой 6, позволяет по имени сразу выбирать некоторые действия, не обращаясь к семантике знака. Это возможно тогда, когда имя и действие связаны между собой однозначно. Увидев красный свет светофора, водитель автомашины автоматически нажимает педаль тормоза. Здесь синтаксис и прагматика оказываются связанными напрямую и не требуют обращения к семантике. Эта же связь позволяет по совершенным действиям восстановить имя той ситуации, в которой стало необходимым совершать данные действия.

В системе, где используются знаки и метазнаки, должны также присутствовать специальные средства, с помощью которых могли бы реализоваться все процедуры, связанные с 4, 5 и 6. В системах ИИ подобная совокупность процедур обычно реализуется в блоках, называемых «планировщик» или «решатель». От того, насколько хорошо реализованы эти процедуры, во многом зависит эффективность работы интеллектуальных систем.

Активность

В примере с треугольником мы не использовали раздел «условия активности». Прежде чем говорить о нем, необходимо ввести понятие активности отдельного знака-фрейма или некоторого фрагмента сети, в вершинах которой находятся знаки-фреймы.

Хорошо известно, что при решении задач обработки данных активную роль играют программы решения задач, а данные, с которыми работает программа, играют пассивную роль в процессе вычислений. Их активизация происходит лишь при выполнении программы, когда реализуется вызов из памяти и обработка.

В отличие от этого, действия, которые совершает человек, или программы, которые он выполняет, мотивируются и активизируются теми знаниями, которыми он располагает. Именно знания и основанные на них указания, поступающие от других людей («Смотри, Иванов стал начальником, а ведь ты не хуже его, добивайся повышения!») являются активизирующей компонентой в человеческой деятельности. Следующий пример показывает, как это можно было бы реализовать в системах, основанных на знаниях.

На рис.6 показан фрагмент сети, в вершинах которой находятся знаки-фреймы «собака», «Джон» и «Мэри». На них заданы отношения «любить» и «не любить». Здесь плюс означает наличие отношения «любить», а минус – наличие отношения «не любить». На рис.6а показан случай, когда Джон и Мэри любят друг друга и оба любят собак, мечтая приобрести существо такого типа. На рис.6б показана ситуация, когда такое существо у них уже есть – любимая собака по имени Джильда.

Случай 6б соответствует некоторому состоянию, в котором не требуется предпринимать каких-либо действий. Джон и Мэри любят друг друга, и рядом с ними находится существо, к которому они испытывают общую любовь, дарящее в ответ аналогичное чувство. Это – своеобразная «нирвана», когда нет причин для возникновения какой-либо потребности в деятельности, т.е. проявления какой-либо активности.

Случай 6а, если Джон и Мэри еще не имеют собаки, более сложен. Может случиться, что у них пока еще нет возможности приобрести любимое существо. У них еще нет собственного дома, или нет уверенности в финансовом благополучии. Но если подобных препятствий нет, то наличие фрагмента сети, показанного на рис.6а, может стать стимулом к возникновению активности, т.е. может инициировать выполнение процедуры «приобретения собаки».

Рассмотрим теперь ситуацию, показанную на рис.7а. Эта ситуация явно носит конфликтный характер. Джон и Мэри по-прежнему любят друг друга, но их отношение к появлению в их будущем доме собаки прямо противоположно. Джон обожает собак, а Мэри их боится и не любит. В такой ситуации (психологи называют ее когнитивным диссонансом [25], т.е. диссонансом, причиной которого являются осознаваемые знания-предпочтения) необходимо принимать какие-то действия.

Для устранения возникшего напряжения могут использоваться разные процедуры, направленные на достижение различных локальных целей. Можно предпринять определенные усилия и привить Мэри любовь к собакам. Для этого, возможно, придется рассказывать ей различные истории о том, как собаки спасали жизнь хозяев или домашнее имущество, водить Мэри на собачьи выставки и т.п. Если эти старания увенчаются успехом, то структура, показанная на рис.7а, перейдет в структуру на рис.7б, которая аналогична структуре 6а, легко преобразующейся в структуру 6б, уже не требующую никаких активных действий.

Усилия, направленные на то, что бы привить Мэри любовь к собакам, могут оказаться тщетными. Тогда сильная любовь к Мери может заставить Джона отказаться от своей любви к собакам. Структура на рис.7в оказывается пассивной, не требующей активных действий, хотя у Джона, возможно, и существует некоторая внутренняя напряженность по поводу нереализованной мечты – приобретения собаки.

Но возможен случай, когда никакие усилия или процедуры не могут привести ни к ситуации 7б, ни к ситуации 7в. В этом случае есть еще один выход. Путем выполнения некоторых ментальных процедур Джон может убедить себя в том, что если Мэри не любит собак, этих благородных и преданных животных, то она, по-видимому, не в состоянии по-настоящему полюбить и человека, оценить его благородство и преданность. А отсюда будет естественным переход к структуре, показанной на рис.7г, которая также пассивна и устойчива после того, как Джон приобретет себе какого-нибудь верного друга в лице Джильды или кого-нибудь еще.

Если все процедуры, которые возникают в результате наличия фрагмента сети, показанного на рис.7а, окажутся безуспешными, то у человека имеется в запасе еще одна процедура универсального характера, которая в психологии называется процедурой вытеснения.«Раздражающий» фрагмент сети просто убирается из активной зоны внимания, прячется в глубине памяти и находится там до поры до времени. Но если потом оказывается, что с Мэри негативно связан не только фрагмент, относящийся к любви к собакам, но также и отношение к курению или спорту, без которых Джон не мыслит своей жизни (см. рис.8), то переход к структуре 7г становится весьма реальным.

Несмотря на шуточный характер нашего примера, в нем четко прослеживается основная идея возникновения активности в сети знаков-фреймов. Не процедуры являются источником активности человека, а наоборот, те или иные структуры в сети становятся источником активизации процедур, целью которых является устранение диссонанса, возникшего в сети знаков-фреймов. Заметим, что в силу наличия многих связей в сети, устранение диссонанса в одном ее фрагменте может привести к появлению его в другом месте. Например, отказ Джона от любви к спорту может вызвать охлаждение его отношений с бывшими товарищами, с которыми он ранее всегда встречался в спортивном зале. Это требует при рассмотрении проблемы устранения диссонансов [26] в сети знаков-фреймов решать специальные оптимизационные задачи .

Для наглядности в разобранном примере мы использовали конкретные фреймы-экземпляры с именами «Мэри», «Джон» и «Джильда». Вообще говоря, в этом не было большой необходимости. Вместо конкретных экземпляров можно было бы воспользоваться прототипами типа «Персонаж 1», «Персонаж 2» или «Собака». Другими словами, возникновение и характер конфликтной ситуации связаны со структурой сети и обращение к экземплярам не обязательно.

Сети из знаков

Кроме иерархических связей знаки могут объединяться и связями одного уровня. Например, известная фраза: «Нет дыма без огня» связывает между собой знаки, соответствующие сущностям «дым» и «огонь» каузальной (причинно-следственной) связью или отношением «причина-следствие». Отношение это является синхронным, ибо в любой ситуации наличие огня обычно вызывает появление дыма, что и наблюдается в обыденной человеческой практике.

Наличие отношений наследования и одноуровневых отношений приводит к тому, что система знаков оказывается объединенной в иерархическую сеть. Вершинами этой сети являются отдельные знаки, а дуги сети характеризуют различные отношения, к которым принадлежат знаки. Такие конструкции в работах по ИИ называются семантическими сетями (см., например, [21-23]).

Эти сети являются вложенными структурами, так как любая вершина сети сама может быть сетью. Это происходит прежде всего благодаря отношениям наследования. Например, семантическая сеть, показанная на рис.4 за счет связей, приведенных на рис.3 для сущности «мебель», может быть преобразована в сеть иерархического вида.

Аналогия между сетью знаков и семантической сетью неслучайна. Не фиксируя явно источник своих конструкций, специалисты, работающие в области ИИ, вводят многие понятия и модели, тесно связанные с семиотикой. Одним из таких понятий является «фрейм». Так М. Минский, который впервые ввел это понятие в научный оборот в 70-х годах [24]), трактовал его как минимальное описание некоторой сущности, в котором еще содержится все, что нужно для ее идентификации. Минимальность означает, что любое выбрасывание чего-либо из описания приводит к потери самой сущности, она становится неотличимой от иных сущностей. В такой интерпретации фрейм напоминаем толкование понятия в базовом треугольнике, определяющем знак.

Более ясно нужная нам аналогия проявляется, когда понятие «фрейм» берется в программистском смысле, как некоторая конструкция, описывающая сущность. В простейшем случае такая конструкция имеет следующий вид:

(имя фрейма) (имя слота 1; значение слота 1)

(имя слота 2; значение слота 2)

...............................

...............................

...............................

(имя слота К; значение слота К)

Примером задания фрейма может служить простая конструкция, определяющая сущность «поездка»:

(Поездка) (Кто; Джон Смит)

(Куда; Сан-Франциско)

(Цель; Участие в конференции)

(С кем; С женой Мэри Смит)

(Когда; С 6 по 10 1996 года)

Число слотов, их содержание и имена могут меняться в зависимости от того, какие стороны сущности важно отразить.

Интересно подчеркнуть, что имена слотов даже при отсутствии соответствующих им значений определяют смысл той сущности, к которой эти слоты относятся. Так смысл сущности «поездка» не изменяется от того, кто именно осуществляет эту поездку, куда и с какой целью он едет.

Каркас фрейма, в котором места, предназначенные для конкретных значений пустуют, принято называть фреймом-прототипом (или протофреймом). Фрейм-прототип явно связан с той вершиной треугольника Фреге, которая носит название «понятие». Информация, хранящаяся во фрейме, задает понятие, которое характеризует все сущности с данным именем. Если же все слоты во фрейме означены, то он несет информацию о вполне конкретной реализации сущности. Поэтому такой фрейм принято называть фреймом-экземпляром (или экзофреймом). Экземпляры связаны со знаками через представления, ибо именно представления в треугольнике Фреге связаны с конкретным проявлением сущностей.

Установленная аналогия позволяет считать, что представления знаков в компьютерных системах подобны фреймовым представлениям, а сети знаков моделируются сетями фреймов, которые в самом общем случае (при произвольной структуре информационных единиц) представляют собой семантические сети.

Основная семиотическая конструкция: треугольник Фреге

Термин «данные» распространен весьма широко. Он используется при решении задач на компьютерах, в системах передачи информации, в статистике и во многих других случаях. Его всеобщность такова, что никто не пытался давать точного определения понятия «данные». Этого и не требовалось до тех пор, пока не появился новый термин «знания», в какой-то мере противопоставляемый термину «данные». Такая ситуация требует уточнения того, что понимается под данными и знаниями.

Табл. 1. Сравнительный анализ основных характеристик

 

      ФОРМАЛЬНЫЕ СИСТЕМЫ

 

 

  СЕМИОТИЧЕСКИЕ СИСТЕМЫ

 

ЕДИНСТВЕННАЯ КЛАССИЧЕСКАЯ ЛОГИКА

 

 

СОСУЩЕСТВОВАНИЕ РАЗЛИЧНЫХ ЛОГИК (АЛГЕБР)

 

 

ВЫПОЛНЯЕТСЯ ЗАКОН ИСКЛЮЧЕННОГО ТРЕТЬЕГО

 

ЗАКОН ИСКЛЮЧЕННОГО ТРЕТЬЕГО НЕСПРАВЕДЛИВ

    

 

ЗАМКНУТЫЕ МИРЫ

 

 

ОТКРЫТЫЕ МИРЫ

 

 

МОНОТОННЫЙ ВЫВОД

 

НЕМОНОТОННЫЙ ВЫВОД

 

 

ПОСЛЕДОВАТЕЛЬНЫЙ  ВЫВОД

 

ПАРАЛЛЕЛЬНАЯ АРГУМЕНТАЦИЯ

 

 

НЕТ МУЛЬТИРЕЗОЛЮЦИИ

 

 

МУЛЬТИРЕЗОЛЮЦИЯ ВОЗМОЖНА

 

СТАТИЧЕСКИЕ МОДЕЛИ ЗНАНИЙ

 

 

ДИНАМИЧЕСКИЕ МОДЕЛИ ЗНАНИЙ

 

ПОСТОЯННАЯ ИНТЕРПРЕТАЦИЯ

 

ПЕРЕМЕННАЯ ИНТЕРПРЕТАЦИЯ

 

Нечто аналогичное было в информатике до тех пор, пока термин «алгоритм» не потребовал уточнения. Такая необходимость возникла с обнаружением алгоритмически неразрешимых проблем, т.е. проблем, для решения которых общий алгоритм построен быть не может. И тогда встал вопрос: «Что именно нельзя построить?» Ответ на него был невозможен без уточнения самого понятия «алгоритм». Это привело к появлению таких формальных конструкций, уточняющих понятие алгоритма, как машина Тьюринга или нормальный алгорифм Маркова.

Развитие ИИ, приведшее к появлению термина «знания», сделало необходимым введение отличия нового понятия от понятия «данные». Поскольку сам термин «знания» теснейшим образом связан с идеями семиотики, то для нас весьма интересно сформулировать эти различия.

Но прежде необходимо ввести несколько важных для дальнейшего изложения понятий. На рис.1 схематически показана конструкция, известная в семиотике как треугольник Фреге[20]. В реальном мире, окружающем человека, имеются некоторые сущности: объекты, явления, процессы. Их принято называть денотатами. Эти сущности, если они вычленяются человеком из общего фона реального мира, как-то отражаются в его сознании. В результате отражения возникают представления о денотатах. Представления могут быть образными, акустическими, тактильными или интегральными, объединяющими различные модальности нашего восприятия окружающего мира. Представления - это тот интегрированный образ (в психологии его часто называют гештальт), с которым имеет дело человек. Денотат, скрывающийся за гештальтом, непосредственно человеку недоступен, а постигается им лишь через некоторые представления, формулируемые его органами чувств или другими источниками информации о реальном мире.

Сталкиваясь с различными денотатами, человек постепенно накапливает о них определенную информацию. Некоторые денотаты кажутся ему неразличимыми (таковы особенности его представлений) и он воспринимает эти сущности, как проявление одной и той же сущности. Другие как-то отличаются друг от друга, и человек склонен рассматривать их как сущности разного вида. Чтобы реализовать возможность такого различия, он вводит специфические имена, связывая их с представлениями о том или ином виде сущности. При этом довольно быстро возникают соображения о том, что один тип сущностей (т.е. сущностей, называемых одним и тем же именем) отличается от другого типа сущностей. Так на основе врожденной для человека процедуре выявления сходства-различия формируется понятие о сущностях данного типа.

Поясним все сказанное на примере. Пусть некоторый человек, приехавший в большой город, раньше никогда не видел трамвая. Впервые увидев трамвай, услышав шум от его движения, ощутив рукой его поверхность, человек формирует гештальт этого конкретного трамвая (единичного представителя пока еще не известной ему сущности, экземпляра этой будущей сущности). Если в городе есть всего один трамвай (например, стоящий в музее транспорта), то у приезжего сущность «трамвай» (имя этого объекта он услышал от кого-то, или прочитал на табличке в музее транспорта) так и останется представленной уникальным экземпляром. Если же он столкнется и с другими сущностями, называемыми «трамвай», то вскоре обнаружит, что несмотря на их общее имя, к ним вполне применима процедура определения сходства-различия. Он поймет, что число вагонов этого транспортного средства, их цвет или длина не являются существенными признаками сущности, а движение по рельсам, использование электрического тока для движения или наличие сидений для пассажиров такими признаками являются. Это поможет ему сформировать некоторое обобщенное представление о трамвае, которое будет составлять для него содержание понятия «трамвай».

Описанная схема возникновения треугольника, показанного на рис.1, весьма поверхностна. Здесь не хотелось бы вдаваться в подробное описание процесса формирования таких первичных представлений. Это – дело психологов и специалистов по теоретической семиотике. Но, в основных чертах, суть происходящего мы сохранили. Наблюдения за единичными проявлениями некоторой сущности вызывают необходимость дать ей имя (или узнать его), а затем формируют обобщенное представление об этой сущности (понятия).