Семиотическая база знаний

Пора подвести итоги первому этапу наших построений. Мы начали с того, что термин «данные» получил широкое распространение в программировании и других сферах человеческой деятельности и что на смену этому термину в ИИ пришел термин «знания». Сейчас мы уже в состоянии показать, чем же знания отличаются от данных. Отличия, которые будут перечислены ниже, все время стираются, ибо развитие программирования, в частности, связано с расширением того, что понимается под данными. И эти расширения идут по пути приближения данных к знаниям. Во всяком случае, несколько первых требований к тому классу объектов, которые можно было бы назвать знаниями, уже реализованы и в отношении тех объектов, которые принято называть данными.

1. Именованность. Информационная единица, которая претендует на то, чтобы называться знанием, должна иметь некоторую собственную метку – имя, выделяющую ее как индивидуальность среди остальных информационных единиц. Если именованность отсутствует, то нет возможности найти информационную единицу среди других единиц. В частности, в системах, где именованность отсутствует, нет надежды получить ответы на вопросы типа: «Что ты знаешь о собаках» или «Верно ли, что Джон любит Мэри?»

2. Структурированность. Информационная единица должна обладать своей внутренней структурой. Например, эта структура такая, как показано на рис.1, то информационная единица является знаком. В этой книге структурированность информационных единиц понимается именно в данном смысле. Отсутствие структурированности приводит к тому, что имена становятся единственным отличительным признаком информационной единицы, и все ее специфические свойства становятся свойствами этого имени.

3. «Принцип матрешки». Знаки за счет связей наследования как бы вкладываются друг в друга, обеспечивая описание сущностей на различных уровнях. Это позволяет выбирать уровень описания, достаточный для решения какой-либо задачи, и не дублировать информацию о сущностях, храня ее в одном месте и распространяя по связям наследования при необходимости.

4. Связность. Знаки благодаря различным отношениям объединяются в сеть, что позволяет описывать не отдельные сущности, а целостные комплексы взаимосвязанных сущностей, отражающие сложные явления в реальном и ментальных мирах. Отсутствие этого свойства приводило бы к невозможности формирования адекватного представления об этих мирах.

5. Активность. В сетях знаков становится возможной реализация принципа «активизация знаний – источник активизации процедур», что приближает сети знаков к тем когнитивным структурам, которые есть у человека. Отсутствие этого свойства не позволило бы сделать свойство активизации «внутренним», зависящим от наличия у системы информации о внешнем мире, а потребовало бы обязательного вмешательства человека для активизации системы.

6. Рефлексивность. Появление метауровня позволяет системе рассуждать о самой себе, о характере имеющейся у нее информации об окружающем мире. Не имея способности к рефлексии нельзя было бы ставить задачу о качестве имеющейся у системы информации, ее полноте и корректности.

Перечисленные шесть особенностей информационных единиц при их наличии (конъюнкции) позволяют говорить о переходе от данных к знаниям.

Определение 2. Система информационных единиц, обладающая свойствами именованности, структурированности, иерархичности, связности, активности и рефлексивности, называется системой знаний.

Для того, чтобы реализовать некоторую систему знаний, необходимо иметь специальный язык для описания знаков и метазнаков и связей между ними. Некоторые конструкции такого языка мы уже описали, когда вводили понятие о знаках-фреймах или о продукциях. Такие языки должны быть близки к языкам представления знаний в ИИ, расширяя их возможности в тех аспектах, которые в традиционных системах ИИ явно не выделяются (например, активность и рефлексивность). Использование в качестве основной модели для системы знаков-фреймов семантической сети свидетельствует о том, что языки для описания знаков, метазнаков и конструкций из них должны быть реляционными, т.е. в явной форме допускать описание отношений с присущими им типами.

Общая структура представления системы знаний о некоторой части внешнего мира (реального или ментального) показана на рис.11. Эта структура напоминает слоеный пирог, в котором «слои» знаков различного уровня связаны со сдвинутыми «слоями» метазнаков. Связи, отмеченные цифрой 7, – это связи наследования. С их помощью из знаков более низкого уровня получаются знаки более высокого уровня. Эти двусторонние связи осуществляют обобщение знаний и, напротив, порождают за счет конкретизации из знаний более высокого уровня знания более низкого уровня. Механизмы, способствующие формированию связей такого рода в ИИ изучаются при решении задач обобщения и формирования понятий, обучения интеллектуальных систем.

Связи, отмеченные цифрой 8, обеспечивают передачу на соответствующие метауровни информации о конфигурациях, возникающих в сетях знаков на соответствующем уровне общности. Механизмы, обеспечивающие реализацию таких связей, опираются на решение довольно непростых задач по распознаванию конфигураций определенного типа. Формирование сведений о таких конфигурациях происходит либо в процессе обучения системы, либо сведения о них априорно закладываются в систему ее создателями.

Связи, отмеченные цифрой 9, отражают механизмы, ответственные за поиск нужной информации в системе знаний или формирование действий, вытекающих из внутренней активности системы знаний. В результате этих действий могут произойти изменения на тех или иных уровнях представления знаков (с помощью связей 8 воздействия передаются на нужный уровень) или произойдет воздействие на какие-то образования во внешнем мире.

На рис.11 показано три уровня представления знаков и метазнаков. В реальных системах знаний их может быть любое нужное количество.

Определение 3. Система представления знаний, структура которой такова, что в ней реализуются механизмы, обеспечивающие функционирование связей, обозначенных нами цифрами от 1 до 9, называется семиотической базой знаний (СБЗ).

Чтобы сделать это определение более содержательным, сведем характеристики основных процедур, присущих СБЗ, в таблицу 2.

Подчеркнем еще раз коренное отличие СБЗ от баз данных и многих баз знаний, встречающихся в системах искусственного интеллекта. В СБЗ элементарные информационные единицы – это не символы, не числа, не векторы или таблицы, не отдельные фреймы или продукции. В СБЗ в качестве исходных единиц выступают целостные знаки со всеми их особенностями. Из знаков генерируются более сложные образования, такие как знаки-фреймы, метазнаки, фрагменты сети, находящиеся на различных уровнях. Вместе с результатами применения базовых операций, типы которых перечислены в табл.2., они образуют содержимое СБЗ.

Термин «семиотическая база знаний» подчеркивает знаковый характер информации, хранящейся в такой базе знаний. Особый характер подобной базы требует специальных языков для описания хранящихся в ней сведений, специальных моделей для их представления на теоретическом уровне и специальных приемов для использования такого рода информации при решении конкретных практических задач.

Итак, в отличие от традиционной семиотики – науке о знаковых системах и их роли в самых различных сферах жизни людей (семиотика языка, семиотика культуры, семиотика поведения, семиотика тела, и т.п.) – прикладная семиотика интересуется вопросами использования знаковых систем при решении прикладных задач, возникающих в больших и сложных системах, созданных природой или людьми.

 

Таблица 2. Основные процедуры в СБЗ

Индекс связи

Название процедуры

Суть действия процедуры

1

поиск информации по имени

по имени в знаке-фрейме ищется вся информация, касающаяся понятия, связанного с этим именем

1

поиск имени

по информации об особенностях сущности (может быть неполной) ищется имя этой сущности

2

порождение представления

 

2

порождение представления

экземпляр сущности порождается в виде представления на основании информации об этом экземпляре

3

приписывание имени

некоторой сущности, о которой система получает информацию через представление (экземпляр), приписывается имя или находится ранее                              приписанное имя

3

порождение

представления

по имени и некоторым дополнительным условиям (если они имеются) порождается некоторое представление экземпляра сущности

4

поиск обоснования для процедуры

по имени фрагмента сети ищется информация о возможных действиях и последствиях этих действий

4

поиск имени фрагмента сети

по информации о содержании некоторой деятельности ищется имя фрагмента сети, который может активизировать эту деятельность

5

поиск нестандартного отклика

по информации о возможных действиях, являющихся следствием активизации определенного фрагмента сети, выбирается конкретная процедура

5

поиск объяснения для процедуры

ищется объяснение активизации и выполнения данной процедуры

6

поиск стандартного отклика

по имени фрагмента сети знаков активизируется стандартная для этого имени процедура

     6

поиск имени процедуры

по выполняемой процедуре определяется ее имя или имя фрагмента сети, вызвавшего ее активизацию

7

обобщение знаков

реализуется переход от знаков одного уровня к знакам большего уровня общности путем применения каких-либо процедур из имеющегося набора (агрегирования, абстрагирования обобщение по признакам и т.п.)

7

конкретизация знаков

осуществляется переход к знакам более низкого уровня общности за счет использования тех или иных процедур из имеющегося арсенала

8

поиск фрагмента в сети знаков

на основании информации об особенностях фрагмента осуществляется его поиск на   определенном уровне и ему присваивается имя

8

воздействие на фрагмент сети знаков

реализуется процедура, активизированная на определенном уровне метазнаков, целью которой является внесение в сеть знаков изменений, определяемых постусловиями продукций

9

композиция процедур

формирование процедур из более мелких процедур ниже лежащего уровня

9

декомпозиция процедур

разбивка процедуры вышележащего уровня на отдельные более мелкие процедуры

Предлагаю ознакомиться с аналогичными статьями: