Методы представления знаний, основанные на аппа­рате семантических сетей.

Основная идея подхода к представлению знаний, базирующегося на аппарате семантических сетей, состоит в том, чтобы рассматривать проблемную среду как сово­купность (сущностей) объектов и (отношений) связей между ними.

Сущности представляются при этом поименованными вершинами, а отношения - направленными поименован­ными ребрами. Система знаний отображается сетью (семантическая сеть) — ориентированным графом, со­ставленным из поименованных вершин и ребер, или со­вокупностью таких сетей. Имена, приписываемые вершинам и ребрам, обычно совпадают с именами соответствую­щих сущностей и отношений, используемыми в естест­венном языке. Ребро и связываемые им вершины образу­ют подграф семантической сети, несущий минимальную с позиций системы знаний информацию - факт наличия связи определенного типа между соответствующими объектами. Более сложные подграфы семантической сети отображают и более сложные факты. В исследованиях по представлению знаний используются как логические мето­ды, так и методы, основанные на семантических сетях. Выбор тех или иных средств в каждом конкретном случае определяется характером решаемых задач и склонностями разработчиков интеллектуальной системы.

При использовании семантической сети для представ­ления знаний важны классификация типов объектов и выделение некоторых фундаментальных видов связей между объектами. Независимо от особенностей моделируемой среды можно предполагать, что любая более или менее сложная ее модель отображает какие-либо обоб­щенные, конкретные и агрегатные объекты.

Обобщенный объект это некоторое известное и широко используемое в моделируемой проблемной среде понятие, например «персона», «вещество», «предмет труда» и т. д. Обоб­щенный объект фактически представляет определенным образом класс объектов проблемной среды.

Конкретный, или индивидный объект - это каким-то образом выде­ленная единичная (индивидная) сущность, например, «сотрудник Петров», «планета ВЕ­НЕРА», «сульфат натрия» и т. д. Из приведенных при­меров видно, что понятия обобщенного и конкретного объекта относительны и зависят от рассматриваемой проблемной среды и решаемых в ней задач. Однако в конкретной системе знаний обобщенные и ин­дивидные объекты выделяются достаточно просто.

Аг­регатным называется объект проблемной среды, который составлен тем или иным образом из других объектов, являющихся его частями. Понятие агрегатного объекта также относительно. Любой объект внешнего мира мож­но расчленить, однако для выделения агрегатного объ­екта важно, чтобы его составные части являлись объек­тами, существенными с позиций решаемой задачи, а следовательно, отображаемыми в системе знаний. Таким образом, один и тот же объект проблемной среды в зависимости от решаемых задач может рассматривать­ся в системе знаний как агрегатный или как неагрегат­ный. При этом агрегатным может быть как обобщенный, так и конкретный объект.

В терминах описанной типизации объектов проблем­ной среды определяются и фундаментальные типы связей между объектами. Так, между двумя обобщенны­ми объектами может существовать родовая связь. Нали­чие ее между обобщенными объектами А и В, например, означает, что любой объект, отображаемый понятием В, отображается и понятием А и существует такой объ­ект, который отображается понятием А, но не отобража­ется В. Иными словами, понятие А более общее, чем В. В таком случае говорят, что А является родом В или что понятие А - родовое для В. Так, понятие «животное» (и соответственно, обобщенный объект «животное» в некоторой проблемной среде) - родовое для понятия «человек », а понятие «транспорт» - родовое для понятия «самолет».

Видовая связь обратна родовой. Если объект А является родом В, то говорят также, что В - вид А, и наоборот. Из приведенных примеров видно, что родовое понятие не охватывает всех свойств видового, так как видовое понятие богаче содержанием. Все свойства родового понятия, как правило, присущи и видовому (на-

следование свойств). Это позволяет более компактно представить систему знаний семантической сетью. Про объекты, между которыми существуют родовая и видовая связи, говорят, что они находятся в родовидовой связи.

Между обобщенным и конкретным объектами может существовать связь «является представителем». Она имеет место в том случае, когда конкретный объект принадлежит классу, отображаемому соответствующим обобщенным объектом. Так, конкретный объект «Третьяковская галерея» является представителем обобщенного объекта «музей». Важно отметить, что один и тот же конкретный объект может рассматриваться как представитель нескольких обобщенных объектов в одной и той же проблемной среде.

Так, конкретный объект. «Третьяковская галерея» - представитель обобщенных объектов «картинная галерея» и «здание в Москве». Первый из них находится в родовидовой связи с объектом «музей», второй - нет, так как музей может быть размещен в нескольких зданиях или на открытом воздухе и не всякое здание в Москве - музей. Свойства, присущие обобщенному объекту, характеризуют и любой конкретный объект - представитель. Таким образом, множество свойств конкретного объекта содержит в себе подмножество свойств, которыми он наделяется как представитель тех или иных обобщенных объектов (или совпадает с этим подмножеством).

Между агрегатным объектом и каким-либо другим объектом проблемной среды может существовать связь «является частью». Смысл этой связи ясен уже из ее названия. Ясно также и то, что частью конкретного агрегатного объекта не может являться обобщенный объект.

Однако возможна и даже представляет интерес ситуация, когда частью агрегатного объекта является агрегатный объект. Понятие агрегатного объекта и отношение «является частью» выделены для того, чтобы представлять знания о сложных объектах проблемной среды. Типизация объектов и фундаментальные отношения не решают всех проблем представления знаний, но создают хорошую основу для построения прикладной ба­зы знаний. Набор отношений в ней не исчерпывается фундаментальными отношениями, хотя именно они обра­зуют «скелет», позволяющий более свободно ориентиро­ваться даже в сложной и большой модели. Типизация обеспечивает и реальные осязаемые преимущества, поз­воляя «сжать» базу знаний, сделать ее более компакт­ной. Так, для обобщенного объекта, являющегося видом некоторого другого, нет необходимости представлять в базе все свойства, по крайней мере часть их можно получить благодаря механизму наследования. Для такого объекта целесообразно представлять в базе лишь его собственные (ненаследуемые) свойства, а также свойст­ва, которые хотя и являются наследуемыми, но несут дополнительную информацию.

Возможности «сжатия» базы знаний обеспечиваются также транзитивностью родовидового отношения и от­ношения «является частью».

Отношение а называется транзитивным тогда и только тогда, когда для любой тройки объектов А, В и С таких, что А находится в от­ношении a с В,

а В - в отношении a с С, выполняется утверждение «А находится в отношении a с С».

Упомя­нутые фундаментальные отношения транзитивны. Свойст­во транзитивности позволяет отображать в базе знаний не все фундаментальные отношения между объектами, а лишь небольшую часть их. Остальные могут быть полу­чены из представленных в базе с помощью специального механизма поддержки транзитивности, типичного для семантических сетей. Транзитивность родовидового отно­шения обеспечивает возможность наследования свойств не только у представленного в базе знаний родового объекта, но и у родового для родового и т. д.

Интересно отметить также связь механизма наследования при использовании семантической сети с механизмом логического вывода. Фактически наследование обеспечивает автоматическое проведение простых дедуктивных рассуждений типа:

«Все люди смертны. Сократ — человек. Следовательно, Сократ смертен».

Операции модификации базы знаний на семантических сетях сводятся к удалению и добавлению новых вершин и ребер. Базовые операции поиска информации в сети обеспечивают поиск вершины или ребра по имени, переходы от одной вершины к другой по связям и от одной связи к другой через смежные вершины. Цель поиска -получение знаний, представленных в сети и требуемых для решения задачи.

Одним из мощных средств манипуляции знаниями является операция сопоставления с образцом. Сущность ее состоит в следующем. Информационная потребность, определяющая содержание и цель запроса к базе знаний, описывается автономной семантической сетью - сетью запроса, построенной по тем же правилам и отобра­жающей те же объекты и отношения, которые представ­лены в системе знаний семантической сетью. Поиск отве­та на запрос реализуется сопоставлением сети запроса с фрагментами семантической сети, представляющей си­стему знаний. Положительный результат сопоставления позволяет получить один из ответов на запрос. Все от­веты можно получить путем обнаружения всех сопоста­вимых с сетью запроса фрагментов.

Операция сопоставления может сводиться не только к выявлению фрагментов базы знаний, изоморфных сети запроса. Так, в сети запроса могут быть указаны родовидовые отношения или отношения «является частью», не представленные в системе знаний (и в семантической сети) явно, но выводимые из пред­ставленных на основе транзитивности. Аналогично, в сети запроса могут указываться свойства объектов, для получения которых в базе знаний необходимо включать механизм наследования свойств. В общем виде операцию сопоставления для семантических сетей можно описать следующим образом. Для сети, представляющей систему знаний, задается набор допустимых преобразований, пе­реводящих исходную сеть (или ее фрагменты) в логиче­ски ей эквивалентную. Операция сопоставления выявляет все фрагменты исходной или эквивалентных ей сетей, изо­морфные сети запроса. Набор допустимых преобразова­ний для семантических сетей дополняет сети новыми связями, полученными из транзитивности фундаменталь­ных отношений и наследования свойств, но не ограничи­вается этим. В зависимости от специфики решаемых задач и особенностей того или иного конкретного средст­ва набор эквивалентных преобразований может сущест­венно расширяться.

В настоящее время аппарат семантических сетей ши­роко используется в практике представления знаний. Его достоинствами являются: большие выразительные воз­можности, естественность и наглядность системы знаний, представленной графически, близость структуры сети, представляющей систему знаний, семантической структу­ре фраз естественного языка.

Общая идея использования ориентированных графов для представления знаний нашла различное воплощение у разных исследователей. Этим объясняется отсутствие единой терминологии и формально определяемой семан­тики для методов представления знаний, основанных на семантической сети.

Рассмотрим пример представления знаний семантическими сетями. Пусть имеется информация о 3 различных конфигурациях компьютеров, которые назовем условно С1, С2, С3. Исходные данные представлены в таблице

Код компьютера

Процессор

ОЗУ

Mb

Видео-карта

HDD

Gb

Монитор

Цена

у.е.

C1

Аtlon 4,2x2

1024

8600GT

200

19’

600

C2

Core2 Duo

E6420

2048

8800GTS

320

20’

700

C3

Core2 Duo

E6850

4096

880GT

200

19’

800

Здесь и далее использованы цветовые обозначения, показанные на рис. 2.1.

Семантическая сеть, представляющая эту информацию показана в приложении 1.

Агрегатный обобщенный объект «компьютер» состоит из отдельных составляющих его обобщенных объектов «процессор», «ОЗУ», «Видео-карта», «HDD», «монитор», имеющих с ним с связь «является частью». Каждому из обобщенных объектов соответствуют конкретные объекты (конкретные реализации процессора, памяти и т.д.), имеющие связь «является представителем». Конфигурации компьютера С1,С2,С3 показаны на семантической сети как конкретные агрегатные объекты, имеющие с объектом «компьютер» связь «является представителем». Эти конкретные конфигурации состоят из конкретных устройств, что показано с помощью связей «является частью».

На семантической сети показан также обобщенный объект «цена». объект «компьютер» связан с ним нефундаментальным отношением «имеет цену». Три конкретных объекта соответствуют ценам компьютеров. Они связаны с объектом «цена» отношениями «является представителем». Объекты С1,С2,С3 связаны с этими ценами связями, порожденными нефундаментальными отношениями.

clip_image002

Рис 2.1. условные обозначения

Извлечение знаний из семантической сети происходит с помощью сети запроса, представленной в приложении 2. Допустим необходимо выбрать конфигурацию компьютера и определить его характеристики исходя из следующих требований: объем ОЗУ должен составлять 2048 Mb, а монитор иметь размер 20’. Сеть запроса представляет собой подграф основной семантической сети. При построении этого подграфа используется механизм наследования свойств, что позволяет не показывать ряд вершин и дуг. Конкретные объекты, значения которых предстоит определить, помечены знаком вопроса. Извлечение знаний происходит путем наложения сети запроса на основную семантическую сеть. Вначале происходит совмещение обобщенных объектов обоих сетей. Затем рассматривается множество дуг, ведущих к конкретным объектам. Например, пусть наложение происходит в следующем порядке: совмещаются обобщенные агрегатные объекты «компьютер». Ведущая от него дуга сети запроса последовательно совмещается с дугами основной сети, ведущими к объектам С1,С2,С3, пусть первым рассматривается объект С1. Путем наложения определяются конкретные устройства, входящие в С1. Очевидно, что попытка совмещения сетей при этом будет неудачной, т.к. конкретное ОЗУ и монитор из сети запроса и принадлежащие С1 будут разные. Следующий вариант наложения пусть соответствует конфигурации С2. При этом наложение будет успешным , значения конкретных объектов сети запроса будут найдены. Как правило, при извлечении знаний из семантических сетей должны рассматриваться все возможные варианты. Поэтому будет сделана попытка рассмотреть и С3. Однако , нетрудно заметить, эта попытка будет неудачной.

Предлагаю ознакомиться с аналогичными статьями: