Переход от данных к знаниям — логическое следствие развития и усложнения информационно-логических структур, обрабатываемых на ЭВМ. Понятие знание не имеет какого-либо исчерпывающего определения.
ПРИМЕР
Рассмотрим понятие персональный
компьютер. Его интенсионал: персональный компьютер — это ЭВМ, которую можно
поставить на стол и купить менее чем за $3000. Экстенсионал этого понятия:
персональный компьютер — это IBM PC, Macintosh и т. п.
ПРИМЕЧАНИЕ
1. Логический (формальный) подход, при котором основное внимание
уделяется изучению и применению теоретических методов представления знаний, фор
мализации, а также логической полноте (например, создание моделей пред
ставления знаний на основе некоторых логических исчислений).
2. Эвристический (когнитивный) подход, который ориентируется на обеспечение возможностей решения задач. При этом опора делается на принцип организа ции человеческой памяти и эвристическое моделирование. В отличие от фор мальных, эвристические модели имеют разнообразный набор средств, переда ющих специфические особенности той или иной области. Именно поэтому эвристические модели превосходят логические по выразительности и возмож ности адекватно представить предметную область.
Типичные модели представления знаний: логические модели; модели, основанные на использовании правил (продукционные модели); семантические сети; фреймо вые модели.
13.2.1. Логические модели
Основная идея подхода при построении логических моделей
представления знаний состоит в том, что вся информация, необходимая для
решения прикладных задач, рассматривается как совокупность фактов и утверждений,
которые пред ставляются как формулы в некоторой логике. Знания отображаются
совокупнос тью таких формул, а получение новых знаний сводится к реализации
процедур логического вывода.
В основе логических моделей представления
знаний лежит понятие формальной теории, задаваемое четверкой: S = < В, F , A
, R >, где В — счетное множество базовых символов (алфавит), F >—
множество, называемое формулами, А — выделенное подмножество априори
истинных формул (аксиом), R — конечное множество от ношений между формулами,
называемое правилами вывода.
Достоинства логических моделей представления
знаний:
2. Существуют достаточно эффективные процедуры вывода, в том числе реали зованные в языке логического программирования Пролог.
3. В базах знаний можно хранить лишь множество аксиом, а все остальные зна ния получать из них по правилам вывода.
Однако действительность не укладывается в рамки классической логики. Так называемая человеческая логика, применяемая при работе с неструктурированными знаниями, — это интеллектуальная модель с нечеткой структурой, и в этом ее отличие от «старой» (классической) логики. Таким образом, логики, адекватно отражающей человеческое мышление, к настоящему времени еще не создано.13.2.2. Продукционные модели
Психологические исследования процессов принятия решений человеком
показали, что рассуждая и принимая решения, человек использует правила
продукций, или продукционные правила (от англ. Production — правило вывода,
порождающее правило).
В общем случае продукционное правило можно
представить в следующем виде:
i : S; L; A→B; Q
где i — индивидуальный
номер продукции;
S — описание класса ситуаций, в котором данная структура
может использоваться;
L — условие, при котором продукция
активизируется;
А→В — ядро продукции, например: «ЕСЛИ A1, A2,,..., Ап ТО В»
. Такая запись означает, что «если все условия от A1 до Аn являются истиной, то
В также истина» или же «когда все условия от A1 до Аn становятся истиной, то
следует выполнить действие B»;
Q — постусловие продукционного правила,
описывает операции и действия (процедуры), которые необходимо выполнить после
выполнения В. Например, внести изменения в данные либо в саму продукцию.
Пример:
ЕСЛИ у является отцом х , ( A 1
)
z
является братом у, ( A 2 )
ТО z является
дядей х , (В)
В этом случае n =2. При n =0 получаем знания, состоящие только из вывода, то
есть простой факт, например, «Атомный вес железа равен 55,8471». Суть
использования правил продукции для представления знаний состоит в том, что левой
части ставится в соответствие некоторое условие, а правой части — действие: ЕСЛИ
<перечень условия>, ТО <перечень действий>. В такой интерпретации
левая часть правил оценивается по отношению к базе данных (известному набору
фактов) системы, и если эта оценка в определенном смысле соответствует
логическому значению «ИСТИНА», то выполняется действие, заданное в правой части
продукции.
В общем случае под условием понимается некоторое предложение —
образец, по которому осуществляют поиск в базе знаний, а под действием —
действия, выпол няемые при успешном исходе поиска, — это могут быть реальные
действия, если система управляющая, или заключение — вывод, представляющий собой
новое ( фактуальное ) знание, или некоторая цель.
При использовании
продукционной модели база знаний состоит из набора правил. Программа,
управляющая перебором правил, называется машиной вывода. Механизм выводов
связывает знания воедино, а затем выводит из последовательности знаний
заключение.
Пример:
Пусть в базе знаний вместе с описанными выше
знаниями содержатся еще и такие знания:
ЕСЛИ z является отцом х ,
z
является отцом у,
х и у не являются одним и тем же лицом,
ТО х и у
являются братьями;
где х , у, z - переменные.
Пусть также в базе данных
(рабочей памяти) имеются факты:
α является отцом β ,
α является отцом γ
,
β является отцом δ .
Тогда из этих знаний можно формально вывести
заключение, что
γ является дядей δ .
В продукционных системах,
основанных на знаниях, процесс обработки инфор мации может осуществляться двумя
способами. Первый предполагает обработку информации в прямом направлении (метод
сопоставления), когда образцом для поиска служит левая часть продукционного
правила — условие, то есть задача решается в направлении от исходного состояния
к целевому . Это соответствует стратегии «от данных к цели» или стратегии
управления данными. После разрешения возникающих конфликтов выполняются правые
части продукционных правил, что соответствует логическому выводу новых
утверждений. После добавления выведенных утверждений в базу данных процедура
повторяется. Процесс оканчивается, если выполняется продукционное правило,
предписывающее прекращение поиска, или в базу данных поступает утверждение,
являющееся решением. При втором подходе обработка информации осуществляется в
обратном направлении — метод «генерации» или выдвижения гипотезы и ее проверки
(стратегия «от цели к данным»). При каждом обратном движении возникает
подцелевое состояние, из которого целевое может быть получено при прямом
движении. В этом случае проверяются правые части продукционных правил с целью
обнаружить в них искомое утверждение. Если такие продукционные правила
существуют, то проверяется, удовлетворяется ли левая часть продукционного
правила. Если да, то гипотеза считается подтвержденной, если нет — отвергается.
Таким образом, продукционные правила могут применяться к описанию состоя ния и описывать новые состояния (гипотезы) или же, напротив, использовать целевое состояние задачи как базу, когда система работает в обратном направле нии. При этом продукционные правила применяются к целевому описанию для порождения подцелей (образуют систему редукций).
Пример:
Имеется фрагмент БЗ из двух правил:
П 1 : ЕСЛИ
«отдых - летом» и «человек - активный»,
ТО «ехать в горы».
П 2 : ЕСЛИ
«любит солнце»,
«отдых летом».
Предположим в систему поступили данные:
«человек - активный» и «любит солнце»
Прямой вывод: исходя из данных, получить ответ.
1-й проход:
Шаг 1. Пробуем П 1 не работает -
не хватает данных
«отдых - летом».
Шаг 2. Пробуем П 2 , работает,
в базу поступает факт
«отдых - летом». 2-й проход:
Шаг 3. Пробуем П 1 , работает,
активируя цель «ехать в горы», которая и выступает,
например, как совет,
который дает система.
Обратный вывод:
подтвердить выбранную цель при помощи имеющихся
правил и данных. 1-й проход:
Шаг 1. Цель - «ехать в горы»:
становятся новой целью, и имеется правило,
где она в правой части.
Шаг 2. Цель «отдых летом»:
правило П
2 подтверждает цель и активизирует ее. 2-й проход:
Шаг 3.
Пробуем П 1 , подтверждается искомая цель.
13.2.3. Семантические сети
Способ представления знаний с помощью сетевых моделей наиболее
близок к тому, как они представлены в текстах на естественном языке. В его
основе лежит идея о том, что вся необходимая информация может быть описана как
совокупность троек ( arb ), где а и b
— объекты или понятия, а r — бинарное
отношение между ними. Формально сетевые модели представления знаний могут быть
заданы в виде H = < I , C 1 ,…, Cn ,
Г>, где I — множество
информационных единиц,
С 1 ,..., Сп —
множе ство типов связей между элементами
I , отображение Г задает между
информационными единицами, входящими в I , связи из заданного набора типов
связей {С i }.
В
зависимости от типов связей {С i
} различают:
Классифицирующие сети — в них используются
отношения структуризации,
они позволяют вводить в базы знаний различн ые ие
рархические отношения
между элементами множества I .
Функциональные сети —
вычислительные модели, характеризующиеся наличи ем функциональных отношений, они
позволяют описывать процедуры вычис лений одних информационных единиц через
другие.
Сценарии — в них используются каузальные отношения
(причинно-следствен ные или устанавливающие влияние одних явлений или
фактов на другие), а также отношения типов «средство — результат», «орудие —
действие» и т. д.
Если в сетевой модели допускаются связи различного типа,
то ее называют семан тической сетью.
ПРИМЕЧАНИЕ
Термин «семантическая» означает «смысловая», а
сама семантика — это наука, устанавлива ющая отношения между символами и
объектами, которые они обозначают, то есть наука, определяющая смысл знаков.
Недостатки: сетевая модель не дает (точнее, не содержит) ясного представления
о структуре предметной области, которая ей соответствует, поэтому формирование и
модификация такой модели затруднительны; сетевые модели представляют собой
пассивные структуры, для обработки которых необходим специальный аппарат
формального вывода и планирования. Проблема поиска решения в базе знаний типа
семантической сети сводится к задаче поиска фрагмента сети, соот ветствующего
некоторой подсети поставленной задачи. Это, в свою очередь, обусловливает еще
один недостаток модели — сложность поиска вывода на семантических сетях.
Еще раз подчеркнем, что сетевые модели являются очень наглядным и достаточно
универсальным средством представления знаний. Однако их формализация в
конкретных моделях представления, использования и модификации знаний ока
зывается достаточно трудоемкой, особенно при наличии множественных отноше
ний между ее элементами.
13.2.4. Фреймовые модели
Термин фрейм ( frame — каркас, рамка) предложен М. Минским
в 70-е годы для обозначения структуры знаний для восприятия пространственных
сцен. Эта модель, как и семантическая сель, имеет глубокое психологическое
обоснование. Под фреймом понимается абстрактный образ или ситуация. В психологии
и фило софии известно понятие абстрактного образа. Например, слово «комната»
вызывает образ комнаты — «жилое помещение с четырьмя стенами, полом, потолком,
окнами и дверью». Из этого описания ничего нельзя убрать, например, убрав окна,
мы получим уже чулан, а не комнату. Но в нем есть «слоты», или «щели», —
незаполненные значения некоторых атрибутов — количество окон, цвет стен, высота
потолка, покрытие пола и др. Такой образ и называется фреймом (фреймом
минимального описания). Фреймом называется также и формализованная мо дель
этого образа.
Фреймовая модель, основанная на теории М. Минского, представляет собой сис тематизированную в виде единой теории технологическую модель памяти человека и его сознания. Важным элементом в этой теории является понятие фрейма — структуры данных для представления некоторого концептуального объекта. Информация, относящаяся к этому фрейму, содержится в составляющих фрейма — слотах. В отличие от моделей других типов, во фреймовых моделях фиксируется жесткая структура, которая называется протофреймом (фреймом-прототипом, или образцом). В общем случае фрейм определяется следующим образом:
f = [( r 1 , v 1 ,), … ,( r n , v n )]Если в качестве значений слотов использовать реальные данные из таблицы, то
получится фрейм-экземпляр.
Важнейшим свойством фреймов является
заимствованное из теории семантических сетей наследование свойств. И во фреймах,
и в семантических сетях наследование происходит по АКО-связям (от A
Kind Of = это). Слот АКО указывает на фрейм более высокого
уровня иерархии, откуда неявно наследуются, то есть переносятся значения
аналогичных слотов, причем наследование свойств может быть частичным.
Фреймовые модели является достаточно универсальными, поскольку позволяют
отобразить все многообразие знаний о мире:
через фреймы-структуры для
обозначений объектов и понятий (заем, залог, вексель);
фреймы-роли
(менеджер, кассир, клиент);
фреймы-сценарии (банкротство, собрание
акционеров, празднование именин);
фреймы-ситуации (тревога, авария, рабочий
режим устройства и т. д.).
Основными достоинствами модели фреймов как модели
представления знаний являются способность отражать концептуальную основу
организации памяти человека, а также естественность, наглядность представления,
модульность, под держка возможности использования значений слотов по умолчанию.
Однако фрейм-представление является не конкретным языком представления знаний, а
некоторой идеологической концепцией, реализуемой поразному в различных языках.
Теория фреймов послужила толчком к разработке нескольких языков представления
знаний, которые благодаря своим широким возможностям и гибкости стали в
последние годы довольно распространенными языками. Отметим, кроме того, что
концепция объектно-ориентированного программирования может рассматриваться как
реальное воплощение понятий, близких фрейму, в традици онных языках
программирования.
Основным недостатком фреймовых моделей является отсутствие
механизмов управления выводом. Отчасти этот недостаток устраняется при помощи
присое диненных процедур, реализуемых силами пользователя системы.
Рассмотренные модели представления знаний во многом близки между собой. По
сути, они обладают одинаковыми возможностями описывать и представлять зна ния.
Разница состоит лишь в том, насколько удобно и естественно представлять те или
иные знания в виде логических формул, семантических сетей, фреймов или
продукций.
Если говорить о взаимосвязях рассмотренных выше моделей, то можно
отметить следующее. Логические и продукционные модели отличаются достаточно выра
женной процедурной формой, поэтому их часто используют для описания проце
дурных знаний. Вместо логического вывода, характерного для логических моде
лей, в продукционных моделях используется вывод, основанный на знаниях. Модели
знаний, опирающиеся на семантические сети, используют для описания декларативных
знаний.
В системах искусственного интеллекта могут использоваться и
несколько моде лей представления знаний одновременно. Например, в качестве
значений некото рых слотов во фрейме могут выступать продукции. Именно смешанные
представ ления оказываются наиболее многообещающими. В продукционных
системах используются некоторые элементы логических и сетевых моделей. Поэтому
они позволяют организовывать эффективные процедуры вывода (близость к
логическим моделям) и наглядно отражать знания в виде сетей (близость к
семантиче ским сетям). В них отсутствуют жесткие ограничения, характерные
для логических исчислений, что дает возможность изменять интерпретацию элементов
продук ции. Кроме того, в результате применения правил вывода к фрагментам
сетевого описания происходит трансформация сети за счет смены ее фрагментов,
наращи вание сети и исключение из нее ненужных фрагментов.
Фрейм можно
рассматривать как фрагмент семантической сети, предназначенной для описания
объекта (ситуации) проблемной области со всей совокупностью присущих ему
свойств. Фреймовый подход к представлению знаний более жест кий, чем основанный
на использовании семантической сети. Все то об объекте или ситуации, что важно с
позиции решаемой задачи, не «размывается» в сети, а представляется во фрейме. В
свою очередь, фрейм можно представить в виде сети, состоящей из вершин и дуг
(отношений), так, что «нижние уровни» фрейма заканчиваются слотами, которые
заполняются конкретной информацией при вызове фрейма.
Обобщая анализ моделей
представления знаний, можно сделать два основных вывода:
Невозможно дать
универсальные рекомендации по выбору модели. Выбор конкретной модели
определяется возможностью и удобством представления исследуемой проблемной
области с учетом необходимости не только представ ления, но и использования
знаний. Однако чаще используются эвристические, не логические модели
представления знаний.
Наиболее мощными оказываются смешанные
представления.