В настоящее время для структурирования знаний используются структурный и объектный подходы. Структурный подход основан на идее алгоритмической декомпозиции, где каждый модуль системы выполняет один из важных этапов общего процесса. В рамках структурного подхода разработано большое число выразительных средств: диаграммы потоков данных, структурированные словари (тезаурусы), языки спецификаций систем, таблицы решений, стрелочные диаграммы, диаграммы переходов, деревья целей, средства управления проектом (PERT-диаграммы) и др. .
Объектный (объектно-ориентированный) подход связан с объектной декомпозицией, при которой каждый объект рассматривается как экземпляр определенного класса. К базовым понятиям этого подхода относятся следующие:
- Абстрагирование, которое М.Шоу определил как упрощенное описание системы, где выделяются наиболее существенные для рассмотрения свойства и детали, а незначительные аспекты опускаются. Абстрактное представление реальности отражено моделью сущности (объект) и моделью поведения (метод). Объекты соответствуют понятиям предметной области. Методы представляют собой операции, которые можно выполнять над объектами.
- Класс — множество объектов, связанных общностью структуры и свойств.
- Иерархия — упорядоченная система абстракций (классов).
- Наследование — такое соотношение между классами, когда один класс использует структурную или функциональную часть другого класса (или нескольких других).
- Типизация — ограничение, накладываемое на класс, которое препятствует взаимозаменяемости объектов, принадлежащих различным классам.
- Модульность — свойство системы, связанное с возможностью ее декомпозиции на ряд взаимосвязанных частей (модулей).
- Инкапсуляция — ограничение доступа к внутренней структуре и механизмам функционирования объекта.
- Полиморфизм — возможность наделения объекта различными свойствами и стратегиями поведения. Иными словами, одно имя может соответствовать различным классам объектов, входящим в один суперкласс. Следовательно, объект, обозначенный этим именем, может по-разному реагировать на некоторое множество действий.
В настоящее время развивается объектно-структурный подход к структурированию знаний на основе обобщения существующих подходов. Основная идея объектно-структурного подхода связана с проведением последовательного объектно-структурного анализа информации о рассматриваемой предметной области, для представления которой используется стратифицированная модель (табл. 8.1). В процессе объектно-структурного анализа происходят выделение и структуризация понятий с применением разнообразных методов анализа знаний.
На стадии структурирования знаний предметной области необходимо решить следующие задачи: составление словаря используемых терминов; выявление понятий и их атрибутов; выявление связей и определение отношений между понятиями; детализация и обобщение понятий; построение обобщенной структуры знаний предметной области.
Таблица 8.1- Стратификация знаний предметной области
Уровень страты |
Категория знаний |
Вид анализа знаний |
1 2 3 4 5 6 7 8 |
ЗАЧЕМ КТО ЧТО КАК ГДЕ КОГДА ПОЧЕМУ СКОЛЬКО |
Стратегический анализ: назначение и функции системы Организационный анализ: коллектив разработчиков системы Концептуальный анализ: основные принципы, понятийная структура Функциональный анализ: гипотезы и модели принятия решений Пространственный анализ: окружение, оборудование, коммуникации Временной анализ: временные параметры и ограничения Причинно-следственный (каузальный) анализ: формирование подсистемы объяснений Экономический анализ: ресурсы, затраты, прибыль окупаемость |
Первым шагом структурирования знаний является определение входных и выходных данных, которые в дальнейшем будут детализироваться и уточняться. На основании этих данных, а также по результатам анализа протоколов сеансов извлечения знаний составляется набор ключевых слов (терминов), в процессе обработки которого выявляются объекты, понятия и их атрибуты. Под понятием подразумевается обобщение предметов некоторого класса по специфическим признакам. Формирование понятий — серьезная проблема. Для выявления понятий используются традиционные методы распознавания образов и классификации, а также нетрадиционные методы, базирующиеся на методологии инженерии знаний. Наиболее распространенными методиками выявления объектов и понятий являются:
- методика формирования перечня понятий;
- интервьюирование специалистов;
- составление списка элементарных действий;
- составление оглавления учебника.
Практическое использование этих методик показало, что наиболее результативными из них являются методики интервьюирования и составления оглавления учебника.
Существует мнение, что теория понятий есть только в одной науке — математике, где возможно их строгое определение. В гуманитарных науках определения понятий чаще всего отсутствуют, следовательно, там вместо понятий приходится иметь дело с идеями. Для строго определенных понятий существуют языки, способные выразить связи между ними, но для описания связей между идеями таких языков пока нет.
Отношения между понятиями могут иметь различную природу: «целое - часть», «причина - следствие», доминирование, временные и пространственные отношения, ситуативные, ассоциативные, функциональные и др. Выявление связей и отношений между понятиями является сложной задачей, для решения которой используются разнообразные средства. Многие инженеры по знаниям сами изобретают различные методы и приемы в процессе работы с экспертом. К таким методам можно отнести «сортировку карточек» и построение замкнутых кривых. Один из современных подходов к представлению взаимосвязанных структур знаний основан на использовании сценариев, которые строятся по аналогии с организацией человеческой памяти, где все знания объединены связями различных типов. Сценарии состоят из фрагментов (сцен), связанных пространственными или временными отношениями. Элементы знаний из фрагментов могут быть связаны отношениями различной природы: функциональными, ассоциативными, ситуативными, причинно-следственными и др. .
Процедуры обобщения и детализации понятий плохо формализуемы и требуют от экспертов и аналитиков высокой квалификации. Иерархическое представление знаний требует установления отношений между понятиями внутри каждого уровня иерархии и между ними. Заключительным этапом структурирования знаний являются анализ возможных цепочек рассуждения и выработка правил принятия решений, которые позволяют объединить сформированные понятия и отношения в динамическую модель знаний предметной области.
Последовательность структурирования знаний зависит от особенностей конкретной области и от наработанных для рассматриваемой категории знаний предметно-ориентированных методов структурирования.