Проблемы структурирования знаний

В настоящее время для структурирования знаний используются структурный и объектный подходы. Структурный подход основан на идее алгоритмической декомпозиции, где каждый модуль системы выполняет один из важных этапов общего процесса. В рамках структурного подхода разработано большое число выразительных средств: диаграммы потоков данных, структурированные словари (тезаурусы), языки спецификаций систем, таблицы решений, стрелочные диаграммы, диаграммы переходов, деревья целей, средства управления проектом (PERT-диаграммы) и др. .

Объектный (объектно-ориентированный) подход связан с объектной декомпозицией, при которой каждый объект рассматривается как экземпляр определенного класса. К базовым понятиям этого подхода относятся следующие:

  • Абстрагирование, которое М.Шоу определил как упрощенное описание системы, где выделяются наиболее существенные для рассмотрения свойства и детали, а незначительные аспекты  опускаются.  Абстрактное  представление  реальности отражено моделью сущности (объект) и моделью поведения (метод). Объекты соответствуют понятиям предметной области. Методы представляют собой операции, которые можно выполнять над объектами.
  • Класс — множество объектов, связанных общностью структуры и свойств.
  • Иерархия — упорядоченная система абстракций (классов).
  • Наследование — такое соотношение между классами, когда один класс использует структурную или функциональную часть другого класса (или нескольких других).
  • Типизация — ограничение, накладываемое на класс, которое препятствует взаимозаменяемости объектов, принадлежащих различным классам.
  • Модульность — свойство системы, связанное с возможностью ее декомпозиции на ряд взаимосвязанных частей (модулей).
  • Инкапсуляция — ограничение доступа к внутренней структуре и механизмам функционирования объекта.
  • Полиморфизм — возможность наделения объекта различными свойствами и стратегиями поведения. Иными словами, одно имя может соответствовать различным классам объектов, входящим в один суперкласс. Следовательно, объект, обозначенный этим именем, может по-разному реагировать на некоторое множество действий.

В настоящее время развивается объектно-структурный подход к структурированию знаний на основе обобщения существующих подходов. Основная идея объектно-структурного подхода связана с проведением последовательного объектно-структурного анализа информации о рассматриваемой предметной области, для представления которой используется стратифицированная модель (табл. 8.1). В процессе объектно-структурного анализа происходят выделение и структуризация понятий с применением разнообразных методов анализа знаний.

На стадии структурирования знаний предметной области необходимо решить следующие задачи: составление словаря используемых терминов; выявление понятий и их атрибутов; выявление связей и определение отношений между понятиями; детализация и обобщение понятий; построение обобщенной структуры знаний предметной области. 

Таблица 8.1- Стратификация знаний предметной области

Уровень страты

Категория знаний

Вид анализа знаний

1

 

2

 

3

 

4

 

5

 

6

 

7

 

 

8

ЗАЧЕМ

 

КТО

 

ЧТО

 

КАК

 

ГДЕ

 

КОГДА

 

ПОЧЕМУ

 

 

СКОЛЬКО

Стратегический анализ: назначение и функции системы

Организационный анализ: коллектив разработчиков системы

Концептуальный анализ: основные принципы, понятийная структура

Функциональный анализ: гипотезы и модели принятия решений

Пространственный анализ: окружение, оборудование, коммуникации

Временной анализ: временные параметры и ограничения

Причинно-следственный (каузальный) анализ: формирование подсистемы объяснений

Экономический анализ: ресурсы, затраты, прибыль окупаемость

Первым шагом структурирования знаний является определение входных и выходных данных, которые в дальнейшем будут детализироваться и уточняться. На основании этих данных, а также по результатам анализа протоколов сеансов извлечения знаний составляется набор ключевых слов (терминов), в процессе обработки которого выявляются объекты, понятия и их атрибуты. Под понятием подразумевается обобщение предметов некоторого класса по специфическим признакам. Формирование понятий — серьезная проблема. Для выявления понятий используются традиционные методы распознавания образов и классификации, а также нетрадиционные методы, базирующиеся на методологии инженерии знаний. Наиболее распространенными методиками выявления объектов и понятий являются:

  • методика формирования перечня понятий;
  • интервьюирование специалистов;
  • составление списка элементарных действий;
  • составление оглавления учебника.

Практическое использование этих методик показало, что наиболее результативными из них являются методики интервьюирования и составления оглавления учебника.

Существует мнение, что теория понятий есть только в одной науке — математике, где возможно их строгое определение. В гуманитарных науках определения понятий чаще всего отсутствуют, следовательно, там вместо понятий приходится иметь дело с идеями. Для строго определенных понятий существуют языки, способные выразить связи между ними, но для описания связей между идеями таких языков пока нет.

Отношения между понятиями могут иметь различную природу: «целое - часть», «причина - следствие», доминирование, временные и пространственные отношения, ситуативные, ассоциативные, функциональные и др. Выявление связей и отношений между понятиями является сложной задачей, для решения которой используются разнообразные средства. Многие инженеры по знаниям сами изобретают различные методы и приемы в процессе работы с экспертом. К таким методам можно отнести «сортировку карточек» и построение замкнутых кривых. Один из современных подходов к представлению взаимосвязанных структур знаний основан на использовании сценариев, которые строятся по аналогии с организацией человеческой памяти, где все знания объединены связями различных типов. Сценарии состоят из фрагментов (сцен), связанных пространственными или временными отношениями. Элементы знаний из фрагментов могут быть связаны отношениями различной природы: функциональными, ассоциативными, ситуативными, причинно-следственными и др. .

Процедуры обобщения и детализации понятий плохо формализуемы и требуют от экспертов и аналитиков высокой квалификации. Иерархическое представление знаний требует установления отношений между понятиями внутри каждого уровня иерархии и между ними. Заключительным этапом структурирования знаний являются анализ возможных цепочек рассуждения и выработка правил принятия решений, которые позволяют объединить сформированные понятия и отношения в динамическую модель знаний предметной области.

Последовательность структурирования знаний зависит от особенностей конкретной области и от наработанных для рассматриваемой категории знаний предметно-ориентированных методов структурирования.