Стратегии получения знаний

Извлечением знаний называют процесс получения знаний от экспертов. Извлечение знаний — сложная и трудоемкая процедура, в результате которой инженеру по знаниям (когнитологу, аналитику) необходимо создать собственную модель предметной области на основе информации, полученной от экспертов. Попытки получить знания, необходимые для разработки интеллектуальной информационной системы, непосредственно от экспертов и обойтись без когнитологов обычно не приводят к успеху, так как в этом случае предъявляются очень высокие требования к эксперту, который, являясь специалистом в предметной области, будет вынужден приобрести квалификацию инженера по знаниям. Кроме того, существует еще несколько причин, вызывающих необходимость участия аналитиков в процессах извлечения знаний, а именно:

  • лучшим способом для вербализации знаний эксперта является диалог;
  • опытный аналитик, вооруженный современной методологией системного анализа, может помочь эксперту в структуризации знаний предметной области;
  • инженер по знаниям помогает эксперту осознать «скрытые» знания, предлагая ему установить причинно-следственные связи (а также связи другой природы) на множестве выделенных понятий.

Успех на этапе извлечения знаний во многом зависит от квалификации аналитика, который должен иметь образование, включающее знания из разных областей, в том числе из когнитивной психологии, системного анализа, математической логики, искусственного интеллекта и т.д.

Как правило, каждый когнитолог сам изобретает язык для описания полученных от эксперта знаний путем пополнения сложившегося языка конкретной науки специальными терминами и знаками. Стандарта таких языков пока не существует. Тем не менее, желательно, чтобы такие языки были понятными и содержали как можно меньше неточностей. Разработка языков инженерии знаний ведется в различных направлениях, в частности известны языки-классификации, логико-конструктивные языки, структурно-логические и др. Перспективный подход к созданию подобных языков открывает семиотика — наука о знаковых системах. Классическая семиотика является чисто гуманитарной наукой, основные интересы которой сосредоточены в области культуры человеческого поведения, искусства и языка. Область исследований прикладной семиотики связана с применением знаковых систем для представления и обработки знаний в практических приложениях искусственного интеллекта.

Процессы извлечения знаний рассматривают в трех основных аспектах: психологическом, лингвистическом и гносеологическом.

Психологический аспект. Это самый важный из всех аспектов, так как извлечение знаний происходит в процессе общения когнитологов с экспертами, где психология играет доминирующую роль.

Процесс извлечения знаний для интеллектуальных систем необходимо организовать не как однонаправленный процесс передачи сообщений от эксперта аналитику, а как совместный поиск истины.

В процессе разговорного общения много информации теряется, поэтому важной проблемой является увеличение информативности общения аналитика и эксперта за счет использования методик, выработанных в психологии.

Модель общения включает участников общения, средства общения и предмет общения (знания). В соответствии с этими компонентами выделяются три слоя психологических проблем: контактный, процедурный, когнитивный.

Степень информативности общения аналитика и эксперта на уровне контактного слоя зависит в основном от пола, возраста, темперамента личности и мотивации участников общения. Установлено, что хорошие результаты дают гетерогенные пары (мужчина/женщина) и соотношение возрастов:

5<(Вэа)<20,

где Вэ, - возраст эксперта;

Ba - возраст аналитика.

Желательно, чтобы участники процесса общения обладали такими качествами, как доброжелательность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, собранность, настойчивость, общительность и находчивость.

В рамках контактного слоя наиболее предпочтительными из четырех классических типов темперамента являются сангвиники и холерики.

Параметры процедурного слоя обеспечивают эффективность извлечения знаний. К этим параметрам относятся: ситуация общения (место, время, продолжительность); оборудование (вспомогательные средства, освещенность, мебель); профессиональные приемы (темп, стиль, методы и др,). Для повышения эффективности процесса извлечения знаний инженер по знаниям должен подобрать значимые для эксперта стимулы, поскольку последний передает аналитику один из самых ценных ресурсов — знания.

Когнитивный слой связан с изучением семантического пространства памяти эксперта и с воссозданием его понятийной структуры и модели рассуждений. Когнитивный слой характеризуется когнитивным стилем и семантической репрезентативностью.

Под когнитивным стилем человека понимается специфическая совокупность критериев, используемых им в процессе познания мира для решения различных задач. Когнитивный стиль — это система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности, обеспечивающей достижение желаемых результатов. Для повышения эффективности извлечения знаний целесообразно подбирать экспертов и аналитиков, обладающих вполне определенными характеристиками когнитивного стиля. Наиболее важными из них являются следующие: поленезависимость (независимость от шумового поля), импульсивность — рефлексивность, жесткость — гибкость, когнитивная эквивалентность.

Желательно, чтобы и аналитики, и эксперты обладали следующими когнитивными характеристиками:

  • высокой поленезависимостью, которая подразумевает способность выделять главные аспекты рассматриваемой проблемы и отбрасывать все лишнее, что не относится к поставленной задаче. Это качество желательно иметь и аналитику, и эксперту, однако следует учитывать тот факт, что полезависимые люди более контактны и склонны к общению;
  • рефлексивностью, характеризующей склонность к рассудительности и самоанализу (в то время как импульсивность характеризуется быстрым, зачастую недостаточно обоснованным принятием решений);
  • когнитивной эквивалентностью, определяющей способность человека к различению понятий и разбиению их на классы и подклассы;
  • эксперты – устойчивостью представлений, т. е. жесткостью структуры восприятия, а аналитики – гибкостью, т. е. умением легко приспосабливаться к новой обстановке.

Для эффективного построения ИИС инженер по знаниям должен владеть специальными неформальными методами и математическим аппаратом, позволяющими ему воссоздавать полученные от эксперта знания с помощью различных моделей, например, таких, как продукционная или фреймовая. Не навязывая эксперту какой-либо модели, аналитик должен подобрать средства представления знаний, имеющие максимально высокую семантическую репрезентативность.

Лингвистический аспект. Актуальность исследования этого аспекта определяется тем, что язык является основным средством общения в процессе извлечения знаний. В области лингвистических проблем наиболее важными являются понятия: общий код, понятийная структура, словарь пользователя.

Общим кодом называют специальный промежуточный язык общения между экспертом и инженером по знаниям. Этот язык включает совокупность общенаучных и специальных понятий из профессиональной литературы, элементов базового языка, неологизмов и т.п.. Общий код позволяет преодолеть языковой барьер в процессе общения когнитологов с экспертами. Выработка общего кода для партнеров осуществляется в соответствии с информационными потоками.

В дальнейшем общий код преобразуется в понятийную структуру, или семантическую сеть, которая связывает понятия, хранящиеся в памяти человека. Выявление отношений между элементами знаний, представленных понятиями, является одной из самых сложных проблем в процессах извлечения знаний. Хорошо известно, что естественные знания человека представляют собой связанные структуры, а не разрозненные фрагменты. Однако до настоящего времени при разработке БЗ учитывается весьма ограниченный набор связей между понятиями, в то время как в действительности существует большое разнообразие таких отношений. Д.А.Поспелов выделяет более 200 базовых видов отношений между понятиями. Такое многообразие делает невозможным однозначное определение набора признаков, описывающих конкретное понятие, и, как следствие, однозначную классификацию понятий. Очевидно, сложность данной проблемы является главной причиной того, что на сегодняшний день отсутствуют надежные методики формирования понятийных структур.

Тем не менее, построение той или иной иерархии понятий входит в задачи концептуального анализа структуры знаний любой предметной области. В последнее время в искусственном интеллекте стал широко употребляться термин онтология, имеющий многозначную интерпретацию, в частности в [5] приводятся следующие его определения.

  1. Онтология как философская дисциплина представляет собой систему категорий, являющихся следствием определенного взгляда на мир.
  2. Онтология как неформальная система концептуализации знаний предполагает построение описания множества выделенных объектов, понятий, связей и отношений в заданной области знаний. При этом могут использоваться формальные или неформальные средства. В простейшем случае онтология может описывать только иерархию понятий, связанных отношениями «элемент-класс». Помимо этого она может содержать набор аксиом и правил вывода, позволяющих выразить другие отношения между понятиями и ограничить область интерпретации понятий.
  3. Онтология как представление концептуальной системы в виде логической теории означает использование определенного синтаксиса для представления знаний.

Разработка словаря пользователя необходима в связи с тем, что конечный пользователь не обязан владеть профессиональным языком предметной области, который использовался при построении БЗ. Интерфейс пользователя создается, как правило, путем доработки словаря общего кода.

Гносеологический аспект. Он объединяет методологические проблемы получения нового научного знания, так как процесс познания часто сопровождается появлением новых понятий и теорий. В процессе разработки БЗ эксперты довольно часто впервые формулируют некоторые закономерности на основе накопленного эмпирического опыта. Последовательность фактобобщенный фактэмпирический закон теоретический закон называется гносеологической цепочкой. Теория — это не только система обобщения накопленных знаний, но и способ получения нового знания.

Основными критериями качества новых знаний являются внутренняя согласованность, системность, объективность, историзм.

В процессе извлечения знаний аналитиков прежде всего интересуют эмпирические знания экспертов, представляющие собой результаты наблюдений, которые могут оказаться несогласованными. Внутренняя согласованность эмпирических знаний характеризуется понятиями модальности, противоречивости, неполноты. Под модальностью знания понимается возможность его существования в различных категориях. Противоречивость является естественным свойством эмпирических знаний и не всегда может и должна быть устранена. Напротив, противоречивость может служить отправной точкой в рассуждениях экспертов. Неполнота знаний связана с невозможностью исчерпывающего описания любой предметной области.

Системность знаний основана на определении места новых знаний в многоуровневой иерархической организации. При этом необходимо найти ответы на вопросы: какие понятия детализируют или обобщают новые знания и в каких отношениях они состоят с известными фактами и закономерностями?

Объективность знаний определить практически невозможно. Процессы накопления, описания, представления, обработки, интерпретации и оценивания качества знаний выполняются конкретными людьми, поэтому их результаты имеют субъективный характер. Объективность некоторых закономерностей часто связывают с широтой области их применимости. Границы этой области можно установить экспериментальным или теоретическим путем, но далеко не всегда. В качестве косвенных свидетельств объективности иногда допускают совпадение представлений различных экспертов и подтверждение выдвинутых гипотез известными фактами.

Историзм знаний связан с развитием и изменением представлений о предметной области с течением времени.

Процесс познания можно представить следующими этапами:

  • описание и обобщение фактов;
  • выявление связей между фактами, формулирование правили закономерностей;
  • построение модели знаний предметной области;
  • объяснение и прогнозирование явлений на основе модели.

На начальных этапах инженер по знаниям, исследуя структуру умозаключений эксперта, может использовать разные теории и подходы для построения формальной модели знаний предметной области. Наиболее известными и часто применяемыми приемами являются математическая логика, теория ассоциаций и гештальт-психология.

Математическая логика формирует критерии, которые гарантируют точность, значимость и непротиворечивость общих понятий, рассуждений и выводов. Применяя логический подход, когнитолог выполняет следующие операции: определение понятий, выявление сходства и различия, анализ, абстрагирование, обобщение, классификацию, образование суждений, составление силлогизмов и т.д. Проблема применения логического подхода к представлению знаний заключается в том, что человек не всегда мыслит категориями строгой классической логики, а естественная система знаний не является полной, допускает противоречия и многозначные оценки истинности.

В теории ассоциаций мышление представляется в виде цепочки идей, связанных общими понятиями. Здесь применяются следующие приемы:

  • ассоциации, приобретенные на основе связей различной природы;
  • привлечение прошлого опыта;
  • метод проб и ошибок со случайным успехом;
  • привычные («автоматические») реакции и пр.

Гештальт-психология ориентирует аналитика на выделение целостного образа или структуры знаний (гештальта) как основы для понимания процессов и явлений окружающего мира. Понятие гештальта во многом согласуется с понятием фрейма. Применение данной теории ориентирует эксперта на формирование модели знаний в соответствии с критериями простоты, связности и гармонии.

Идеализированная модель знаний предметной области строится на основе установленных логических связей между понятиями. Модель формализуется с помощью категориального аппарата, формально-знаковых средств математики и логики. Для адекватного отображения в модели реальной картины мира инженеру по знаниям необходимо владеть такими приемами, как идеализация, абстрагирование, огрубление. Критерием качества построенной модели является способность ИИС делать прогнозы и объяснять множество явлений из заданной предметной области. Инженер по знаниям должен стремиться, чтобы результирующая модель знаний была достаточно полной, связной и непротиворечивой.