Рассмотрим проблемы приобретения знаний интеллектуальными информационными системами. Процесс приобретения знаний называется обучением. Большинство обучающихся систем, разработанных до настоящего времени, ориентировано на воспроизведение компьютером механизмов приобретения знаний, свойственных человеку. Несмотря на ряд успехов в этой области, проблема сложного эвристического обучения интеллектуальных систем до сих пор не решена. С ее решением ряд исследователей связывает надежды на то, что обученные компьютеры смогут создавать программы и генерировать решения лучше, чем это удается человеку.
Смысл процесса машинного обучения можно пояснить следующим образом. В процессе повторения однотипных экспериментов происходит модификация программной системы, в результате которой система демонстрирует на следующем этапе экспериментов результаты лучшие, чем прежде.
Мы уже говорили о том, что приобретение знаний реализуется с помощью двух функций: получения информации извне и ее систематизации. В зависимости от интеллектуальных способностей ИИС возможны разные формы приобретения знаний и представления исходной информации.
Японскими специалистами по инженерии знаний предложена следующая классификация этапов обучения, соответствующих способностям компьютерных систем к формализации.
A. Получение информации без логических выводов
- Ввод программ.
- Ввод фактических данных,
B. Получение знаний извне
- Получение готового набора знаний, представленных во внутреннем формате.
- Получение знаний во внутреннем формате в режиме диалога.
- Получение знаний во внешнем формате и их понимание.
C. Обучение по примерам
- Параметрическое обучение.
- Обучение на основе выводов по аналогии.
- Индуктивное обучение.
- Обучение нейронных сетей.
D. Приобретение знаний на метауровне
Методы категории А можно назвать обучением без выводов или механическим запоминанием. Здесь полученная информация используется для решения задач в том же виде, в котором поступает в систему.
В методах категории В внешняя информация поступает в компьютерную систему в форме знаний, следовательно, ее можно использовать в процессе логического вывода. Примером такой информации являются правила, поступающие в ЭС продукционного типа. В интеллектуальной системе необходимо иметь функцию преобразования поступающих знаний в формат, удобный для дальнейшего использования. Эту функцию выполняют редакторы знаний, которые, в отличие от редакторов данных в БД, не только корректируют поступающую информацию, но и выполняют проверку знаний, содержащихся в БЗ, на наличие конфликтов (противоречий) с новыми знаниями.
Если знания поступают в ИИС во внешнем формате, то кроме преобразования и редактирования возникает задача их понимания. Такие проблемы характерны для систем с ЕЯ-интерфейсом.
Одной из актуальных проблем ИИ является операционализация знаний, связанная с пониманием, преобразованием и использованием советов и подсказок, которые человек сообщает интеллектуальной системе в ходе решения конкретных задач. Советы и подсказки, поступающие в систему на естественном языке в терминах предметной области, необходимо преобразовывать в процедуры, ориентированные на выполнение определенных действий.
Категория С принципиально отличается от А и В тем, что интеллектуальные системы приобретают знания самостоятельно, выполняя сбор отдельных фактов, их обобщение и систематизацию. В процессе решения задач определенного класса (примеров) компьютерная система выявляет понятия, выбирает формат их представления и проводит структуризацию. Подобные задачи вызывают сложности и у человека.
Проблемы понимания и преобразования знаний характерны для категорий В и С, причем последняя отличается наличием процедур обобщения, примерами которых являются замена постоянных атрибутов языка (констант) на переменные, исключение описаний с ограниченным применением, индукция, абдукция и др. Способы обобщения тесно связаны с языком представления знаний в информационных системах.
Параметрическое обучение — самая простая форма в категории С. Оно заключается в определении общего вида правила, формирующего результат вывода, и в последующей корректировке входящих в него параметров, зависящих от конкретных данных. Пример обучающейся системы такого типа — известная экспертная система Meta-Dendral, предназначенная для построения структурных формул химических соединений на основе данных масс-спектрального анализа. В ней выводятся новые правила путем коррекции уже заложенных в базу знаний продукций.
Обучение по аналогии базируется на гипотезе о том, что «если две ситуации подобны по нескольким признакам, то они подобны еще по одному признаку». Подобие ситуаций распознается на основе обобщенной меры совпадения значений важнейших признаков, с помощью которых описаны ситуации.
Вопросы приобретения знаний на метауровне актуальны на современном этапе развития искусственного интеллекта, так как связаны с выработкой стратегий управления процессом решения задач в интеллектуальных информационных системах. Это направление активно развивается, но здесь пока не выработано устойчивых представлений и апробированных моделей. Вопросы приобретения метазнаний частично затрагиваются в новых направлениях Data Mining и Knowledge Discovery, которые связаны с извлечением знаний из данных