Представление нечетких знаний - Моделирование неопределенности в рассуждениях
Рассмотрим ситуацию. Пусть используется правило если (А), то (В), предположим, что никакие другие правила и посылки не имеют отношения к рассматриваемой ситуации. Неопределенность может быть двух типов: · неопределенность в истинности самой посылки (например, если степень уверенности в том, что A истинно составляет 90%, то какие значения примет В); · неопределенность самого правила (например, мы можем сказать, что в большинстве случаев, но не всегда, если есть А, то есть также и В). Еще более сложная ситуация возникает в случае, если правило имеет вид: если (А и В), то (С), где мы можем с некоторой степенью быть уверены как в истинности каждой из посылок (А, В), а тем более их совместного проявления, так и в истинности самого вывода. Существуют четыре проблемы, которые возникают при проектировании и создании систем с неопределенными знаниями: 1. Как количественно выразить степень определенности при установлении истинности (или ложности) некоторой части данных? 2. Как выразить степень поддержки заключения конкретной посылкой? 3. Как использовать совместно две (или более) посылки, независимо влияющие на заключение? 4. Как быть в ситуации, когда нужно обсудить цепочку вывода для подтверждения заключения в условиях неопределенности? Рассмотрим возможности использования теории вероятности при выводе в условиях неопределенности — байесовское оценивание. Для рассмотрения теоремы Байеса приведем некоторые фундаментальные понятия теории вероятностей. Пусть А некоторое событие реального мира. Совокупность всех элементарных событий называется выборочным пространством или пространство событий W. Вероятность события А, обозначается р(А) и каждая вероятностная функция р должна удовлетворять трем аксиомам: 1. Вероятность любого события А является неотрицательной, то есть p(A) ? 0 для " A ? W. 2. Вероятность всех событий выборочного пространства равна 1, то есть p(W)=1. 3. Если k событий А1, А2, … , Аk являются взаимно независимыми (то есть не могут подойти одновременно), то вероятность, по крайней мере, одного из этих событий равна сумме отдельных вероятностей, или
Аксиомы 1 и 2 можно объединить, что дает 0 ? p(A) ? 1 для " A ? W. Это утверждение показывает, что вероятность любого события находится между 0 и 1. По определению, когда р(А) = 0, то событие А никогда не произойдет. В том случае и когда р(А) = 1 , то событие А должно произойти обязательно. Дополнение к А, обозначаемое (¬A), содержит совокупность всех за исключением А. Так как А и ¬A являются взаимонезависимыми (то есть W событий в А? ¬A= W) то из аксиомы 3 следует р(А) + р(¬A) = р(А ? ¬A) = р(W ) = 1 . Переписывая это равенство в виде р(¬A) = 1 – р(А), мы получает путь для получения р(¬A) из р(А). Предположим теперь, что В ? W некоторое другое событие. Тогда вероятность того, что произойдет А при условии, что произошло В записывается в виде р(А | B) и называется условной вероятностью события А при заданном событии В. Вероятность того, что оба события А и В произойдут р(А?В) называется совместной вероятностью событий А и В. Условная вероятность р(А|B) равна отношению совместной вероятности р(А?В) к вероятности события В, при условии, что она не равна 0, то есть
Аналогично условная вероятность события В при условии А, обозначаемая р(В | А) равна
и таким образом p(B?A) = p(B|A) Так как совместная вероятность коммутативна (то есть от перестановки мест сумма не меняется), то p(A?B)= p(B?A)= p(B|A) Подставляя это равенство в ранее полученное выражение для условной вероятности р(А| В ) получим правило Байеса
В ряде случае наше знание того, что произошло событие B, не влияет на вероятность события A (или наоборот A на B). Другими словами, вероятность события А не зависит от того, что произошло или нет событие В, так что р(А | В) = р(А) и р(В | А) = р(В). В этом случае говорят, что события А и В являются независимыми. Приведенные выше соотношения предполагают определенную связь между теорией вероятностей и теорией множеств. Если А и В являются непересекающимися множествами, то объединение множеств соответствует сумме вероятностей, а пересечение — произведению вероятностей, то есть р(А ? В) = р(А) + р(В), р(А ? В) = р(А) ? р(В). Без предположения независимости эта связь является неточной и формулы должны содержать дополнительные члены включения и исключения (так например, р(А?В)=р(А)+ р(В) – р(А?В) ). Продолжая теоретико-множественное обозначение B можно записать как В = (В ? А) ? (В ? ¬A). Так как это объединение явно непересекающееся, то р(В)=р((В?А)?(В?¬A))=р(В?А)+ р(В?¬A) = р(В|А) р(А) + р(В|¬A)р(В) Возвращаясь к обозначению событий, а не множеств, последнее равенство может быть подставлено в правило Байеса
Это равенство является основой для использования теории вероятности в управлении неопределенностью. Оно обеспечивает путь для получения условной вероятности события B при условии А. Это соотношение позволяет управлять неопределенностью и «делать вывод «вперед и назад». Неопределенность можно промоделировать, приписывая утверждениям некоторые характеристики, отличные от «истина» или «ложь». Степень уверенности может выражаться в форме действительного числа, заключенного в некотором интервале, например между –1 и +1. Такую числовую характеристику называют по-разному: коэффициент определенности, коэффициент уверенности, степень доверия. Границы интервала обозначают следующее: +1 — система в чем-то полностью уверена; 0 — у системы нет знаний об обсуждаемой величине; –1 — высказанная посылка или заключение полностью неверно. Промежуточные величины отражают степень доверия или недоверия к указанным ситуациям. Коэффициент неопределенности в выводимом заключении представляет собой число, которое должно объединить и отразить источники внутренних ошибок. Приведем схему приближенных рассуждений, реализованную в MYCYN, и в дальнейшем в EMYCIN. Основной вычислительный прием, который используется для нахождения коэффициента определенности сводится к следующему: t(заключение) = ct(посылка)*ct(импликация). Для импликации вида ЕСЛИ (е1 и е2) ТО (с) согласно оценке, сделанной в EMYCIN, коэффициент определенности посылки равен коэффициенту определенности наименее надежной из посылок, то есть ct(e1 и e2)= min(ct(e1), ct(e2)). Для ЕСЛИ (е1 или е2) ТО (с) общее правило комбинирования, по которому вычисляется коэффициент определенности посылки, заключается в том, что коэффициент определенности дизъюнкции равен коэффициенту ее сильнейшей части, то есть ct(e1 или e2)= max(ct(e1), ct(e2)). В случае, когда используются два правила для поддержки, например: ЕСЛИ (е1) ТО (с) ct(заключения)=0.9 ЕСЛИ (e2) ТО (с) ct(заключения)=0.8 Был предложен следующий механизм: ctotal= коэффициент определенности из правила 1 + коэффициент определенности из правила 2 – (коэффициент определенности из правила 1) *(коэффициент определенности из правила 2) При вычислении итоговых коэффициентов необходимо учитывать знаки. В EMYCIN был предложен следующий механизм. 1) если оба коэффициента определенности положительны: ctotal= ct1 + ct2 – ct1*ct2; 2) если оба коэффициента определенности отрицательны: ctotal= ct1 + ct2 + ct1*ct2; 3) когда отрицателен один коэффициент: ctotal= (ct1 + ct2)/ (1 – min(abs(ct1),abs(ct2)); 4) когда одна определенность равна +1, а другая –1: ctotal= 0. Помимо использования коэффициентов уверенности, в литературе описаны и иные подходы, альтернативные вероятностному. В частности, много внимания уделяется нечеткой логике (fuzzy logic) и теории функций доверия (belieffunctions), что положило начало одной из ветвей искусственного интеллекта — мягкие вычисления (soft computing).
Читайте также:
|
.
.
p(A).
.
.