Представление знаний нейронными сетями - Активационная функция нейронаАктивационная функция нейрона определяет нелинейное преобразование, осуществляемое нейроном. Существует множество видов активационных функций, но более всего распространены следующие четыре: 1. Пороговая функция. На рис. 7.2, а приведен ее график.
Первая из введенных активационных функций, она была описана в работе Мак-Каллока и Питтса. В честь этого модель нейрона с пороговой активационной функцией называется моделью Мак-Каллока-Питтса. 2. Кусочно-линейная функция. Она изображена на рис. 7.2, б и описывается следующей зависимостью:
В данном случае a=1, и коэффициент наклона линейного участка выбран единичным, а вся функция может интерпретироваться как аппроксимация нелинейного усилителя. При бесконечно большом коэффициенте наклона линейного участка функция вырождается в пороговую. В большинстве типов искусственных нейронных сетей используются нейроны с линейной активационной функцией
Рис. 7.2. Типы активационных функций 3. Сигмоидальная функция. Это наиболее широко используемый тип активационной функции. Она была введена по аналогии с пороговой функцией, но везде является строго монотонно возрастающей, непрерывной и дифференцируемой (рис. 7.2, в). Дифференцируемость является важным свойством для анализа нейронной сети и некоторых методов их обучения. В общем виде сигмоидальная активационная функция описывается зависимостью:
где a — параметр, определяющий наклон функции. Варьированием его могут быть получены разные виды сигмоида. Наиболее часто используется a = 1. В случае бесконечно большого a сигмоидальная функция вырождается в пороговую. Помимо перечисленных функций, изменяющихся в диапазоне [0, 1], вводятся также их аналоги с областью значений [–1, 1]. Так, например (рис. 7.2, г), пороговая функция может быть переопределена как
То есть
Вместо сигмоидальной активационной функции широко применяется гиперболический тангенс, обладающий аналогичными свойствами (рис. 11, д)
Нечетность этой функции делает ее удобной для решения задач управления. 4. Во введенных Брумхеадом и Лоуе нейронных сетях в качестве активационной применяется функция Гаусса (рис. 7.2, е)
Ее аргумент рассчитывается по формуле:
z — вектор входных сигналов нейрона, c — вектор координат центра окна активационной функции, s — ширина окна, || || — евклидово расстояние. В теории нейронных сетей активационные функции типа
называются радиально-базисными функциями (РБФ), а основанные на них сети — РБФ-сетями (RBF — radial basis function).
Читайте также:
|
. (7.5)
. (7.6)
, представляющей собой частный случай (7.6) с неограниченным линейным участком.
, (7.7)
. (7.8)
. (7.9)
. (7.10)
. (7.11)
, (7.12)
(7.13)