КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Алгоритм обратного распространения ошибки. Алгоритм обратного распространения ошибки является классическим алгоритмом обучения многослойного персептрона
Алгоритм обратного распространения ошибки является классическим алгоритмом обучения многослойного персептрона. Этот алгоритм состоит из двух проходов вычислений: - Прямой проход, при котором вычисляется отклик сети на поданный входной сигнал - Обратный проход, при котором, в соответствии с полученным сигналом ошибки, модифицируются веса всех нейронов от выходного слоя к входному. Введем следующие обозначения: - Будем считать, что индекс - Зададим обучающее множество - Обозначим ошибку на выходе нейрона - Введем обозначение При прямом проходе вычислений определяются отклики
Энергию ошибки можно записать в виде:
где суммирование осуществляется по всем нейронам выходного слоя, то есть по тем нейронам, для которых можно явно вычислить сигнал ошибки. Модификация весов при обратном проходе вычислений должна быть направлена на уменьшение величины
Очевидно, что выполняются следующие равенства:
и, наконец,
Таким образом, производную
Воспользовавшись методом градиентного спуска, запишем величину модификации синаптического веса
где Величину модификации синаптического веса
где Таким образом, для вычисления модификации синаптического веса В случае, когда рассматриваемый нейрон находится в выходном слое, вычисление локального градиента не представляет труда, поскольку для нейронов выходного слоя можно явно определить сигнал ошибки Рассмотрим локальный градиент нейрона
Поскольку
Используя выражения:
а также
Можно получить следующие очевидные соотношения:
и, кроме того,
И переписать выражение для производной
А следовательно, мы получаем выражение для локального градиента скрытого нейрона:
Подводя итоги, правило модификации весов для алгоритма обратного распространения ошибки можно сформулировать в виде:
Где локальный градиент для нейронов выходного слоя описывается выражением:
А для нейрона в скрытом слое локальный градиент определяется как:
Модификация весов выполняется после вычисления отклика сети на каждый из обучающих примеров. Сначала вычисляются локальные градиенты для всех нейронов начиная с выходного слоя, а потом, в соответствии с полученными градиентами, вычисляются модификации всех весов сети. Процесс обучения прекращается, если ошибка
----------------------------- ---------------------------------------------
Величину На начальной стадии моделирования нейронных сетей применялись пороговые функции активации, например:
или
Дата добавления: 2014-01-06; Просмотров: 695; Нарушение авторских прав?; Мы поможем в написании вашей работы! |