КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Итерационный алгоритм поиска решения МЦП
Автор: Вилисов Валерий Яковлевич, профессор кафедры Математики Технологического университета (г. Королев, Моск. обл.) Есть два варианта алгоритма: · полный перебор стратегий · сокращенный перебор (алгоритм Р. Ховарда) с постепенным улучшением элементов вектора стратегий Решение будем искать в классе стационарных стратегий, т.е. таких векторов
Рассмотрим, как можно построить целевую функцию. Конкурирующие стратегии сравниваются между собой по величине среднего платежа за один шаг при большом количестве шагов ( Определим средний платеж Для Технология составления Аналогично конструируется и матрица Средний платеж за один шаг при условии, что процесс находился в i -ом состоянии определится обычным усреднением:
Для вычисления безусловного среднего платежа необходимо определить вектор вероятностей состояний
Здесь Тогда задача выбора оптимальной стратегии примет вид:
Здесь неизвестным остается вектор
где должно выполняться условие нормировки:
Решение системы уравнений (8) и (9) позволяет получить значения координат вектора Пример. Рассмотрим, как можно построить матрицы Для
? Метод полного перебора стратегий состоит из следующих этапов: 1. Сформировать множество стратегий 2. Для очередной стратегии s сформировать матрицы 3. Вычислить вектор вероятностей состояний в установившемся режиме 4. Вычислить средний платеж за один шаг 5. Выбрать оптимальную стратегию по формуле (7), сравнив значения
Метод итерационного перебора стратегий (метод Р. Ховарда). Этот метод основан на пошаговом улучшении стратегии Итерационный процесс прекращается, как только ни по одному элементу вектора стратегий Критерий выбора оптимальной стратегии Для любой стратегии В основе итерационного метода лежит уравнение Беллмана:
где, ось времени «развернута в обратную сторону», т.е. t означает число шагов, оставшихся до общей продолжительности процесса N. В (10) от стратегии Схематически, метод состоит из двух чередующихся этапов: · на 1-ом этапе - вычисляются ВК · на 2-ом этапе - улучшается стратегия Затем вновь повторяется 1-й этап и т.д. до тех пор, пока улучшенные стратегии на двух соседних шагах не будут отличаться. Итерации можно начинать с любого из этапов. На 1-ом этапе используются свойства уравнения (10) в установившемся режиме (при
где Следует решить систему уравнений (11) относительно 1-й этап называется этапом определения весовых коэффициентов (ВК). На 2-ом этапе следует воспользоваться уравнением (10) для улучшения стратегии Таким образом, на данном (2-ом) этапе путем варьирования элементов 2-й этап называется этапом улучшения стратегии. Этапы 1 и 2 повторяются до тех пор, пока процесс улучшения стратегий не прекратится, т.е. пока стратегии на двух соседних этапах не станут одинаковыми. Приведенные алгоритмы поиска оптимальных стратегий МЦП успешно работают при условии, что характеристики процесса (
Дата добавления: 2014-01-04; Просмотров: 1346; Нарушение авторских прав?; Мы поможем в написании вашей работы! |