КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Метод динамического программирования
В течение 50-х годов XX века американский математик Р. Беллман и ряд его сотрудников развили новый общий метод решения вариационных задач, названный или динамическим программированием. Этот метод пригоден для оптимизации любых сложных систем, описываемых не только дифференциальными уравнениями с ограничениями на переменной, или без них, но и другим математическим аппаратом, включая различные статические системы, СМО и экономические системы. МДП по своей идее значительно отличается от классического вариационного исчисления и принципа максимума Понтрягина. Методика решения последними двумя способами заключается в том, что оптимальная траектория считается уже каким то образом найденной известной. Затем вся эта оптимальная траектория варьируется целиком, в целом их множества проварьируемых траекторий находится оптимальная. В МДП принят иной путь нахождения оптимальной траекторий, который заключается в том, что оптимальная траектория и соответствующая ей уравнение ищутся на отдельных участках или ступенях. Иными словами, проще разбиваются на несколько ступеней, на каждой стоится множество траекторий и соответствующих им управлений. Теперь казалось бы достаточно перебрать все траектории, и выбрать оптимальную, но это нерациональный титанический труд. Создатели МДП пошли другим путем – на каждой стадии они выбирают оптимальную и отбрасывают неоптимальные, бесперспективные участки траекторий (на отдельной стадии для участка это сделать много легче, чем для траектории в целом). При этом оказывается, что отбрасывается не только не оптимальный кусочек траектории на этой стадии, но и вся траектория в целом, которые в своем составе имеют неперспективный кусочек на рассматриваемой стадии. Выбор оптимальной траектории при этом ставится намного легче и короче. Для подтверждения сказанного рассмотрим статическую задачу по выбору оптимальной траектории. Пример. Пусть между пунктами Сдвинемся еще на шаг назад на стадию Продолжая понятное движение и отсекая неперспективные траектории, доходим до точки Теперь двигаемся из точки Понятно, что отвергая неперспективные маленькие участки между стадиями, мы тем самым, не проделывая непосредственно этого, отвергаем все неоптимальные траектории, включающие в себя этот отвергнутый участок т.е. эффективность выбора оптимальной траектории очень высока. Обратимся теперь к шестой типовой задаче управления, т.е. к динамической задаче в которой объект управления характеризуется уравнением Причем
Пусть
В основе МДП лежит принцип оптимальности. Этот принцип сформулирован Р. Беллманом для широкого круга систем, будущее поведение которых полностью определяется их состоянием в настоящем. Поэтому оно не зависит от характера их «предыстории», т.е. поведение системы в прошлом, коль скоро система находится в данный момент в данном состоянии. Для иллюстрации рассмотрим оптимальную траекторию в Пусть начальное условие
Отметим какую-либо промежуточную точку Второму участку соответствует часть интеграла (1), равная
Второй участок траектории может рассматриваться и как самостоятельная траектория. Она будет оптимальной, если соответствующий ей интеграл минимален. Принцип оптимальности можно сформулировать так:
Это означает, что в том случае, когда начальное состояние системы есть Сформулированный выше принцип оптимальности является весьма общим необходимым условием оптимального процесса, справедливым как для непрерывных, так и для дискретных систем. Принцип оптимальности выглядит почти тривиальным и, на первый взгляд бедным по содержанию утверждением. Однако из него можно, как показывал Беллман, методически рассуждая вывести необходимое условие для оптимальной траектории, имеющее отнюдь не тривиальный характер. В сущности, принцип оптимальности не так уж тривиален, как может в начале показаться. Это видно хотя бы из того, что утверждение, кажущееся его обобщением: «Любой участок оптимальной траектории является оптимальной траекторией» - вообще говоря, не справедливо. Так, например, первый участок траектории Поясним это утверждение элементарной иллюстрацией. Как распределяет свой силы хороший бегун при беге на длинную дистанцию? Действует ли он по принципу: Беги на каждом отрезке на столько быстро, на сколько сможешь? Конечно нет, ведь, бегун может «выдохнуться» за долго до подхода к цели. Разумно распределяя свои ресурсы в соответствии с конечной целью, бегун в начале экономит свои силы, чтобы не «выдохнуться» в конце дистанции. Аналогичным образом любое управлением не должно быть «близоруким», не должно руководствоваться лишь достижением наилучшего моментального, локального эффекта. Оно должно быть «дальновидным», оно должно быть подчинено конечной цели, т.е. минимизации функционала (1) на всем интервале от Можно дать и другую формулировку принципа оптимальности:
Поясним метод рассуждения Беллмана на простом принципе управляемого объекта с управлением
Где
Пусть задано начальное условие
где для удобства за Прежде всего дискретизируем задачу, т.е. приближено значением непрерывную систему дискретно-непрерывной. Основания для этого следующее: во первых, дискретизация является неизбежным этапом подготовки задачи для ее решения на ЭВМ. Во вторых, методику рассуждений проще пояснить на примере дискретно – непрерывной системы. Вообще говоря, основная сфера применения метода динамического программирования лежит в области дискретно-непрерывных либо чисто дискретных систем, либо систем, приближению к ним приводимых. Разобьем интервал
или
Начальное условие остается прежним
Интервал (28) приближенно заменяется суммой
где
Задача теперь состоит в определении последовательности дискретных значений управляющего воздействия Для решения задачи применяется прием, заключающийся в «понятном» движении о конца процесса, т.е. от момента Рассмотрим последний участок траектории от Обозначим сумму этих членов через
Следовательно, Обратим внимание на то, что для определения Переедем теперь к предполагаемому участку времени. Рассматривая два участка – последний и предпоследний – вместе, можно заметить, что выбор
Величину Найдем величину
поскольку из (34)следует
Отметим, что минимизация здесь производится также всего лишь по одному переменному Важно отметить, что найденное оптимальное значение Можно продолжить описанную выше процедуру «понятного» движения от конца к началу промежутка
Параллельно в процессе минимизации правой части этой формулы определяется оптимальное значение
Вычисляя по формуле (37) последовательно В некоторых простейших случаях удается провести всю описанную процедуру аналитически. Однако в общем случае аналитическое выражение результатов минимизации оказывается невозможным; поэтому данную процедуру можно рассматривать лишь как программу вычислений, производимых в простейших случаях вручную, а в более сложных на ЭВМ. Весь процесс решения без затруднений переносится на объект любого порядка « Выше изложенное может разочаровать тех читателей, которые представляли себе МДП неким волшебным рецептом для получения решений любых задач, причем эти решения мыслятся в виде готовых общих формул. Однако получит решение в таком виде большей частью невозможно, а иногда просто и ненужно. Обычно требуется решение в виде графиков и таблиц. Путь к получению этого решения, указанный выше, представляет собой процедуру вычислений для получения требуемой результата. Чем проще процедура вычислений, тем лучше метод. МДП отличается именно радикальным упрощением процедуры вычислений, ибо позволяет заменить минимизацию сложной функции по многим переменным последовательностью минимизаций по одной переменно гораздо менее сложных функций.
Дата добавления: 2014-01-11; Просмотров: 857; Нарушение авторских прав?; Мы поможем в написании вашей работы! |