КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Пример: уравнение Беллмана в задаче о рекламной деятельности
Непрерывный вариант динамического программирования
Метод динамического программирования разработан и для непрерывной задачи оптимального управления, в которой поведение ОУ описывается дифференциальным уравнением в векторной форме
или в скалярной форме
Показатель качества имеет вид:
Начальный момент процедуры управления Доказательство условия оптимальности опирается на принцип оптимальности Беллмана, сформулированный в разделе 2.1, и использует вытекающую из этого принципа процедуру попятного движения. Выделим произвольным образом внутри интервала Рассмотрим сначала решение задачи для интервала
Предположим, что задача решена, и получено оптимальное управление
Оптимальное управление зависит от текущего времени Подставим найденное оптимальное управление в показатель качества (9), который примет минимальное значение
Функция Рассмотрим теперь решение задачи для интервала
Предположим, что эта задача решена, и получено оптимальное управление
Подставим это управление в показатель качества (10), который примет минимальное значение
Найдем связь между функциями Беллмана для моментов времени
От управляющего воздействия
Второе слагаемое остается в составе фигурных скобок, так как от управления
В итоге
Вектор состояния
Производную вектора состояния
Теперь второе слагаемое представим в виде
Функцию Беллмана Используя разложение в ряд Тейлора, получим следующую связь между значениями функции Беллмана в моменты времени
Приращения
Подставим этот результат в выражение (11):
Упростим это соотношение. Прежде всего, заметим, что величина
Уравнение Беллмана является инструментом решения непрерывных задач оптимального управления. Оно решается за 3 шага. На первом шаге из условия минимума выражения в фигурных скобках находится оптимальное управление На втором шаге оптимальное управление На третьем шаге функция Беллмана Наиболее трудоемким в этой процедуре является второй шаг, связанный с решением дифференциального уравнения в частных производных. В задаче оптимального управления с нефиксированным временем управления
Упрощение достигается за счет того, что функция Беллмана зависит только от вектора состояния
Применим уравнение Беллмана к задаче о рекламной деятельности фирмы, которая с целью увеличения объема продаж осуществляет рекламу своего товара. Исходное уравнение, связывающее объем продаж
Затраты на рекламу подвержены ограничению:
В разделе 1.2 исходное уравнение было преобразовано в дифференциальное уравнение второго порядка:
а затем с помощью переменные состояния
Вывод уравнения Беллмана проводился из условия минимума показателя качества; в нашем примере показатель качества требуется максимизировать. Приведем исходную задачу (14) к нужному виду с учетом новых переменных:
Так как конечный момент времени
В условиях данной задачи
и уравнение Беллмана принимает вид:
1 шаг. Из условия минимума выражения в фигурных скобках найдем структуру оптимального управления. Управляющее воздействие входит сюда линейным образом, поэтому классический способ оптимизации из условия
к успеху не приведет. Преобразуем выражение в фигурных скобках, обобщив слагаемые, содержащие управляющее воздействие
Процедуру минимизации проведем с учетом ограничения: 1) если 2) если Таким образом, оптимальное управление может принимать только граничные значения в зависимости от знака функции переключения
Дата добавления: 2014-11-29; Просмотров: 2525; Нарушение авторских прав?; Мы поможем в написании вашей работы! |