КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Прямая процедура
Воспользуемся результатами попятной процедуры для решения исходной задачи, то есть для построения оптимального управления и оптимальной траектории при заданном начальном условии (3). Полагая t = 0 и х = х°в (8), найдем управление в начальный момент: u(0) = v0(х°). Далее из соотношения (2) определим состояние х(1) = f(х°, u(0)). Продолжая этот процесс, найдем u(1) = vt(х(1)), х(2)) и т.д. Вообще имеем u(t)=vt(x(t)), x(t+1)=f(x(t),u(t)), x(0)=x0, t=0,1,…., N-1 (9) Соотношения (9) определяют прямую процедуру и позволяют полностью рассчитать оптимальное управление и оптимальную траекторию. Минимальное значение критерия оптимальности, отвечающее этой траектории, J= S(x°, 0). Пример В качестве примера рассмотрим модельную задачу об оптимальном функционировании фермы по разведению скота или птицы. Пусть х - число животных (или птиц) на ферме в начале некоторого интервала времени. Из этого числа их животных отправляется на продажу, а остальные животные приносят приплод, так что их число возрастает в q раз за рассматриваемый интервал. Уравнение (2) примет вид x(t+1)=q[1-u(t)]x(t), t=0,1,... Здесь q > 1 — постоянный коэффициент, и — управляющее воздействие (доля животных, отправляемых на продажу). Ограничение (1) в данном случае имеет вид 0 <=u<=1. Расходы на содержание животных примем пропорциональными их оставшемуся числу и равными а[1 - u(1)]х(t) где а > 0 — постоянная; Выручку от продажи считаем равной сu(t)x(t), где с - цена одного животного на рынке. Поставим задачу максимизации дохода фермы за N шагов по времени. Как отмечалось выше, эта задача эквивалентна минимизации убытка (то есть дохода со знаком минус). Критерий оптимальности имеет вид (4), где нужно принять в соответствии со сказанным выше R(x,u)=a(1-u)x-cux, F(х)=-сх. (11) Последнее равенство (11) определяет (со знаком минус) стоимость животных на ферме в конце процесса. Учитывая соотношения (10) и (11), составим уравнение (6) для рассматриваемой задачи S(x,t)=тin[а(1-и)х-сих+S(q(1-u)x,t+1)] (12) 0<=u<=1
Условие (7) с учетом (11) примет вид S(x,N)= -сх (13) Несложный анализ позволяет реализовать попятную процедуру и построить функции S(x,t) и соответствующие им управления из (9) для задачи (12), (13). Приведем окончательные результаты: S(x,t)=a(qN-1-1)(q-1)-1x-cqN-1 x vt(x)= 0 при a<c(q-1); S (x,t)=-cx vt(x)=1 при a>c(q-1) (14) В том, что функции из (14) удовлетворяют уравнению (12) и условию (13) при всех t, можно убедиться методом математической индукции, проводя ее в сторону убывания t и начиная t=N. Решения (14) допускают простую интерпретацию. Если а < с(q -1), то есть расходы на содержание животных сравнительно невелики, то имеет смысл не направлять животных на продажу (u) = 0) и получить наибольший доход, сохранив все поголовье к концу процесса. Если же а > с(q -1), то есть расходы на содержание велики, то целесообразно отправить на продажу сразу всех животных. В случае а = с(q — 1) оптимальное управление неединственно: в этом случае любое управление приводит к одному и тому же результату. Более сложные и более содержательные результаты получим, если учтем зависимость рыночной цены с от числа продаваемых животных х (цена убывает с ростом х), а также зависимость расходов на содержание одного животного а от числа животных на ферме. НЕПРЕРЫВНОЙ СЛУЧАЙ. Рассмотрим далее случай детерминированной динамической системы с непрерывным управлением без ограничения на состояния Управление u(t) выбираем из класса допустимых, так что u где α - носит название "коэффициента актуализации", с математической точки введение этого коэффициента позволяет рассматривать случай когда T=+¥. "Экономическая" интерпретация этого коэффициента становится ясной, если учесть разный вклад величин f(t,u(t),y(t)) из-за величин t: сначала где функционал Реализуем непрерывный аналог вывода реккурентного состношения принципа динамического программирования Беллмана. Пусть на отрезке Пусть нам известно оптимальное управление u(s) с момента t+d Тогда Теперь на основании принципа оптимальности Беллмана можно записать Разложим функцию Ф(y(t+d),t+d) по степени малого параметра d: Это нелинейное уравнение с частными производными называется уравнением динамического программирования или уравнением Гамильтона-Якоби-Беллмана. Здесь мы воспользовались определением производной
для замены уравнений движения динамической системы. Привлекая условие Ф(T,x(T))=j(x(T)) получаем несколько необычную задачу для определения функции Ф(x,t): В математической теории оптимального управления устанавливается корректность этой задачи для функции Ф(x,t). Построение алгоритма управления требует некоторого уточнения. Значение оптимального управления в каждый момент времени t есть правило (алгоритм) от имеющейся в этот момент информации. Если динамическая система наблюдаема, то к моменту времени t мы располагаем информацией о состоянии динамической системы и управлением во все предшествующие моменты времени. Будем называть управление обратной связью, если оптимальное значение управления в момент времени t зависит лишь от состояния ДС в этот момент, т.е. от y(t). Одним из основных результатов математической теории управления состоит в том, что при полной наблюдаемости ДС существует управление, которое является обратной связью. В нашем случае (непрерывное управление динамическими системами) синтезируется следующим образом. Пусть нижняя точная грань в скобках, где u,x считаются параметрами, реализуется на функции V(x,s) тогда оптимальное управление v(t) можно задать равенством: v(t)=V(y(t),t) Т.е. управление зависит от текущего состояния динамической системы и поэтому является обратной связью! Если рассматривать непрерывное управление динамическими системами со случайными факторами, то уравнение Беллмана приводится к виду Случай импульсного управления. Рассмотрим случай детерминированной ДС с импульсным управлением, для простоты без ограничений. Здесь встает вопрос: когда нам выгодно осуществлять управляющий импульс и какова должна быть его интенсивность. Функционал качества (критерий) целевая функция записывается в виде Рассмотрим сначала интервал (t,t+δ), свободный от управляющих импульсов. Тогда определяя функцию Имеем свободные движения на интервале t,t+ δ. При этом Тогда (если t несвободна от импульсов, то <0!) Пусть теперь в момент времени t система испытывает мгновенный управляющий импульс. Значит система из положения x перешла в положение x+x. До импульса была стоимость Ф(x,t) после стала Ф(x+xit)+C(x). По определению Ф можем написать: А поскольку должно в любой момент времени tÎ[t,t+δ] реализовываться либо одно, либо другое, то одно из неравенств должно перейти в равенство, что можно записать в виде: И к нему необходимо добавить конечное условие Таким образом импульсное управление ДС приводит к задаче не для дифференциального уравнения, а к задаче для неравенства, называемого вариационным! Тематика импульсного управления интенсивно развивается. В частности есть обнадеживающие результаты в области управления производством электроэнергии, управления запасами, финансами, производством сырьевыми ресурсами, в задачах управления качеством с учетом износа, статистического управления в финансах, банковским портфелем (управление акциями), задачах распределения дивидендов в проблеме разорения. Пример. Применение импульсного управления к задаче терапевтического лечения. Пусть X(t)- “уровень” болезни в момент времени t. В отсутствие лечения состояние больного эволюционирует согласно уравнению: Рассмотрим последовательность моментов Однако лечение может оказать вредное воздействие на организм. Пусть y(t)-степень разрушения организма вследствие лечения. Тогда считаем, что состояние y(t) эволюционирует согласно уравнениям: Где введены ограничения Предположим, что цель лечения состоит в удержании состояния x(t) в пределах 0£x(t)£x0. Однако речь идет о том, чтобы чрезмерно не разрушать организм лечением, то есть 0£y(t)£y0. Пусть t - первый момент, в который x(t), или y(t) выходит из точки x0 или y0. Мы хотим максимизировать t. Учитывая стоимость одного акта лечения (равную k) ставим другую задачу минимизировать функционал
Где Пусть Отсюда можно вывести оптимальную стратегию лечения! Решение конкретной задачи управления процессом лечения приводят к диаграммам, приведенным ниже:
Предоставляем читателю в качестве небольшого упражнения разобраться что избражено на них (какие показатели состояния и в какие моменты проводится лечение).
Дата добавления: 2015-01-03; Просмотров: 429; Нарушение авторских прав?; Мы поможем в написании вашей работы! |