Для решения задач оптимизации многостадийных процессов, и для процессов, каковые смогут быть математически обрисованы как многостадийные (Рис.4.1), используется способ динамического программирования.
Рис. 4.1. Многостадийный процесс
Динамическое программирование используется для оптимизации математически обрисованных процессов. Исходя из этого в будущем для многостадийного процесса предполагается известным математическое описание его каждой стадии, которое представляется в общем виде совокупностью уравнений:
xk(i)
j k(i)(x1(i-1), …, xm(i-1), u1(i), …, ur(i)),
k
1, …, m; i
1, …, N,
связывающей выходные параметры i-й стадии xk(i) с выходными параметрами прошлой стадии xk(i-1) и управлением иl(i) (l
1, …, r), применяемым на i-й стадии.
Совокупность уравнений комфортно кроме этого представить в векторной форме
x(i)
j (i)(x(направляться-1), u(i)),
причем x(i) вектор совокупности переменных состояния (либо выход) i-й стадии;
x(i)
(x1(i), x2(i), …, xm(i)),
a u(i) — вектор совокупности управляющих действий (управление) на i-й стадии:
u(i)
(u1(i), u2(i), …, ur(i)).
Размерности векторов состояния x(i) и управления и u(i) в общем случае смогут быть разными для различных стадий процесса. Но потом, не нарушая общности, возможно принять, что размерности m и r управления и векторов состояния для всех стадий процесса однообразны.
В настоящих процессах на значения переменных состояния x(i) и управляющих действий u(i) смогут быть наложены ограничения, определяющие диапазон трансформации либо связь указанных переменных. Математически это находит выражение в появлении дополнительных условий в виде равенств либо неравенств
Fj(x(1), …, x(N), u(1), …, u(N)),
каковые должны учитываться при ответе задачи оптимизации.
В будущем при необходимости выразить, что значения переменных состояния либо управляющих действий удовлетворяют ограничениям, будем употребляться запись:
,
Суть записи содержится в том, что значения переменных x(i) и u(i) принадлежат к допустимым областям их трансформации Х и U, ограниченным соответствующими соотношениями.
Предполагается, что эффективность каждой стадии процесса оценивается некоей скалярной величиной
ri
ri*(x(i), u(i)).
заданной в виде функции от переменных состояния стадии x(i) и принятого на ней управления u(i).
С учетом математического описания стадии функциональная зависимость эффективности возможно представлена кроме этого как
ri
ri(x(i-1), u(i)).
т. е. как функция состояния входа x(i-1) на i-й стадии и применяемого на ней управления u(i)
Результирующая оценка эффективности многостадийного процесса в целом определяется как аддитивная функция результатов, приобретаемых на каждой стадии:
Конечно, что значение критерия оптимальности RN зависит от совокупности u(i)N управляющих действий на всех стадиях процесса, каковые является набором значений векторов u(i) для всех стадий:
uN
(u(1), u(2), …, u(N)).
Совокупность управлений для всех стадий процесса uN будем именовать в будущем стратегией управления многостадийным. процессом либо легко стратегией управления.
Так, задачу оптимизации многостадийного процесса возможно сформулировать как задачу отыскания оптимальной стратегии
(uопт(1), uопт(2), …, uопт(N)),
для которой критерий оптимальности rn принимает в зависимости от постановки оптимальной задачи большое либо минимальное значение.
Принцип оптимальности
В базу способа динамического программирования положен принцип оптимальности, что в переложении для большое количество-, стадийного процесса возможно сформулирован следующим образом. Оптимальная стратегия владеет тем свойством, что каковы бы ни были начальное состояние x(0) многостадийного процесса и управление на первом этапе u(1), последующие управления на всех стадиях u(i) (i
2, …, N) должны составлять оптимальную стратегию иN-1 относительно состояния x(1) первой стадии, определяемого начальным состоянием процесса x(0) и управлением на первом этапе u(1).
В приведенной формулировке принципа оптимальности под оптимальной стратегией иN-1 понимается стратегия управления многостадийным процессом, включающим N-1 последних стадий исходного процесса, придающая критерию
оптимальное значение.
Иначе говоря оптимальная стратегия иN-1 находится для (N-1)-стадийного процесса, для которого величина есть начальным состоянием.
Так, в случае если известна оптимальная стратегия управления иN-1 для любого вероятного состояния x(1) первой стадии N-стадийного процесса, то уже очень просто выбрать оптимальное управление и на первом этапе uопт(1), потому, что на последующих стадиях оно определяется лишь состоянием выхода первой стадии:
иN-1
иN-1 (x(1)).
Процедура применения принципа оптимальности для оптимизации N-стадийного процесса, разумеется, обязана начинаться с последней стадии процесса, для которой не существует последующих стадий, могущих воздействовать в соответствии с принципу оптимальности на выбор управления uопт(N) на данной стадии. По окончании того как оптимальное управление uопт(N) отыскано для всех вероятных состояний входа последней стадии x(N-1)
X, возможно приступить к определению оптимального управления для прошлой (N-1)-стадии, для которой оптимальная стратегия управления на последующих стадиях (т. е. на последней N-й стадии) известна, и т. д.
В следствии возможно отыскана оптимальная стратегия управления для всего многостадийного процесса, являющаяся функцией начального состояния процесса uN(x(0)). В случае если начальное состояние x(0) известно (задано либо выбрано из условия оптимума критерия R), то его значение определяет оптимальные управления для всех стадий процесса.
Динамическое программирование: траектории кузнечика