Динамическое программирование — электронная энциклопедия

Для решения задач оптимизации многостадийных процессов, и для процессов, каковые смогут быть математически обрисованы как многостадийные (Рис.4.1), используется способ динамического программирования.

Динамическое программирование

Рис. 4.1. Многостадийный процесс

Динамическое программирование используется для оптимизации математически обрисованных процессов. Исходя из этого в будущем для многостадийного процесса предполагается известным математическое описание его каждой стадии, которое представляется в общем виде совокупностью уравнений:

xk(i)

Динамическое программирование

j k(i)(x1(i-1), …, xm(i-1), u1(i), …, ur(i)),

Динамическое программирование

1, …, m; i

Динамическое программирование

1, …, N,

связывающей выходные параметры i-й стадии xk(i) с выходными параметрами прошлой стадии xk(i-1) и управлением иl(i) (l

Динамическое программирование

1, …, r), применяемым на i-й стадии.

Совокупность уравнений комфортно кроме этого представить в векторной форме

x(i)

Динамическое программирование

j (i)(x(направляться-1), u(i)),

причем x(i) вектор совокупности переменных состояния (либо выход) i-й стадии;

x(i)

Динамическое программирование

(x1(i), x2(i), …, xm(i)),

a u(i) — вектор совокупности управляющих действий (управление) на i-й стадии:

u(i)

Динамическое программирование

(u1(i), u2(i), …, ur(i)).

Размерности векторов состояния x(i) и управления и u(i) в общем случае смогут быть разными для различных стадий процесса. Но потом, не нарушая общности, возможно принять, что размерности m и r управления и векторов состояния для всех стадий процесса однообразны.

В настоящих процессах на значения переменных состояния x(i) и управляющих действий u(i) смогут быть наложены ограничения, определяющие диапазон трансформации либо связь указанных переменных. Математически это находит выражение в появлении дополнительных условий в виде равенств либо неравенств

Fj(x(1), …, x(N), u(1), …, u(N)),

каковые должны учитываться при ответе задачи оптимизации.

В будущем при необходимости выразить, что значения переменных состояния либо управляющих действий удовлетворяют ограничениям, будем употребляться запись:

Динамическое программирование

Суть записи содержится в том, что значения переменных x(i) и u(i) принадлежат к допустимым областям их трансформации Х и U, ограниченным соответствующими соотношениями.

Предполагается, что эффективность каждой стадии процесса оценивается некоей скалярной величиной

Динамическое программирование

ri*(x(i), u(i)).

заданной в виде функции от переменных состояния стадии x(i) и принятого на ней управления u(i).

С учетом математического описания стадии функциональная зависимость эффективности возможно представлена кроме этого как

Динамическое программирование

ri(x(i-1), u(i)).

т. е. как функция состояния входа x(i-1) на i-й стадии и применяемого на ней управления u(i)

Результирующая оценка эффективности многостадийного процесса в целом определяется как аддитивная функция результатов, приобретаемых на каждой стадии:

Динамическое программирование

Конечно, что значение критерия оптимальности RN зависит от совокупности u(i)N управляющих действий на всех стадиях процесса, каковые является набором значений векторов u(i) для всех стадий:

Динамическое программирование

(u(1), u(2), …, u(N)).

Совокупность управлений для всех стадий процесса uN будем именовать в будущем стратегией управления многостадийным. процессом либо легко стратегией управления.

Так, задачу оптимизации многостадийного процесса возможно сформулировать как задачу отыскания оптимальной стратегии

Динамическое программирование

(uопт(1), uопт(2), …, uопт(N)),

для которой критерий оптимальности rn принимает в зависимости от постановки оптимальной задачи большое либо минимальное значение.

Принцип оптимальности

В базу способа динамического программирования положен принцип оптимальности, что в переложении для большое количество-, стадийного процесса возможно сформулирован следующим образом. Оптимальная стратегия владеет тем свойством, что каковы бы ни были начальное состояние x(0) многостадийного процесса и управление на первом этапе u(1), последующие управления на всех стадиях u(i) (i

Динамическое программирование

2, …, N) должны составлять оптимальную стратегию иN-1 относительно состояния x(1) первой стадии, определяемого начальным состоянием процесса x(0) и управлением на первом этапе u(1).

В приведенной формулировке принципа оптимальности под оптимальной стратегией иN-1 понимается стратегия управления многостадийным процессом, включающим N-1 последних стадий исходного процесса, придающая критерию

Динамическое программирование

оптимальное значение.

Иначе говоря оптимальная стратегия иN-1 находится для (N-1)-стадийного процесса, для которого величина есть начальным состоянием.

Так, в случае если известна оптимальная стратегия управления иN-1 для любого вероятного состояния x(1) первой стадии N-стадийного процесса, то уже очень просто выбрать оптимальное управление и на первом этапе uопт(1), потому, что на последующих стадиях оно определяется лишь состоянием выхода первой стадии:

иN-1

Динамическое программирование

иN-1 (x(1)).

Процедура применения принципа оптимальности для оптимизации N-стадийного процесса, разумеется, обязана начинаться с последней стадии процесса, для которой не существует последующих стадий, могущих воздействовать в соответствии с принципу оптимальности на выбор управления uопт(N) на данной стадии. По окончании того как оптимальное управление uопт(N) отыскано для всех вероятных состояний входа последней стадии x(N-1)

Динамическое программирование

X, возможно приступить к определению оптимального управления для прошлой (N-1)-стадии, для которой оптимальная стратегия управления на последующих стадиях (т. е. на последней N-й стадии) известна, и т. д.

В следствии возможно отыскана оптимальная стратегия управления для всего многостадийного процесса, являющаяся функцией начального состояния процесса uN(x(0)). В случае если начальное состояние x(0) известно (задано либо выбрано из условия оптимума критерия R), то его значение определяет оптимальные управления для всех стадий процесса.