Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [ 95 ] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

принимает меньшее значение, чем при управлении и* [f, tf], т. е.

J2{u[tJf])<J{u*lt,t}]).

Тогда критерий оптимальности в задаче (10.63) при управлении

uO(0. t ttf

принимает меньшее значение, чем при управлении и* [tg, ffl т. е.

J (u" [to, tf])Ji(u*[toJ])+J.Auo [f, t) < J {u*[to, tf]) = = Л(и*[/о,/])+Л(и*[/,/;0,

a это противоречит, оптимальности управления u* (о. Л-Принцип оптимальности для задачи оптимального управления является частным случаем следующего более общего утверждения: если допустимая для задачи (10.63) пара (и* {t), x*(t)) оптимальна, то, каков бы ни был подынтервал [ti, tJ сг [to. tfh управление и* (t) на этом подынтервале является оптимальным относительно граничньих точек к* (ti) и х* (t). Это утверждение доказывается точно так же, как и принцип оптимальности. В частном случае, когда = о. приведенное утверждение называют обратным принципом оптимальности [7J. Приведем несколько иную формулировку этого принципа.

Обратный принцип оптимальности. Для оптимальности допустимой для задачи (10.63) пары (и* (t), X* (t)) необходимо, чтобы при любом f [to, tj\ управление U* [fo, t] было оптимальным относительно конечного для интервала [to, t] состояния х (/) = х* {t).

Функция и уравнение Беллмана

Произведем инвариантное погружение задачи (10.63) в семейство задач, которое получается из задачи (10.63) при замене начального условия х (to) = х" параметрическим условием x(f)= х, / £ [to, t)]; в новом условии f и х рассматриваются как параметры. В частном случае, когда if = to и х = х", из введенного семейства вьщеляется исходная задача.



Минимальное значение критерия оптимальности при параметрическом начальном условии зависит от выбранных значений /их (С):

5[x(i).n== min go{{t,),tf)+ \h{x,u,t)dt

t <t < tf

причем S{x{tf),if):=go{x{tf),tf).

Функция S (x (/), t) называется функцией Беллмана. Получим уравнение Беллмана. Очевидно,

Six{t-At)J min go (х ( ), )+

< t к tf

f / 1

+ J fodt + jfgdt .

Для краткости записи аргументы функции /о(х, t) опущены. В силу принципа оптимальности

Slx{t -M),t -At]= min

u(t)£Vt, f -ht <t<t

f <t<tf

S(x(/-A/),/-A/]= min

J/„d/-f S[x(/),f] .

Фазовый вектор x (f - Д/) и соответственно функция Беллмана в левой части последнего соотношения не зависят от управления на интервале W - At, tl, поэтому в этом отношении



функцию Беллмана левой части можно перенести в правую часть и внести под знак минимума:

min j f fodtSlx{n,t]-S[x{t -t-M<t<t

-AO, t-At] .

В полученном уравнении интеграл представим в виде f

j fodt=fo{{f),u{t),t)At + OiAt).

f -м

Затем, разделив обе части на Д/, устремим к нулю. Тогда, приняв f = t, в пределе получим уравнение

0= min {fo{x,u,f)-dS(\{t),t)ldt}, (10.64)

u(OCU(

О = min j/o (X. u, О + 2 fi C. 0 +

1= 1

которое называется уравнением Беллмана или обратным уравнением Беллмана. Так как функция S (х (/), О не зависит от управления и {t), последнее слагаемое в правой части можно вынести за скобки и уравнение Беллмана записать в виде

min \k{x,J)Л-Z-ft{?,u,{)\-.дSдt, или в векторной форме

-dS/dt.

(10.65)

Напомним, что, по определению, производная от скалярной функции по векторному аргументу есть вектор-строка:

dS/dx=={dS/dxi,...,dS/dXn).

Сформулируем основной результат: если функция Беллмана дифференцируема, то, для того чтобы допустимая пара (и (i), X (t)) для задачи (10.63) была ее решением, необходимо.



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [ 95 ] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0013