Главная Нелинейные системы управления [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [ 95 ] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] принимает меньшее значение, чем при управлении и* [f, tf], т. е. J2{u[tJf])<J{u*lt,t}]). Тогда критерий оптимальности в задаче (10.63) при управлении uO(0. t ttf принимает меньшее значение, чем при управлении и* [tg, ffl т. е. J (u" [to, tf])Ji(u*[toJ])+J.Auo [f, t) < J {u*[to, tf]) = = Л(и*[/о,/])+Л(и*[/,/;0, a это противоречит, оптимальности управления u* (о. Л-Принцип оптимальности для задачи оптимального управления является частным случаем следующего более общего утверждения: если допустимая для задачи (10.63) пара (и* {t), x*(t)) оптимальна, то, каков бы ни был подынтервал [ti, tJ сг [to. tfh управление и* (t) на этом подынтервале является оптимальным относительно граничньих точек к* (ti) и х* (t). Это утверждение доказывается точно так же, как и принцип оптимальности. В частном случае, когда = о. приведенное утверждение называют обратным принципом оптимальности [7J. Приведем несколько иную формулировку этого принципа. Обратный принцип оптимальности. Для оптимальности допустимой для задачи (10.63) пары (и* (t), X* (t)) необходимо, чтобы при любом f [to, tj\ управление U* [fo, t] было оптимальным относительно конечного для интервала [to, t] состояния х (/) = х* {t). Функция и уравнение Беллмана Произведем инвариантное погружение задачи (10.63) в семейство задач, которое получается из задачи (10.63) при замене начального условия х (to) = х" параметрическим условием x(f)= х, / £ [to, t)]; в новом условии f и х рассматриваются как параметры. В частном случае, когда if = to и х = х", из введенного семейства вьщеляется исходная задача. Минимальное значение критерия оптимальности при параметрическом начальном условии зависит от выбранных значений /их (С): 5[x(i).n== min go{{t,),tf)+ \h{x,u,t)dt t <t < tf причем S{x{tf),if):=go{x{tf),tf). Функция S (x (/), t) называется функцией Беллмана. Получим уравнение Беллмана. Очевидно, Six{t-At)J min go (х ( ), )+ < t к tf f / 1 + J fodt + jfgdt . Для краткости записи аргументы функции /о(х, t) опущены. В силу принципа оптимальности Slx{t -M),t -At]= min u(t)£Vt, f -ht <t<t f <t<tf S(x(/-A/),/-A/]= min J/„d/-f S[x(/),f] . Фазовый вектор x (f - Д/) и соответственно функция Беллмана в левой части последнего соотношения не зависят от управления на интервале W - At, tl, поэтому в этом отношении функцию Беллмана левой части можно перенести в правую часть и внести под знак минимума: min j f fodtSlx{n,t]-S[x{t -t-M<t<t -AO, t-At] . В полученном уравнении интеграл представим в виде f j fodt=fo{{f),u{t),t)At + OiAt). f -м Затем, разделив обе части на Д/, устремим к нулю. Тогда, приняв f = t, в пределе получим уравнение 0= min {fo{x,u,f)-dS(\{t),t)ldt}, (10.64) u(OCU( О = min j/o (X. u, О + 2 fi C. 0 + 1= 1 которое называется уравнением Беллмана или обратным уравнением Беллмана. Так как функция S (х (/), О не зависит от управления и {t), последнее слагаемое в правой части можно вынести за скобки и уравнение Беллмана записать в виде min \k{x,J)Л-Z-ft{?,u,{)\-.дSдt, или в векторной форме -dS/dt. (10.65) Напомним, что, по определению, производная от скалярной функции по векторному аргументу есть вектор-строка: dS/dx=={dS/dxi,...,dS/dXn). Сформулируем основной результат: если функция Беллмана дифференцируема, то, для того чтобы допустимая пара (и (i), X (t)) для задачи (10.63) была ее решением, необходимо. [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [ 95 ] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] 0.0013 |