Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [ 98 ] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

принцип оптимальности Кротова. Сначала рассмотрим задачу оптимального управления с фиксированным временем: моменты tn и tf фиксированы. Пусть К (х, f) - произвольная скалярная функция, которая определена, непрерывна и имеет непрерывные частные производные по всем своим аргументам на прямом произведении R" X [tg, tf]. Допускается, чтобы частная производная по времени имела разрывы 1-го рода в конечном числе точек на интервале 1о, tf]. Построим функции

+ (10.72)

F (X (g, X (tf)) =go (X (g, X (tf)) + K{x (tf), tf) -

-A:(x(g,g. (ю.тз)

где f - правая часть уравнения (10.70); fo ч go - функции, входящие в функционал (10.71). Введем обозначения

\i{t) sup /?(х.и,0; (10.74)

(и. x)gV(o

m= inf F(x{to),K{t,)). (10.75)

Относительно функции К (х, t) также предполагается, что она обладает такими свойствами, что соответствующая ей функция R (х, U, /) определена и непрерывна всюду на /?" X R" X X 10. tf], а р {t) - кусочно-непрерывна на [о. tf]. Функцию К (х, t), обладающую указанными выше свойствами, будем называть функцией Кротова.

Принцип оптимальности Кротова можно сформулировать следующим образом: для того чтобы допустимая последовательность (и") (t), х<> (t)) была решением задачи (10.70), (10.71), достаточно существования такой фtJHKЦuu Кротова

K{,t), что: 1°) /?(хМ {t),u> (t),t)N> -Ой при всех t е [0. tf] и s; 2°) R (;Г(») (О, и(«) (t), t) р (О на tf];

3°) F (xi (f), х() (tf)) -> m > - 00.

Символ обозначает сходимость по мере.



Для доказательства этого принципа введем в рассмотрение множество D пар (и (f), х (t)) из кусочно-непрерывных на [/ц, f] функций U (/) и X (О, удовлетворяющих ограничению (и (/), X (0) € V (0. и определим на нем функционал:

L (и, X) =f (X (g, X (tf)) - j (X (О, u (О, (10.76)

Очевидно, допустимое множество является подмножеством D, т. е. D с: D. Поэтому функционал (10.76) определен и на D, причем на D в силу уравнения из условия (10.70)

и функционалы (10.71) и (10.76) совпадают:

L (и, X) (X (g, X (tf) ~[к {x{tf), tf)-K{x (g, gi 4-

-f-J/o(x,u,Od=y(u.x).

Обозначим

/= inf Z.(x,u)= inf f(x(gx(0)) -

.(U.x)!) X {/o)tXo. X (/y)£Xy

• - sup „ (R{-K{t),u(t),t)dt.

в силу непрерывности R (x (t), и (t), t) •

If If

sup \R{\{t),u{t),t)dt= \ sup R{K(t).u{t),t)dt

(и.х)ео( J(u.x)ev(0

И., следовательно.

l = m- ii{t)dt.

неравенства

inf J(u,x)= inf L(u,x)> inf L(u,x) = Z (u,x)eD (u,x)eD (u.x)gD



следует, что / является нижней гранью функционала J (и, х). Если выполняются соотношения 1"-3°, то, очевидно,

lim J (uw if), j?) (0) = lim L (u(») (/), x<») (0) = /.

S-*-oo s->-oo

Таким образом, I является точной нижней гранью функционала (10.71) и достигается на последовательности (и") (t), х<> (/)). Следовательно, эта последовательность является решением задачи (10.70), (10.71), что и доказывает принцип оптимальности Кротова. Если и") {t) = и* (/) и х") (О = х* {t), т. е. решением является допустимая пара, принцип оптимальности Кротова формулируется следующим образом: для того чтобы допустимая пара (u*(t), х* (t)) была решением задачи (10.70), (10.71), достаточно существования такой функции Кротова К (х, t), что

R (X* (О, U* (/), О = Ц (0. F (X* (<„), X* (tf)) = m. (10.77)

где \i (t) и т по-прежнему определяются соотношениями (10.74) и <10.75).

Как решается задача оптимального управления на основе принципа оптимальности Кротова? Допустим для простоты рассуждения, что. решение существует в классе допустимых пар. Подход, основанный на принципе оптимальности Кротова, состоит в том, что вместо непосредственного отыскания допустимой пары (и* (0. X* (0), доставляющей минимум критерию оптимальности, отыскиваются функция Кротова и допустимая пара, удовлетворяющие условиям (10.77). В общем случае такой подход сводит вариационную задачу к задачам нелинейного программирования в конечномерном пространстве.

Как следует из формулировки принципа оптимальности Кротова, существует достаточно большой произвол в выборе функции К (х, /). Этот произвол иногда позволяет преодолеть те трудности, которые при других методах преодолеть не удается. Способ задания функции К (х, /) определяет метод решения. Путем определенного способа задания функции К (х, t) можно получить уравнение Беллмана и принцип максимума Понтрягина.

Рассмотрим два различных способа задания функции Кротова. Пусть область ограничения V (t) можно представить в виде прямого произведения: V {t) =»= Uj X Х<. Тогда первое соотношение в (10.77) можно представить в виде

/?(х*(0.и* (/)./)--= sup sup R(x{t),u{t),t). (10.78)



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [ 98 ] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0014