Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [ 88 ] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

Принцип максимума, сформулированный Л. С. Поитря-гиным в 1953 г. как необходимое условие экстремума для задач оптимального управления, был доказан и развит впоследствии им, его учениками и сотрудниками [I, 4, 17].

Задача с закрепленными концами и фиксированным временем

При отсутствии фазового ограничения задачу оптимального управления в этом случае в общем виде можно сформулировать как следующую задачу Лагранжа:

xi = fi{\,u,t), i=\.2,...,n, uetl; Xi (to) = x;xi (ti)=xl j = 1,2,.... n;

У J /д (x. u, t) dt -> min (inf).

(10.47)

Bee функции fi непрерывны no совокупности переменных Xy, ...

...,Xn,Ui.....Ur,t и непрерывно дифференцируемы по Ху, .... jc„, t.

Эта задача отличается от задачи (10.28)-(10.31) с закрепленными концами и фиксированным временем, рассмотренной в предыдущем параграфе, тем, что ограничение задается в виде включения U g и, где U - допустимое множество значений управления. Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций ft (i = О, 1, п) по управлению и.

Допустимым принимается управление u{t), принадлежащее к классу кусочно-непрерывных функций и принимающее значение из допустимого множества U. Фазовая траектория х() называется допустимой, если она является кусочно-гладкой. При допустимом управлении фазовая траектория задачи (10.47) является кусочно-гладкой: координаты Xi{t) (t = 1, 2, п) непрерывны всюду на интервале [to, tf], а их производные могут иметь разрыв 1-го рода в точках разрыва управления. Пара {u{f), x(f)) называется допустимой для задачи (10.47), если u(t) и х{1) являются допустимыми управлением и траекторией и х() при u(t) = u(f) удовлетворяет уравнениям и краевым условиям этой задачи.



Применим к задаче (10.47) прием Лагранжа [1]. Составим функцию Лагранжа:

1=1 «=1

где гамильтониан

Я = 2 я],,/,. (10:48)

1 = 1

Функцию Н называют также функцией Понтрягина П ]. Функции Лагранжа и Понтрягина имеют такой же вид. что и соответствующие функции в вариационных задачах классического типа, рассмотренных в предыдущем параграфе, только в эти функции не входит ограничение на управление, имеющее в данном случае вид включения и £ U. В соответствии с приемом Лагранжа задача (10.47) сводится к задаче

7= f L (х, X, U, г{), t) di -> max;

Xi{to) = xh Xi(tf)==4, i = п. (10.49)

Функционал J максимизируется, хотя функционал J в исходной задаче требуется минимизировать, так как множитель чро при /о. или, что то же, при J, в неособом случае принимается отрицательным (о = -П- В особом случае (iJJo = 0) функционал J не зависит от J.

Пусть (x*(t), u*{f), ф*(0) - решение задачи (10.49). Очевидно, задача (10.49) равносильна следующим двум:

Jj= Г L(x,x,u*,i,t)dt-maK; 2= Г L(x*,x*, и, \i)*,t)dt- max.



Я(х, U*, о - S "iXi

Л->тах; (10.50)

d/->niax. (10.51)

при тех же граничных условиях, что и в задаче (10.49). Естественно, задачи (10.49)-(10.51), как и исходная задача, рассмат-4)иваются в классе допустимых функций, причем функция ф() называется допустимой, если она, как и х(), является элементом множества кусочно-гладких функций.

Задача (10.50) - простейшая задача вариационного исчисления. Для нее необходимые условия (уравнения Эйлера) имеют вид

jdH/dxj, /=1,2.....п;

Xj-=dHld%. /= 1.2,...,fi.

(10.52) (10.53)

Решение задачи (10.51) очевидно: управление и*(0 доставляет максимум в этой задаче в том и только в том случае, если всюду на 10, tf], кроме точек разрыва и*(/), выполнено равенство

max Н (X*, U, xJ)*, () Н (х*, и*, Ц)*, (),

(10.54)

Необходимые условия задачи (10.50) совместно с условием (10.54) составляют необходимые условия задачи (10.47), называемые принципом максимума или принципом максимума Понтрягина. Уравнения (10.53) совпадают с уравнениями объекта, и поэтому их можно не рассматривать. Уравнения (10.52) называют сопряженными уравнениями или сопряженной системой.

Принцип максимума. Для того чтобы допустимая для задачи (10.47) пара (и*(!), х*(/)) была ее решением, необходимо, чтобы суш,ествовали такие не обращающиеся одновременно в нуль константа гр < О а решение xJ)* = (ijit, ... ....fnYсопряженной системы (10.52) при х(0 = *(t) и u(t) = =u *(t), что при любом t £ 1, t,], кроме точек pa3pbieau*(t), функцияН (и = Н(х*, и, гр*, {) достигает при и = u*(t) максимума, т. е. выполняется соотношение (10.54).



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [ 88 ] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0013