Главная Нелинейные системы управления [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [ 88 ] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] Принцип максимума, сформулированный Л. С. Поитря-гиным в 1953 г. как необходимое условие экстремума для задач оптимального управления, был доказан и развит впоследствии им, его учениками и сотрудниками [I, 4, 17]. Задача с закрепленными концами и фиксированным временем При отсутствии фазового ограничения задачу оптимального управления в этом случае в общем виде можно сформулировать как следующую задачу Лагранжа: xi = fi{\,u,t), i=\.2,...,n, uetl; Xi (to) = x;xi (ti)=xl j = 1,2,.... n; У J /д (x. u, t) dt -> min (inf). (10.47) Bee функции fi непрерывны no совокупности переменных Xy, ... ...,Xn,Ui.....Ur,t и непрерывно дифференцируемы по Ху, .... jc„, t. Эта задача отличается от задачи (10.28)-(10.31) с закрепленными концами и фиксированным временем, рассмотренной в предыдущем параграфе, тем, что ограничение задается в виде включения U g и, где U - допустимое множество значений управления. Кроме того, здесь не требуется гладкость (непрерывная дифференцируемость) функций ft (i = О, 1, п) по управлению и. Допустимым принимается управление u{t), принадлежащее к классу кусочно-непрерывных функций и принимающее значение из допустимого множества U. Фазовая траектория х() называется допустимой, если она является кусочно-гладкой. При допустимом управлении фазовая траектория задачи (10.47) является кусочно-гладкой: координаты Xi{t) (t = 1, 2, п) непрерывны всюду на интервале [to, tf], а их производные могут иметь разрыв 1-го рода в точках разрыва управления. Пара {u{f), x(f)) называется допустимой для задачи (10.47), если u(t) и х{1) являются допустимыми управлением и траекторией и х() при u(t) = u(f) удовлетворяет уравнениям и краевым условиям этой задачи. Применим к задаче (10.47) прием Лагранжа [1]. Составим функцию Лагранжа: 1=1 «=1 где гамильтониан Я = 2 я],,/,. (10:48) 1 = 1 Функцию Н называют также функцией Понтрягина П ]. Функции Лагранжа и Понтрягина имеют такой же вид. что и соответствующие функции в вариационных задачах классического типа, рассмотренных в предыдущем параграфе, только в эти функции не входит ограничение на управление, имеющее в данном случае вид включения и £ U. В соответствии с приемом Лагранжа задача (10.47) сводится к задаче 7= f L (х, X, U, г{), t) di -> max; Xi{to) = xh Xi(tf)==4, i = п. (10.49) Функционал J максимизируется, хотя функционал J в исходной задаче требуется минимизировать, так как множитель чро при /о. или, что то же, при J, в неособом случае принимается отрицательным (о = -П- В особом случае (iJJo = 0) функционал J не зависит от J. Пусть (x*(t), u*{f), ф*(0) - решение задачи (10.49). Очевидно, задача (10.49) равносильна следующим двум: Jj= Г L(x,x,u*,i,t)dt-maK; 2= Г L(x*,x*, и, \i)*,t)dt- max. Я(х, U*, о - S "iXi Л->тах; (10.50) d/->niax. (10.51) при тех же граничных условиях, что и в задаче (10.49). Естественно, задачи (10.49)-(10.51), как и исходная задача, рассмат-4)иваются в классе допустимых функций, причем функция ф() называется допустимой, если она, как и х(), является элементом множества кусочно-гладких функций. Задача (10.50) - простейшая задача вариационного исчисления. Для нее необходимые условия (уравнения Эйлера) имеют вид jdH/dxj, /=1,2.....п; Xj-=dHld%. /= 1.2,...,fi. (10.52) (10.53) Решение задачи (10.51) очевидно: управление и*(0 доставляет максимум в этой задаче в том и только в том случае, если всюду на 10, tf], кроме точек разрыва и*(/), выполнено равенство max Н (X*, U, xJ)*, () Н (х*, и*, Ц)*, (), (10.54) Необходимые условия задачи (10.50) совместно с условием (10.54) составляют необходимые условия задачи (10.47), называемые принципом максимума или принципом максимума Понтрягина. Уравнения (10.53) совпадают с уравнениями объекта, и поэтому их можно не рассматривать. Уравнения (10.52) называют сопряженными уравнениями или сопряженной системой. Принцип максимума. Для того чтобы допустимая для задачи (10.47) пара (и*(!), х*(/)) была ее решением, необходимо, чтобы суш,ествовали такие не обращающиеся одновременно в нуль константа гр < О а решение xJ)* = (ijit, ... ....fnYсопряженной системы (10.52) при х(0 = *(t) и u(t) = =u *(t), что при любом t £ 1, t,], кроме точек pa3pbieau*(t), функцияН (и = Н(х*, и, гр*, {) достигает при и = u*(t) максимума, т. е. выполняется соотношение (10.54). [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [ 88 ] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] 0.0013 |