Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [ 97 ] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

откуда с учетом условия (10.66) и равенства х* {Q = хР находим

5 (х«, Q = go [X* (tf), tf] +ро [X* (0. u* (0. tut. (10.69)

Рассмотрим допустимую пару lu (t), к (t)], где u (t) - произвольное допустимое управление. В силу определения функции U* (О = U* (х* (О, О справедливо неравенство

/„ (х, u,t) + dS (X, t)/dt > /„ (X*, u*, t) + dS (X*, t)/dt = 0.

Интегрируя обе части по / вдоль траектории х (t), получим 1/ ~

/о (X (О, U (0. t)dt + S (X (tf), tf)-S (X (to), to) > 0.

или с учетом условия (10.66) и равенства х (to) = х° /о(X(0.й(0.t)dt + go(K(tf), tf)>S(xo. to).

Из этого неравенства следует [см. также (10.69)1, что при U (t) = и* (х, t) критерий оптимальности принимает минимальное значение. Следовательно, управление и* (х, /) является оптимальным.

В том случае, когда функция Беллмана является негладкой, достаточное условие оптимальности дает теорема В. Г. Болтянского. В ее формулировке используется понятие кусочно-гладкого множества. Определение этого понятия дается в [4, 7]. Здесь только отметим, что всякая замкнутая гладкая поверхность размерности, меньшей п, является кусочно-гладким множеством в R" [4]. Напомним, что гладкой поверхностью или гладким многообразием размерности п - k в пространстве называется множество точек, удовлетворяющих системе уравнений

(рг(л:1, ...,х„)=0, / = 1,...,/г,

где ф4 (хх, ...,Хп) - гладкие функции и их градиенты d(pi/dx =

= (dffjdxi.....difjdxn) (i = 1, n) линейно независимы.

Теорема Болтянского: пусть существует непрерывная функция S (х; /), обладающая непрерывными производными по всем своим аргументам и удовлетворяющая урав-



нению Беллмана (10.65), всюду на прямом произведении X X 1/о, tj\, кроме точек кусочно-гладкого множества м размерности, меньшей п + 1; при t = tf эта функция подчиняется граничному условию (10.66). Допустимая для задачи (10.63) пара (и* (t), X* (t)), удовлетворяюищя почти всюду на Uq, tf\ уравнению Беллмана, является ее решением.

На основании теоремы Болтянского можно рекомендовать следующий порядок решения задач оптимального управления [71. Выписывается уравнение Беллмана. Находятся функции, удовлетворяющие этому уравнению в различных областях пространства R"* = X X /?, где производные этих функций непрерывны. Далее, если удается непрерывно «склеить» полученные функции, то «склеенная» функция, как правило, и есть искомая функция Беллмана. Чтобы убедиться в этом, нужно проверить, является ли множество, где производные найденной функции разрывны, кусочно-гладким.

Метод Кротова [II]

В начале 60-х годов В. Ф. Кротов разработал новый метод решения вариационых задач, который основан на достаточном условии оптимальности, названном впоследствии принципом оптимальности Кротова [7]. Но прежде чем познакомиться с этим принципом, рассмотрим более общую постановку задачи оптимального управления.

Решение задачи оптимального управления в классе кусочно-непрерывных управлений и (f) и кусочно-гладких траекторий X {t) не всегда существует. Целесообразно обобщить ее так, чтобы расширить класс задач оптимального управления, обладающих решением.

Пусть объект, ограничения и краевые условия задаются следующим образом:

x=f(х,и,о; (и,х)€ V(0; x(g€.Хо, х(у е х. (ю.то)

Здесь V [t) при каждом фиксированном t Но, tf] является некоторым множеством пространства /?" * Обозначим через D множество пар (и (/), х (/)) кусочно-непрерывных функций U (t) и кусочно-гладких (непрерывных и кусочно-дифференцируемых) функций X (If), определенных на [о. и удовлетворяющих уравнению на этом интервале, за исключением конечного числа точек, ограничению на всем интервале и краевым условиям (10.70). Множество D называют допустимым мне-



жеством, а его элементы - допустимыми парами. На множестве D задан функционал

У(и(0,х(/)) = Яо(х(д,х(/,))-Ь \fo{x,u,t)dt. (10.71)

Требуется найти последовательность допустимых пар {u<s) (/), х<*> (t)), "а которой функционал (10.71) стремится к своему наименьшему значению на множестве D:

lim J (u<») it), x(») (0) = • inf J (u it), X (0).

(u(O.x(O)eD

Такая последовательность называется минимизирующей. Последовательность допустимых пар будем также называть допустимой последовательностью.

Основным обобщающим моментом в новой постановке является то, что в качестве решения задачи оптимального управления принимается минимизирующая последовательность, а не определенная допустимая пара. В частном случае, когда существует допустимая пара (и* (t), х* (t)), доставляющая минимум функционалу (10.71), все члены минимизирующей последовательности равны этой паре: u(s) (t) = u* (/), х<*) (t) = = X* it).

Пример 10.12. Рассмотрим несколько видоизмененный пример Больца 1]:

\и\ < 1; ;с(0)=41)=о:.

J{u, х)= I [ (\--uf+x]dt-*ini.

Наименьшее значение (точная нижняя грань) функционала равно нулю и достигается на последовательности

«()(/) = sign sin 2nst; хЩ1)= sign sin 2л sxdx.

Действительно, lu<*) (/)P == 1 при любом s и xi) (<) равномерно стремится к нулю при s -* оо. Кроме того, эта последовательность принадлежит допустимому множеству: при каждом фиксированном s функция uV) {() является кусочно-непрерывной, х() (<) - кусочно-гладкой и пара (ы<4 (<), хР) (/)) удовлетворяет заданным условиям (уравнению, ограничению и краевым условиям). В обычном смысле задача решения не имеет: иет допустимой пары, прн которой функционал принимает нулевое значение.



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [ 97 ] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0012