Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [ 99 ] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

Один из возможных способов задания функции Кротова заключается в таком ее выборе, что функция R (х (t), и {t), i) не зависит от х(0- При таком способе соотношение (10.78) принимает вид

/?(х*(0.и*(0,0= sup R(x(t).u(t).t). (10.79)

u(0€Uj

При другом способе функцию Кротова выбирают таким образом, чтобы функция R (х (t), и (t), f) не зависела от и (/). В этом случае соотношение (10.78) записывается в виде

R(x*(i),u*(i),i)= sup R(x{t),u(i),i). (10.80)

х(0€Х,

Способ задания функция К (х, t) зависит от задачи, и успех ее решения в значительной степени определяется тем, как задается функция Кротова.

Пример 10.13. Рассмотрим задачи из 1[7].

Первая задача: х=и, и < I, х(0)=х(1) - 0, ./(л-. и) =

с= 1 (дг»-и)Л -> inf.

Здесь и, X - скаляры. Составим функцию R {х, и, t):

дх dt

Так как концы траектории закреплены, функция F (л (ta), х (tj)) не рассматривается. Выберем функцию К (х, t) так, чтобы функция R (х, и, i) не зависела от управления. Это условие будет выполнено, если

аК (х, t)/dx = -1 или К (X, t) = -х + с (О,

где с (/) - произвольная гладкая функция. В этом случае

R (х, и, t) = -х + dKldt = -х+ dcldt и соотношение (10.80), принимает вид

-*2-f dc/d/=sup (-x+dcldt).

откуда л:* = 0. В силу уравиеиия объекта х* = и* = 0. Пара и* = О, ** = О является допустимой и удовлетворяет достаточным условиям оптимальности. Следовательно, это пара является искомым решением.

Заметим, что решить рассмотренную задачу методом динамического программирования или используя принцип максимума Понтрягина ие удается.

Вторая задача: пусть уравнения, ограничение и краевые условия те же, а критерий оптимальности имеет вид

J(x. u)= I (л=-Ь1 о



в этом случае

дх dl

Примем К (х, t) ==0. Тогда R {х, и, f) = -- I + "° и максимум этой функции достигается при и* = ±1, х* = О и равен нулю, т. е. х (f) = 0. Пара {и* (t), х* (t)) не удовлетворяет заданному уравнению X* (/) =5 и* (/) н, следовательно, не является решением.

Попытаемся найти допустимую последовательность пар (/),

х(*) (/)), на которой достигается нижняя грань функционала, равная нулю. Рассмотрим последовательность пар

u(s)()=sign sins я/, л (*)(0 = j"sign sin sntdt.

функции и x(.){t) при каждом фиксированном s являются соот-

ветственно кусочно-непрерывными и кусочно-гладкими, удовлетворяют всем условиям задачи. Таким образом, последовательность пар (t), х(*) (t)) является допустимой. Последовательность {х<) (t)] равномерно стремится к нулю, а все члены последовательности [ul) (t)) принимают только значения ±1. Поэтому

Таким образом, приведенная выше последовательность удовлетворяет достаточным условиям оптимальности и, следовательно, является искомым решением.

Рассмотрим задачу с нефиксированным временем. Пусть to фиксировано, а tf может изменяться в интервале [to, ti], условия совпадают с (10.70), а критерий оптимальности имеет вид

J{u,x)=go{x{to),x(t,),tf)+ ijfo{x,u,t)dt. (10,81) Обозначим

F (X {to), X {t,), tf) - go (X (g, X {tf), tf) +К{х {tf), tf) -

-K(x(g.g;

m= inf F{K{to),x{tf),tf).

X(to)\o.X(tf)\f,

tflto,h]

В данном случае, если решение существует в классе допустимых пар, принцип оптимальности Кротова формулируется следующим образом: для того чтобы допустимая пара (и* (),



X* (0) была решением задачи (10.70), (10.81) с нефиксированным временем, достаточно существования функции Кротова К (х. О " времени tf G [to, к] таких, что: . П II (i) = о, / е [to, М;

2°)/?(х*(0, и*(0, 0 = 0 почти всюду на [t, tf]; 3°)f (x*(g, x*(<f*), tDm.

Это утверждение доказывается аналогично принципу оптимальности Кротова для задачи с фиксированным временем (111.

Установим связь между достаточными условиями в методе Кротова и уравнением Беллмана в методе динамического программирования.

Рассмотрим задачу (10.63). Обозначим

Я(х, 0= sup R(x, и, 0= sup fiLf-ь-

ueu [ ox dt

Допустим, удалось найти такую функцию Кротова, что функция Я(х. О не зависит от х, а функция F (х (/„), х (t,), t,) не зависит от X (tf) и tf. Тогда

. Я (X, О = sup Р (X, 0 = 1 (0; F (X (to), X (tf) tf)

inf F(x(to), x(tf), tf)=m.

В последнем соотношении опущена операция минимизации по начальной точке х (to), так как она фиксирована. Для задачи (10.63) функция

F(Mto). Mt,),ti) = go((i,). tf)-\-K(x(tf). tf)-K(x(to), to)

и не зависит от х (tf) и tf. если

K(x(tf). t,)~go(x(tf), tf). (10.82)

Очевидно, условие 3° в принципе оптимальности Кротова совпадает с (10.82), условия 1° и 2° принимают вид

р (О Р (X, о = sup If- f -f-f - -fo ] = 0.

йен, ox dt ]

или, так как /< (x, f) не зависит от управления,



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [ 99 ] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0014