Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [ 109 ] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

дениям ( - to) на максимально допустимые значения Ixi (i)V, обратные элементы 1/гц матрицы R-произведениям (tf - io) максимально допустимые значения [ui (t)].

Если является конечным, то независимо от того, являются ли матрицы А; В, Q, R постоянными или зависящими от времени, сформулированную задачу назовем задачей синтеза оптимального нестационарного линейное регулятора состояния или коротко - нестационарной задачей.

Оптимальное управление имеет вид

и*=-(R-» В5Кх+-i-R-» Вр), (10.122)

где симметричная (п X п)-матрица К и п-вектор р определяются из системы уравнений

К=-KA-AK-f KBR-ВК-Q; (10.123)

p=KBR-Bp-A5p-2Kh (10.124)

при граничных условиях

K( )=F; р(/;)=0. (10.125)

При оптимальном управлении для любого t [to, tf] справедливо равенство

(/)К (О X (О 4 рЧО X (О + 9 (0=хЧ/) Fx (,) Ч-

+ f [x(x)Q(T)x(T)-l-u*(T)R(T)u*(T)]dT, (10.126)

гд.е q (t) - скалярная функция, которая определяется из уравнения

9=-pBR-Вр-ph (10.127)

при граничном условии q (tf) - 0. Функция q (t) не входит в (10.122)-(10.124), и уравнение (10.127) при нахождении оптимального управления не используется.

Решение задачи синтеза оптимального нестационарного линейного регулятора состояния существует и единственно. Заметим, что в этой задаче не требуется, чтобы объект был вполне управляем. Решение существует и единственно даже в том случае, когда объект является полностью неуправляемым. Это обусловлено тем, что управляемый процесс рассматривается на конечном интервале и вклад неуправляемых ко-



ординат в значении критерия оптимальности является конечным даже если они расходятся (т. е. стремятся к бесконечности при t- оо).

Векторное дифференцирование. Прн выводе соотношений (10.122) - (10.127) используется векторное дифференцирование. Напомним основные определения и правила векторного дифференцирования. Здесь, как всюду в этой главе, под вектором понимается вектор-стол-def

бец. Символ = означает «равно по определению»: 1) производная вектора по скаляру

dx dt

/dx, \ dt

\ dT/

dt -[di)

2) производная скаляра по вектору

dS ldS dx \dxi

dxn ,

= grad S;

3) производная вектора по вектору


dh \

dx

dx ;

\ dx.

Используя приведенные определения и обычные правила дифференцирования, нетрудно установить следующие правила векторного дифференцирования:

d(xy)

. dk

--Ах

~ dt"

d(yz)

d r

Qx) =

d x dt

Q - симметричная (n X п)-матрица, не зависящая от х.



Для получения соотношений (10.122)-(10.127) воспользуемся методом динамического программирования. Уравнение Беллмана (10.65) и граничное условие (10.66) для задачи (10.120), (10.121) соответственно принимают вид

U L

xQx + uRu+ -(Ax + Bu + h) dx

= ~dS/dt; (10.128) Six(tf),tf)=xtf)Fx{tf). (10.129)

В уравнении (10.128) выражение в квадратных скобках есть квадратный трехчлен относительно векторного управления, и так как нет ограничения на управления, то он достигает минимума в стационарной точке. Поэтому уравнение (10.128) равносильно системе уравнений

xQx + uRu+ i(Ax4-Bu + h)=-aS/a; (10.130)

2uR-f-B=0. (10.131)

8 левой части (10.131) стоит производная по управлению от левой части (10.130). Из уравнения (10.131) находим

и= -R-B(-~-j" (10.132)

Подставив это выражение в (10.130), получим

. xQx-L.BR-B№4 4 dx \ dx /

+ i(Ax-fh)=-- • (10.133)

dx dt

Решение последнего уравнения будем искать в виде квадратного трехчлена:

S (x,O=xK(0x + p40x+q(0, (10.134)

где К (О - симметричная (п Хп)-матрица, являющаяся функцией времени; р (/) - векторная функция размерности п;

9 (О - скалярная функция.



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [ 109 ] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0012