Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [ 126 ] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]


Расширенный фильтр Калмаиа - Бьюси описывается следующими уравнениями:

Рис. 10.9

=" + 1 [6-arctg ( x/Xi)]; A-i(<o) = /o;

\ dx jo \ dXi

\ xl + xl

xl+xl J

Стохастическая линейная оптимальная система управления при неполной информации. Принцип разделимости

Рассмотрим задачу синтеза стохастической линейной оптимальной системы управления при неполной информации о состоянии. Пусть объект и наблюдение описываются уравнениями

x = Ax + Bu+V„; xCg-x"; y = Cx + V„. (10.244)

критерий оптимальности имеет вид

= М х itj) Fx {tf) + j" (x Qx + Ru) dt

(10.245)

Шумы Vo и V„ являются белыми с интенсивностями Qo (О и Ro (t) соответственно; начальное состояние х" - случайный

вектор со средним значением х" и матрицей дисперсий Ро-Шумы и начальное состояние не коррелированы между собой. Матрицы R {() и Ro {t) положительно определены. Задача состоит в определении такой функции (функционала)

U = U {у (т), /о < т < 0. 0 < < tf,

при которой критерий оптимальности принимает минимальное значение.



Решение этой задачи, т. е. оптимальный закон управления, имеет вид

U* = -R-1 В?" К МО. (10.246)

где К - матрица, определяемая из уравнения

К=-KA~AK + KBR-iBK-Q, K{tf)=F; (10.247)

- линейная оптимальная оценка, получаемая наблюдателем (фильтром) Калмана-Бьюси:

x = Ax+Bu-fK«(y-Сх); х(д=Хо; К« = PC-RS"; P = AP-f РА -PCRrCP + Qo; P(g-Po.

(10.248)

Соотношения (10.246), (10.247) совпадают с соотношениями (10.138), (10.123), (10.125) и (10.179)-(10.181), определяющими оптимальный регулятор в детерминированной задаче синтеза оптимальных систем и задаче синтеза стохастических линейных оптимальных систем управления с полной информацией, с той лишь разницей, что в (10.246) входит оценка х, а в (10.138) и (10.179) - сам вектор х. Таким образом, стохастический линейный оптимальный регулятор состоит из линейного оптимального наблюдателя и детерминированного оптимального регулятора (рис. 10.10). Этот результат известен как принцип разделения [101 или принцип стохастической эквивалентности [5]. В соответствии с этим принципом задача синтеза стохастической линейной оптимальной системы управ-

Mode/Ill системы

Объект

Измеритель

Стохастический оптимальный peey/rmcf

Детер/щнаро-ванный оптимальный регулятор

Фильтр Колмана -Бьюси



ления при неполной информации о состоянии разбивается на две: задачу синтеза линейного оптимального наблюдателя и детерминированную задачу синтеза оптимальной системы. Если шумы и начальное состояние подчиняется гауссов-скому закону распределения, то соотношения (10.246)-(10.248) определяют стохастический оптимальный регулятор, т. е. регулятор, оптимальный в классе всех систем, а не только линейных.

• Для доказательства принципа разделения сначала пока-

жем, что ошибка е = х - х и оценка х не коррелированы. Уравнение для оценки из (10.248), используя (10.246) и (10.244), можно преобразовать к виду

5 = (A-BK*)+K«Ce-l-K«V„; K*=R-»BK.

Это уравнение совместно с уравнением (10.219) для ошибки можно представить в виде

z==Gz4-Hw,

Ixji кое А

ГЕ -К»\ К")

Дисперсионное уравнение (10.217) в данном случае принимает вид г ..

/А-КОС о \ А-КС О Y •

I КОС А-ВК*/ I КОС А-ВК*/

[о К" j Vo KV lo KV vo KV

fQo 0\ VORo

Представим матрицу Q в виде

(10.256)



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [ 126 ] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0012