Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [ 118 ] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

Подставив это выражение в первое уравнение, получим X- Qx + Ах - i-- BR- В- ( -А Y +

2 I " йхйх У dt

Будем искать решение этого уравнения в виде квадратичной формы:

S = xK(t)x + koit),

где К (О - симметричная матрица, (t) - скалярная функция. Подставив ее, получим

х- (Q-К BR-1 В- К -f К А + А К + Y trQo К) - - х" Кх -ко, откуда

К = - Q + KBR-> В К-КА-А? К,

Ao=-(l/2)tr(QeK). (10.184)

Граничное условие (10.170) принимает вид

х- (tf) К (tf) X {tf) + ко {tf) = х {tf) F X {tf),

поэтому

K{tf) = ¥; ko{tf) = 0. (10.185)

Подставив выражение для S в (10.183), получим оптимальный закон управления (10.179). Осталось получить (10.182). Из определения функции Беллмана следует, что

J=MlS{x{to), to)]=M{x>rKx>}+ko{to). (10.186)

Вычислим математическое ожидание от квадратичной формы":

М {х" К {to) х"} = М {{х"-х» + хО) К {to) (х"- х» -f х«)} =

= М {(хо ~ х»)" К {to) (х" -х")} Н-х"" К {to) х".

Как легко проверить непосредственным вычислением, если с и b являются произвольными векторами (столбцами) одного и того же размера, то

ab = tr{bai. (10.187)

Используя это соотношение, окончательно получаем

М {хо К (to) хО} - tr (К Но) Ро) + х» К (о) х«. (10.188)



Для второго слагаемого правой части (10.186) из уравнения (10.184) с учетом граничного условия (10.185) имеем

o(<o)=-f ltr(Qo K)dt,

поэтому действительно из (10.186) получаем (10.182).

Синтез стохастических оптимальных

систем управления при неполной информации

Измерение (наблюдение), как правило, всегда сопровождается помехами, и состояние системы никогда точно не известно, поэтому более практичной является стохастическая задача оптимального управления при неполной информации о состоянии системы, а задача намного сложнее, и для ее решения часто используют эвристический прием (метод разделения), при котором стохастическая задача синтеза при неполной информации разделяется на две задачи: задачу оптимальной оценки состояния и детерминированную задачу синтеза или стохастическую задачу синтеза при полной информации. В общем случае система, синтезированная таким приемом, не обязательно является оптимальной. Но возможно, что, как, например, при линейных уравнениях объекта и наблюдения и среднеквадратичном критерии, метод разделения позволяет синтезировать оптимальную систему управления. Таким образом, со стохастической задачей оптимального управления тесно связана задача оптимальной оценки. Перейдем к рассмотрению этой задачи.

Наблюдатель (оцениватель, фильтр) Калмана-Бьюси. Рассмотрим следующую задачу оптимального оценивания (восстановления). Пусть объект и наблюдение описываются уравнениями

x = A(0x-bB(0u+Vo; х(0=х; (10.189)

y = C(Ox+V„, (10.190)

где Vo н Vj, - гауссовские белые шумы с характеристиками М Vo = 0; м {Vo it) VJ it)} = Qo (0 б it- tr.

. . MV„=o;M{V„(OV?;(r)}=Ro(oe(-n; . M{Vo(0 vj:(0} = So(oe(/-0;



х" - гауссовская случайная величина с характеристиками М х" = х"; м {х" -х") (хО- хУ} = Рд;

Qo. Ро - неотрицательно-определенные симметричные матрицы (Qo > О, Ро > 0); Ro - положительно-определенная симметричная матрица (Rq > 0).

Случайные процессы V> и Vj," называются соответственно шумом объекта и шумом наблюдения или измерения. Они не коррелированы со случайной величиной х". Требуется, используя измеренные значения выходной переменной у (т)

на интервале [о. /1. найти несмещенную оценку х (/), обеспечивающую минимум среднего квадрата ошибки:

Jo = М [(X (t) -"(0) (х (0-(01 min. (10.191)

Условие Ro > О, т. е. условие положительной определенности матрицы интенсивности шума наблюдения, означает, что ни одна компонента выходной переменной у (?) не измеряется точно. В этом случае задача оценивания называется несингулярной [10]. Таким образом, задача (10.189)-(10.191) является несингулярной задачей оценивания (фильтрации).

Ее решение, т. е. несмещенная оптимальная оценка х (t), определяется из уравнения

= Ах+ Ви+К(у-Сх); 7{to)=xP, (10.192)

где матрица коэффициентов усиления

K = (PC"+So)R7. (10.193)

В (10.193) Р является дисперсионной матрицей ошибки

е = X - X (Р(0 = М {е (f) е (t)}) и находится из так называемого дисперсионного уравнения:

Р = (А-So R- С) Р 4-Р (А-So R- С)--

-PC-R-i CP-f Qo-SoR7> SJ: t > to. P(g = Po. (10.194)

Если шумы объекта и наблюдения не коррелированы (So == 0), то из (10.193) и (10.194) получаем

K-PCR-;

P=AP-fPA"-PC-R-CP-bQo; (10.195)

P(o) = Po-



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [ 118 ] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0011