Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [ 131 ] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

Если К° (О = 1, то л; (О = у (0. т. е. в этом случае оценка полностью определяется последним измерением. Измерения, произведенные до г-го момента, а также другая априорная информация никак не используются. Очевидно, такая ситуация возникает, когда очень велики (по сравнению с дисперсией ошибки г-го измерения) дисперсии ошибок до / го момента или дисперсии шума объекта или когда г-е измерение производится без ошибки. Такой вывод следует также из соотношений

для /С" (О и Р(0.

Таким образом, выбором величины К° (О регулируется влияние априорной и текущей информации на определение

оценки X (г). Задача оптимальной оценки состоит в выборе такого /С" (О, при котором наилучшим образом (в оптимальной пропорции) используются априорная и текущая информации. " Перейдем к выводу равенств (10.280)-(10.283). В соответствии с принятыми обозначениями

X (О - М {х (0}; Р (О = М [е (Ое (t)]; Р(0 = М[ё(0 е~-(0],

где е (О = X (О -X (0; ё(О = х (О-х (/).

Уравнение (10.280) непосредственно следует из (10.275). Вычитая (10.280) из (10.275), находим

e(i--l) = A(Oe(0+V„(0,

откуда

М {ё (i + 1) ё а -f 1)} = М {[А (О е (/) + + V„(0][A(Oe(0 + V„(OJV

В силу независимости е (/) и (() из последнего соотношения получаем (10.283).

Для доказательства первой части равенства соотношения (10.282) подставим в (10.279) выражение для у (О из (10.276). Затем, вычтя каждую часть полученного равенства из х (г), преобразуем его к виду

е (О -ё (О- К« (О [С (О ё(0 Ч- V., (01

е (О - [Е- К" (О С (0]ё(0- К» (О V„ (О-



Так как е (i) и V„ (i) независимы, то из последнего соотношения следует первая часть равенства (10.282).

Остается доказать, что средний квадрат ошибки е (г), равный следу матрицы Р (i), принимает минимальное значение, если в (10.279) матрица К° (О определяется соотношением (10.281). Как легко проверить, первую часть равенства (10.282) Р (О = [ Е - К" (О С (01 Р (О I Е - К" (О С {i)V + -Ь К" (О Ro (О К" (О (опустив для краткости аргумент i) можно представить в виде

р=[КО -PC/(CPC/ + Ro)-4 (CPC-f Ro) X

X [К" - PC-r (СРС + Ro)~4 + Р -

- РС (СРГ/ + Ro)-* СР. (10.284)

Если К" определяется из (10.281), первое слагаемое правой части последнего равенства обращается в нуль. Оставшуюся часть обозначим Р*:

Р* =ррст (срс + Ro)-i СР.

Эта матрица в силу свойств дисперсионных матриц является неотрицательно-определенной, поэтому ее диагональные элементы не отрицательны (последнее следует из неравенств PiiXf > О, i= 1, 2, которые получаются из хР*л; >0 при Xj=0, j Ф i; Pij - диагональные элементы матрицы Р*). Так как матрица СРС + Ro является положительно-определенной, то первое слагаемое в (10.284) также является неотрицательно-определенной при произвольной матрице К*. Поэтому след матрицы Р будет минимальным при такой матрице К", когда первое слагаемое в (10.284) обращается в нуль, т. е. когда К" определяется соотношением (10.281). При этом из (10.284) получаем вторую часть равенства соотношения (10.282).

Заметим, что здесь вывод соотношений, определяющих фильтр Калмана, был несколько упрощен тем, что структура уравнения (10.279) была задана. Задача оптимальной оценки, таким образом, была сведена к определению оптимальной матрицы коэффициентов усиления.

Стохастическая линейная оптимальная система управления при неполной информации. Пусть объект и наблюдатель описываются уравнениями

X (i -f 1) = А (О X (О + В (О U (О + v„ (0;

у(0 = С(/)х(0 + Ун(0



и критерии оптимальности имеет вид

J = М jx (if) Fx ii,) + 2 f 0") Q (/) X (/) 4- (/) R (/) u (/)]j.

Шум объекта (i) и шум наблюдения V„ (/) представляют последовательности независимых гауссовских случайных величин с нулевыми средними, дисперсионными матрицами Qo (О и Ro (i) соответственно; матрицы F, Q (i), R (i), Qq (i) и Ro (О симметричны, причем F > О, Q (/) > О, R (i) > О, Qo (1) > О и Ro (1) > О- при io < г < i/ - 1. Начальное состояние X {io) = Хо является гауссовской случайной величиной со средним значением Хо и дисперсионной матрицей Ро и не зависит от шумов (г) и V,, (/).

Требуется найти такое управление

u(() = u{y(/), to</<t},

при котором критерий принимает минимальное значение.

Для этой задачи справедлив принцип разделения, или принцип стохастической эквивалентности [51. Поэтому ее решение имеет следующий вид:

U (О = -(О (О К (i -Ь 1) А (О

L(o = Br(OK(t + i)B(o + R(o;

к (О - Q (О + А (О [К (t + 1)-К (t -f 1) В (О L-1 (О X

X В (О к (t + 1)1 А (0; к {i,} F, (10,285)

(О X(О -f К« (О [у (О -С (О x(i)]; X {i + 1) = А (O(t) + В (О U (£); X Но) = х«; К« (О =Р (О (О [С (О Р (О (О + Ro (0)-; р (О = [Е - К« (О с (01Р (О [Е - к« (О с (01 + + K«(0Ro(OK40. P(t + !)-A(OP(t)A(t) + Q(t);

P(g = Po. (10.286)

Соотношения (10.285) определяют оптимальное управление с обратной связью. Они совпадают с соотношениями (10.266), (10.261)-(10.263), определяющими оптимальный регулятор в случае полной информации, за исключением того, что в



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [ 131 ] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0012