Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [ 130 ] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

функция Беллмана в данном случае определяется следующим образом:

5(x(H-1), I I-1)= min X

u(i4-l),.... u(i-bl)

+ uM/)R(/)u(/)I/x(t + l)

Уравнение Беллмана принимает виц (для краткости опускается аргумент i)

Six, 0=-minM{(Ax-f ВиЧ-Ы-Vf Q(i+1) X

X (Ax-f Bu + h + V) + 5(Ax + Bu+h + V, i+l)/x},

5 (x, i) ==min {(Ax + Bu -f h) Q H + 1) (Ax -f Bu + h) +

4-М[У0(Н- l)V]-fM[S(Ax + Bu-f h-f V, i+ l)/xl}.

Решение последнего уравнения ищется в виде «трехчлена» (10.269). Далее, проделав те же выкладки, что и в детерминированном случае, можно получить искомые соотношения для оптимального управления.

Наблюдатель (оцениватель, фильтр) Калмана. Как отмечалось, задача синтеза стохастической оптимальной системы при неполной информации обычно разделяется на задачу оптимальной оценки и задачу синтеза оптимальной системы при полной информации. Рассмотрим задачу оптимальной оценки в дискретном случае. Пусть объект и наблюдение описываются уравнениями

X (t -f П = А (О X (О -f В (О U (i) + Vo. X (g = Хо; (10.275) y(0 = C(Ox(/) + V„(0. (10.276)

где (/) и V„ (f) - последовательность гауссовских случайных величин с характеристиками

(0=0; МI Vo (О V (/)! = Qo (О б,/. MV„ (О = 0; МIV„(0 vl (j)] = Ro (О б,,.; 1 (0-277) M{Vo(OV(/)=0;



bij-символ Кронекера = 1 при i = / и = О при I ф /); х" - гауссовская случайная величина с характеристиками

Мх" = хО; М [(х" -хО) (х" -х«)1 - Р; (10.278)

Qo (0. Ro (0. Ро - симметричные матрицы, причем Qo (О > > О, Ro (О > О, Ро > 0.

Случайные последовательности (/) и V,, (0) называются соответственно шумом объекта и шумом наблюдения или измерения, и они не коррелированы со случайной величиной х".

Требуется, используя измеренные значения переменной

у (/) при /= «о. «0+ 1..... найти несмещенную оценку

X (О вектора х (i), обеспечивающего минимум квадрата ошибки е (г) = X (О - X (/):

У = M[e(i)e(0]->-min.

Напомним, что оценка х (г) называется несмещенной, если Ме (i) = 0. Условие R (lo) > О означает, что ни одна координата выходной переменной не измеряется точно. В этом случае задача оценивания называется несингулярной или не-выроокденной (неособой).

Решение невырожденной задачи определяется следующим образом [51:

(П = X (О + К" (О [у (О -С (О X (О); (10.279) х(1 + 1)=А(«я(0 + В(ОиуО; х(д=-х«, (10.280)

К" (О --= Р (О С- (П [С (О р (О С- (О + Ro (01-1; (10.281)

Р (О = [Е - К" (О С (01 Р (О [Е -К« (О с (01/ -f -h К" (О Ro (О (О = Р (О-Р (О С- (О [С (О Р (О (О +

+ Ro(ol-C(OP(0. (10.282)

Р (Н- 1) = А (О Р (О (04- Qo (О. (10.283)

Р(д = Ро-

Здесь X (t) является математическим ожиданием вектора X (О и служит его априорном оценкой, т. е. оценкой, которая получается до измерения у (0; Р (О - дисперсионная матри-



ца ошибки е (О = х (t) - х (t)> т. е. ошибки априорной оценки; Р (О-дисперсионная матрица ошибки е (i) ==x(i)- х (/), т. е. ошибки искомой (апостериорной) оценки.

Выражение для оценки содержит кроме априорной оценки поправочный член, пропорциональный невязке - разности между измеренным значением переменной у (i) и ее оценкой. При вычислении оценки на каждом шаге нужно начинать с определения априорной дисперсионной матрицы Р(0- Далее нужно вычислить матрицу коэффициентов усиления К" (О и дисперсионную матрицу Р {(), затем априорную оценку X (i) и в последнюю очередь искомую оценку х (/). Так как матрицы Р (i), Р (О и К (О не зависят от измерений, их можно вычислить заранее при всех необходимых значениях i.

Соотношения (10.279)-(10.283), определяющие оптимальный фильтр (оцениватель, наблюдатель), впервые были получены Калманом, поэтому оптимальный дискретный линейный фильтр называют фильтром Калмана.

Установим физический смысл или роль матрицы К" (О-Для этого рассмотрим случай, когда х (/) и у (i) являются скалярными переменными и С (t) = 1. При этом соотношения (10.279)-(10.283) принимают следующий вид:

X (О =.х (О -4- К" (О [у (О -X (01; x{i + 1) = Л (0 (О + В (О «(0;

x(g=J«; /(«(0 = Р(0/[/(0 + /?о(0]; Р (О = [ 1 - (ОР Р (О + А" (О Ro (О =

~P{i)-P {i)/[Pii) + Roii)]: Р{1 + 1) = АЦ1)р (Pi+Qo (0; Р (to) = Ро-

Пусть /(" (О = 0. В этом случае х {i) = x (i) (искомая оценка равна априорной оценке) и измерение, которое производится в /-Й момент, при определении оценки х (i) не используется. Из физических соображений ясно, что i-e измерение не должно учитываться, если оно никакой информации не несет, т. е. дисперсия его ошибки очень велика (Rg (i) оо). Этот вывод также следует из приведенного соотношения для

K4i):.K{i)~0 при Rg{i)co.



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [ 130 ] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0012