Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [ 121 ] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

является несмещенной и доставляет минимум (10.196) при любом а. Продифференцируем (10.211) и, используя (10.208), получим

х=К»у + (А-К«С)

5Z(T)K(t)y(T)dT + Z(/. f„)xO

или, принимая во внимание (10.211),

Г= К» у -(А-К" С)х == А+К" (у-Сх).

Из (10.211) при t-U получаем х {Q = х".

Итак, для случая и (f) = О показали, что наблюдатель Калмана-Бьюси действительно является линейным оптимальным наблюдателем.

Перейдем к случаю и (t) ф 0. Представим фазовый вектор в виде суммы 19]: х = х(> + х>. где слагаемые удовлетворяют уравнениям

x<> = Ax<-hVo; х"(д = хв; =Ах-ЬВи; х=(д=-0.

Вектор наблюдения также представим в виде двух составляющих: у = у<) 4- у<\ где

y<i> = Cx"-f V„; у=Сх.

Составляющие х<> (t) и у<*) (/) однозначно определяются из уравнений.

Составляющая у> (О легко определяется по измерениям у (0:

у" (О-у (О-У*(О-

Таким образом, задача оптимальной оценки при и () О свелась к оценке х< {t) по у<) (т), tg t, - задаче оп-

тимальной оценки при U {f) = 0.

Для линейной оптимальной оценки х<*> имеем [см. (10.192)1

<)=.А"--К«(У-Сх«");9(д -х«. где К" определяется из (10.193)-(10.195).

Очевидно, оптимальная оценка х {f) равна сумме:

iirjT-i-x*.



Продифференцировав это выражение, получим

1 = ?ч >х<= А "х И-Ви -1-К" (у" - Сх"). или, принимая во внимание равенство у<*) = Сх*\

= Ах+ Ви + К" (у -Сх), X (to) = х«.

На этом заканчивается доказательство, что наблюдатель Калмана-Бьюси, определяемый соотношением (10.192)- (10.195), является линейным оптимальным наблюдателем.

Пример 10.24. Рассмотрим задачу определения оптимальной оценки скалярной постоянной величины х по измерениям у (<) = х+ V„ (/), где Vh (t) - белый шум с интенсивностью Гд.

До начала измерения известны следующие характеристики х:

Мх = т; М (х - т)* = ро.

Искомая величина и шум независимы. Учитывая уравнение х =0, рассматриваемую задачу можно сформулировать как задачу линейной оптимальной оценки. В данном случае

А=0. В=0. Qo = 0

и наблюдатель Калмана - Бьюси описывается уравнением

x=fc»(-х). X (<о)«"/п. . . • где k" - р/го; р определяется из уравнения

p-,filr„. р(<о)=Ро-

Как легко проверить,

Р = Роо/(Го-+-РоО. k-PaHro + Pot).

Заметим, что хотя х - константа, ее оценка х является функцией времени: с течением времени оценка уточняется и при < ->- оо стремится к X. Это следует нз того, что дисперсия ошибки при /->-оо стремится к нулю:

limр= lim [ро ro/{ro-f Ро 01 =0.

/-►оо /-+-00

Дисперсионное уравнение. Покажем, что матрица Р, .определяемая из уравнения (10.194), является дисперсионной матрицей ошибок для оценки, получаемой наблюдателем Калмана-Бьюси. С этой целью сначала получим уравнение для дисперсионной матрицы стохастического процесса 2 (<), описываемого уравнением

. i==C(0z + H(0w-f h(0: 2(g=z«, (10.212)



(10.213)

где G (О - {tl X п)-матрица; Н {t) - (n X т)-матрица; h (t) - детерминированная функция; w {t) - белый шум с интенсивностью S (t); гР - случайный вектор с математическим ожиданием z" и матрицей дисперсий Q (t); z" и w не кор-релированы.

Пусть Z {t, 4) - нормированная фунцаментальная матрица. Тогда

z(t. g = G(OZ(<. Q; Z{t„, /о) = Е; t

z (О = Z {t, to) z« f Z {t, t) [H (t) w (t) + h (t)l dx.

Так как, очевидно,

*

z (О - Mz (t) = Z {t, to) + J Z (t. t) h (T) dx.

to для центрированного процесса z (/) = z {t) - z (/) имеем

I (0 = Z {t, to) z (to) -t- j Z (t, X) H (t) w (t) dr.

Используя это выражение, для корреляционной матрицы Кг у получаем

R,(f,. g-z(. gQoZ(f2. g+ "

min «,)

+ J Z (f„ t) H (t) S (t) (t) (fa. t) dT. (10.214)

Дисперсионная -матрица • • v.-,-.

Q(t) = RAt. n = Z {t, to) Qo Z (f. to) Л- • - 7

+ j Z (f, tj H (t) S {x)W (t) гг {t, x) dx. (10.215)

! Используя тождества Z {t, t) = Z (fg, fj) Z (ifi, т) при ,)(*а > jf„ Z (<i, t) = Z (1, g Z (/2. t) при 4 > fa и выражение ;<10.125) для Q (t), соотношение (10.214) для корреляционной матрицы можно преобразовать к виду

Q{tt)P(ti, tl) при 2jg

Z«i. «2)Q(MnpH><a.



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [ 121 ] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0011