Главная Нелинейные системы управления [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [ 121 ] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] является несмещенной и доставляет минимум (10.196) при любом а. Продифференцируем (10.211) и, используя (10.208), получим х=К»у + (А-К«С) 5Z(T)K(t)y(T)dT + Z(/. f„)xO или, принимая во внимание (10.211), Г= К» у -(А-К" С)х == А+К" (у-Сх). Из (10.211) при t-U получаем х {Q = х". Итак, для случая и (f) = О показали, что наблюдатель Калмана-Бьюси действительно является линейным оптимальным наблюдателем. Перейдем к случаю и (t) ф 0. Представим фазовый вектор в виде суммы 19]: х = х(> + х>. где слагаемые удовлетворяют уравнениям x<> = Ax<-hVo; х"(д = хв; =Ах-ЬВи; х=(д=-0. Вектор наблюдения также представим в виде двух составляющих: у = у<) 4- у<\ где y<i> = Cx"-f V„; у=Сх. Составляющие х<> (t) и у<*) (/) однозначно определяются из уравнений. Составляющая у> (О легко определяется по измерениям у (0: у" (О-у (О-У*(О- Таким образом, задача оптимальной оценки при и () О свелась к оценке х< {t) по у<) (т), tg t, - задаче оп- тимальной оценки при U {f) = 0. Для линейной оптимальной оценки х<*> имеем [см. (10.192)1 <)=.А"--К«(У-Сх«");9(д -х«. где К" определяется из (10.193)-(10.195). Очевидно, оптимальная оценка х {f) равна сумме: iirjT-i-x*. Продифференцировав это выражение, получим 1 = ?ч >х<= А "х И-Ви -1-К" (у" - Сх"). или, принимая во внимание равенство у<*) = Сх*\ = Ах+ Ви + К" (у -Сх), X (to) = х«. На этом заканчивается доказательство, что наблюдатель Калмана-Бьюси, определяемый соотношением (10.192)- (10.195), является линейным оптимальным наблюдателем. Пример 10.24. Рассмотрим задачу определения оптимальной оценки скалярной постоянной величины х по измерениям у (<) = х+ V„ (/), где Vh (t) - белый шум с интенсивностью Гд. До начала измерения известны следующие характеристики х: Мх = т; М (х - т)* = ро. Искомая величина и шум независимы. Учитывая уравнение х =0, рассматриваемую задачу можно сформулировать как задачу линейной оптимальной оценки. В данном случае А=0. В=0. Qo = 0 и наблюдатель Калмана - Бьюси описывается уравнением x=fc»(-х). X (<о)«"/п. . . • где k" - р/го; р определяется из уравнения p-,filr„. р(<о)=Ро- Как легко проверить, Р = Роо/(Го-+-РоО. k-PaHro + Pot). Заметим, что хотя х - константа, ее оценка х является функцией времени: с течением времени оценка уточняется и при < ->- оо стремится к X. Это следует нз того, что дисперсия ошибки при /->-оо стремится к нулю: limр= lim [ро ro/{ro-f Ро 01 =0. /-►оо /-+-00 Дисперсионное уравнение. Покажем, что матрица Р, .определяемая из уравнения (10.194), является дисперсионной матрицей ошибок для оценки, получаемой наблюдателем Калмана-Бьюси. С этой целью сначала получим уравнение для дисперсионной матрицы стохастического процесса 2 (<), описываемого уравнением . i==C(0z + H(0w-f h(0: 2(g=z«, (10.212) (10.213) где G (О - {tl X п)-матрица; Н {t) - (n X т)-матрица; h (t) - детерминированная функция; w {t) - белый шум с интенсивностью S (t); гР - случайный вектор с математическим ожиданием z" и матрицей дисперсий Q (t); z" и w не кор-релированы. Пусть Z {t, 4) - нормированная фунцаментальная матрица. Тогда z(t. g = G(OZ(<. Q; Z{t„, /о) = Е; t z (О = Z {t, to) z« f Z {t, t) [H (t) w (t) + h (t)l dx. Так как, очевидно, * z (О - Mz (t) = Z {t, to) + J Z (t. t) h (T) dx. to для центрированного процесса z (/) = z {t) - z (/) имеем I (0 = Z {t, to) z (to) -t- j Z (t, X) H (t) w (t) dr. Используя это выражение, для корреляционной матрицы Кг у получаем R,(f,. g-z(. gQoZ(f2. g+ " min «,) + J Z (f„ t) H (t) S (t) (t) (fa. t) dT. (10.214) Дисперсионная -матрица • • v.-,-. Q(t) = RAt. n = Z {t, to) Qo Z (f. to) Л- • - 7 + j Z (f, tj H (t) S {x)W (t) гг {t, x) dx. (10.215) ! Используя тождества Z {t, t) = Z (fg, fj) Z (ifi, т) при ,)(*а > jf„ Z (<i, t) = Z (1, g Z (/2. t) при 4 > fa и выражение ;<10.125) для Q (t), соотношение (10.214) для корреляционной матрицы можно преобразовать к виду Q{tt)P(ti, tl) при 2jg Z«i. «2)Q(MnpH><a. [0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [ 121 ] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166] 0.0013 |