Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [ 139 ] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

где Ме - математическое ожидание.

Из (11.46) можно сделать вывод о том, что получение функции качества в детерминированном виде связано с необходимостью вычисления интеграла либо при жестких ограничениях на характер случайных воздействий е, либо при известных вероятностных характеристиках изменения таких воздействий. Однако обычно имеется только информация об отдельных реализациях случайной функции Н (х, е).

При поиске экстремума дифференцируемой функции качества J (х) все п частных производных dJ (xldxi, i = \ , 2, n, должны обращаться одновременно в нуль, т. е.

grad J (х) = 0. (11.48)

В результате замены J (х) на Mg [Н (х, е)1 условия экстремума принимают следующий вид:

grad Me [Я (X. 8)1 = О, (11.49)

или, учитывая линейность операций, можно записать

Ме [grad Н (х, 8)1 = Ме [grad (дН (х,

8/5x1, дН (X, е)/5х„.....5Я(х, 8)/Эх„1 = 0. (11.50)

Осуществляя итеративную процедуру стохастической аппроксимации, определяем состояние х*, соответствующее экстремальному значению Н* (х, 8), постепенно приближаясь к нему:

х,+ 1 Xi-Ai grad Н (Х;, е). (11.51)

Таким образом, при отсутствии точного знания функции качества J (х) следует заменить ее стохастической оценкой Н (х, 8) и далее оперировать с этой оценкой при поиске точки экстремума х*.

В том случае, если Н (х, е) представима в виде скалярной функции скалярного аргумента х и случайного параметра е, процедура стохастической аппроксимации сводится к процедуре определения корня этой скалярной функции или к так называемой процедуре Роббинса-Монро. Пусть

Я(х,е) = £(х,8). (11.52)

где L (х, е) - скалярная функция от параметра состояния х.



функцию L (х, е) можно представить в виде суммы регулярной составляющей / (х) н случайной составляющей е, причем математическое ожидание М (е) = О, т. е. случайная составляющая центрирована.

В результате поиска определяют корень х* регулярной составляющей / (х), т. е.

/(*) = 0. (11.53)

в соответствии с процедурой

+ 1 =Xi-~aGL (£•;, X,). (11.54)

где а - знак наклона регулярной составляющей / (х) в точке X* (для минимума «-f», для максимума «-»); а - постоянная, определяющая наклон аппроксимированной прямой к / (х).

Если функция L (х, е) является однопараметрической функцией регрессии, задана своими реализациями Н (х,-, и можно дать точечную оценку ее градиента grad Н (х, е) = = dH (X, e)/dx, т. е.

dH (xi, e)/dx ~ (1/2Д01Я (Xi-f Д„ в,)~Н (х-А,, е)]. (11.55)

где Л( - интервал оценки производной, то поиск экстремума функции L (х, е) сводится к поиску корня функции регрессии регулярной части L (х, е) в соответствии с процедурой Кифера-Вольфовица:

х,+ 1 =Хг-а (аг/2Д,) [Н (х + Д,-, е,)-Н (х-Д, ео)1, (11.56) + 1 для min, - 1 для max.

В случайном поиске по статистическому градиенту из исходного состояния Xj делается т случайных пробных шагов: af,.,, d£?+„ aE+, .... аЕ . В новых точках х{ , = = Xj -f a£{j, / = 1, 2, .... m, вычисляют значения функции качества / (xj -f 1), / = 1, 2, m, и соответствующие приращения функции качества:

ду/ = у/ (X, + \)~J (Xj). (11.57)

После этого вычисляется вектор статистической оценки градиента в точке Xj, т. е.

Vy(Xi)== Ej[Jix.+ i)~J {Xi)],il....,n. (11.58)

где а =



в пределе при тоо статистическая оценка VJ{xi) совпадает с направлением градиента функции качества, поэтому рабочий шаг производится в направлении полученной оценки


(11.59)

Рис. 11.11

где II V/(Xj) - норма вектора статистического градиента; а - величина рабочего шага.

Таким образом, в случайном поиске по статистическому градиенту число точечных измерений статистической оценки градиента может быть меньше по сравнению с методами стохастической аппроксимации (/п <Г п).

Глобальный случайный поиск с независимым выбором плотности распределения пробных шагов. Процедура поиска значительно усложняется в тех случаях, когда функция качества является не унимодальной, а многоэкстремальной (рис. 11.11). Практически все рассмотренные способы поиска локального экстремума не могут быть использованы без специальных модификаций для поиска глобального экстремума. Исключение составляет метод полного перебора. Однако на практике им пользоваться бывает неудобно из-за слишком больших затрат времени на поиск. Как правило, методы поиска глобального экстремума базируются на статистических принципах.

Это объясняется тем, что поиск статистическими методами позволяет управлять плотностью распределения независимых пробных шагов и сосредоточивать поисковые шаги в местах наиболее вероятного нахождения глобального экстремума.

Глобальный случайный поиск с независимым выбором плотности распределения пробных шагов может быть описан следующей рекуррентной формулой:

Xi-i при J (Xi) > г (х/ ,); Xi при J (Xi) < J° (xi-1); r{Xii) при J (Xi)J (xi-i);

nXi) при J (Xi) <Z J (Xii),

(11.60)



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [134] [135] [136] [137] [138] [ 139 ] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0014