Главная  Нелинейные системы управления 

[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [ 134 ] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

постепенном накапливании, запоминании и анализе информации о поведении системы и изменении законов функционирования в зависимости от приобретаемого опыта. К процессу обучения приходится прибегать тогда, когда не только мал объем априорных сведений об объекте, но и отсутствует возможность установления детальных причинно-следственных связей в структуре самой системы из-за ее сложности.

Накопление и обобщение информации в процессе обучения можно осуществлять за счет внесения «эталонного опыта» в систему извне либо путем формирования такого опыта внутри системы. Например, в первом случае обучаемой системе предъявляют последовательность ситуаций, образов или режимов", которые имеют заранее известные характеристики или различаются по принадлежности определенным классам. Поведение системы в ответ на такую обучакяцую последовательность ситуаций формируют на основе принципа «поощрение- наказание», т. е. правильная реакция системы на предъявленную ситуацию запоминается и используется для организации контролируемых изменений динамических свойств системы управления. В зависимости от способов накопления опыта указанные системы разделяют на обучающиеся с поощрением и обучающиеся без поощрения (самообучающиеся) системы.

Значительный интерес к адаптивным системам управления ведет к созданию разнообразных типов систем, предназначаемых для решения широкого круга задач автоматического управления. При построении адаптивных систем часто используют сочетания различных принципов, например самонастройки и обучения, в этом случае создаются комбинированные адаптивные системы управления, наделяемые полезными свойствами различных систем.

§ 11.3. Самонастраивающиеся системы

Структурная схема самонастраивающейся системы управления представлена на рис. 11.2. К основному контуру управления, состоящему из регулятора Р и объекта О, добавлен контур самонастройки КС, с помощью которого осуществляется коррекция параметров и алгоритма управления регулятора.

Основная задача самонастраивающейся системы заключается в поддержании заданной в виде функционала J [х (/),



f(t)

y(t)

C(t)=x(t)-y(t)

Рис. 11.2

8 (t), у (t), и {t), t {t), tl меры качества системы вблизи экстремального значения при изменениях в процессе функционирования системы входных управляющих воздействий х (t), возмущающих воздействий f (t), а также динамических характеристик объекта.

Так как значение функционала качества J изменяется при действии указанных возмущений, то для выполнения основной задачи возникает необходимость в определении условий экстремума.

Если время, требующееся для определения условий экстремума, не является критическим фактором, например в случае сравнительно медленного изменения значейий функционала качества J в процессе управления, тогда целесообразно применять для определения условий экстремума поисковые методы.

Беспоисковые методы определения условий экстремума не требуют специальных затрат времени на поисковые движения и используют, как правило, аналитические методы определения указанных условий.

Сравнивая поисковые и беспоисковые самонастраивающиеся системы, можно сказать, что для определения условий экстремума поисковые системы нуждаются в меньшей информации, но обладают небольшим быстродействием при наличии процесса поиска, а беспоисковые системы при прочих равных условиях обладают более высоким быстродействием, но требуют более полной информации об управляемом процессе.

Принципы построения поисковых самонастраивающихся систем. Задача поисковой самонастройки формулируется следующим образом. Предполагается, что имеется множество состояний системы {Xi, Х2,Хп) =Х, которое является областью определения целевой функции или функционала качества системы

J (Xi, Хг, Хп). (11.1)

Из множества состояний X необходимо выбрать определенные состояния

hjhjixi, .Xi,..., Хп), (11.2)



где / = 1. 2, .... т, при которых обеспечивается экстремальное значение функционала качества

J (Xi, ЛГг, Х„) = Уо- (11.3)

Связь между экстремальным значением функционала качества и предпочтительными состояниями системы из множества X не задана в явном виде, и требуемый выбор обеспечивается путем последовательного приближения к решению в результате опробования различных состоянии системы. Таким образом, существенной чертой самонастраивающихся систем данного класса является наличие процесса поиска как последовательной, итеративной процедуры выбора одного из множества возможных путей для достижения поставленной цели.

Поиск экстремума может осуществляться различными способами, начиная от простого просмотра всех имеющихся в наличии состояний системы и кончая сложными вероятностными процедурами сравнения вариантов выбираемых путей. На сложность процедуры поиска влияют многие факторы: а) общее число состояний или параметров системы в области поиска (с увеличением множества состояний приходится принимать специальные меры для ускорения процедуры поиска экстремума); б) вид целевой функции, которая может быть унимодальной или обладать многими экстремумами (в случае многоэкстремальных функций процедуры поиска не должны заканчиваться в окрестности локальных экстремумов); в) дрейф экстремума, приводящий к ошибкам и нарушениям в поиске; г) ограничения области поиска, длительности поиска и точности используемой информации; д) непрерывность или дискретность поиска и т. д.

Все методы поиска подразделяются на регулярные и случайные. В регулярных методах поиска выбор направления поискового движения осуществляется по заранее заданному закону, а в случайных методах направление к экстремуму «на-щупывается» случайным образом.

Регулярные методы поиска экстремума

Сканирование. Сканирование или полный перебор используют для определения экстремума функционала качества J (л;*), где X* - значение управляемого параметра в точке экстремума, в том случае, если имеется информация только



[0] [1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [50] [51] [52] [53] [54] [55] [56] [57] [58] [59] [60] [61] [62] [63] [64] [65] [66] [67] [68] [69] [70] [71] [72] [73] [74] [75] [76] [77] [78] [79] [80] [81] [82] [83] [84] [85] [86] [87] [88] [89] [90] [91] [92] [93] [94] [95] [96] [97] [98] [99] [100] [101] [102] [103] [104] [105] [106] [107] [108] [109] [110] [111] [112] [113] [114] [115] [116] [117] [118] [119] [120] [121] [122] [123] [124] [125] [126] [127] [128] [129] [130] [131] [132] [133] [ 134 ] [135] [136] [137] [138] [139] [140] [141] [142] [143] [144] [145] [146] [147] [148] [149] [150] [151] [152] [153] [154] [155] [156] [157] [158] [159] [160] [161] [162] [163] [164] [165] [166]

0.0011