ПОИСК Статьи Чертежи Таблицы Идентификационный подход к адаптивному программному управлеКонцепция алгоритмического конструирования адаптивных систем программного управления из "Адаптивные робототехнические комплексы " Для компенсации возникающей неопределенности необходимо, чтобы система управления самостоятельно отыскивала недостающую информацию в процессе адаптации РТК к фактической обстановке. В этом случае появляется принципиальная возможность получить такое качество переходных процессов, которое достижимо лишь при точном знании уравнения динамики (3.1). [c.70] Компенсацию априорной неопределенности и оценивание неизвестных величин можно осуществлять по-разному. В теории адаптивных систем наиболее распространены два подхода, которые будем условно называть идентификационным и безыдентифи-кационным . Суть идентификационного подхода заключается в воздействии на двигательную систему РТК определенными тестовыми управляющими воздействиями и в фиксации с помощью информационной системы характеристик реального движения, порожденного этими пробными воздействиями. В результате такого зондирования РТК получается система уравнений относительно неизвестных параметров Решая эту систему алгебраических уравнений тем или иным методом, можно идентифицировать неизвестные параметры. После этого найденные оценки можно подставить в синтезированные законы управления, например в законы (3.12). [c.70] Процесс идентификации неизвестных параметров целесообразно совместить с процессом управления. При этом управление служит двум целям. С одной стороны, оно выступает как средство изучения динамики РТК путем текущей идентификации его параметров, с другой — закон управления, использующий идентифицированные параметры, обеспечивает желаемый характер переходных процессов при отработке ПД. В этом проявляется дуальность управления с идентификацией. [c.70] Настройка параметров т модели (3.21) производится в силу некоторого алгоритма, который нужно построить исходя из заданного критерия идентификации. При этом оценки г вычисляются согласно (3.21) по заданному (тестовому) управлению и, измеренному текущему состоянию х и сформированной оценке т. [c.71] Этот показатель, связывающий выходы модели г и скорость изменения вектора состояний х, особенно удобен в том случае, когда параметры I не фиксированы, а дрейфуют по неизвестному закону. В этом случае целесообразно рассматривать скользящий интервал идентификации, для которого to = t, tj = t + Т. [c.71] Идентификация неизвестных параметров сводится к решению уравнения (3.23). [c.71] Описанная схема адаптивной идентификации представлена на рис. 3.1. Она привлекательна своей простотой. Однако ей присущ ряд недостатков. [c.72] Среди них нужно особо выделить рассматриваемый ниже оптимальный многошаговый алгоритм с полной памятью . Этот алгоритм гарантирует точную идентификацию неизвестных параметров i, причем число его шагов не превышает размерности пространства настраиваемых параметров [109]. [c.73] Концепция дуального управления исходит, по суш,еству, из постулата, что для эффективного управления нужно уметь идентифицировать динамическую модель РТК- Первоначально эта концепция зародилась в теории стохастического управления [101, 136 J. Здесь принцип дуальности оказался особенно плодотворным, так как позволил увязать результаты классической теории управления с методами стохастической аппроксимации и оценивания. Важную роль дуальное управление сыграло и в становлении теории адаптивных систем. [c.73] Однако постепенно было осознано, что точная идентификация не является необходимым условием эффективного управления. Было четко установлено [101, 107, 132], что для успешного управления вовсе не требуется детально изучать динамические свойства объекта управления. На справедливость этого тезиса наводят и физиологические соображения управляя рукой, мозг отнюдь не утруждает себя точной идентификацией массы или моментов инерции предмета, которым рука манипулирует. [c.73] Существуют и более веские доводы, свидетельствующие об ограниченности, а в ряде случаев непригодности концепции дуального управления в робототехнике. Один из них — трудоемкость и сложность осуществления точной идентификации — уже обсуждался выше. Другой связан с тем, что в ряде конкретных задач точная идентификация принципиально невозможна. К числу таких задач относятся, например, все задачи, в которых действуют неконтролируемые возмущения. В этих задачах движения РТК описываются уравнением (3.1), зависящим от постоянно действующих возмущений п (/). Для решения таких задач, особенно характерных для ГАП, приходится опираться на какие-то иные, неидентификационные принципы адаптации. Перейдем к рассмотрению этих принципов и реализующих их алгоритмов. [c.73] Перейдем к описанию общей схемы алгоритмического синтеза законов адаптивного программного управления, гарантирующих желаемый характер переходных процессов при осуществлении заданного ПД в недетерминированных и изменяющихся производственных условиях. Специфические особенности динамической модели РТК позволяют разделить сложную задачу алгоритмического синтеза адаптивного управления ПД на две самостоятельные задачи. [c.74] Первая задача заключается в аналитическом синтезе идеального (неадаптивного) закона управления, обеспечивающего желаемый переходный процесс в предположении, что параметры уравнения динамики (3.1) полностью известны, а возмущения л отсутствуют. Методы и алгоритмы решения этой задачи в различных ее формах (стабилизация ПД, оптимальное терминальное управление и самонаведение) подробно рассмотрены в работах [89—91, 107, 112, 113, 119]. [c.74] Вторая задача — это синтез алгоритмов адаптивной настройки (самонастройки) параметров законов управления, полученных в результате решения первой задачи. Методы синтеза алгоритмов самонастройки, представляющие основной интерес для адаптивного управления РТК, излагаются в следующем параграфе. [c.74] Конкретизируем общую схему решения сформулированных задач с учетом специфических особенностей динамики РТК. С этой целью сначала синтезируем по заданному ПД Хр (/) идеальный (неадаптивный) закон управления, обеспечивающий желаемый характер переходных процессов. Семейство приемлемых законов управления ПД описывается формулой (3.12). Реализация любого закона управления из этого семейства требует точного знания вектора параметров . Однако, как отмечалось выше, эти параметры обычно неизвестны, поэтому синтезированные законы управления вида (3.12) заданы, по существу, с точностью до параметров . [c.74] Уточним понятие цели управления в условиях неполной информации. Система управления РТК должна гарантировать желаемый характер переходных процессов, должна привести к этому несмотря на имеющуюся неопределенность. Поэтому цель адаптивного управления удобно формулировать в терминах свойств переходных процессов. При этом формализация и конкретизация цели управления зависит от решаемой технологической задачи или режима эксплуатации РТК. Так, в задаче адаптивной стабилизации ПД целью управления является обеспечение желаемого характера ПП, гарантирующего асимптотическую устойчивость ПД. Тем самым обеспечивается отслеживание ПД с заданной точностью е, т. е. выполняется целевое условие (3.16). В задаче адаптивного терминального управления цель управления состоит в достижении наперед заданного состояния за заданное время технологической операции Т = tr — о, т. е. должно выполняться целевое условие вида (3.17). [c.75] Важно подчеркнуть, что названные цели управления ввиду нестационарности и неопределенности условий эксплуатации РТК должны достигаться для любых возможных значений неизвестных параметров и возмущения я из класса неопределенности jQ , Q,-, . Если система управления, реализующая закон управления (3.27) и алгоритм адаптации (3.15), сконструирована так, что цель управления достигается для любых неизвестных параметров и возмущений я из заданного класса неопределенности, то будем говорить, что РТК адаптивен в этом классе. Поскольку класс неопределенности, задаваемый информационными ограничениями (3.4) и (3.5), может быть практически любым, речь идет по существу об адаптации в широком смысле. [c.75] Проблема синтеза алгоритмов адаптации тесно связана с проблемой контроля качества переходных процессов в ходе управления. Для формализации функции контроля введем критерий качества адаптации. К сожалению, указать универсальный критерий, охватывающий с единых позиций все практически интересные случаи, весьма затруднительно. Поэтому ограничимся примерами наиболее характерных критериев качества, хорошо приспособленных к задачам адаптивного программного управления РТК. [c.75] Процесс адаптации с критерием качества (3.28) сводится к поиску решения системы эстиматорных неравенств. Это соображение наводит на мысль о том, что в качестве алгоритмов адаптации можно использовать соответствующие модификации алгоритмов выпуклого программирования. Значительный интерес представляют также разного рода рекуррентные алгоритмы вида (3.15), обладающие свойством конечной сходимости [109, 132]. В конкретных задачах адаптивного управления с идентификацией удобны эстиматорные неравенства вида (3.26). Легко видеть, что эти неравенства также выпуклы и разрешимы с запасом б О при т = и л = 0. Для их решения опять-таки применимы соответствующие модификации алгоритмов выпуклого программирования, которые выступают здесь как алгоритмы адаптивной идентификации неизвестных параметров. [c.76] Данная схема отражает описанную выше концепцию алгоритмического конструирования адаптивных систем программного управления РТК. Поскольку гибкие алгоритмы программирования и адаптивные задачи управления РТК достаточно сложны, то для их реализации целесообразно применять современные быстродействующие ЭВМ и микропроцессоры. [c.77] Вернуться к основной статье