Введение
Анализ управляемых динамических систем тесно связан с построением их областей достижимости и управляемости. Так, например, задача с терминальным критерием качества может быть сведена к оптимизационной задаче по терминальному состоянию на множестве достижимости за время функционирования системы [1-4]. При рассмотрении вопросов стабилизации множества управляемости определяют те начальные состояния, для которых данная задача разрешима в принципе [5-6]. Отдельно следует упомянуть задачу быстродействия [7-8], для которой множества 0-управляемости фактически представляют собой множества уровня функции будущих потерь, из-за чего использование метода динамического программирования [Беллман, 1960] неразрывно связан с построением данных множеств.
Наибольшую эффективность аппарат множеств достижимости и управляемости демонстрирует при изучении систем с дискретным временем [2-3]. Во многом это связано с тем, что последовательности этих множеств могут быть построены рекуррентным образом и в ряде случаев данная процедура сводится к стандартным операциям выпуклого анализа [Рокафеллар, 1973]. С другой стороны, на практике работа с непрерывными системами часто осуществляется при помощи дискретизации [Мордухович, 1988], что делает неизбежной аппроксимацию исходных множеств достижимости и управляемости их дискретными аналогами. Однако устремление к нулю шага дискретизации приводит к тому, что конечное непрерывное время начинает описываться бесконечным числом шагов системы дискретной. Это делает актуальным, с одной стороны, исследование вопросов сходимости последовательности множеств дискретной системы к множествам непрерывной системы [Зыков, 2022], с другой стороны, не менее важной оказывается задача построения и исследования свойств предельных множеств дискретной системы непосредственно [13-18].
Известны аналитические представления множеств достижимости и 0-управляемости для линейных систем с дискретным временем и ограничениями на функцию управления в смысле -нормы. В частности, доказано, что в случае линейных ограничений на управление множества достижимости и 0-управляемости за конечное число шагов представляют собой многогранники [Ибрагимов, 2021]. Для их предельных аналогов сформулированы необходимые и достаточные условия ограниченности [19-21].
Случай суммарных ограничений на управление в смысле -нормы является менее изученным, и основные результаты по данной тематике представлены в [16-18]. В [17-18] подробно рассмотрен случай . В частности, представлены необходимые и достаточные условия ограниченности предельных множеств достижимости и 0-управляемости, явным образом описана структура их опорных гиперплоскостей, а также предложен эффективный метод формирования внешних оценок произвольного порядка точности на основе принципа сжимающих отображений. В то же время случай рассмотрен значительно менее подробно: доказаны только достаточные условия ограниченности, а описание их полиэдральной структуры представлено в весьма общем виде.
Целью данной статьи является расширение и уточнение результатов [Ибрагимов, 2022]. В частности, необходимо сформулировать и доказать строгий критерий ограниченности множеств достижимости и 0-управляемости линейных систем с дискретным временем и суммарными -ограничениями на управление. Также требуется определить условия, когда исследуемые множества представляют собой многогранники, и построить их явное описание в этом случае. Полученные теоретические результаты предполагается проиллюстрировать различными примерами численного моделирования систем с дискретным временем.
Постановка задачи
Рассматривается автономная линейная система с дискретным временем и суммарными
-ограничениями на скалярное управление:
|
(1)
|
где – вектор состояния, – управляющее воздействие на -ом шаге, – матрицы системы. Заданное ограничение является ограничением на -норму управления . В ряде случае будет предполагаться, что выполнено ранговое условие Калмана:
|
(2)
|
Для произвольного обозначим через множество достижимости системы (1), т.е. множество тех состояний, в которые можно перевести систему (1) за шагов из 0 посредством выбора допустимого управления:
|
(3)
|
Введем также предельное множество достижимости – множество тех состояний, в которые можно перевести систему (1) за конечное число шагов из 0 посредством выбора допустимого управления:
|
(4)
|
Аналогично для произвольного обозначим через множество 0-управляемости системы (1), т.е. множество тех начальных состояний, из которых можно перевести систему (1) за шагов в 0 посредством выбора допустимого управления:
|
(5)
|
И также введем предельное множество 0-управляемости – множество тех начальных состояний, из которых можно перевести систему (1) за конечное число шагов в 0 посредством выбора допустимого управления:
|
(6)
|
Обозначим через спектр матрицы , т.е. множество всех собственных значений с учетом кратности, и приведем следующие известные результаты.
Лемма 1 ([16, лемма 1]). Пусть семейства множеств
и
для системы (1) определяются соотношениями (3) и (5) соответственно,
. Тогда
-
1.множество допускает представление
-
2.если , то множество допускает представление
Теорема 1 ([16, теорема 1]). Пусть множества
и
для системы (1) определяются соотношениями (4) и (6) соответственно. Тогда
-
если система (1) устойчива, т.е. , то существует такая величина
- , что
-
2.если система (1) неустойчива, т.е. , то существует такая величина
- , что
Можно заметить, что теорема 1 задает исключительно достаточные условия ограниченности множеств (4) и (6), которые являются в действительности довольно жесткими. В [Ибрагимов, 2023] для случая -ограничений на управление продемонстрировано, что необходимые и достаточные условия ограниченности предельных множеств достижимости и 0-управляемости в действительности зависят от соотношения и , а не только от спектрального радиуса . С другой стороны, теорема 1 в совокупности с леммой 1 гарантируют, что множества (4) и (6) при определенных условиях окажутся многогранниками, однако в [Ибрагимов, 2022] не дается конструктивных указаний на то, как априорно вычислить величины и .
В данной работе требуется определить необходимые и достаточные условия ограниченности предельных множеств достижимости (4) и 0-управляемости (6), а также построить верхние оценки величин и :
Априорные оценки и
На основе утверждений из выпуклого анализ и матричной алгебры предложим способ априорного оценивания величин и из теоремы 1.
Лемма 2. Пусть семейства множеств
и
для системы (1) определяются соотношениями (3) и (5) соответственно. Тогда
-
если , то для любого также выполнено включение
;
-
если и , то для любого также выполнено включение ;
Доказательство. Докажем сначала пункт 1. Пусть . Тогда в силу пункта 1 леммы 1 найдутся такие, что
Предположим, что для некоторого выполнено включение
Тогда в силу пункта 1 леммы 1 верно, что
Отсюда получаем включение
Таким образом, по принципу математической индукции для любого .
Пункт 2 доказывается в силу леммы 1 аналогично при замене на , на .
Лемма 2 доказана.
Обозначим для произвольного и выпуклого , содержащего в качестве внутренней точки, через функционал Минковского [22, разд. 3, §2, Гл. III]:
Также для произвольной квадратной матрицы определим следующую норму:
Данная матричная норма в действительности является операторной нормой для случая, когда в введена норма
Согласно лемме 2 величины и однозначно определяются включениями
С учетом определения функционала Минковкого данные включения эквивалентны неравенствам
Данные неравенства в общем случае достаточно сложно разрешить из-за неявной зависимости функционала Минковского в левой части от или . Однако для случаев можно получить простые верхние оценки и , используя более строгие условия
которые в свою очередь эквивалентны неравенствам
|
(7)
|
|
(8)
|
Представим точное выражение для функционалов Минковского и для управляемых систем в виде следующей леммы.
Лемма 3. Пусть выполнено условие (2), семейства множеств
и
для системы (1) определяются соотношениями (3) и (5) соответственно. Тогда
-
справедливы соотношения
-
2.если , то справедливы соотношения
Доказательство. Докажем сначала пункт 1. Из определения (3), полагая , получим цепочку равенств
Учтем, что из (2) следует обратимость матрицы , и получим следующие соотношения для функционала Минковского:
Окончательно, в силу неравенства Гельдера
Пункт 2 доказывается в силу леммы 1 аналогично при замене на , на и на .
Лемма 3 доказана.
Обозначим через наименьшее целое, которое не меньше чем :
При помощи леммы 3 построим величины и явным образом для случая, когда диагонализируема.
Теорема 2. Пусть верно (2), множества
и
для системы (1) определяются соотношениями (4) и (6) соответственно, матрица
диагонализируема, т.е. существуют невырожденная матрица
и числа
,
,
такие, что
|
(9)
|
Тогда для
-
если система (1) устойчива, т.е. , то
-
2.если система (1) неустойчива, т.е. , то
Доказательство. Докажем сначала пункт 1. Из спектрального разложения (9) для любого
следует представление
Тогда верны соотношения
Рассмотрим оптимизационную задачу
Применяя метод множителей Лагранжа, можно установить, что
Если положить
то для всех верны оценки
Таким образом, окончательно справедливы оценки
С учетом леммы (3)
Тогда неравенство будет следователь из условия
|
(10)
|
Положим и получим из (7) искомые оценки
Из последнего неравенства следует пункт 1 теоремы 2.
Для доказательства пункта 2 проведем аналогичные рассуждения, заменив в силу леммы 1 на , на и на . Учтем, что собственные значения и взаимнообратны и выберем в условии (10):
Отсюда в силу (8) следуют искомые оценки
Из последнего неравенства следует пункт 2 теоремы 2.
Теорема 2 полностью доказана.
Заметим, что в теореме 2 возможны ситуации, когда , т.е. все собственные значения существенно комплексные, и когда , т.е. все собственные значения действительные. В этих случаях оценки, представленные в теореме 2, несколько упрощаются. Важным является частный случай , так как для него возможно только две ситуации: , или
, . Приведем оценки для двумерных систем в виде следствия.
Следствие 1. Пусть выполнены предположения теоремы 2,
. Тогда для
-
если система (1) устойчива, т.е. , то
-
2.если система (1) неустойчива, т.е. , то
Доказательство. Доказательство следствия 1 вытекает непосредственно из теоремы 2 при замене .
Необходимые и достаточные условия ограниченности множеств ,
В [Ибрагимов, 2023] доказано, что для случая суммарных -ограничений на управление ограниченность множеств , определяется соотношением и . В частности, разложением по вещественному жорданову базису матрицы .
Жордановым базисом матрицы называется набор линейно независимых векторов , который задает преобразование подобия матрицы в ее вещественную жорданову каноническую форму [23, разд. 3.4, Гл. 3]. Такой базис единственен с точностью до ненулевых сомножителей и порядка векторов , и каждый базисный вектор соответствует некоторой жордановой клетке, т.е. некоторому собственному значению матрицы . Если разбить элементы жорданова базиса на три множества по критерию того, соответствуют ли они собственному значению матрицы большему, равному или меньшему 1 по модулю, то получится определить следующие три инвариантных подпространства:
Заметим, что не включает в себя присоединенные векторы, соответствующие собственному значению .
Теорема 3. Пусть множества
и
для системы (1) определяются соотношениями (4) и (6) соответственно.
-
множество ограничено тогда и только тогда, когда
-
2.множество ограничено тогда и только тогда, когда и
Доказательство. Докажем сначала пункт 1. Обозначим через пространство суммируемых числовых последовательностей:
Предельное множество достижимости в силу определений (3), (4) и [17, лемма 9] с точностью до замыкания является проекцией шара из нормированного пространства на конечномерное пространство :
Отсюда следует, что множество ограничено тогда и только тогда, когда ограничен оператор
Оператор ограничен в свою очередь в том и только в том случае, когда образующие его линейные функционалы , , являются ограниченными. Это в силу теоремы Рисса [Колмогоров, 1981] эквивалентно ограниченности последовательностей . Таким образом, множество ограничено тогда и только тогда, когда последовательность ограничена.
Рассмотрим ограниченность последовательности . Пусть вектор допускает разложение
Через обозначим невырожденную матрицу, задающую преобразование к её вещественной жордановой форме:
где соответствует либо вещественному собственному значению и имеет вид
либо соответствует паре комплексно-сопряженных собственных значений :
Заметим, что в силу (11) справедливы равенства
Отсюда следует, что последовательности и ограничены одновременно. Сгруппируем координаты вектора в соответсвии с размерностями и расположением жордановых клеток в разложении (11):
Аналогично для всех обозначим
С учетом (11) для любых верно соотношение
В случае, определенном соотношением (12), для всех справедливо
где здесь и везде далее через обозначено число сочетаний из по :
Получим предсталение
Если и , то справедливы оценки:
Таким образом, последовательность сходится, а следовательно, ограничена.
Пусть и найдется такой, что . Без ограничений общности будем считать, что или . Тогда
Следовательно, не является ограниченной последовательностью.
Если же , то при любом и справедливо, что ,
, т.е. ограничена.
Пусть и , но для всех остальных . Тогда
Таким образом, для всех последовательность ограничена.
Пусть и существует такой , где . Без ограничения общности будем полагать, что или . Тогда
т.е. последовательность не ограничена.
Получаем, что в случае (12) последовательность
ограничена тогда и только тогда, когда либо , либо и для всех , либо .
Рассмотрим случай (13), и для всех введем обозначения
Для всех справедливо
Получим представление
Если и , то справедливы оценки:
Таким образом, последовательность сходится в , а следовательно, сходится и покоординатно. Т.е. также сходятся и, как следствие, ограничены последовательности и .
Пусть и найдется такой, что . Без ограничений общности будем считать, что или . Тогда
Таким образом, не является ограниченной последовательностью в . Отсюда с учетом неравенства Минковского следует, что хотя бы одна из последовательностей или также не является ограниченной.
Если же , то при любом и справедливо, что ,
, т.е. обе последовательности или являются тождественно нулевыми и, как следствие, ограничены.
Пусть и , но для всех остальных . Тогда
Таким образом, для всех последовательности и ограничены.
Пусть и существует такой , где . Без ограничения общности будем полагать, что или . Тогда
Таким образом, не является ограниченной последовательностью в . Отсюда с учетом неравенства Минковского следует, что хотя бы одна из последовательностей или также не является ограниченной.
Получаем, что в случае (13) последовательность
ограничена тогда и только тогда, когда либо , либо и для всех , либо . А в свою очередь ограниченность последовательностей и равносильна тому, что данные условия будут выполнятся для всех , что эквивалентно включению
Рассмотрим вопросы ограниченности . Если , то у матрицы существует собственный вектор , соответствующий собственному значению . Тогда согласно (5) верно включение , что с учетом (6) приводит к включению , откуда следует, что неограничено. Если , то существует матрица , собственные значения которой взаимнообратны собственным значениям [23, Гл. I]. Отсюда ясно, что доказательство пункта 2 теоремы 3 аналогично доказательству пункта 1, если заменить на .
Теорема 3 доказана.
Важно сопоставить результаты теоремы 3 с результатами [Ибрагимов, 2023]. Напомним, что в случае
-ограничений на скалярное управление при предельные множества достижимости (4) и 0-управляемости (6) оказываются ограниченными тогда и только тогда, когда и
соответственно [17, теоремы 2, 3]. Эти условия исключают возможность одновременной ограниченности этих множеств, за исключением тривиального случая . Для систем с суммарными -ограничениями, как следует из теоремы 3, такая ситуация возможна. Представим данный факт в виде следствия.
Следствие 2. Пусть множества
и
для системы (1) определяются соотношениями (4) и (6) соответственно. Тогда данные множества ограничены тогда и только тогда, когда
Доказательство. Доказательство следствия 2 следует непосредственно из теоремы 3.
Примеры
На языке Maple была написана программа, которая в соответствии с разработанными методами строит множества достижимости и 0-управляемости. В качестве фазового пространства было выбрано .
Пример 1. Пусть
|
(14)
|
Матрица собственных значений и матрица из разложения (9) имеют вид
Собственные значения матрицы по модулю меньше единицы, значит, мы имеем дело с устойчивой системой.
Искомая величина , вычисленная в соответствие с пунктом 1 следствия 1, для этой системы равна 3. На рис. 1 изображен многогранник . Также при помощи леммы 2 вычислено точное значение .
Рис. 1. Множества достижимости для системы (14)
Пример 2. Пусть
|
(15)
|
Матрица имеет только комплексно-сопряженные собственные значения. Матрица собственных значений и матрица из разложения (9) имеют вид
Модуль собственных значений матрицы меньше единицы, следовательно, система устойчива.
Априорная оценка , вычисленная в соответствии с пунктом 1 следствия 1, для этой системы равна 5. На рис. 2 изображен многогранник . Также при помощи леммы 2 вычислено точное значение .
Пример 3. Пусть
|
(16)
|
Матрица собственных значений и матрица из разложения (9) имеют вид
Собственные значения матрицы оказались больше единицы по модулю, следовательно, система является неустойчивой, а значит, мы можем для нее построить предельные множества 0-управляемости.
Априорная оценка , вычисленная в соответствии с пунктом 2 следствия 1, для этой системы равна 88. На рис. 3 изображен многогранник . Также при помощи леммы 2 вычислено точное значение .
Рис. 2. Множества достижимости для системы (15)
Рис. 3. Множества 0-управляемости для системы (16)
Пример 4. Пусть
|
(17)
|
Матрица имеет только комплексно-сопряженные собственные значения. Матрица собственных значений и матрица из разложения (9) имеют вид
Модуль комплексно-сопряженных собственных значений матрицы больше единицы, следовательно система неустойчива, поэтому можем построить предельные множества
0-управляемости.
Априорная оценка , вычисленная в соответствии с пунктом 2 следствия 1, для этой системы равна 7. На рис. 4 изображен многоугольник . Также при помощи леммы 2 вычислено точное значение .
Рис. 4. Множества 0-управляемости для системы (17)
Пример 5. Пусть
|
(18)
|
Матрица совпадает со своей вещественной жордановой формой из разложения (9):
В таком случае матрица системы имеет только комплексно-сопряженные собственные значения, равные по модулю единице. По этой причине нельзя воспользоваться результатами теорем 1 и 2 для построения предельных множества достижимости и 0-управляемости, хотя в силу теоремы 3 множества и являются ограниченными, и представляют собой круг радиуса 1 с центром в начале координат. Докажем это.
Множество достижимости является выпуклой оболочкой множества точек, полученных путем умножения возведенной в степень матрицы системы на вектор . Последовательность является плотной в окружности радиуса 1, поскольку матрица является матрицей поворота на угол, отношение которого к не является рациональным числом. То есть замыкание этого множества точек является окружностью, следовательно, замыкание выпуклой оболочки данной последовательности точек должно совпадать с выпуклой оболочкой окружности, то есть с кругом [10, Теорема 17.2]. Из этого следует, что с точностью до замыкания предельное множество достижимости совпадает с кругом.
Аналогичные рассуждения справедливы также для последовательности и множеств 0-управляемости.
Пример 6. Пусть
|
(19)
|
Матрица собственных значений и матрица из разложения (9) имеют вид
Матрица имеет одно собственное значение кратности 2, а вектор – присоединенный вектор, соответствующий этому собственному значению. Согласно теореме 3 предельные множества достижимости и 0-управляемости будут неограниченными. На рис. 6 изображена последовательность множеств 0-управляемости данной системы для , которая неограниченно возрастает.
Рис. 5. Множества достижимости для системы (18)
Рис. 6. Множества 0-управляемости для системы (19)
Пример 7. В ранее рассмотренном примере 5 система не имела действительных собственных значений, а лишь комплексно-сопряженные. Выясним, существуют ли такие системы, собственные значения которых будут действительными, а им соответствующие множества достижимости и 0-управляемости будут ограниченными, однако не будут являться многогранниками.
Рассмотрим систему следующего вида для :
|
(20)
|
Вещественная жорданова форма и матрица из разложения (9) для данной системы имеют вид
Согласно теореме 3 предельное множество 0-управляемости ограничено, однако оно не удовлетворяет теореме 1 и не является многогранником. Докажем это.
Для матрицы справедливы следующие тождества:
Рассмотрим следующий вектор для произвольного фиксированного :
Тогда
Найдем максимум этого функционала по . Для этого введем функцию
Вычислим стационарные точки :
Определим характер экстремума в точке , для этого выберем малое и определим знак производной в -окрестности точки .
Таким образом,
Теперь рассмотрим величину
Найдем максимум этого функционала по . Для этого введем функцию:
Так как , точка является минимумом функции . Тогда
Таким образом,
Рассмотрим также два предельных случая. Пусть
Следовательно, в достигается единственный максимум функционала по . Т.е. согласно [10, Следствие 32.3.2] является крайней для замыкания . Но поскольку был выбран произвольно, то множество крайних точек не является счетным.
Проиллюстрируем пример на рис.7, выбрав .
Рис. 7. Множества 0-управляемости для системы (20)
Заключение
Для решения задач анализа и численного моделирования линейных систем с дискретным времен и геометрическими ограничениями на управление в статье решена задача построения предельных множеств достижимости и 0-управляемости. Определен и доказан строгий критерий ограниченности этих множеств, сводящийся к построению вещественного жорданова базиса матрицы системы. В виде теоремы 2 предложен метод построения априорных оценок предельных множеств достижимости и 0-управляемости. Определены условия, при которых исследуемые множества являются многогранниками.
Эффективность теоретических результатов продемонстрирована на примере построения множеств достижимости и 0-управляемости для различных систем. Отдельно стоит упомянуть примеры, демонстрирующие существование систем, для которых рассматриваемые множества не являются многогранниками, несмотря на то, что они ограничены.