Всё сдал! - помощь студентам онлайн Всё сдал! - помощь студентам онлайн

Реальная база готовых
студенческих работ

Узнайте стоимость индивидуальной работы!

Вы нашли то, что искали?

Вы нашли то, что искали?

Да, спасибо!

0%

Нет, пока не нашел

0%

Узнайте стоимость индивидуальной работы

это быстро и бесплатно

Получите скидку

Оформите заказ сейчас и получите скидку 100 руб.!


Оптимальное управление линейными динамическими объектами

Тип Реферат
Предмет Математика
Просмотров
498
Размер файла
1 б
Поделиться

Ознакомительный фрагмент работы:

Оптимальное управление линейными динамическими объектами

ФЕДЕРАЛЬНОЕ АГЕНТСТВО ПО ОБРАЗОВАНИЮ

ГОУВПО «Пермский государственный университет»

С.В. Лутманов

ЛИНЕЙНЫЕ ЗАДАЧИ

ОПТИМИЗАЦИИ

Часть 2

Оптимальное управление линейными динамическими объектами

Учебное пособие

Рекомендовано УМС по математике и механике УМО по классическому университетскому образованию РФ в качестве учебного пособия для студентов высших учебных заведений, обучающихся по группе направлений и специальностей «Механика»

Пермь 2005

БК 22. 161.8

Л 86

УДК 519.9

Лутманов, С.В.

Л 86 Линейные задачи оптимизации: учеб. пособие [Электронный ресурс] /Перм. ун.-т. – Пермь, 2005.- Ч.2. Оптимальное управление линейными динамическими объектами. – 195 с.

ISBN 5-7944-0565-1

В учебном пособии рассматриваются задачи теории оптимального управления линейными динамическими объектами. В частности, подробно исследован случай управления с терминальным критерием качества и случай управления по критерию предельного быстродействия. Изучается возможность сведения задачи теории оптимального управления к функциональной проблеме моментов. Вывод необходимых условий оптимальности управляющих воздействий опирается на математический аппарат выпуклого анализа. Указываются эффективные достаточные условия оптимальности программных управлений. Само построение оптимальных управлений осуществляется либо аналитическим путем, либо с применением систем аналитических вычислений, реализуемых в интерактивном режиме на ЭВМ. Весь излагаемый материал поясняется на примерах, большинство из которых решено с применением пакета MATHEMATICA 4.2 Пособие предназначено для студентов, магистрантов и аспирантов математических специальностей, изучающих курсы, связанные с вопросами оптимизации.

Ил. 34. Библиогр. 32 назв.

Печатается в соответствии с решением редакционно-издательского совета Пермского государственного университета

Рецензенты: кафедра дифференциальных уравнений Удмуртского государственного университета; профессор кафедры «Математическое моделирование систем и процессов» Пермского государственного технического университета, д.т.н. В.Ю. Столбов

ISBN 5-7944-0565-1 © Лутманов С.В., 2005

ОГЛАВЛЕНИЕ

ПРЕДИСЛОВИЕ…………………………………………………………………. 5 1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ ДИНАМИЧЕСКИЕ ОБЪЕКТЫ……….8

1.1. Примеры линейных управляемых динамических объектов …………………8

1.2. Системы однородных линейных дифференциальных уравнений …………16

1.3. Фундаментальная матрица Коши ……………................................................20

1.4. Допустимые реализации вектора управляющих параметров ………………26

1.5. Формула Коши …………………………...........................................................31

1.6. Критерии качества управления динамическими объектами………………..33

1.7. Программные стратегии ……………………………………………………...36

1.8. Постановка и существование решения задачи теории оптимального управ-

ления ……………………………………………………………………………….39

1.9. Область достижимости линейного управляемого динамического объекта 45

2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ФИКСИРОВАННЫМ ВРЕМЕНЕМ И ТЕРМИНАЛЬНЫМ КРИТЕРИЕМ КАЧЕСТВА……………………………………..49

2.1. Случай закрепленного левого конца и свободного правого конца траекто-

рии ………………………………………………………………………………….49

2.2. Поведение функции Л.С. Понтрягина вдоль оптимальной пары…………..53

2.3. Частные случаи геометрических ограничений на вектор управляющих па-

раметров……………………………………………………………………………56

2.4. Минимизация расстояния до целевого множества…………………………67

2.5. Случай подвижного левого и свободного правого конца траектории……85

2.6. Минимизация расстояния до целевого множества в случае подвижного ле-

вого конца траектории…………………………………………………………….96

3. ЗАДАЧА ЛИНЕЙНОГО ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ…….107

3.1. Постановка задачи линейного предельного быстродействия и существова-

ние ее решения.……………………………………………………………………107

3.2. Необходимые условия оптимальности программной стратегии ………….108

4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ………………….117

4.1. Сведение задачи теории оптимального управления к функциональной про-

блеме моментов…………………………………………………………………..117

4.2. Управляемость линейной динамической системы…………………………125

4.3. Управление по критерию «минимум энергии»…………………………….128

4.4. Управление по критерию «минимум силы»……………………………….134

ПРИЛОЖЕНИЕ…………………………………………………………………142 БИБЛИОГРАФИЧЕСКИЙ СПИСОК …………………………………...192

ПРЕДИСЛОВИЕ

Предлагаемое учебное пособие написано на основе спецкурса «Линейные задачи оптимизации», который автор читает для студентов и магистрантов (специальность «Механика») механико-математического факультета Пермского государственного университета. Оно представляет собой конспект лекций той части курса, которая посвящена задачам оптимального управления линейными динамическими системами. Линейные динамические системы с выпуклыми геометрическими ограничениями на управляющие параметры являются удобными объектами исследования в теории оптимального управления. Вывод необходимых условий оптимальности управляющих воздействий для таких систем опирается на математический аппарат выпуклого анализа и требует существенно меньших усилий, чем для нелинейных систем. В ряде случаев удается сформулировать эффективные достаточные условия оптимальности. Само построение оптимальных управлений осуществляется либо аналитическим путем, либо с применением систем аналитических вычислений, реализуемых в интерактивном режиме на ЭВМ.

Пособие состоит из четырех разделов и приложения. В первом разделе изучаются основные свойства систем линейных дифференциальных уравнений, вводится понятие фундаментальной матрицы Коши системы однородных линейных дифференциальных уравнений и доказывается формула Коши. Здесь же приводится постановка задачи теории оптимального управления в классе программных стратегий, оговаривается класс допустимых стратегий и доказывается теорема существования решения задачи теории оптимального управления.

Во втором разделе для задач управления с терминальным критерием качества и фиксированным временем выводятся необходимые условия оптимальности программного управления в форме принципа максимума Л.С. Понтрягина. В частности, когда минимизируемый функционал имеет смысл расстояния от целевого множества до фазового вектора объекта в финальный момент времени, эти условия записываются в форме прицеливания на опорный вектор к области достижимости динамического объекта. Для этого случая формулируются и доказываются эффективные достаточные условия оптимальности. Рассмотрены ситуации, когда левый конец траектории закреплен и когда он является подвижным. В последнем случае принимается, что множество начальных положений объекта описывается системой дифференцируемых неравенств.

Третий раздел посвящен задачам линейного быстродействия. Оптимальное время перехода определяется здесь как разность между первым моментом времени, для которого пересечение области достижимости управляемого объекта и целевого множества не является пустым, и начальным моментом времени. Оптимальная программная стратегия строится из условия прицеливания на соответствующий опорный вектор к области достижимости объекта.

В четвертом разделе изучается возможность сведения задачи теории оптимального управления к функциональной проблеме моментов. Приводятся необходимые и достаточные условия разрешимости проблемы моментов. На их основе доказывается критерий полной управляемости динамическим объектом и реализуется конструктивный алгоритм решения задачи теории оптимального управления по критерию «минимум энергии» и «минимум силы».

В каждом разделе пособия дается подробный алгоритм решения соответствующего класса задач теории оптимального управления. Реализация алгоритма поясняется на конкретных примерах. Большинство из них решается с применением пакета MATHEMATICA 4.2. Заголовки примеров, решение которых требует обращения к компьютеру, помечены звездочкой. Для них в приложении приводятся тексты программ, обеспечивающие решение этих примеров.

По тематике книги существует обширная библиография. Приведенный в конце книги библиографический список содержит лишь те источники, которые непосредственно использовались при написании данного учебного пособия. Пособие разбито на разделы, внутри которых принята самостоятельная нумерация задач, лемм, рисунков, примеров и теорем. В свою очередь, раздел разбит на пункты, в которых ведется независимая нумерация формул. Ссылки на материалы (за исключением формул), расположенные в пределах данного раздела, нумеруются одним числом, вне данного раздела – двумя числами. Ссылки на формулы нумеруются одним числом только в пределах данного пункта. Вне данного пункта, но в пределах данного раздела, они нумеруются двумя числами, вне данного раздела – тремя числами.


1. ЛИНЕЙНЫЕ УПРАВЛЯЕМЫЕ ДИНАМИЧЕСКИЕ ОБЪЕКТЫ

1.1. Примеры линейных управляемых динамических объектов. Рас-

смотрим управляемые объекты, состояние которых в каждый момент времени t R1 характеризуется набором величин x1,",xn . Эти величины называются фазовыми координатами объекта. Управление объектом осуществляется посредством воздействий u1,",ur , которые будем называть управляющими параметрами объекта. Принимаем, что изменение фазовых координат во времени описывается системой обыкновенных линейных дифференциальных уравнений вида

x1 = a11(t x) 1 + +" a1n (t x) n +b11(t u) 1 + +" b1r (t u) r +c t1( ),

.......................................................................................... (1)

xn = an1(t x) 1 + +" ann (t x) n +bn1(t u) 1 + +" bnr (t u) r +cn (t),

где aij = aij (t), bik = bik ( )t , ci = c ti ( ), t R i j1, , =1,", ,n k =1,",r - известные непрерывные функции времени.

Система дифференциальных уравнений (1) допускает векторноматричную запись

x = A t x( ) +B t u( ) +C t( ). (2)

Здесь обозначено

⎛⎜ x

x = ⎜⎜⎜⎜⎜⎜"x1n⎠⎟⎟⎟⎟⎟⎟⎟⎟, u =⎛⎝⎜⎜⎜⎜⎜⎜⎜"uu1r ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, A t( )= ⎜⎛⎝⎜⎜⎜⎜⎜⎜⎜aa11n"1( )( )tt """ aa1nn"n ( )( )tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, B t( )=⎜⎛⎝⎜⎜⎜⎜⎜⎜⎜bb11n"1( )( )tt """ bb1nr"r ( )( )tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, C t( )=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜cc t1n"( )( )t ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟.

Векторы xRn и uRr называются фазовым вектором и вектором управляющих параметров объекта, соответственно.

Система дифференциальных уравнений (1), или ее векторно-матричная форма (2), является математической моделью (с той или иной степенью точности) реального управляемого физического объекта. В дальнейшем эту математическую модель будем называть линейным управляемым динамическим объектом. Следуя [17], приведем примеры линейных управляемых динамических объектов.

Пример 1. Рассмотрим материальную точку массы m , движущуюся в вертикальной плоскости ξ η, в однородном поле тяжести (см. рис. 1). Управ-

ляющее воздействие на точку M осуществляет-

ся посредством реактивной силы f , возникающей в результате отделения от точки частиц с элементарной массой dm . Тогда масса точки M является величиной переменной, а движение точки описывается векторным дифференциальным

ξ уравнением Мещерского

Рис. 1

m dv = +mg dm ar , (3) dt dt

где ar - вектор относительной скорости отде-

ляющихся частиц. Проектируя уравнение (3) на оси выбранной системы координат, получим

= ma cosαξ, (4) = ma cosαη mg.

Здесь α αξ, η - углы, которые составляет вектор относительной скорости отделяющихся частиц с соответствующими координатными осями. Запишем систему (4) в нормальной форме

x1 = x3,

x2 = x4, (5) x3 = u1, x4 = u2 g,

где

x1 = = = = =ξ, x2 η, x3 ξ, x4 η, u1 a m cosαξ, u2 = a mm cosαη . m

Векторно-матричная форма системы дифференциальных уравнений (5) имеет вид

⎛⎜⎜x ⎞⎟

⎜⎜⎜x

⎜⎝⎜⎜⎜⎜⎜⎜xx1243⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎛0000 0000 1000 1000⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜xxxx1243⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜1000 1000⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎜⎝⎜⎜⎛uu12 ⎠⎞⎟⎟⎟⎟+⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜−000g⎟⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠⎟.

Обычно физический объект можно моделировать линейными дифференциальными уравнениями лишь в дополнительных предположениях об области изменения его фазовых координат.

Пример 2. Рассмотрим упругий вал, несущий жестко насаженные маховики A B, и C (см. рис. 2). Система вращается вокруг оси вала с постоянной угловой скоростью ω , однако вследствие возмущений возникают крутильные колебания, которые необходимо успокоить управ-

ляющими моментами u u1, 2 , приложенными к ма-

ховикам A и C соответственно. Система имеет три степени свободы. В качестве обобщенных координат выбираются следующие величины: q2 - угол отклонения маховика B от заданного движения системы ψ(t)=ωt t, ≥t0; q q1, 3 - суть углы закручивания маховиков A и C соответственно относительно маховика B .

Пусть IA,IB,IC - моменты инерции маховиков. Вычислим кинетическую энергию всей системы. Имеем

T = 12 IA (ω+ + +q1 q2 )2 12 IB (ω+ +q2 )2 12 IC (ω+ +q3 q2 )2 .

Обозначим через c c1, 2 крутильные жесткости соответствующих участков вала. Принимаем, что система работает в пределах деформаций, подчиняющихся закону Гука. Тогда потенциальная энергия системы определяется равенством

Π = 12 c q1 12 + 12 c q2 32 .

Из выражения для элементарной работы

δA=Q q1δ 1 +Q q2δ 2 +Q q3δ 3 = + +u q1δ 1 (u1 u2 )δq2 +u q2δ 3

следует, что обобщенные силы Q ii, =1,2,3 выражаются равенствами

Q1 = u Q1, 2 = +u1 u2,Q3 = u3 .

Составим уравнения Лагранжа

d ⎛⎜⎜T ⎞⎟

dt⎜⎜⎝∂qi ⎠⎟⎟⎟−∂qTi =Qi ∂Πqi , i =1,2,3.

Получаем следующие три дифференциальных уравнения второго порядка:

I qA1 + =I qA2 −c q1 1 +u1,

IAq1 + + +(IA IB IC )q2 + = +I qC 3 u1 u2, (6)

I qC 2 + =I qC 3 −c q2 3 +u2.

Разрешим систему дифференциальных уравнений (6) относительно старших производных

q1 = − c1(IA + IB )q1 − c2 q3 + 1 u1,

I IA B IB IA

q2 = +c1 q1 c2 q3, (7)

IB IB q3 = − c1 q1 − c2 (IB + IC )q3 + 1 u2.

IB IB + IC IC

Проведя замену переменных

x1 = q1, x2 = q2, x3 = q3, x4 = q1, x5 = q2, x6 = q3 ,

запишем систему (7) в нормальной форме

x1 = x4, x2 = x5, x3 = x6,

x4 = − c1 (IA + IB ) x1 − c2 x3 + 1 u1,

I IA B IB IA

x5 = +c1 x1 c2 x3,

IB IB

x6 = − c1 x1 − c2 (IB + IC ) x3 + 1 u2. (8)

IB IB +IC IC

Векторно-матричная форма системы дифференциальных уравнений (8) имеет вид

⎜⎜⎜⎜⎛ 00 00 00 10 10 00⎞⎟⎟⎟⎟⎟ ⎜⎛ 0 0 ⎞

⎟⎟ ⎜⎜⎜⎜⎜⎜⎜ 0 0 0 0 0 1⎟⎟⎟⎟⎜⎛ x

⎜⎜⎜xx ⎟⎟⎟⎟⎟⎟ = ⎜⎜⎜⎜⎜− c (II I+ I ) 0 − Ic 0 0 0⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜xx ⎟⎟⎟ ⎜⎜⎜ ⎟

⎜⎜⎜⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜xxxx124653⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ ⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜ 1 IcAIA BB1cB1 B 00 c2 I(BIIcB+B2B2+ICIC ) 00 00 00⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜xxx165243⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎜⎜⎜⎜⎜⎜⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜ I10000A I10000C ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎛⎜⎜⎜⎝uu12⎞⎠⎟⎟⎟⎟.

⎜⎜

⎜⎝⎜⎜ ⎟

Заметим, что в разобранном примере математическая модель, представленная системой дифференциальных уравнений (8), адекватна физическому объекту только в пределах деформаций, удовлетворяющих закону Гука, т.е. ес-

ли фазовые координаты x1,x2,x3 достаточно малы по абсолютной величине.

К дифференциальным уравнениям вида (2) можно прийти и в результате линеаризации исходных нелинейных дифференциальных уравнений движения объекта. Опишем процедуру линеаризации.

Пусть математической моделью управляемого динамического объекта служит система нелинейных дифференциальных уравнений

y =Y t y v( , , ) , t ∈[t T0, ], y Rn, v Rr . (9) Относительно функции Y :[t0 ,TRn+r Rn предполагается существование непрерывных частных производных не ниже второго порядка включительно по каждому из аргументов.

Допустим, что некоторой функции v:[t T0, ]→ Rr отвечает решение y()⋅ = y(⋅,t0 , y0 ,v()) дифференциального уравнения (9), удовлетворяющее начальному условию y t( 0)= y0 . Предположим, что именно эта функция y(⋅) является требуемым законом движения для управляемого объекта. Однако при физической реализации указанного управления v(⋅) закон движения y()⋅ реального динамического объекта вследствие ряда факторов (неадекватность математической модели, наличие неконтролируемых возмущений, невозможность в точности удовлетворить начальным условиям и др.) будет отличаться от идеального движения y()⋅ . Для реализаций управляющих воздействий и отвечающих им движений примем следующее представление:

y(⋅)= y (⋅)+ x(⋅), v(⋅)= v(⋅)+ u(⋅). (10) Здесь величины x()⋅ , u()⋅ полагаются малыми. Подставим выражения (10) в уравнения (9). В результате получим

y( )t + x( )t = Y(t, y(t)+ x(t),v(t)+ u(t)), t ∈[t0,T]. (11) С точностью до величин второго порядка малости по отношению к x(⋅) , u(⋅) из (11) выводим

y( )t + x( )t =Y ( ) ( ) [ ,T]. y v

Обозначая

A( )t = Y(t, y( )t ,v( )t ), B( )t = Y(t, y ( )t ,v( )t ), t∈[t0 ,T] (12)

y v

и учитывая, что

y( )t = Y (t, y(t), v(t)), t ∈ [t0 ,T ],

приходим к уравнениям (2), в которых C t( )= 0, t ∈[t T0, ].

Пример 3*. На горизонтальный плоскости находится двухзвенный механический манипулятор, каждое звено которого представляет собой абсолют-

но жесткий стержень длиной

li ,i =1,2. Первое звено соединено с неподвижным основанием манипулятора вращательной парой O1 , а со вторым звеном – враща-

Рис. 3 тельной парой O2 . Масса схвата

манипулятора – m , центр масс i-го звена находится в середине стержня – точке Ci , его масса – mi , момент инерции i-го звена относительно своего центра масс – Ii ,i =1,2. В соединительных парах могут развиваться управляющие вращательные моменты, соответственно, v1 и v2 ,

На горизонтальной плоскости, в которой расположен манипулятор, введем прямолинейную ось O1 x. Обозначим через ϕi угол, образованный i-м звеном манипулятора, i =1,2, с осью O1 x. Запишем дифференциальные уравнения движения манипулятора в форме уравнений Лагранжа второго рода, в которых в качестве обобщенных координат берутся углы ϕi ,i =1,2 . Кинетическая энергия манипулятора определяется по формуле

T = T1 + T2 + Tc , (13)

где Ti – кинетическая энергия i-го, i =1,2, звена, а Tc – кинетическая энергия схвата манипулятора. Последовательно вычисляем

1 ( 2 21 )( 2 2 2 ) 4I1 + m1l12 2

T1 = I1ϕ1 + m1vC =4I1ϕ1 + m1l1ϕ1 = ϕ1 ,

28

T2 = (I 2ϕ22 + m 2 vC22 )= [4I 2ϕ22 + 4m 2 l12ϕ12 + m 2 l22ϕ22 + 4m 2 l1l2ϕ1ϕ2 cos(ϕ1 −ϕ2 )],

Tc = mvc2 = m[l12ϕ12 + l22ϕ22 + 2l1l2ϕ1ϕ2 cos(ϕ1 −ϕ2 )].

Подставляя найденные величины энергий составных частей манипулятора в (13), находим

T = 1ϕ12 [l12 (m1 + 4m2 + 4m)+ 4I1 ]+ 1ϕ22 [l22 (m2 + 4m)+ 4I 2 ]+ (2m + m2 )l1l2ϕ1ϕ2 cos(ϕ1 −ϕ2 ).

8 8

Введем обозначения

a = 1 [l12 (m1 + 4m2 + 4m)+ 4I1 ], b = 1 [l22 (m2 + 4m)+ 4I 2 ], c = (2m + m2 )l1l2 .

4 4

Тогда выражение для кинетической энергии манипулятора принимает вид

T = [aϕ12 + 2cϕ1ϕ2 cos(ϕ1 −ϕ2)+ bϕ22].

Справедливы равенства

T d T

= aϕ1 + cϕ2 cos(ϕ1 −ϕ2 ), = aϕ1 + cϕ2 cos(ϕ1 −ϕ2 )− cϕ2 1 −ϕ2 )sin(ϕ1 −ϕ2 ),

∂ϕ1 dt ∂ϕ1

T d T

= bϕ2 + cϕ1 cos(ϕ1 −ϕ2 ), = bϕ2 + cϕ1 cos(ϕ1 −ϕ2 )− cϕ11 −ϕ2 )sin(ϕ1 −ϕ2 ),

∂ϕ2 dt ∂ϕ2

T = −cϕ1ϕ2 sin(ϕ1 −ϕ2 ), ∂T = cϕ1ϕ2 sin(ϕ1 −ϕ2 ). (14)

∂ϕ1 ∂ϕ2

Обобщенной силой Qi , отвечающей обобщенной координате ϕi , является управляющий вращательный момент vi, i =1,2.

Используя формулы (14), выпишем уравнения Лагранжа

d T T

− = Qi , i =1,2.

dt ∂ϕi ∂ϕi

В результате получим

aϕ1 +cϕ2 cos(ϕ ϕ1 − 2)+cϕ 2[1] sin(ϕ ϕ1 − 2)= v1 , cϕ1 cos(ϕ ϕ1 − 2)+bϕ2 −cϕ12 sin(ϕ ϕ1 − 2)= v2 . (15)

Разрешим дифференциальные уравнения (15) относительно старших производных

2 2 ,

1 2 abc cos (ϕ ϕ1 − 2 )

2 2 .

2 2 abc cos (ϕ ϕ1 − 2 )

Полученную систему двух дифференциальных уравнений второго порядка от-

носительно переменных ϕ12 заменой переменных

y1 =ϕ1, y2 =ϕ2, y3 =ϕ1, y4 =ϕ 2

сведем к системе четырех дифференциальных уравнений первого порядка

y1 = y3 , y2 = y4 ,

1 2bv −2bcy sin y y −2cv cos y y c y sin 2

y3 = ⋅ 1 42 ( 1 2 ) 2 2 2 ( 1 2) 2 32 (y1 y2 ),

2 abc cos (y1 − y2 )

y4 = 1 ⋅ 2av2 +2acy32 sin(y1 − y2 )−2cv2 1 cos2 (y1 − y2 )+c y2 42 sin 2⎡⎣ (y1 − y2 )⎤⎦ (16)

⎛ ⎞⎜⎜⎜0⎟⎟

v∗( )t ≡ ⎛ ⎞⎜⎝ ⎠⎜00⎟⎟⎟⎟, y∗( )t = ⎜⎜⎜⎜⎜⎝ ⎠⎜000⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟.

По формулам (10) находим

⎜⎜0 0 1 0⎞⎟

A= ⎜⎜⎜⎜⎜⎜000 000 000 100⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ , B = ⎜⎜⎜⎛⎜⎜⎜⎜⎜⎝⎜⎜⎜ab cab c00−−bc 22 ab cab c00−−ac 22 ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟.

⎜⎝⎜

Таким образом, линеаризованные уравнения здесь имеют вид

⎜⎜⎛ x

⎜⎜⎜⎜⎜xx ⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎝x1423⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟ = ⎜⎜⎜⎜⎝⎜⎜⎜⎜⎜⎜⎜⎛0000 0000 1000 1000⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜xxxx1423⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟+⎜⎜⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜⎛ab cab c00−−bc 22 ab cab c00−−ac 22 ⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎝⎜⎜⎛⎜uu12 ⎞⎟⎟⎟⎟⎠.

1.2. Системы однородных линейных дифференциальных уравнений

Системе дифференциальных уравнений (1.1) поставим в соответствие однородную систему уравнений

x1 = a11(t x) 1 + +" a1n (t x) n,

.............................................. xn = an1(t x) 1 + +" ann (t x) n.

или ее векторно-матричный аналог

x = A t x( ) . (1)

Установим некоторые простейшие свойства дифференциального уравнения (1).

Свойство 1. Пусть x(⋅) - решение дифференциального уравнения (1) и x t( 0)= 0 для некоторого значения t0 R1. Тогда x( )t ≡ 0, t R1 .

Доказательство. Справедливость свойства следует непосредственно из теоремы существования и единственности решения дифференциальных уравнений.

Свойство 2. Пусть x(1)(⋅),",x(s)(⋅) - система решений уравнения (1). Тогда для всех α1,",αs R1 выражение

xˆ()⋅ =∑s αix( )i ()⋅

i=1

будет также решением дифференциального уравнения (1).

Доказательство. Действительно,

dx tˆ( ) ⎛ ⎞ ⎛ ⎞

.

dt dt i=1 ⎠ i=1 i=1 ⎝ i=1 ⎠

Определение 1. Система решений x(1)(⋅),",x(s)(⋅) уравнения (1) называется линейно зависимой, если существуют такие константы α1,",αs R1 , не обращающиеся одновременно в нуль, что

s αi x( )i ( )t ≡ 0, t R1 .

i=1

В противном случае система решений x(1)(⋅),",x(s)(⋅) называется линейно независимой.

Заметим, что для зависимой системы решений x(1)(⋅),",x(s)(⋅) набор векторов x(1)(t),",x(s)(t) является линейно зависимым при всех t R1 . Это утверждение может быть обращено следующим образом.

Лемма 1. Пусть для некоторого значения t0 R1 набор векторов

x(1)(t0),",x(s)(t0) линейно зависим. Тогда система решений x(1)(⋅),",x(s)(⋅) уравнения (1) является линейно зависимой.

Доказательство. Из линейной зависимости векторов x(1)(t0),",x(s)(t0) следует существование ненулевого набора констант α1,",αs R1 , для которого

s αi x( )i ( )t0 = 0 . (2)

i=1

Полагаем

xˆ()⋅ =∑s αix( )i ()⋅ .

i=1

По свойству 2 функция xˆ()⋅ является решением уравнения (1), при этом в силу

(2) справедливо равенство x tˆ( 0)= 0. Тогда по свойству 1 должно выполняться

s

xˆ( )t =∑αi x( )i ( )t ≡ 0, t R1 ,

i=1

что и означает искомую линейную зависимость системы решений

x(1)(⋅),",x(s)(⋅). Лемма доказана.

Следствие. Пусть система решений x(1)(⋅),",x(s)(⋅) линейно независима.

Тогда набор векторов x(1)( )t ,",x(s)( )t является линейно независимым при всех t R1 .

Доказательство. От противного приходим к существованию некоторого значения t R , для которого набор векторов x(1)( )t ,",x(s)( )t является линейно зависимым. Тогда по лемме 1 система решений x(1)(⋅),",x(s)(⋅) должна быть зависимой, что противоречит исходным предположениям.

Установим критерий линейной зависимости и независимости системы

решений x(1)(⋅),",x(s)(⋅) уравнения (1).

Теорема 1. Система решений x(1)(⋅),",x(s)(⋅) уравнения (1) является линейно зависимой или линейно независимой, тогда и только тогда когда соответственно линейно зависим или линейно независим набор векторов x(1)(t0),",x(s)(t0) хотя бы при одном значении t0 R1.

Доказательство. Необходимость теоремы вытекает непосредственно из определения 1 и следствия из леммы 1. Достаточность в части линейной зависимости системы решений x(1)(⋅),",x(s)(⋅) доказана в лемме 1. Наконец, если набор векторов x(1)(t0),",x(s)(t0) является линейно независимым при некотором значении t R , то для системы решений x(1)(⋅),",x(s)(⋅)равенство

s αi x( )i ( )t0 = 0

i=1

невозможно ни при каких ненулевых наборах констант α1,",αs R1 . Это означает, что система решений x(1)(⋅),",x(s)(⋅) не является линейно зависимой, и поэтому она линейно независима. Теорема доказана.

Определение 2. Линейно независимая система решений

x(1)(⋅),",x(n)(⋅) (3)

дифференциального уравнения (1), где n - размерность вектора x, называется фундаментальной системой решений дифференциального уравнения (1). Теорема 2. Для уравнения (1) существует фундаментальная система решений, и любое решение этого уравнения может быть представлено как линейная комбинация решений, составляющих фундаментальную систему. Доказательство. Пусть набор векторов

e1,",en Rn

образует базис в Rn . Определим систему решений (3) условиями

x(i)(t0)= =e ii, 1,",n .

По теореме 1 из линейной независимости векторов x(1)(t0),",x(n)(t0) вытекает линейная независимость системы решений (3). Таким образом, существование фундаментальной системы решений для уравнения (1) установлено.

Покажем, что каждое решение x()⋅ уравнения (1) можно представить в виде

x( )t =∑n αi x( )i ( )t , t R1 .

i=1

Набор векторов x(1)(t0),",x(n)(t0) является базисом в Rn . Тогда для любого решения x(⋅) уравнения (1) найдется набор констант α1,",αn R1 такой, что

n x( )t0 =∑αi x( )i ( )t0 .

i=1

Решения x()⋅ и n αi x( )i ()⋅ имеют общее начальное условие и потому совпадают.

i=1

Теорема доказана.

Пример 4*. Рассмотрим однородную линейную систему дифференциальных уравнений третьего порядка

x1 = + +x1 4x2 x3,

x2 = + +x1 x2 x3, (4) x3 = 2x1 −4x2 + x3.

Приведем векторно-матричную форму записи этой системы

⎜⎝⎛⎜⎜⎜xx123⎞⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜112 −144 111⎠⎝⎞⎛⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜xxx123⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟.

⎜⎜x

⎜⎜

Покажем, что следующая система решений этого уравнения

⎜⎛2e

x( )1 ( )t =⎜⎜⎜⎜⎜⎜⎝ e033tt ⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟, x( )2 ( )t =⎜⎜⎜⎛⎜⎜⎜⎜⎜⎝7coscos−10tt +cos2sinsint tt⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, x( )3 ( )t =⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜−43coscos−tsint−+sint2sint t⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, t R1

образует фундаментальную систему решений.

Сначала непосредственно проверяем, что каждый член системы

2e3t

D t( )= e3t

0

7cost +sint cost−2sint

−10cost

3cost−sint

−sint .

−4cost +2sint

x(1)(⋅),x(2)(⋅),x(3)(⋅) является решением уравнений (2). Далее составим определитель

Вычислим его значение при t = 0. Имеем

2 7 3

D( )0 =1 1 0= −10 ≠ 0.

0 −10 −4

Таким образом, D( )0 ≠ 0 и набор векторов x(1)(0), x(2)(0), x(3)(0) является линейно независимым. Тогда по теореме 1 система решений x(1)(⋅),x(2)(⋅),x(3)(⋅) уравнений

(2) является фундаментальной системой решений.

1.3. Фундаментальная матрица Коши. Пусть

x( )1 ()⋅ =⎜⎜⎜⎜⎜⎜⎛x1n( )( )"11 ((⋅⋅))⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟,",x( )n ()⋅ =⎝⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜xx1n( )( )"nn ((⋅⋅))⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟ ⎝⎜⎜⎜x

фундаментальная система решений однородного дифференциального уравнения (2.1). Для всех t R1 построим квадратную матрицу Z(t) следующего вида

Z t( )=⎛⎜⎜⎜⎜⎜x1( )"1 (t)

"

"

x1( )n (t)⎞⎟⎟⎟⎟⎟⎟⎟.

"

⎝⎜⎜⎜xn( )1 (t) " xn( )n (t)⎠⎟⎟⎟

Из теоремы 1 следует, что матрица Z(t) является невырожденной при всех t R1 и, следовательно, для всех t R1 существует обратная матрица

ζ1( )1 ( )t

Z 1 ( )t = ⎜

⎜⎜ζn( )1 ( )t

Полагаем

ζ1( )n ( )t ⎞ ⎟

⎟.

ζn( )n ( )t ⎟⎟⎠

X [t,τ]= Z t Z( ) ( )τ =

−1 ⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝xx1n( )( )11"[[tt,,ττ]]

" x1n( )( )nn [[tt,,ττ]]⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟, t,τ R1 .

" "

" x

Определение 3. Матрица X [t,τ] , t,τ R1 называется фундаментальной матрицей Коши для однородного дифференциального уравнения (2.1).

Установим ряд свойств фундаментальной матрицы Коши.

Теорема 3. Для всех t, ,τ sR1 имеют место равенства

⎜⎜" " "1 " 0 ⎞⎟

X s s[ , ]= =E ⎜⎝⎜⎜0 " 1 ⎠⎟⎟⎟⎟⎟⎟⎟, . (1)

(X [t,τ])−1 = X [τ, ,t] (2)

d

X [t,τ]= A t X t( ) [ ,τ], (3)

dt

d

dτ X t[ ,τ]=−X t[ ,τ] ( )A τ . (4)

Доказательство. Равенство (1) является простым следствием определения 3. Докажем равенство (2). Имеем

(X [t,τ])−1 =(Z t( ) Z−1 ( )τ )−1 =(Z−1 ( )τ )−1 Z−1 ( )τ = Z( )τ Z−1 ( )t = X [τ,t] .

Для вывода равенства (3) замечаем, что

n xi( )j [t,τ]= xi( )s ( )t ζs( )j ( )τ , ,i j =1,",n.

s=1

Тогда

⎜⎜⎛x( )[t,τ]⎞

x( )j [t,τ]=⎜⎜⎜⎜ 1n( )jj"[t,τ]⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟= s=n1 ζ j τ ⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜⎜xxi( )"ss ( )tt ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟.

⎜⎜⎜x

Таким образом, столбцы матрицы X[t,τ], t,τ∈[t0 ,T] являются линейными комбинациями столбцов матрицы Z(t) и поэтому представляют собой решения уравнения (2.1). Последнее означает, что

d x( )i [t,τ]= A t x( ) ( )i [t,τ] , i =1,",n d X t[ ,τ]= A t X t( ) [ ,τ]. (5) dt dt

Для вывода равенства (4) продифференцируем по переменной τ очевидное тождество X[t,τ] [X τ,t]= E . Имеем

d X[t,τ]X[τ,t]+ X[t,τ] d X[τ,t]= 0 .

dτ ⎠ dτ

Перепишем последнее равенство с учетом (5):

d X[t]X[τ,t]= −X[t,τ]A( )τ X[τ,t]. (6)

dτ ⎠

Умножим равенство (6) на матрицу X 1[τ,t] справа. В результате получим искомое равенство (4) Теорема доказана.

Равенству (4) в доказанной теореме можно дать следующую трактовку: d X t[ ,τ]=−X t[ ,τ] ( ) d −1[τ,t]=−X −1[τ,t A] ( )τ

A τ X dτ dτ

d { −1[τ,t]}=−A( )τ {X −1[τ,t]}.

X

Таким образом, матрица {X −1[t,τ]}T является фундаментальной матрицей Коши для линейной однородной системы дифференциальных уравнений

dψ

= −A ( )t ψ. (7)

dt

В дальнейшем систему (7) будем называть сопряженной системой дифференциальных уравнений по отношению к системе (2.1).

Укажем один способ построения фундаментальной матрицы Коши для случая, когда известна фундаментальная система решений x(1) ( )⋅ , ,x(n) (⋅) дифференциального уравнения (2.1), не связанный с вычислением обратной матрицы для матрицы

Z ( )⋅ = (x( )1 ( )⋅ , ,x( )n ( )⋅ ).

Для каждого номера i∈{1, ,n} составим систему линейных алгебраических уравнений

c x1 1(1) (τ)+ +c xn 1(n) (τ) = 0,

…………………………..

c x1 i(1) (τ)+ +c xn i(n) (τ) =1,

………………………….

c x1 n(1) (τ)+ +c xn n(n) (τ) = 0,

τ∈[t0 ,T] (8)

относительно переменных c1, ,cn . Эта система имеет решение при всех τ∈[t0 ,T], т. к. ее определитель отличен от нуля при всех τ∈[t0 ,T]. Пусть ck(i) ( )τ , k i, =1, , ,n τ∈[t0 ,T] – решение системы (8). Положим

c1( )i ( )τ x1( )1 ( )t + +cn( )i ( )τ x1( )n ( )t

( )i ⎜ ⎟ x [t,τ] = ⎜ ................................ ⎟ , t,τ∈[t T0, ] , i =1, ,n .

⎜⎜⎝c x t c x t ⎟⎟⎠

Вектор x( )i [t,τ] представляет собой i -й, i =1, ,n , столбец фундаментальной матрицы Коши.

В случае, когда матрица A постоянна в алгоритме построения фундаментальной матрицы Коши система алгебраических уравнений (8) заменяется на следующую систему:

c x1 1(1) (0)+ +c xn 1(n) (0) = 0,

…………………………..

c x1 i(1) (0)+ +c xn i(n) (0) =1,

………………………….

c x1 n(1) (0)+ +c xn n(n) (0) = 0.

Пусть ck(i), ,i k =1, ,n – ее решение. Столбцы фундаментальной матрицы Коши строятся по формуле

c x1( )i 1( ) t c xi 1n t

⎜⎟

( )i

x [t,τ] = ⎜ ................................ ⎟ , t,τ∈[t T0, ] , i =1, ,n. (9) ⎜⎜⎝c x1( )i 1( ) t c xi 1n t ⎟⎟⎠

Пример 5*. Требуется построить фундаментальную матрицу Коши для однородного дифференциального уравнения из примера 4 и проверить для нее выполнение равенств (1)-(4).

Выше было показано, что система решений

⎜⎛2e

x( )1 ( )t =⎜⎜⎜⎜ e33tt ⎟⎟⎟⎟⎟⎟⎟⎟, x( )2 ( )t =⎜⎜⎜⎛⎜⎜⎜⎜⎜⎝7coscos−10tt +cos2sinsint tt⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, x( )3 ( )t =⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜−43coscos−tsint−+sint2sint t⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, t R1

⎜⎜⎜⎝ 0 ⎠⎟⎟

этого уравнения является фундаментальной. Построим фундаментальную матрицу Коши непосредственно следуя ее определению. Имеем

X t[ ,τ]=⎛⎜⎜2e33tt 7cost +sint 3cost−sint ⎞ ⎛⎟⎟⎟⎟⎟⎟⋅⎜⎜⎜⎜⎜⎜⎜⎜⎜2ee033ττ 7coscos−τ10τ−cos+2sinsinτ ττ −34coscos−ττsin−+τsin2sinττ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟−1 = ⎜⎜⎜⎜⎜⎝⎜⎜ e0 cos−10t−cos2sint t −4cos−sint +t2sint⎠ ⎝⎟⎟⎟⎟

⎛⎜⎜⎜ 54 e3(tτ) + 15 cos(tτ)− 52 e3(tτ) − 52 cos(tτ)+ 53 e3(tτ) − 53 cos(tτ)− ⎟⎟⎟⎟⎞⎟

⎜⎜⎜

⎜⎜⎜⎜⎟⎟⎟⎟

⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝⎜⎜ 2sin(tτ)

−4sin(tτ)

⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠⎟⎟⎟ cos(tτ)+sin(tτ)

⎜⎜⎜⎜⎜⎜⎜⎜−52 e153(sintτ)(−t−52 τcos) (tτ)− +15 e523 sintτ (+t−54 cosτ) (tτ)+ 103 e1013sintτ (−t 103 τcos) (tτ)+⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟. (10)

=

Осуществим построение фундаментальной матрицы Коши, не прибегая к обращению матрицы Z ( )⋅ . Для этого последовательно решаем три системы линейных алгебраических уравнений

2c11−+ + =+107cc222 −34cc33==10., ⎜⎝⎜⎛⎜⎜⎜cc132( )(111)⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎜⎜⎛⎜⎝⎜⎜⎜⎜−152 52⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟, 2cc11−+ + =+107ccc222 −34cc33 ==010,, ⇒ ⎜⎜⎛⎜⎜⎜⎝⎜⎜⎜⎜ccc132( )(( )222)⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎜⎛⎜⎝⎜⎜⎜⎜⎜−15542⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟. c c 0, ⇒ ⎜⎜

⎜⎜c( )⎠⎟⎟

2c11−+ + =107cc222 34cc33 01, ⎜⎛⎜⎜c132( )(333)⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎜⎜⎜⎜⎜⎜⎝⎜−10123103 ⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟. c + c = 0, ⇒ ⎜⎜⎜⎜c

− = ⎜⎝⎜c( )⎠

По формуле (9) определяем столбцы фундаментальной матрицы Коши

( )1 ⎜2e33t(tττ) ⎟ 2 ⎛⎜7cos(t −τ)+sin(t −τ)⎞⎟ ⎜⎛ 3cos(t −τ)−sin(t −τ) ⎟⎞

2 ( )

x [t,τ] = ⋅⎜ e ⎟− (t −τ)⋅⎜cos(t −τ)− 2sin(t −τ)⎟+⎜ −sin(t −τ) ⎟ =

5 ⎜⎜ 0 ⎟5 ⎜⎝ −10cos ⎟⎠ ⎜⎝−4cos(t −τ)+ 2sin(t −τ)⎟⎠

⎝ ⎠

⎛ 54 e3(t−τ) + 15 cos(t −τ)− 75 sin(t −τ)⎞

⎜ ⎟

= ⎜ 52 e3(tτ) 52 cos(t −τ)− 15 sin(t −τ)⎟,

⎜ ⎟ ⎜ 2sin(t −τ) ⎟

⎝ ⎠

( )2 ⎜2e33t(tττ) 4 ⎜⎛7cos(t −τ)+sin(t −τ)⎟⎞ ⎛⎜ 3cos(t −τ)−sin(t −τ) ⎟⎞

1 ( )

x [t,τ] = ⋅⎜ e ⎟+ ⋅⎜cos(t −τ)−2sin(t −τ)⎟− 2⋅⎜ −sin(t −τ) ⎟ =

5 ⎜⎜ 0 ⎟ 5 ⎜⎝ −10cos(t −τ) ⎠⎟ ⎜⎝−4cos(t −τ)+ 2sin(t −τ)⎟⎠

⎝ ⎠

⎛ 52 e3(t−τ) − 52 cos(t −τ)+ 145 sin(t −τ)⎞

⎜ ⎟

= ⎜ 15 e3(tτ) + 54 cos(t −τ)+ 52 sin(t −τ) ⎟,

⎜ ⎟ ⎜ −4sin(t −τ) ⎟

⎝ ⎠

( )3 ⎜2e33t(tττ) ⎟ 3 ⎛⎜7cos(t −τ)+sin(t −τ)⎟⎞ 1 ⎛⎜ 3cos(t −τ)−sin(t −τ) ⎞⎟

3 ( )

x [t,τ] = ⋅⎜ e ⎟−⎟ ⋅⎜⎝cos(t −τ)−2sin(t −τ)⎟+ 2 ⋅⎜⎜−4cos(−t −sinτ)(+t −2τsin) (t −τ)⎟⎠⎟ =

10 ⎜ ⎟ 10 ⎜ −10cos(t −τ) ⎠⎟ ⎝

⎜ 0

⎝ ⎠

⎛ 53 e3(t−τ) − 53 cos(t −τ)− 54 sin(t −τ) ⎞

⎜ ⎟

= ⎜ 103 e3(t−τ) − 103 cos(t −τ)+ 101 sin(t −τ)⎟ . ⎜ ⎟ ⎜ cos(t −τ)+sin(t −τ) ⎟

⎝ ⎠

Получили совпадение с формулой (10). Непосредственно убеждаемся, что равенства (1)-(4) выполняются (см. приложение).

В случае A= const дадим другую интерпретацию для фундаментальной матрицы Коши.

Определение 4. Квадратная матрица etA , определенная степенным рядом

etA = + + + + + +E 1!A t A2!2 t2 A3!3 t3 " Akk! tk " , (11)

где E - единичная матрица размера n×n , называется экспоненциалом матрицы A.

Покажем, что ряд (11) сходится абсолютно для любого фиксированного t R1 . Действительно, с одной стороны,

Akk! tk Ak!k t k , k = 0,1,2,",

а с другой стороны, степенной ряд

1+ + + + + +1!A t A2!2 t2 A3!3 t3 " Ak!k tk "

сходится абсолютно при всех t R1 .

Из абсолютной сходимости ряда (11) следует, что его можно почленно дифференцировать. Вычисляем

d tA d A A2 2 A3 3 Ak k A2 A3 2 Ak k

e = (E + + + + + + = + + + + + =1! t 2! t 3! t " k! t ") A 1! t 2! t " k! t "

dt dt

= + + + + +A(E 1!A t A2!2 t2 A3!3 t3 " (kAk−1 !1) tk−1 + =") AeAt . (12)

Из (12) вытекает справедливость матричного равенства

d tA At

e = Ae , dt

которое означает, что столбцы экспоненциала матрицы A являются решениями однородного дифференциального уравнения

x = Ax. (13)

В силу очевидного равенства eAtt0 = E эти столбцы образуют фундаменталь-

=

ную систему решений дифференциального уравнения (13). Таким образом,

X [t,τ]= e(tτ)A, t,τ R1 .

1.4. Допустимые реализации вектора управляющих параметров.

Пусть управление динамическим объектом осуществляется на промежутке времени [t T0, ]. Начальную точку траектории x0 называют левым концом траектории, а конечную xT – правым концом траектории. Начальный t0 и конечный

T моменты времени в общем случае не являются фиксированными. Предполагается, что t0 θ0 ⊂ R1, T R t t . На левый и правый концы траектории обычно накладываются ограничение в форме включений

x0 S0 ( )t0 Rn, t0 ∈θ0, xT S T1( ) ⊂ Rn, T ∈θ1 .

В задачах теории оптимального управления принята следующая терминология: если множество S0 (множество S1 ) состоит из одной точки и не зависит от t0 ∈θ0 (T ∈θ1 ), то говорят, что левый (правый) конец траектории закреплен; если S0 (t0 ) = Rn , t0 ∈θ0 , (S1 (T) = Rn ,T ∈θ1 ), то левый (правый) конец траектории называют свободным.

Реализация вектора управляющих параметров не является произвольной функцией времени. Эта функция должна быть достаточно «гладкой» и в любой момент времени удовлетворять геометрическим ограничениям

u t( )∈ PRr, t ∈[t T0, ].

Оба приведенных требования обусловливаются техническими возможностями механизмов, осуществляющих управляющие воздействия на объект.

С другой стороны, слишком «бедное» множество возможных реализаций вектора управляющих воздействий может не обеспечить достижение поставленной цели управления. В частности, таковым является класс непрерывных на отрезке времени [t T0, ] функций. Покажем это на примере.

Пример 6. Рассмотрим поезд, движущийся от станции A к станции B в соответствии с уравнениями

x1 = x2, x2 =u ,

где x1 - расстояние от станции A до поезда; u - тяга поезда, которой можно управлять. На величину тяги наложено ограничение u ≤1. Требуется так выбрать управление, чтобы поезд преодолел путь между станциями за наименьшее время. При этом скорость в начальный и конечный моменты времени должна быть нулевой.

x1

Рис. 4

Нетрудно сообразить, что время перехода будет минимальным, когда поезд до половины пути разгоняется с максимальным ускорением u t( )=+1, а вторую половину максимально затормаживается, т.е. u t( )=−1. Таким образом, реализация оптимального управления в данном случае имеет вид

0 1, , , u t

1, , ,

Функция u0 (t), t ∈[t T0, ] терпит разрыв в точке T .

Из опыта решения прикладных задач следует, что реализации вектора управляющих воздействий принадлежат классу C0 [t T0, ] – кусочно-непрерывных функций, то есть таких функций u:[t0 ,T]→ R r , которые непрерывны в каждой точке t∈[t0 ,T], за исключением, быть может, конечного числа точек τ1, ,τm ∈[t0 ,T], в которых функция u()⋅ терпит разрывы первого рода. В этих точках существуют конечные пределы

t→limτi −0 u(t) = ui − 0), t→limτi +0 u(t) = ui + 0),

но ui − 0)≠ ui + 0),i =1, ,m. В теории оптимального управления принимается, что в точках разрыва реализации вектора управляющих воздействий непрерывны справа. Таким образом,

t→limτi +0 u(t) = ui ),i =1, ,m .

Определение 5. Реализация u()⋅ вектора управляющих воздействий называется допустимой, если u()⋅ ∈C t T0 [ 0, ], функция u()⋅ непрерывна справа в точках разрыва и выполнено условие u t( )∈ PRr, t ∈[t T0, ].

Определение 6. Движением линейного динамического объекта, отвечающим допустимой реализации вектора управляющих воздействий u()⋅ и выходящим из начального положения x0 S0 (t0), называется решение следующей задачи Коши для векторного дифференциального уравнения

x = A t x( ) +B t u t( ) ( )+C t( ), x t( 0)= x0 . (1)

Это движение будем обозначать символом x(⋅, ,t0 x u0, ()).

Кусочно-непрерывная реализация вектора управляющих воздействий не гарантирует непрерывность по переменной t правой части дифференциального уравнения (1), поэтому условия классической теоремы существования и единственности решения задачи Коши для дифференциального уравнения здесь не выполняются. В связи с этим предлагается следующая процедура построения движения динамического объекта, отвечающего реализации вектора управляющих воздействий u( )⋅ ∈C0 [t T0, ] и выходящего из начального положения x0 S0 ( )t0 . Пусть τ1, ,τm ∈[t0 ,T] - точки разрыва функции u(⋅). Движение объекта на полуинтервале [t0 1 ) отождествим с решением задачи Коши

x = A t x( ) +B t u t( ) ( )+C t( ), x t( )0 = x0, t ∈[t0,τ1).

В силу непрерывности управления u(⋅) на полуинтервале [t0 1 ) сформулированная задача Коши имеет решение и притом единственное. Доопределим фазовый вектор в момент времени τ1 по непрерывности, положив

x1 = x1 )= lim x(t) .

tτ1−0

Движение объекта на полуинтервале [τ12 ) отождествим с решением задачи Коши x = =x A t x( ) +B t u t( ) ( )+C t( ) , x(τ1) = x1, t ∈[τ τ1, 2 ),

которое также существует и единственно. Фазовый вектор в момент времени τ2 снова доопределим по непрерывности

x2 = x( )τ2 = lim x(t).

t →τ2 −0

Аналогичные построения производятся на каждом полуинтервале времени

i1i ),i =1, ,m .

В результате получим искомое движение динамиче-

x2 ского объекта (см. рис 5). В Рис. 5 книге [7] приводится теорема существования и единственности такого движения. Заметим, что для любого момента времени t∈[t0 ,T] имеет место равенство

τ τ τ x( )t = +x0 A( ) ( )τ x τ τd +∫ B( ) ( )τ u τ τd +∫ C( )τ τd . (2)

t0 t0 t0

Равенство (2) может служить и непосредственным определением движения x(⋅, ,t0 x u0, ()). Таким образом, движение объекта принадлежит классу D t T0 [ 0, ]- классу кусочно-дифференцируемых на промежутке [t T0, ] функций и удовлетворяет дифференциальному уравнению (1) во всех точках промежутка [t T0, ] за исключением тех, где реализация вектора управляющих воздействий терпит разрыв. Пример 7*. Рассмотрим линейный управляемый динамический объект

x =u x, ∈ R1, uR1, [t T0, ]=[0,4 ,] x0 = 0.

Пусть реализация управляющего воздействия имеет вид

⎧ 1, t∈[0,1),

t, t∈[1,2),

u(t) =

t, t∈[2,3), ⎪−1, t∈[3,4].

Построим движение, отвечающее данной реализации управляющего воздействия и выходящее из начального положения x0 = 0. Полагаем

τ0 = 0,τ1 =1,τ2 = 2,τ3 = 3 и проводим необходимые построения на каждом полуинтервале i i+1 ),i = 0,1,2,3. Последовательно определяем

i = 0, x0 = 0, x(t) = t, t∈[0,1),

i ,

i = 2, x2 = , x,

i = 3, x3 = 0, x(t) = 3−t, t ∈[3,4].

Рис 6.

Итоговая конструкция изображена на рис. 6.

1.5. Формула Коши. Рассмотрим линейный управляемый динамический объект, динамика которого описывается дифференциальным уравнением (1.2).

Пусть t s, ∈ R1 ,xRn, u(⋅ ∈) C0 ⎢⎣R1⎥⎦ . Для движения x( )⋅ = x(⋅, ,s x u, (⋅)) этого объекта справедливо следующее утверждение.

Теорема 4 (Формула Коши). Для всех tR1 , в которых реализация вектора управляющих воздействий u( )⋅ непрерывна, имеет место равенство

t t

x( )t = X t s x[ , ] ∗ +∫ X t[ ,τ] ( ) ( )B τ u τ τd +∫ X t[ ,τ] ( )C τ τd , t R1. (1)

s s

Доказательство. Требуется доказать следующие два равенства:

x(s) = x,

d 1 dt x( )t = A t x t( ) ( )+B t u t( ) ( )+C t( ), t R .

Первое из них следует непосредственно из теоремы 3 (равенство (3.1)), а второе доказывается путем дифференцирования по аргументу t правой части равенства (1). Действительно,

d d d t d t

dt x t( )= dt X t s x[ , ] ∗ + dt s X t[ ,τ] ( ) ( )B τ u τ τd + dt s X t[ ,τ] C( )τ τd =

t

= A( )t X t s x[ , ] ∗ + X t t B t u t[ , ] ( ) ( )+∫ A t X t( ) [ ,τ] ( ) ( )B τ u τ τd + X t t[ , ] C t( )+

s

t

+∫ A t X t( ) [ ,τ] C( )τ τd =

s

= A( )t ⎢⎢⎢⎣X t s x[ , ] ∗ +∫st X t[ ,τ τ] ( ) ( )B u τ τd +∫st X t[ ,τ] C( )τ τd ⎤⎥⎥⎦⎥ +B t u t( ) ( )+ =W t( )

= A t x t( ) ( )+B t u t( ) ( )+C t( ), t R1 .

Теорема доказана.

Для однородной системы дифференциальных уравнений (т.е., если B t( ) ≡ 0, C t( ) ≡ 0) формула Коши принимает вид

x( )t = X t s x[ , ] ∗, t R1.

Тогда решение ψ(⋅) сопряженной системы дифференциальных уравнений (3.7), удовлетворяющее условию ψ(s) =ψ, можно записать в виде

ψ( )t ={X 1 [t s, ]}Tψ, t R1 . (2)

Пример 8*. Рассмотрим линейную управляемую систему

x1 = x2 +u1, x2 = u2, tR1 (3)

с начальными условиями

x1(0)=1, x2(0)=1. (4)

В качестве реализации вектора управляющих воздействий выберем вектор-

функцию u R: 1 R2 , определенную формулой

u t1 ( )⎞ ⎛ ⎞t 1 u t( )=⎜ ⎟=⎜ ⎟ , tR .

u2 ( )t ⎠ ⎝ ⎠2t

Нетрудно видеть, что после подстановки этой функции в (1) и интегрирования полученной системы дифференциальных уравнений с начальными условиями (4) получим

x. (5)

Покажем, что движение x(⋅), определенное формулой Коши (1), совпадает с выражением (5). Действительно, для данного примера имеем

C t( ) = 0, B t( ) = ⎛⎜⎜⎝⎜10 10⎞⎠⎟⎟⎟⎟ , X t[ ,τ]=⎛⎝⎜⎜⎜10 t −1τ⎞⎠⎟⎟⎟⎟ , t,τ R1 .

Подставляя последние выражения в формулу (1), получим

x1 ( )t ⎞ ⎛1 t⎞⎛1⎞ t ⎛1 t −τ⎞⎛1 0⎞⎛ τ ⎞

⎜⎜x2 ( )t ⎟⎟⎠ = ⎜⎜⎝0 1⎟⎠⎟⎜⎝⎜1⎟⎠⎟ + ∫0 ⎝⎜⎜0 1 ⎟⎠⎟⎜⎜⎝0 1⎟⎠⎟⎜⎜⎝2τ⎟⎟⎠dτ= ⎝

⎛1+ tt ⎛1 t −τ⎞ ⎛ τ ⎞ ⎛1+ tt ⎛τ+ 2tτ− 2τ2

=⎜⎜⎝ 1 ⎟⎠⎟ + 0 ⎝⎜⎜0 1 ⎟⎟⎠ ⎜⎝⎜2τ⎟⎠⎟dτ= ⎜⎝⎜ 1 ⎠⎟⎟ + 0 ⎜⎜⎝ 2τ ⎟⎠⎟ dτ=

⎛ 1 2 3 2 3 ⎞ ⎛1 3 1 2 ⎞

= ⎜⎛1+t+⎜⎜⎜⎝ 2t +tt2 − 3t ⎟⎟⎟⎠ = ⎜⎜⎜⎝ 3t +t22 +t 1+ +t 1⎟⎟⎟⎠, tR1 .

⎝ 1 ⎠

Искомое совпадение установлено.

1.6. Критерии качества управления динамическими объектами. Цель управления динамическим объектом состоит в оптимизации некоторого критерия качества, который формализуется в виде функционала, определенного на множестве реализаций вектора управляющих параметров и отвечающих им движений объекта. Обычно функционал представляет собой следующее выражение:

T

f0(τ,x( ) ( )τ ,u τ )dτ+ Φ(t0,x0,T,x( ))T , (1)

t0

где f0 : Rn+r+1 R1, Φ : R2(n+1) R1 - заданные функции, непрерывные по совокупности своих аргументов. Первое слагаемое в (1) называется интегральным, а второе – терминальным.

Определение 7. Функционал (1) называется функционалом Больца. В частности, если f0 ≡ 0, то функционал (1) называют функционалом Майера, а если Φ≡ 0 , то - функционалом Лагранжа.

Задача управления, в которой критерий качества имеет вид функционала Лагранжа с подынтегральной функцией f0 ≡1, называется задачей на предельное быстродействие.

Пусть задан критерий (1). Уточним схему, в соответствии с которой, можно оценить качество управления динамическим объектом в случае, когда известно дифференциальное уравнение движения объекта (1.2), промежуток времени процесса управления [t T0, ], начальное положение объекта x0 S0 ( )t0 и реализация вектора управляющих параметров

u(⋅ ∈) D t T0 [ 0, ], u t( )∈ PRr, t ∈[t T0, ].

Сначала определяется движение x(⋅)= x(⋅, ,t0 x u0, (⋅)) динамического объекта, отвечающее реализации вектора управляющих воздействий u(⋅ ∈) D t T0 [ 0, ], u t( )∈ P, t ∈[t T0, ] и выходящее из начального положения x0 S0 ( )t0 . Оно находится в результате решения задачи Коши (4.1), например, с помощью формулы Коши (5.1). В конечный момент времени T это движение должно удовлетворять граничному условию x(T)∈ S T1( ). В противном случае оценивать качество управления динамическим объектом не имеет смысла. Далее для пары (u() ()⋅ ,x ) вычисляется значение функционала (1). Полученное число и является количественной оценкой качества управления динамическим объектом.

Пример 9*. Рассмотрим линейный управляемый динамический объект

⎛⎜⎜⎜⎜⎜⎜⎜⎜xxx123⎟⎟⎟⎟⎟⎟⎟⎟⎠⎞=⎜⎜⎜⎜⎜⎜⎜⎜⎛⎝112

для которого

4

1

−4

111⎞⎛⎠⎝⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜xxx123⎞⎠⎟⎟⎟⎟⎟⎟⎟⎟+⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜100

0

1

0

100⎞⎛⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜uuu123⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟,

⎠⎝

⎛1 4 1⎞

⎛1 0 0⎞

⎛ ⎞0

⎜ ⎟ ⎜ ⎟ ⎜ ⎟

.

⎜⎜⎜⎝2 −4 1⎠⎟ ⎝⎜⎜⎜0 0 1⎠⎟⎟ ⎝ ⎠⎜⎜⎜0⎟⎟

Полагаем

⎧⎪

θ0 = ={t0} {0}, θ1 = ={T} {1}, ,S0 = ={x0} ⎪⎩⎪⎪⎨⎪⎪⎪⎪⎝ ⎠⎜⎜⎜⎜⎜⎜⎛ ⎞⎜111⎟⎟⎟⎟⎟⎟⎟⎟⎪⎭⎪⎬⎪⎪⎪⎪⎪⎫⎪∈ R3, S1 ={xT Rn ≤ 50},

T I u()⋅ ,x()⋅ ⎤=t u t( ),x t( ) dt + x t( )0 2 + x T( ) 2 ,

0

P ={u R3 u ≤ 2}, u tˆ( )=⎜⎜⎜⎜⎜⎜cossint tt⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟, t ∈[0,1].

⎜⎝

Реализуем описанную выше схему оценки качества управления динамическим объектом для рассматриваемого случая. В примере 5 для однородной системы дифференциальных уравнений

⎛⎜⎜⎜⎜⎜xx123⎞⎟⎟⎟⎟⎟⎟⎟⎟=⎛⎝⎜⎜⎜⎜⎜⎜⎜⎜112 −144 111⎞⎛⎠⎝⎟⎟⎟⎟⎟⎟⎟⎟⎜⎜⎜⎜⎜⎜⎜⎜xxx123⎠⎞⎟⎟⎟⎟⎟⎟⎟⎟

⎜⎜⎝⎜x

была построена фундаментальная матрица Коши

X t[ ,τ]= ⎛⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎜⎝−−5452 ee715533((sinsinttττ))((2−+ttsin−−5215 ττcoscos()t)−((t−−) ττ))

52 e3(tτ) − 52 cos(t τ)+ + 145 sin(t τ)

15 e3(tτ) + 54 cos(t τ)+

+ 52 sin(t τ)

−4sin(t τ)

− sin(t τ) e ( τ) − cos(t τ)+ + sin(t τ) cos(t τ)+sin(t τ)

10353 e1015433(ttτ) − 10533cos(t τ)− ⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎞⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎟⎠⎟⎟⎟⎟⎟.

Для управления uˆ(⋅) по формуле (5.1) находим

x tˆ( ) = x t t x u( , 0, 0, ˆ(⋅)) =

⎛⎞

⎛ ⎞1

2sint

−4sint

⎜ ⎟1

cost +sint ⎟⎝ ⎠

= ⎜ 2 −2cos −sin 2 + 4cos + 2sin 3 −3cos +sin ⎟⎜ ⎟⎜ ⎟1 +


⎛ 54 e3(t−τ) + 15 cos(t −τ)− ⎜

⎜− 75 sin(t −τ)

2 e3(t−τ) − 2 cos(t −τ)− t ⎜ 5 5

+∫⎜− 15 sin(t −τ)

0 ⎜

⎜ 2sin(t −τ)

52 e3(t−τ) − 52 cos(t −τ)+ + 145 sin(t −τ)

15 e3(t−τ) + 54 cos(t −τ)+

+ 52 sin(t −τ)

−4sin(t −τ)

3 e3(t−τ) − 3 cos(t −τ)− ⎞

5 5

54 sin(t −τ) ⎟

103 e3(t−τ) − 103 cos(t −τ)+⎟⎟ ⎛ sinτ⎞

+ 101 sin(t −τ) ⎟ ⎜⎜cosτ⎟⎟ dτ= .

⎟⎟ ⎜⎝ τ ⎟⎠ cos(t −τ)+sin(t −τ)

⎟ ⎟ ⎠


⎛ 301 ⎡⎣−20+62e3t +3(− +4 5t)cost +9 1( +5t)sint⎦⎤⎞⎟ ⎜

= ⎜ ⎡⎣−10+31e +3 3+5t cost +12sint⎦⎤ ⎟⎟, t∈[0,1]

⎜ 1+ −t t cost −(1+ 2t)sint

⎝ ⎠

Далее полагаем

⎛ 41.4121 ⎞ xˆ( )1 = 21.1906 , xˆ(1) = 46.531...< 50.

⎝−1.06472

Последнее неравенство означает, что для движения xˆ(⋅) выполнены граничные условия на правом конце. Величина критерия качества процесса вычисляется по формуле

1

I u⎣⎡ ˆ()⋅ , xˆ()⋅ ⎦⎤ =∫0 u tˆ( ), x t dtˆ( ) + xˆ( )0 2 + xˆ( )1 2 = 49.7931.

1.7. Программные стратегии. Различают два типа стратегий управления динамическим объектом: позиционный и программный. Первый из них предполагает, что при назначении вектора управляющих параметров используется информация о текущем времени и о значении фазового вектора объекта; второй - только информация о текущем времени. В математическом плане программные стратегии можно отождествить с функциями одного переменного (текущего времени), а позиционные стратегии с функциями n+1 переменного, где n - размерность фазового вектора. Таким образом, множество программных стратегий формально включено в множество позиционных стратегий. Вместе с тем задача программного управления представляет и самостоятельный интерес. Это объясняется тем, что в ряде случаев результат управления, достигаемый в классе позиционных стратегий, может быть получен и в классе программных стратегий. В то же время техническая реализация программного управления значительно проще позиционного. Кроме того, решение задачи программного управления может быть использовано как вспомогательное средство решения задачи позиционного управления. Сами позиционные стратегии обычно применяются в тех случаях, когда дифференциальные уравнения движения объекта с недостаточной степенью точности описывают динамику управляемого процесса.

Другой сферой применения позиционных стратегий являются конфликтноуправляемые динамические объекты, математическими моделями которых служат дифференциальные игры. Позиционные стратегии управления не являются предметом изучения данного пособия.

Пусть P Rr - область изменения вектора управляющих параметров.

Определение 8. Программной стратегией управления динамическим объектом на промежутке времени [t T0, ]⊂ R1 называется функция вида

U :[t T0, ]→ P Rr .

Обычно оговаривается класс допустимых программных стратегий. В частности, если им является класс кусочно-непрерывных (в точках разрыва непрерывных справа) функций, то допустимые программные управления можно отождествить с допустимыми реализациями вектора управляющих параметров. В этом случае программные стратегии будем также называть программными управлениями и обозначать строчными буквами.

В теоретических исследованиях программные стратегии обычно принадлежат более широким, классам функций, таким, как например, пространство L t Trp [ 0, ], p ∈[1,∞]. Здесь символом Lrp [t T0, ], p ∈[1,∞) обозначено пространство измеримых вектор функций u t T:[ 0, ]→ PRr , для которых функция u()⋅ p суммируема на промежутке [t T0, ] в смысле Лебега, с нормой

1

u Lp = ⎜⎜⎜⎜⎜⎝∫tT0 u t( ) pdt⎞⎠⎟⎟⎟⎟⎟⎟p .

При p = ∞ под символом Lr[t T0, ] понимается пространство ограниченных измеримых функций, u :[t T0, ]→ P Rr с нормой

u L∞ = ess t∈sup[t T0, ] U t( ) = inf supv()t[t T0, ] v t( ) ,

где v(⋅) пробегает множество всех измеримых функций, совпадающих с функцией u()⋅ почти всюду на отрезке [t T0, ].

Класс допустимых программных стратегий должен удовлетворять следующему свойству: любую допустимую программную стратегию U()⋅ можно сколь угодно точно приблизить (в смысле сходимости в среднем

T us ( )t U t dt( ) → 0, s → ∞ ) реализацией вектора управляющих параметров

t0

us (t), s =1,2, , t ∈[t T0, ].

В частности, пусть класс допустимых программных стратегий принадлежит пространству L t Trp [ 0, ], p ∈[1,∞]. Тогда указанное свойство следует из того, что множество непрерывных функций всюду плотно в L t T1r [ 0, ] [16 ].

В дальнейшем, если не оговорено противное, множество допустимых программных стратегий будем считать принадлежащим пространству суммируемых по Лебегу функций.

Определение 9. Движением динамического объекта на интервале времени [t T0, ], выходящим из начального положения {t x0, 0}и порожденным допустимой программной стратегией U (⋅), называется функция x:[t T0, ]→ Rn , определенная равенством

t t

x( )t = X t t x[ , 0] 0 +∫ X t[ ,τ] ( )B τ U( )τ τd +∫ X t[ ,τ] ( )C τ τd , t ∈[t T0, ]. (1)

t0 t0

В общем случае интегралы в формуле (1) следует понимать в смысле Лебега. Движение объекта, определенное формулой (1), обозначим символом

x(⋅) = x(⋅,t x U0, 0, (⋅)).

Пусть {us ( )⋅ } - последовательность реализаций вектора управляющих воздействий, аппроксимирующая программное управление U ( )⋅ , и xs ( )⋅ движение объекта, отвечающее реализации us (⋅), s =1,2, . Тогда справедлива оценка

tT

x( )t xs ( )t X t[ ,τ]B( )τ τU ( )−us ( )τ τ⎤d M U ( )τ −us ( )τ τd ,

t0t0

t ∈[t T0, ], M = const .

Из нее следует, что последовательность функций ϕs (⋅), определенных формулой

ϕs ( )t =x t( )− xs (t) , t∈[t T0, ], s =1,2,

равномерно сходится к нулю на отрезке времени [t T0, ].

Таким образом, любое движение динамического объекта можно рассматривать как равномерный предел движений объекта, порожденных соответствующими допустимыми реализациями вектора управляющих воздействий. При этом оно принадлежит классу абсолютно непрерывных на промежутке [t T0, ] функций и удовлетворяет на нем дифференциальному уравнению x = A t x( ) +B t U t( ) ( )+C t( )

почти всюду.

1.8. Постановка и существование решения задачи теории оптимального управления. Пусть заданы дифференциальные уравнения (1.2) движения динамического объекта, критерий качества (6.1), множество начальных и конечных моментов времени θ0 R1, θ1 R1, infθ0 ≤ sup, θ1 , область изменения вектора управляющих параметров P Rr , ограничения на левый конец S0 ( )t0 Rn, t0 ∈θ0 и правый конец S T1( ), T ∈θ1 фазовой траектории динамического объекта, и допустимая программная стратегия U (⋅).

Определение 10. Набор (t T x U0, , 0, ( )⋅ ,x( )⋅ ) назовем допустимым, если t0 ∈θ0 , T ∈θ1, t0 <T, x( )⋅ = x(⋅,t x U0, 0, ( )⋅ ), x0 S0(t0), x(T)∈S1(T) .

На множестве допустимых наборов посредством формулы (6.1) определим функционал I :(t T x U0, , 0, ( )⋅ , x( )⋅ ) → I t T x U[ 0, , 0, ( )⋅ , x( )⋅ ] и поставим следующую задачу.

Задача 1. Определить допустимый набор такой, что для

любого другого допустимого набора (t T x U0, , 0, ( )⋅ ,x( )⋅ ) выполнялось бы неравенство

I t T x U x I t T x U x .

Допустимый набор назовем решением задачи оптимального

управления, U 0 ( )⋅ – оптимальной программной стратегией, x0()⋅ – оптимальной траекторией. В задаче 1 требуется минимизировать функционал I . Случай максимизации функционала сводится к эквивалентной задаче минимизации функ-

ционала − I .

Сформулированная задача 1 оптимального управления динамическим объектом не всегда имеет решение. Покажем это на примере.

Пример 10. Рассмотрим управляемый динамический объект

1 ⎧⎫

x = u, xR , u∈ −[ 1,1 ,] θ0 ={ }0 , θ1 = (0,+∞) , S0 ={ }0 , S1 ( )T = ⎨x= 0, T ∈θ1,

I[T,u(⋅)]= x(T).

1

Очевидно, что I T U, ( )⋅ ⎤= T > 0. Для каждого Tˆ > 0 положим

⎧0, ⎪ u ˆ ( )t = ⎨

T

⎪⎩1

t ∈⎡t T0, ˆ⎤ ,

⎣ ⎦ t >Tˆ.

⎩⎭

Траектория движения, отвечающая программному управле-

нию uTˆ (⋅), изображена на рис. 7.

Момент времени T окончания процесса в данном случае удов-

летворяет неравенству T >Tˆ , и

Рис. 7 1 1 поэтому < . Выбирая вели-

T Tˆ

чину Tˆ достаточно большой, значение функционала I T uˆ, Tˆ ( )⋅ ⎤ = T1ˆ можно сделать сколь угодно малым. Однако программной стратегии U ( )⋅ , для которой I T U, ( )⋅ ⎤= 0, не существует в классе L t Trp [ 0, ], p ∈[1,∞]. Отсюда заключаем, что рассматриваемая задача оптимального управления решения не имеет. Для задачи теории оптимального управления

x = A t x( ) + B t u( ) +C t( ),

t t T t t t T T T t T ,

xRn, uP Rr , x0 S0 (t0 ) , t0 ∈θ0, x T( )∈S T1 ( ) , T ∈θ1 ,

I[t0,T, x0,u(⋅), x(⋅)]= Φ(t0,T, x0, x(T))

выведем достаточные условия существования ее решения в классе интегрируемых по Лебегу программных стратегий.

Теорема 5 (существование решения задачи теории оптимального управления).

Пусть выполнены следующие предположения:

1) множество P R r компактно и выпукло;

2) множество Ξ = {e = (t0 ,T, x0 ,xT)x0 S0 (t0 ), xT S1(T), t0 ∈θ0 , T ∈θ1}⊂ R2(n+1) компактно;

3) множество допустимых наборов G ={(t T x U0, , 0, ( )⋅ , x( )⋅ )} содержит хотя бы один элемент;

4) множество допустимых программных стратегий принадлежит пространству функций, интегрируемых по Лебегу на интервале управления.

Тогда существует допустимый набор t T x U x G , на котором

функционал I достигает минимума.

Доказательству теоремы предпошлем лемму.

Лемма 2. Пусть R:[t0,t]→ K Rn – интегрируемая по Лебегу функция и множество K - выпуклый компакт. Тогда

1 t

R( )τ dτ∈K . (1)

t t0 t0

Доказательство. Известно [16], что для всякой интегрируемой по Лебегу функции R , определенной на интервале [t0 ,t], найдется последовательность ступенчатых функций { }Rs , определенных и равномерно сходящихся на этом интервале к функции R , причем справедливо равенство

t t ( ) R( )τ dτ. (2)

t0 t0

Покажем, что включение (1) справедливо для всякой ступенчатой функции

R:[t0 ,T]→ K . Напомним, что функция называется ступенчатой, если она принимает конечное число значений R(1), ,R(k) K . Обозначим

Tj = {τ∈[t0,t]R(τ) = R( j)}, j =1, ,k .

Тогда

1 t R( )τ dτ= . (3)

t t0 t0 t t0 j=1

Здесь µ(T j ) – мера множества T j , j =1, ,k . Заметим, что

. t

Выражение (3) представляет собой выпуклую комбинацию векторов R( j) K , j =1, ,k . Отсюда следует справедливость включения (1) для случая, когда функция R ступенчатая. Доказательство общего случая использует предельный переход в (2) и условие компактности множества K .

Доказательство теоремы. B силу компактности множества Ξ функционал I ограничен на множестве допустимых наборов G . Из условия G ≠∅ следует существование для функционала I минимизирующей последовательности {(t0s ,T s ,x U0s , s ( )⋅ ,xs ( )⋅ )}, (t0s ,T s ,x U0s , s ( )⋅ ,xs (⋅))∈G , s =1,2, , т.е. такой последовательности, что

lims→∞ I t T⎣ 0s , s ,x U0s , s ( )⋅ ,xs ( )⋅ = (t T x U0, , 0inf, ( )⋅ ,x( )⋅ ∈) G I t T x U0, , 0, ( )⋅ ,x(⋅)⎤ = I, I< ∞ .

В силу 2) из последовательности {(t T0s , s , x x0s , s (T s ))}, s =1,2, можно извлечь сходящуюся. Не теряя общности, считаем, что

{(t T0s , s , x x0s , s (T s ))} → (t T00, 0, x00,xT0 )∈Ξ .

Рассмотрим последовательность движений

{x( )s ( )⋅ }, x( )s ( )⋅ = x(⋅,t0s , x U0s , s ( )⋅ ), s =1,2,

Для всех номеров s =1,2, справедливо равенство

t t

x( )s ( )t = X t t⎢⎣ , 0s x0s +∫t X t[ ,τ] ( )B τ U s ( )τ τd +∫t X t[ ,τ] ( )C τ τd , t t0s ,T s . (4)

0 0

Полагаем

⎧⎪ x0s , t ∈⎡⎣t0∗,t0s ) , x( )s ( )t = x( )s ( )t , t ∈⎡t0s ,T s , (5)

⎪ ( )s s s

x (T ), t∈(T ,T .

Из компактности множеств Ξ, P и формул (4) (5) следует, что функции, образующие последовательность {x( )s ( )⋅ }, равномерно ограничены и равностепенно непрерывны на отрезке t0,T . По теореме Арцела (при необходимости следует перейти к подпоследовательности) эта последовательность равномерно сходится на отрезке t0,T к некоторой абсолютно непрерывной функции x0( )⋅ . Очевидно, что

x .

Обозначим через x0 ( )⋅ сужение функции x0(⋅) на отрезке t00,T 0 и докажем существование допустимой программной стратегии U 0 ( )⋅ , для которой почти всюду на отрезке t00,T 0 выполняется равенство

x0 ( )t = A t x( ) 0 (t)+ B t U( ) 0 (t)+C t( ). (6)

Пусть t ∈(t T0, 0 ) – точка, где функция x0 (⋅) имеет производную. Для достаточно больших номеров s =1,2, и малых положительных чисел h будет

выполнено вложение [t t, + h]⊂ ⎡t0s ,T s . Из равенства

t t t

x( )

t0∗ t0∗ t0∗

следует

x(s) (t + hh)− x(s) (t) = 1h t h+t A( )τ x( )s ( )τ + B( )τ U s ( )τ +C( )τ ⎤⎦dτ. (7) ∫ ⎣

В силу равномерной сходимости последовательности функций {x( )s ( )⋅ } к функции x0 ( )⋅ , для любого ε> 0 и достаточно малого h > 0 , начиная с некоторого номера s , будет выполняться включение

A( )τ x(s) ( )τ + B( )τ U s (τ)+C(τ)∈K x( 0 (t),ε),τ∈[t t, + h],

где

K x( 0 ( )t ,ε) = A t x( ) 0 (t)+ B t P( ) +C t( )+O(0,ε).

Множество K x( 0 (t),ε) является выпуклым компактом. Тогда по лемме 2 следует, что

1 t h+ s s 0

h t A( )τ x ( )τ τ τ τ τ+ B( )U ( )+C( )⎤d K x( ( )t ,ε).

Отсюда и из равенства (7) выводим

x(s) (t + h)− x(s) (t) 0

A t x( ) ( )t + B t P( ) +C t( )+O(0,ε). h

Переходя в нем к пределу при s → ∞, получим

x0 (t + h)− x0 (t) 0

A t x( ) ( )t + B t P( ) +C t( )+O(0,ε). (8)

h

Из существования производной функции x0 (⋅) в точке t вытекает возможность предельного перехода в левой части равенства (8) при h → 0. В результате такого перехода получим

x0 ( )t A t x( ) 0 (t)+ B t P( ) +C t( )+O(0,ε).

Отсюда в силу произвольности ε> 0 выводим

x0 ( )t A t x( ) 0 (t)+ B t P( ) +C t( ).

Итак, установлено, что для каждого момента времени t ∈⎡t00,T 0 , в который существует производная функции x0 (⋅), найдется вектор u0( )t P, удовлетворяющий равенству (6). По лемме об измеримом выборе [31] функция u0 (⋅) может быть выбрана интегрируемой по Лебегу. Допустимую программную стратегию U 0 ( )⋅ отождествим с функцией u0 (⋅).

Очевидно, что набор является допустимым, и при этом

I= lims→∞ I t T0s , s , x U0s , s ( )⋅ , xs ( )⋅ ⎤ = lims→∞ Φ( t T0s , s ,x x0s , s (T s ))) = Φ( t T00, 0,x00, x0 (T 0 )) =

.

Теорема доказана.

1.9. Область достижимости линейного управляемого динамического объекта. Важной характеристикой управляемого объекта является его область достижимости. Пусть t0 ∈θ0 , x0 S0 (t0 ),T ∈θ1. Символом Π[t T0, ] обозначим множество всех допустимых программных стратегий вида U :[t T0, ]→ P.

Определение 11. Множество

G t( 0,x T0, ) ={q = x T t( , 0,x U0, ( )⋅)U ( )⋅ ∈Π[t T0, ]} ⊂ Rn

называется областью достижимости управляемого динамического объекта в момент времени T для начального положения {t0, x0}.

Теорема 6. Пусть множество P Rr выпукло и компактно. Тогда область достижимости является выпуклым компактным множеством в пространст-

ве Rn .

Доказательство. Из определения области достижимости для всякого qG t x T( 0, 0, ) следует существование программной стратегии U ( )⋅ ∈Π[t T0 , ] такой, что

T T

q = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )d + ∫ X T[ ,τ τ τ]C( )d , (1)

t0 t0

где X[s,t], s,t∈[t0,T]– фундаментальная матрица Коши, отвечающая однородному дифференциальному уравнению x = A(t)x, t∈[t0,T]. Оценим по норме вектор q . Имеем

T T

q X T t[ , 0 ] x0 + ∫ X T[ ,τ] B( )τ τ τU ( ) d + ∫X T[ ,τ τ τ] C( ) d .

t0 t0

В силу ограниченности множества P Rn из последнего неравенства вытекает ограниченность области достижимости. Пусть q~ – предельная точка области достижимости и {q( )s } → q q, ( )s G t( 0,x T0, ). Из равенства (1) следует, что для всех s =1,2, будет справедливо

T T

q( )s = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ U ( )s ( )τ τd + ∫ X T[ ,τ τ τ]C( )d , (2)

t0 t0

где U (s) ( )⋅ ∈Π[t T0, ]. В силу слабой компактности множества Π[t T0, ] [16 ] из последовательности функций {U ( )s ( )⋅ } можно извлечь подпоследовательность, слабо сходящуюся к функции U (⋅ ∈Π) [t T0 , ]. Переходя к пределу по подходящей подпоследовательности индексов в (2), получаем равенство

T T

q= X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )d + ∫ X [T,τ]C( )τ τd . (3)

t0 t0

Равенство (3) означает, что qG t x T( 0, 0, ). Отсюда следует замкнутость области достижимости. Докажем ее выпуклость. Пусть q( )1 ,q( )2 ∈ ∈G t x T( 0, 0, ). Это означает, что существуют функции U (1) (⋅),U (2) (⋅ ∈Π) [t T0, ], для которых справедливы равенства

T T

q( )i = X T t[ , 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU ( )i ( )d +∫ X T[ ,τ τ τ]C( )d , i =1,2. (4)

t0 t0

Для любого α∈[0,1] положим qα q(1) + (1−α)q(2) . В силу (1) имеем

T T

α 0 0 X [T,τ] B( )τ α τU ( )1 ( ) (+ 1−α)U ( )2 ( )τ τ⎤d + ∫ X T[ ,τ τ τ]C( )d . (5)

q = X T t[ , ]x +

t0 t0

Из выпуклости множества P следует, что α τU (1) ( )+(1−α)U (2) ( )τ ∈P для всех

τ∈[t T0, ] . Это означает справедливость включения

αU (1) ( ) (⋅ + 1−α)U (2) (⋅ ∈Π) [t T0, ]. Тогда в силу (5) заключаем, что qαG t x T( 0, 0, ). Таким образом, область достижимости выпукла. Теорема доказана.

Упражнения для самостоятельной работы

Даны дифференциальные уравнения движения управляемых линейных динамических объектов

x1 = −3x1 + 4x2 − 6x3 + u1, x1 = −2x1 − 4x2 − 60x3 + u1,

а) x2 = x1 − 2x2 + 2x3 + u2, б) x2 = −4x1 x2 −51x3 + u2, x3 = 2x1 x2 + 3x3 + u3, x3 = 2x1 − 2x2 + x3 + u3,

x1 = 2x1 + 4x2 −16x3 + u1, x1 = −3x1 x2 −5x3 +u1,

в) x2 = 2x1 x2 + 21x3 + u2, г) x2 = x1 x2 +u2, x3 = −2x1 − 2x2 + x3 + u3, x3 = x1 + x2 + 2x3 +u3.

1. Записать дифференциальные уравнения движения в матричной форме.

2. Для однородных систем линейных дифференциальных уравнений, соответствующих заданным неоднородным системам, построить фундаментальную матрицу Коши двумя способами: с использованием операции обращения матрицы и без использования. Убедиться в том, что оба метода строят одну и ту же матрицу. Проверить выполнение свойств (3.1)-(3.4) фундаментальной матрицы Коши.

3. Проверить справедливость формулы Коши (5.1) при следующих дополнительных данных:

⎛ ⎞1 ⎛−1⎞

⎜ ⎟ ⎜ ⎟

x =

а) 0 ⎜ ⎟⎜ ⎟⎝ ⎠11 , t0 = 0,T =1, б) x0 = ⎜⎝⎜−11⎟⎠⎟, t0 = 0,T =1,

u1 ( )t = sin ,t u2 ( )t = cos ,t u3 ( )t = et , u1 ( )t = t u, 2 ( )t = et , u3 ( )t = cos ,t

⎛ 1 ⎞ ⎛−1⎞

⎜ ⎟ ⎜ ⎟

в) x0 = −⎜⎜⎝ 11⎟⎠, t0 = 0,T =1, г) x0 = −⎜⎜⎝ 11⎠⎟⎟, t0 = 0,T =1,

u1 ( )t = sin ,t u2 ( )t = t2, u3 ( )t = et , u1 ( )t = e ut , 2 ( )t = sin ,t u3 ( )t = −cos .t

4. Вычислить критерии оптимальности для движений, отвечающих указанным в пункте 3 задания управлениям и выходящих из приведенных там же начальных положений

I u⎡⎣ ( )⋅ ⎤⎦ = I u⎡⎣ (⋅)⎤⎦ =

а) б)

I u⎡⎣ ( )⋅ ⎤⎦ = I u⎡⎣ (⋅)⎤⎦ =

в) г)


2. ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ЛИНЕЙНЫМИ

ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ С ФИКСИРОВАННЫМ

ВРЕМЕНЕМ И ТЕРМИНАЛЬНЫМ КРИТЕРИЕМ КАЧЕСТВА

2.1. Случай закрепленного левого конца и свободного правого конца траектории. Рассматривается следующая задача теории оптимального управления.

Задача 1. Найти допустимую программную стратегию U 0 ( )⋅ ∈Π[t T0, ], доставляющую минимум функционалу

I U (⋅)⎤= Φ(x T( )), Φ∈C1(R1)

при ограничениях

x = A t x( ) + B t u( ) +C t( ), xRn, uP Rr , θ0 ={t0},θ1 ={T}, S0 ={x0}, S1 = Rn ,

где множество P Rn является выпуклым компактом.

По теореме 1.6 область достижимости G t( 0,x T0, ) является компактом в пространстве Rn . Тогда в силу непрерывности функции Φ решение задачи 1 существует.

Пусть U 0 ( )⋅ - оптимальная программная стратегия. Обозначим через x0 ( )⋅ = x(⋅,t0,x U0, 0 ( )⋅ ) оптимальное движение объекта, а через ψ0 ( )⋅ - решение сопряженной системы дифференциальных уравнений (1.3.7), удовлетворяющее условию

.

Теорема 1 (принцип максимума Л.С. Понтрягина). Оптимальная программная стратегия U 0 ( )⋅ удовлетворяет следующему условию максимума:

B( )t U 0 (t),ψ0 (t) = max B t u( ) ,ψ0 (t) (1)

u P

для почти всех t ∈[t T0, ].

Доказательство. Из выпуклости области достижимости G t( 0,x T0, ) в силу [7 ] следует, что для всех qG t( 0,x T0, ) имеет место неравенство

∂Φ 0 00 00 00

0 ≤(x ( )T ),q x ( )T = − ψ ( )T ,q x ( )T = ψ ( )T ,x ( )T − ψ ( )T ,q. (2)

x

Тогда для всех u( )⋅ ∈Π[t T0, ] должно выполняться

T T

ψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( )U 0 ( )d + ∫ X T[ ,τ τ τ]C( )d

t0 t0

T T

− ψ0 ( )T , X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( ) ( )u d + ∫ X T[ ,τ τ τ]C( )d=

t0 t0

TT

= ψ ( )T ,∫ X T[ ,τ τ τ τ ψ]B( )U 0 ( )d 0 ( )T ,∫ X T[ ,τ τ τ τ]B( ) ( )u d≥ 0.

t0t0

Последнее возможно, только если

TT

ψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( )U 0 ( )d= u( )⋅ ∈Πmax[t T0, ]ψ0 ( )T ,∫ X T[ ,τ τ τ τ]B( ) ( )u d. (3)

t0t0

Последовательно преобразуем левую и правую части равенства (3). Имеем

T

ψ0 ( )T , X T[ ,τ τ τ τ]B( )U 0 ( ) d = u ⋅ ∈Πmaxt T0, ∫ ψ0 ( )T , X T[ ,τ τ τ τ]B( ) ( )u d

( ) [ ]

t0

T

ψ0 ( )T , X 1 [τ,T B] ( )τ τ τU 0 ( ) d = u ⋅ ∈Πmaxt T0, ∫ ψ0 ( )T , X 1 [τ,T B] ( ) ( )τ τ τud

( ) [ ]

t0

T X [τ,T]}ψ0 ( )T , B( )τ τ τU 0 ( ) d = u( )⋅ ∈Πmax[t T0, ]{X 1 [τ ψ,T]}0 ( )T , B( ) ( )τ τ τud .

t0 0

Отсюда в силу (1.5.2) выводим

T T

∫ψ0 ( )τ τ τ τ, B( )U 0 ( )d = u( )⋅ ∈Πmax[t T0, ] ∫ψ τ τ τ τ0 ( ), B( ) ( )ud

t0 t0

В книге [18 ] показано, что

T T max ∫ψ0 ( )τ τ τ τ,B( ) ( )ud = ∫maxψ τ τ τ0 ( ), B( )u d .

u( )⋅ ∈Π[t T0, ]u Pt0 t0

Тогда

T

ψ τ τ τ0 ( ), B( )U 0 ( )−maxu P∈ ψ τ τ τ0 ( ), B( )u d = 0,

t0

что и означает выполнение условия (1). Теорема доказана.

Функция

H t x u( , , ,ψ) =A t x( ) + B t u( ) +C t( ),ψ

представляет собой функцию Л.С. Понтрягина [25] для рассматриваемого управляемого динамического объекта. Таким образом, доказанная теорема утверждает, что на оптимальном управлении функция Л.С. Понтрягина достигает максимального значения.

Заметим, что для выпуклых функций Φ неравенство (2) является доста-

точным условием минимума функции Φ на множестве G t( 0,x T0, ). Тогда усло-

вие (1) будет не только необходимым, но и достаточным для оптимальности программной стратегии

U 0 (⋅).

Пример 1. Рассмотрим линейный управляемый динамический объект

x1u1 ⎞ ⎧⎪⎛u1 x1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜ ⎟

u2 ⎠ ⎩⎪⎝u2 ⎠

x10 ⎞ ⎛ ⎞0

⎜ ⎟ = ⎜ ⎟, t0 = 0,T =1, Φ( )x =

x20 ⎠ ⎝ ⎠0

Рис. 1


Оптимальное управление объектом, как вид-

но из рис. 1, здесь состоит в том, чтобы перевести управляемую точку из на-

x10 (1)⎞ ⎛ ⎞1

чала координат в положение M÷⎜x20 ( )1 = ⎜ ⎟⎝ ⎠0 . Это можно осуществить только программной стратегией вида

U t u d t . (4)

⎝ 1 ⎠ 0

Проверим выполнение условий теоремы 1 для таких стратегий. Сопряженная система дифференциальных уравнений и граничные условия для нее здесь имеют вид

ψ1 = 0,ψ2 = 0,

x10 (1)

ψ1 ( )1 = −= 0,

(x10 ( )1 )2 +(x20 ( )1 −2)2

x20 ( )1 −2 ψ2 ( )1 = −=1.

(x10 ( )1 )2 +(x20 ( )1 −2)2

Интегрируя, находим, что

.

Выпишем функцию Л.С. Понтрягина, вычисленную вдоль оптимальной пары

(x0 ( )⋅ ,ψ0 ( )⋅ ). Имеем

H t x t u t t u t u u t .

Отсюда следует, что

maxu PH t x( , 0 ( )t , ,uψ0 (t)) = u1max≤1,u2 ≤1(ψ10 (t u) 1 10 (t u) 2 ) = maxu2 ≤1 u2 =1, t∈[0,1]. (5)

Очевидно, что программное управление (4) доставляет максимум в (5) и, следовательно, удовлетворяет условию (1).

Практическое применение теоремы 1 для поиска решения задачи управления осуществляется следующим образом.

Для каждого фиксированной пары (t,ψ)∈[t T0, ]×Rn решается задача математического программирования

B(t)ψ, u → max, uP . (6)

Распишем подробнее левую часть условия (6). Имеем

b11 ( )t B( )t ψ= ⎜⎜

b1r ( )t

n

b t ψ

bn1 ( )t ⎞⎛ψ1 ⎞k=1 k1 ( ) k

⎟⎜ ⎟ = ⎜ ⎟ .

bnr ( )t ⎟⎠⎜⎝ψn ⎟⎠ ⎜⎜∑n bkr ( )t ψk ⎟⎟⎟

k=1 ⎠

Тогда задача математического программирования принимает вид

n n u1 ⎞ ⎛ ⎞ ⎛ ⎞ ⎜ ⎟

u1 ⎜∑bk1 ( )t ψk + +ur ⎜∑bkr ( )t ψk → max, ⎜ ⎟P . (7)

k=1 ⎠ ⎝ k=1 ⎠ ⎜ur

По теореме Вейерштрасса максимум в условии (7) существует для любой пары (t,ψ)∈[t T0, ]×Rn . Следовательно, можно определить вектор-функцию

Uˆ :[t T0, ]×Rn P , (8)

которая каждой паре (t,ψ)∈[t T0, ]×Rn ставит в соответствие вектор U tˆ ( ,ψ)∈P , доставляющий максимум в условии (7).

Пусть функция Uˆ уже построена. Рассмотрим систему из 2n обыкновенных дифференциальных уравнений

⎧⎪⎨x = A t x( ) + B t U t( ) ˆ( ,ψ)+C t( ), (10)

⎪⎩ ψ= −A ψ.

относительно 2n неизвестных x,ψ с 2n граничными условиями

x( ) ( ) . (11) x

Заметим, что в общем случае эта система нелинейная. Более того, функция Uˆ может оказаться разрывной по переменной ψ, и тогда для системы дифференциальных уравнений (10) не будут выполняться условия существования решения. В случае, когда все же для задачи (10), (11) получено решение x0 (⋅),ψ0 (⋅), программная стратегия U0 ( )⋅ =Uˆ (⋅,ψ0(⋅)) будет удовлетворять условиям теоремы 1, т.е. являться стратегией подозрительной на оптимальную стратегию.

2.2. Поведение функции Л.С. Понтрягина вдоль оптимальной пары

В предыдущем пункте (теорема 1) было доказано, что функция Понтрягина на оптимальном управлении принимает максимальное значение. Установим ниже некоторые общие свойства функции максимума (минимума).

Пусть F : X ×Y R1, X Rn ,Y Rm – некоторая функция, непрерывная по совокупности своих переменных в каждой точке области определения. При этом множество Y компактное, а множество X – открытое. Положим

F 0(x)= max F(x, y), xX , (1)

yY

Y 0( )x = {y0(x)F(x, y0(x))= F 0(x)}, xX .

Лемма 1. Функция F 0 : X R1 , определенная равенством (1), является непрерывной в каждой точке xX .

Доказательство. Пусть xX . Для всякого xRn , x + ∆xX положим

F 0 (x) = F 0 (x + ∆x)− F 0 (x)= F(x + ∆x, y 0 (x + ∆x))− F(x, y 0 ( )x ).

Справедливо двойное неравенство

F(x + ∆x, y 0 (x))− F(x, y 0 ( )x )≤ ∆F 0 (x) ≤ F(x + ∆x, y 0 (x + ∆x))− F(x, y 0 (x + ∆x)), (2) из которого следует, что F 0 (x) → 0 при x → 0. Лемма доказана.

Определение 1. Будем говорить, что многозначное отображение χ: X → 2Y , где через 2Y обозначено множество всех подмножеств множества Y , называется полунепрерывным сверху по включению в точке xX , если для всякой последовательности {x( )s } → x и {y( )s } → y, y( )s ∈χ(x( )s ), s =1,2, имеет место включение y∈χ(x).

Заметим, что если отображение χ однозначно, т.е. множество χ(x) состоит ровно из одного элемента при всех xX , то из полунепрерывности сверху по включению этого отображения следует его непрерывность в обычном смысле.

Лемма 2. Многозначное отображение Y 0 : X → 2Y полунепрерывно сверху по включению в каждой точке xX .

Доказательство. От противного приходим к существованию точки xX и таких последовательностей

{ }xs x, xs Y, ys0 Y 0 (xs ), s =1,2 ,

что yY 0 ( )x. Тогда найдется число ε> 0, для которого

F 0 (x)− F(x, y)=ε. (3)

Из непрерывности функций F,F 0 и сходимости последовательностей {xs },{ys } к точкам x, y, соответственно, для достаточно больших номеров s будут справедливы неравенства

F 0 ( )xF 0 ( )xs F(x, y)− F(xs , ys0 ) < ε. (4)

3

Учитывая, что F, , из соотношений (3),(4) выводим

ε= F 0 ( )xF(x, y)=F 0 (x)− F(x, y) ≤

F 0 ( )x∗ − F 0 (xs ) + F(xs , ys0 )− F(x∗, y∗) < ε + ε = 2ε<ε.

3 3 3

Получили противоречие, которое и доказывает лемму.

Дополнительно предположим, что функция F непрерывно дифференцируема по переменной x в области X , а множество Y 0 (x) состоит ровно из одного элемента y 0 (x) при всех xX . Тогда, как отмечалось выше, функция y 0 : X Rm будет непрерывной в каждой точке xX .

Теорема 2. В принятых предположениях функция F 0 : X R1 непрерывно дифференцируема в каждой точке области определения и при этом имеет место равенство

∂ 0 ∂∗ 0

F ( )x = F(x, y ( )x ), xX , (5) ∂x x

где индекс «» в обозначении производной по векторному аргументу x в правой части (5) означает, что эта производная вычисляется без учета зависимости y 0 от xX .

Доказательство. По формуле конечных приращений [7] из двойного неравенства (2) находим

F(x, y 0 (x + ∆x)), ∆x + o x ≤ ∆F 0 ( )x F(x, y 0 ( )x ), ∆x + o x . (6)

Из соотношений (6) с учетом непрерывности функции y 0 следует, что

F 0 ( )x = F(x, y 0 ( )x ), ∆x + o x .

Последнее условие означает дифференцируемость функции F 0 в точке xX и справедливость равенства (5). Из непрерывности правой части равенства (5) следует непрерывность и его левой части. Теорема доказана.

Докажем одно важное свойство функции Л.С. Понтрягина.

Теорема 3. Пусть A= const B, = const C, = const и тройка U 0 ( )⋅ ,x0 (⋅),ψ0 (⋅) удовлетворяет условиям теоремы 1. Тогда функция Л.С. Понтрягина

H t x( , 0 ( )t ,U 0 ( )t 0 ( )t ) = ψ0 ( )t , Ax0 ( )t + BU tˆ ( ,ψ0 ( )t )+C,

вычисленная вдоль оптимальной пары (x0 (⋅),ψ0 (⋅)), остается постоянной на всем промежутке времени [t T0, ].

Доказательство. Вычисляем

d 0 0 0 d 0 0 d 0 0

ψ ( )t , Ax ( )t + BU ( )t +C = ψ ( )t , Ax ( )t + ψ ( )t , BU ( )t +C=

dt dt dt

0 00 0 d 0 ˆ (ψ0 ( )t )+C =

= ψ ( )t , Ax ( )t + ψ ( )t , Ax ( )t + ψ ( )t , BU dt Тр 0 0Тр 0 0 d 0 ˆ (ψ0 ( )t )

= −A ψ ( )t , Ax ( )t + A ψ ( )t , x ( )t + ψ ( )t , BU

dt

= −AТрψ0 ( )t , Ax0 ( )t + AТрψ0 ( )t , Ax0 ( )t + BUˆ (ψ0 ( )t )+C + d ψ0 ( )t , BUˆ (ψ0 ( )t )+C=

dt

= − ψ ( )t , BUˆ (ψ0 ( )t )+C + d ψ0 ( )t , BUˆ (ψ0 ( )t )+C=

dt

0 ˆ 0 ( )t ) + d ψ0 ( )t , BUˆ 0 ( )t ). (12) = −ψ ( )t , BU

dt

В силу теоремы 2 справедливо равенство

d ψ0 ( )t , BUˆ (ψ0 ( )t ) = ψ0 ( )t , BUˆ (ψ0 ( )t ) = ψ0 ( )t , BUˆ (ψ0 ( )t ). dt t

Тогда из (12) следует, что

d 0 0 00 0 0 ψ ( )t , Ax ( )t + BU ( )t +C= 0 ⇒ψ ( )t , Ax ( )t + BU ( )t +C= const .t ∈[t T0, ].

dt

Теорема доказана.

2.3 Частные случаи геометрических ограничений на вектор управляющих параметров. Иногда функция (1.8) может быть выписана в явном виде. Рассмотрим два таких частных случая.

Случай 1. Пусть

r r ( )ui 2 ⎫⎪

P = ⎨uR ∑ 2 ≤1⎬, ai > 0, i =1, ,r . ⎪⎩ i=1 ( )ai

Задача математического программирования по определению функции Uˆ состоит в максимизации линейной формы (1,7) при квадратичных ограничениях

2 1.

i=1 ( )ai 2

Решение этой задачи приводится в примере 1.4.3 книги [22]. Ее решением при ус-

Uˆ 1 (t,ψ)⎞

⎜ ⎟

ловии, что ψ≠ 0, служит вектор U tˆ ( ,ψ) = ⎜ ⎟∈P , для которого

⎜⎜⎝Uˆ r (t,ψ)⎟⎟⎠

2 ⎛ n ai ⎜∑bki ( )t ψk

Uˆ i (t,ψ) = k=1 , i =1, ,r . (1)

2

n n ⎞ 2

∑ ∑⎜ bks ( )t ψk as

s=1 ⎝ k=1 ⎠

В частности, если a1 = = ar = a, то формула (1) принимает вид

n

⎜∑bki ( )t ψk

Uˆ i (t,ψ) = a k=1 , i =1, ,r .

2 n n

∑∑bks ( )t ψk

s=1 ⎝ k=1 ⎠

Пример 2*. Рассмотрим линейный управляемый динамический объект

x1 = x2 +u x1, 2 = −x1 +u2, t∈[0,π];

u1 ⎞ ⎧ ⎛u1 ⎞ 22 2 ⎫

u = ⎜ ⎟, uP = ⎨u = ⎜ ⎟∈Ru1 +u2 ≤1⎬, x1 ( )0 = −3, x2 ( )0 = 2;

u2 ⎠ ⎩ ⎝u2 ⎠ ⎭

I Ux x .

Здесь

⎛ 0

A = ⎜

⎝−1

1⎞

⎟,

0⎠

⎛1

B = ⎜

⎝0

0⎞

⎟,

1⎠

Φ( )x = 3x12 + 2x22

Сформулируем задачу математического программирования (1.7)

Функция (1.8) здесь имеет вид

⎛ ψ1

⎜⎟

U tˆ ( ,ψ) = ,ψ≠ 0, (2)

⎜⎟

⎜⎟

⎝⎠

система дифференциальных уравнений (1.10) и граничные условия (1.11) записываются так:

ψ1

x1 = x2 +,

ψ ψ12 + 22 ψ2

x2 = −x1 +, (3)

ψ12 +ψ22

ψ1 = −ψ2, ψ2 1,

x1 ( )0 = −3, x2 ( )0 = 2,ψ1 (π) = −6x1 (π ψ π), 2 ( ) = −4x2 ( )π . (4)

Общее решение сопряженной системы находится независимо от остальных уравнений системы

ψ1 (t c c, 1, 2 ) = c1 cost +c2 sin ,t ψ2 (t c c, 1, 2 ) = c2 cost c1 sint. (5)

Преобразуем первые два уравнения в (3) с учетом (5)

(c cost +c sint)

и проинтегрируем полученную систему

tc1 cost tc2 sint

x1 (t c c c c, 1, 2, 3, 4 ) = +c3 cost + + c4 sint , c +c c +c

x2 (t c c c c, 1, 2, 3, 4+c4 cost − −c3 sint . (6)

Граничные условия (4) принимают вид

πc1 ⎞ ⎛ πc2

c3 = −3, c4 = 2, −c1 = 6⎜+ c3 ⎟, −c2 = 4⎜+ c4 ⎟ . (7)

⎜⎝ c12 +c22 ⎟⎠ ⎜⎝ c12 +c22 ⎟⎠

Решением нелинейной системы уравнений (7) будут числа

c1= 2.0562, c2= −1.2967, c3= −3, c4= 2.. (8)

Подставляя найденные константы в (5) определяем вектр-функцию ψ0 (⋅), а из

(2) - оптимальное программное управление

⎛ ⎞ ⎛ c1cost +c2sint

⎜ 02 02 ⎟ ⎜ ∗2 ∗2 ⎟ 0 0 ⎜ ψ1 ( )t 2 ( )t c1 +c2

u ( )t =U tˆ ( ,ψ ( )t ) = 0 = ∗ ∗ , t∈[0,π]. (9)

⎜ ψ2 c2 cost c1 sint

⎜⎜ ψ102 ( )t +ψ202 ( )t ⎟⎟⎠ ⎜⎝ c1∗2 +c2∗2 ⎟⎠

Аналогично из (8) находим оптимальную траекторию

2 ⎜ +c4cost − −c3sint

Ниже на рис. 2 приводятся графики изменения каждой из компонент вектора ψ0 ( )t от времени

Рис. 2

Из графиков видно, что вектор ψ0 (t) не является нулевым вектором на всем промежутке времени [t T0, ], и программное управление, удовлетворяющее условиям принципа максимума, единственное. В силу выпуклости функции Φ программное управление u0 ( )⋅ и движение объекта x0 (⋅), определенные равенствами (9) и (10) соответственно, являются оптимальными. Вычислим значение функционала на оптимальном управлении

I u⎡⎣ ⎤⎦ x x .

Для сравнения вычислим значение функционала на допустимом программном управлении

⎜ ⎟

Имеем

I u(⋅)⎤= 0.598124 .

Итак,

I u⎡⎣ ( )⋅ ⎤⎦ = 0.598124 > 0.56252 = I u⎡⎣ 0 (⋅)⎤⎦.

Оптимальная траектория объекта показана на рис. 3

Рис. 3

Заметим, что в соответствии с теоремой 3 функция Понтрягина

H t x( , 0 ( )t ,u0 ( )t 0 ( )t ) =ψ10 (t)(x20 (t)+u10 (t))+ψ20 (t)(−x10 ( )t +u20 ( )t ),

должна оставаться постоянной на всем промежутке времени [0,π]. Действительно, ниже на рис. 4 приводится график функции

H t x( , 0 (t),u0 (t),ψ0 (t)) =

⎡ 0 ⎤ ⎡ 0 ⎤ 0 ⎢ 0 ψ1 ( )t ⎥ 0 ⎢ 0 ψ2 ( )t

=ψ1 ( )t x2 ( )t + 2 2 ⎥ +ψ2 ( )t ⎢−x1 ( )t + 2 2 ⎥

10 ( )t ) +(ψ20 ( )t ) ⎥10 ( )t ) +(ψ20 ( )t ) ⎥

3

2.5 2

1.5 1

0.5

0.2 0.4 0.6 0.8 1

Рис. 4

который подтверждает факт постоянства функции Л.С. Понтрягина.

Случай 2. Геометрические ограничения на вектор управляющих параметров имеют вид

⎧ ⎛u1 ⎞⎫

⎪ ⎜ ⎟r

P = ⎨u = ⎜ ⎟∈Rαi ui ≤ βi ,i =1, ,r.

⎪⎩ ⎜⎝ur ⎟⎠⎪⎭

Uˆ 1 (t,ψ)⎞

⎜ ⎟

Решением задачи (1.7) будет служить вектор U tˆ ( ,ψ) = ⎜ ⎟∈P , для которого

⎜⎜⎝Uˆ r (t,ψ)⎟⎟⎠


⎪ βi ,

Uˆ i (t,ψ) = ⎨∀ui ∈[αβi , i ],

⎪ αi , ⎩

n

bki ( )t ψk > 0,

k=1

n

bki ( )t ψk = 0, i =1, ,r ,

k=1 n

bki ( )t ψk < 0.

k=1


Отсюда следует, что оптимальное управление u0 (t) =U tˆ ( ,ψ0 ( )t ), t ∈[t T0, ] имеет кусочно-постоянные компоненты. При дополнительных предположениях относительно матриц A и B можно дать оценку сверху для числа переключений каждой из компонент оптимального управления.

Теорема 4 (А. А. Фельдбаума). Пусть в задаче линейного быстродействия

A = const B, = const , множество P имеет вид (1), все собственные значения матрицы A - действительные числа и вектор-функция ψ0 (⋅) не является тривиальным решением сопряженной системы дифференциальных уравнений (1.3.7). Тогда каждая компонента оптимального управления u0 (t) =U tˆ ( ,ψ0 ( )t ), t ∈[t T0, ] имеет не более n −1 переключений, где n-размерность фазового вектора.

Доказательству теоремы предпошлем лемму.

Лемма 3. Пусть λ1, ,λm – действительные попарно различные числа, а f1, , fm – многочлены с действительными коэффициентами, имеющие степень k1, ,km , соответственно. Тогда функция F : R1 R1, определенная форму-

лой

F(t) = f1(t)eλ1t + + fm (t)eλmt , tR1, (11)

имеет не более чем k1 + + km + m −1 корней.

Доказательство. Проведем индукцию по числу m . При m =1 лемма очевидно справедлива, ибо функция F тогда имеет вид F(t) = f1 (t)eλ1t , t R1 , ее действительные корни совпадают с действительными корнями полинома f1 и их число не более чем k1 . Предположим, что лемма уже доказана для случая, когда в формуле (11) содержится меньше чем m слагаемых.

От противного будем считать, что функция F имеет, по крайней мере, k1 + + km + m действительных корней. Построим функцию F1 : R1 R1 по фор-

муле

F1(t) = F(t)e−λmt = f1(t)e(λ1−λm )t + + fm−1(t)em−1−λm )t + fm (t), tR1.

Функции F и F1 имеют одни и те же действительные корни. Так как между каждыми двумя действительными корнями функции лежит, по крайней мере, один корень ее производной, то производная (km +1)-го порядка функции F1 имеет по крайней мере

(k1 + + km + m)−(km +1) = k1 + + km1 + m−1

действительных корней. С другой стороны, эта производная имеет вид

F1(km+1)( )t = g1(t)e(λ1−λm )t + + gm−1(t)em−1−λm )t , tR1 ,

где числа λ1 −λm , ,λm1 −λm попарно различны, а степень многочлена gi равна ki ,i =1, ,m −1. Согласно предположению индукции функция F1(km +1) имеет не более

k1 + + km +(m−1)− =1 k1 + + km + m− 2

действительных корней, вопреки тому, что было установлено выше. Полученное противоречие завершает индукцию. Лемма доказана.

Доказательство теоремы 4. Достаточно установить, что для всех

n

i =1, ,r функция Vi ( )⋅ = ∑bkiψk0 ( )⋅ имеет не более чем n −1 действительных

k=1

корней. Напомним, что вектор-функция ψ0 (⋅) является решением линейного дифференциального уравнения

ψ= −ATψ.

Каждое собственное число матрицы AT представляет собой собственное число матрицы A, взятое с противоположным знаком, и поэтому является действительным числом. Тогда

ψk0 ( )t = g1k ( )t eλ1t + + gmk ( )t eλkt , tR1, k =1, ,n,

где λ1, ,λm – все попарно различные собственные значения матрицы AT , а g jk ( )⋅ – многочлен степени rj −1, где rj – кратность корня λj , j =1, ,m, k =1, ,n. Таким образом,

V t( ) = f ( )t eλt + + f ( )t eλmt , tR1, i =1, ,r .

Здесь f ji – многочлен степени rj −1, j =1, ,m . По лемме 3 функция Vs (⋅) имеет не более чем

(r1 −1)+ + (rm −1)+ m −1= r1 + + rm −1= n −1

действительных корней. Теорема доказана.

Пример 3*. Рассмотрим линейный управляемый динамический объект

x1 = 2x1 + 2x2 −30x3 +u1, x2 =10x1 x2 −35x3 +u2, x3 = 2x1 x2 + x3 +u3,

u1 ⎞ ⎧ ⎛u1 ⎞ ⎫

⎜ ⎟ ⎪ ⎜ ⎟ 3

u = ⎜u2 ⎟, uP = ⎨u = u2 R ui ≤1, i =1,2,3 ,⎬ x1 ( )0 = −3, x2 ( )0 = 2, x3 ( )0 =1;

u3 ⎟

Здесь

u3 ⎟

I U( )⋅ ⎤= x1 (1)+ 2x2 (1)− x3 (1) → min .

⎛ 2

A = 10

⎜ 2

2

−1

−1

−30⎞ ⎛1 0 0⎞

⎟ ⎜ ⎟

−35, B = 0 1 0, Φ( )x = x1 ( )1 + 2x2 ( )1 − x3 ( )1 .

1 ⎟⎠ ⎜⎝0 0 1⎟⎠

Сформулируем задачу математического программирования (1.7)

ψ1 1u +ψ ψ2u2 + 3u3 → min, ui ≤1, i =1,2,3

и решим ее. Функция (1.8) здесь имеет вид

ˆ ( ,ψ) = ⎜⎛⎜UUˆˆ12 ((tt,,ψψ))⎟⎟,Uˆi (t,ψ) = ⎪⎨⎧любоечислоsigni ], ψψii =<00,

U t

U

⎜⎝ ˆ3 (t,ψ)⎟⎟⎠ ⎩⎪⎪из−[0sign,1],[ψ ψi ], i > 0.

Система дифференциальных уравнений (1.10) и граничные условия (1.11) записываются так:

x1 = 2x1 + 2x2 −30x3 +Uˆ1 (t,ψ), x2 =10x1 x2 −35x3 +Uˆ2 (t,ψ), x3 = 2x1 x2 + x3 +Uˆ3 (t,ψ),

ψ1 = −2ψ ψ ψ1 −10 2 −2 3, ψ2 = −2ψ ψ ψ1 + 2 + 3, ψ3 = 30ψ ψ ψ1 +35 2 3,

x1 ( )0 = −3, x2 ( )0 = 2, x3 (0) =1, ψ1 (1) = −1,ψ2 (1) = −2,ψ3 ( )1 =1.

В данном примере сопряженная система дифференциальных уравнений интегрируется независимо от основной системы. В результате с учетом граничных условий получим вектор-функцию ψ0 (t), t ∈[0,1]

Ниже на рис. 5 приводятся графики зависимости компонент этой вектор-функции от времени

ψ1 ψ2

Рис. 5

Из приведенных графиков видно, что вектор ψ0 (t), t ∈[0,1] не является тождественным нулем. Тогда функция (8) определяется однозначно и представляет собой оптимальное программное управление. Компоненты

вектора ψ0 (t) знакопостоянны, поэтому для построения

оптимальной программной стратегии достаточно определить момент времени tˆ∈[0,1], в который происходит переключение первой компоненты вектора ψ0 ( )t . В результате решения уравнения ψ10 (t) = 0 приходим к равенству

tˆ = 0.741061.

Таким образом, оптимальное программное управление имеет вид

⎧ 1, t ∈⎡⎣0, tˆ),

произвольноечисло

u t = ⎨ t = tˆ, , u t u t

из[−1,1 ,]

⎩ −1, t ∈(tˆ,1 .⎤⎦

Подставим оптимальное управление в основную систему дифференциальных уравнений и проинтегрируем ее с соответствующими начальными условиями. В результате получим оптимальное движение x0 ( )t , t∈[0,1].

Вычислим значение функционала на оптимальном программном управле-

нии

I u0 ( )⋅ ⎤= x10 (1)+ 2x20 (1)− x30 (1) = −366.188

Для сравнения вычислим значение функционала на допустимом про-

⎛ 1 ⎞

граммном управлении u t( ) = −1, t∈[0,1]. Пусть x(⋅) = x(⋅,t x u0, 0, ( )⋅ ). Тогда ⎜⎝ 1 ⎟⎠

I u( )⋅ ⎤= x1 (1)+ 2x2 (1)− x3 (1) = −365.348.

Таким образом,

I u⎡⎣ ( )⋅ ⎤⎦ = −365.348 > −366.188 = I u⎡⎣ 0 (⋅)⎤⎦ .

Наконец, в соответствии с теоремой 3 проверим постоянство функции Понтрягина, вычисленной вдоль оптимальной пары (x0 (t),ψ0 ( )t ) на промежутке времени [0,1]. Действительно, ниже на рис. 6 приводится график функции

H t x( , 0 ( )t ,u0 ( )t 0 (t)) =ψ10 (t)(2x10 (t)+ 2x20 (t)−30x30 ( )t +u10 ( )t )+

20 ( )t (10x10 (t)− x20 ( )t −35x30 (t)+u20 (t))+ψ30 (t)(2x10 (t)− x20 (t)+ x30 ( )t +u10 ( )t ),

Рис. 6

который подтверждает факт постоянства функции Л.С. Понтрягина.

2.4. Минимизация расстояния до целевого множества. Рассмотрим частный случай задачи 1, исследованной в предыдущем пункте. Именно, будем предполагать, что функция Φ , определяющая критерий качества, имеет смысл евклидового расстояния от проекции фазового вектора на часть своих (k первых, k n) координат до некоторого выпуклого компактного множества M Rk .

Таким образом,

Φ( )x = ρ({ }x k ,M ) = minm Mρ({ }x k ,m) = minm Mm−{ }x k ,m−{ }x k , k n M, ⊂ Rk . Здесь символ {⋅}k означает проекцию вектора из пространства Rn на свои первые k n координат.

В дальнейшем множество M Rk будем называть целевым.

Проекцию области достижимости G t x T( 0, 0, ) ⊂ Rn на подпространство Rk обозначим символом {G t( 0,x T0, )}k . Предположим, что выполняется условие

{G t( 0,x T0, )}k M = ∅. Полагаем

ε0 = min{ε> 0{G t( 0,x0 )}k Mε ≠ ∅},

где символом Mε обозначена замкнутая ε−окрестность целевого множества. Из компактности множества {G t( 0,x T0, )}k следует существование минимума в правой части последнего равенства и справедливость соотношения

ε0 = I U0 (⋅)⎤ > 0.

Вычислим величину ε0 . По теореме 1.30 [22] условие {G t( 0,x T0, )}k Mε ≠ ∅ будет иметь место тогда и только тогда, когда

G tmin0 0,x T, l q, ≤χ(M ε, ),l l S(0, 1)={s Rk s =1}.

q{ ( )}k

Здесь χ(Mε,⋅) - опорная функция множества Mε. Тогда

ε0 = min⎨⎧ε> 0min l q, ≤ χ(Mε, )l ∀ ∈l S (0, 1) . (1)

q{G t( 0 0,x T, )}k

В силу равенства

χ(M ε, )l = max m l, = +ε maxm M m l, m Mα

из (1) выводим, что

0 ⎡⎤

ε = l Smax∈ (0,1) ⎢⎣−maxm Mm l,+ q∈{G tmin( 0 0,x T, )}k q l, ⎦⎥ . (2) Пусть максимум в (2) достигается на векторе l0 S(0,1). Покажем, что вектор l0 S(0,1) определяется однозначно. Действительно, от противного приходим к существованию векторов l(1),l(2) S (0,1 ,) l(1) l(2) , для которых

= −max m l, ( )1 + min q l, ( )1 ,

q{G t( 0 0,x T, )}

k

= −max m l, ( )2 + min q l, ( )2 .

q{G t( 0 0,x T, )}


k

Сложим эти равенства почленно


0 = −max m l, ( )1 + min q l, ( )1 − max m l, + min q l, ( )2m Mq{G t( 0 0,x T, )}k m Mq{G t( 0 0,x T, )}

≤ −max m l, ( )1 +l( )2 + min q l, ( )1 +l( )2 (3)

m Mq∈{G t( 0 0 k

Из неравенства (3) следует, что l(1) ≠ −l(2) , а из условия l(1) l(2) следует, что l( )1 +l( )2 < 2. Полагаем

(1) (2)

l +l

l = ( )1 ( )2 ∈S(0,1). l +l


Тогда из (3) выводим

2ε0 0

ε <≤ −max m, l( )1 +l( )2 m M


+ min=

q∈{G t( 0 0,x T, )}k

−maxm Mm l, ∗ + q∈{G tmin( 0 0,x T, )}k q l, ∗ ≤ l Smax∈ (0,1) ⎡⎢⎣−maxm Mm l, + q∈{G tmin( 0 0,x T, )}k q l, ⎤⎦⎥ =ε0 .

Получили противоречие, которое и доказывает единственность максими-

зирующего вектора l0 S(0,1).

Геометрическая интерпретация полученного результата (см. рис. 7) состоит в том, что вектор l0 является опорным к множеству M , а вектор −l0 -

опорным к множеству {G t( 0,x0 )}k .

Используя формулу Коши, придадим равенству (2) другую форму

ε0 =

T T ⎪⎤⎥ =

= max ⎢−max m l, +X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( ) ( )u d + ∫ X t[ ,τ τ τ]C( )d ⎬⎥

l=1 ⎢ m Mt0 t0 ⎪⎭k

T T

= max ⎢−max m l, +X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( ) ( )u d + ∫ X t[ ,τ τ τ]C( )d , l⎥ =

l=1 m M

⎢⎣t0 t0

T

= max1 ⎢−max m l, + X T t[ , 0 ]x l0, + ∫ X T[ ,τ]B( ) ( )τ τu , ldτ+ l= m M

⎢⎣ t0

= max ⎢−max m l,

l=1 m Mu P

⎢⎣

T

+∫C( )τ , XТр[T,τ τ]ld . (4)

t0

l

⎜ ⎟

Здесь обозначено l= 0 Rn .

⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠

Теорема 5. Пусть ε0 > 0 и U 0 (⋅ ∈Π) [t T0, ] - оптимальная программная стратегия. Тогда

B( )t U 0 ( )t , XТр[T t l, ] 0= min B t u( ) , XТр[T t l, ] 0 (5)

u P

l0

⎜ ⎟

при почти всех t ∈[t T0, ], где l0= 0 Rn .

⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠

Доказательство. Допустим, что условие (5) нарушается. Тогда существует множество T ∈[t T0, ] ненулевой меры, на котором выполняется неравенство

B(t U) 0 ( )t , XТр[T t l, ] 0> minB t u( ) , XТр[T t l, ] 0, tT .

u P

Из последнего соотношения вытекает, что

T T

B( )τ U 0 ( )τ , XТр[T,τ τ]l0d > ∫minu PB( ) ( )τ τu , XТр[T,τ τ]l0d . (6)

t0 t0

Подставим вектор l0 S(0,1) в правую часть равенства (4). Имеем

T

0 = −max m l, 0 + x0, XТр[T t l, 0 ] 0+ ∫minB( ) ( )τ τu , XТр[T,τ τ]l0d +


t0 u P

T

+∫C( )τ , XТр[t,τ τ]l0d .

t0

С учетом неравенства (6) выводим

ε0 = I U0 ( )⋅ ⎤= ρ({x0 ( )T }k ,M ) = maxl=1 ⎣⎢−maxm Mm l, + {x0 ( )T }k ,l⎦⎥ = l1 ⎡⎢−max m l, X T t[ , 0 ]x0 + tT0 X T[ ,τ τ τ τ]B( )U 0 ( )d + tT0 X t[ ,τ τ τ]C( )d ⎬⎫k⎥⎤⎥ ≥

= max

= ⎪⎭


T 0 T

≥ −max m l, X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( )U ( )d + ∫ X t[ ,τ τ τ]C( )d ⎬ , l=

t0 t0 ⎪⎭k

T T

= −max m l, X T t[ , 0 ]x0 + ∫ X T[ ,τ τ τ τ]B( )U 0 ( )d + ∫ X t[ ,τ τ τ]C( )d , l0

t0 t0

T

+ x0, XТр[T t l, 0 ] 0+ ∫ B( )τ U 0 ( )τ , XТр[T,τ τ]ld +

t0

C( )τ , XТр[t,τ τ]l0d > −max m l, 0 + x0, XТр[T t l, 0 ] 0+

m M

0

T T

+∫minu PB( )τ u X, Тр[T,τ τ]l0d + ∫ C( )τ , XТр[t,τ τ ε]l0d = 0 .

t0 t0

Получили противоречие. Теорема доказана.

Очевидно (см. рис. 7), что

0 {x0 ( )T }k m0 l =.

{x0 ( )T }k m0

Представим функцию Φ в виде

Φ( )x = minm M∈ { }x k m,{ }x k m =


= { }x k m0 ( ) { }x , x k m0 ( )x ,

Рис. 7 xRn .

Из теоремы 3 следует, что

⎧∂Φ(x)⎫

⎨ ⎬ =

⎩ ∂x k

⎧ ∂ ⎫ {x} −m0 (x) {x} −m0 ( )x


= ⎨ { }x k m,{ }x k m m m= 0 x ⎬ = 0 k 0 = k 0 = l0 .

⎩∂x ( ) ⎭k { }x k m ( ) { }x , x k m ( )x { }x k m ( )x

При x = x0 ( )T отсюда выводим

∂Φ(x0 ( )T )⎫{x0 (T )}k m0 (x0 (T )) 0 ∂Φ(x0 ( )T ) 0∗

⎨ ⎬ = 0 0 0 = l ⇒ = l .

⎪⎩ ∂x ⎪⎭k {x ( )T }k m (x ( )T ) ∂x

Тогда условие (5) эквивалентно следующему:

0 ТрТр ∂Φ(x0 ( )T )

B( )t U ( )t , −X [T t, ]= maxB t u( ) , −X [T t, ], t∈[t T0, ].

u P∈∂x

В силу равенства

0 Тр ∂Φ(x0 (T ))

ψ ( )t = −X [T t, ] , t∈[t T0, ]

x

необходимые условия оптимальности программного управления, доказанные в теореме 6, совпадают с аналогичными условиями принципа максимума Л.С. Понтрягина (теорема 1). Из теоремы 5 также следует, что если величина Φ(x0 ( )T ), вычисленная в результате интегрирования исходной системы дифференциальных уравнений после подстановки в нее программного управления, определенного из условия (4), совпадает с величиной ε0 , вычисленной по формуле (5), то это программное управление является оптимальным.

Пример 4. Рассмотрим линейный управляемый динамический объект из примера 1. Терминальный критерий качества Φ( )x = x12 +(x2 −2)2 можно трактовать как расстояние в конечный момент времени от фазового вектора

⎛ ⎞0 до точки m = ⎜ ⎟. Для данного примера выполнены равенства

⎝ ⎠2

⎛1

k = 2, X t[ ,τ] = ⎜

⎝0

Последовательно вычисляем

0⎞

⎟,

1⎠

⎛1 B t( ) =

⎝0

T

0⎞ 0∗ 0

, l = l . 1⎠

∫minu PX T[ ,τ τ]B( )u l d, 0 τ=

t0

⎤ ⎡ 1

dτ⎥ = maxl=1 ⎢−2l2 − ∫( l1 + l2 )dτ⎥ =

⎦⎥⎣ 0 ⎦

l10 ⎞ ⎛ 0 ⎞

=1 ⎤ =1, ⎜ 0 ⎟ = ⎜ ⎟ . l l2 ⎠ ⎝−1⎠

Необходимые условия оптимальности программного управления здесь принимают вид

u t sign l u t sign l t . (7)

В силу l10 = 0 условия(7) определяют программную стратегию неоднозначно. В частности, им удовлетворяет стратегия

U t u d t .

⎝ 1 ⎠ 0

При этом

I U0 (⋅)⎤ =1=ε0 .

Следовательно, стратегия U 0 (⋅) является оптимальной.

Приведем последовательность действий по решению задачи управления динамической системой на основе теоремы 5.

В начале строится фундаментальная матрица Коши для однородной системы дифференциальных уравнений и вычисляется опорная функция χ(M, )⋅ целевого множества M по формуле

χ(M l, ) = maxm Mm l, , l S(0,1).

Далее для произвольного l S(0,1) решается задача математического программирования

l

⎜ ⎟

Tр Тр 0

B ( )t X [T t, ]⎜ ⎟, u→ min, uP. (8)

⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠

По теореме Вейерштрасса минимум в левой части равенства (8) существует для любой пары (t l, )∈[t T0, ]×S(0,1). Таким образом, определена векторфункция

Uˆ :[t T0, ]×S (0,1) → P, (9)

которая каждой паре (t l, )∈[t T0, ]×S(0,1) ставит в соответствие вектор U t lˆ ( , )∈P , доставляющий минимум в условии (8). Явная запись этой функции возможна для частных случаев управляемой системы, рассмотренных в предыдущем пункте. Пусть функция Uˆ уже построена. Тогда приходим к следующей задаче математического программирования:

l ⎞⎛ l

⎜ ⎟⎜ ⎟

Тр 0Tр Тр 0 ε( )l = −χ(M l, )+[T t, 0 ]⎜ ⎟ U (τ,l), B ( )t X [T,τ]⎜ ⎟dτ+

⎜ ⎟⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠⎜⎜⎝ 0 ⎟⎟⎠

C( )τ , XТр[dτ→ max , l=1. (10)

Эта задача всегда имеет решение, а в случае когда ε ε0 = ( )l0 > 0 , ее решение единственное. Заметим, что приведенная задача математического программирования осложнена наличием определенных интегралов в выражении для целевой функции. Эти интегралы обычно не берутся

аналитически даже, если функция Uˆ определена явно.

Пусть ε0 > 0 и l0 S(0,1) - максимизирующий вектор. Тогда программное управление, удовлетворяющее необходимому условию оптимальности, определяется по формуле

U 0 (⋅) =Uˆ (⋅,l0 ). (11)

После подстановки этого управления в исходные дифференциальные уравнения движения объекта, последние могут быть проинтегрированы с заданными начальными условиями. Далее проверяется справедливость равенства

ε0 = I U0 (⋅)⎤.

В случае его выполнения программная стратегия, определенная равенством (11), является оптимальной.

Пример 5*. Рассматривается следующая управляемая динамическая система

x1 = 2x1 +9x2 +u1, ⎧⎪⎛u1 ⎞22 2 ⎫⎪

, uP = ⎨⎜ R u1 +u2 ≤1⎬, t∈[0,1],

x2 = x1 + 2x2 +u2 ⎪⎩⎝u2 ⎠⎪⎭

⎧⎪⎛ m1 ⎞⎫⎪

M = ⎨⎜ ≤1, k = n = 2, x1 (0) = x2 ( )0 = 0.

⎪⎩⎝m2 ⎠⎪⎭

Фундаментальная матрица Коши для однородной системы дифференциальных уравнений здесь имеет вид

12 e−(t−τ) (1+e6(t−τ) ) 32 e−(t−τ) (− +1 e6(t−τ) )⎞

X t[ ,τ] = ⎜⎜⎜ ⎟⎟⎟ .

⎝ ⎠

Вычислим опорную функцию χ(M,⋅)терминального множества M . Име-

ем

ml1 1 + m l2 2 .

Обозначим n1 = m1 −50, n2 = m2 −12. Тогда

n2 n2

(n1 +50)l1 +(n2 +12)l2 = nl1 1 + n l2 2 +50l1 +30l2 → max, .

Отсюда выводим

2 2 l 2

χ(M,l) = 4l +9l +50l +30l l, = ∈R .


Выражение ε( )l здесь принимает вид

T

ε( )l = −max m l, 0 + X T t[ , 0 ]x, l0 + ∫minu P

t0

+ ⎜

l2 ⎠

X T[ ,τ τ τ]B( ) ( )u , l0=

3 e−(1(−1τ−τ) )(− +1 e6 1( −τ) )⎟⎞⎛ ⎞⎜ ⎟0 , ⎛⎜l1 ⎞⎟+

2

12 e− (1+e6 1( −τ) ) ⎟⎠⎟⎝ ⎠0 ⎝l2 ⎠


u1 ⎞ ⎜

u ⎠ )

1


) ∫ ⎡⎡ 1 e−(1−τ) (1+ e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 ⎤⎦2 +

= −4l +9l +50l1 +30l2 − ⎢⎣ 2

0 ⎣

2

+⎣ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+e6 1( −τ) )l2 ⎥⎦ dτ=

,

где обозначено

2

Ε(τ, ,l l1 2 ) = ⎢⎣⎡⎣⎡ 12 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 ⎦⎤ +

2

+23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+e6 1( −τ) )l2 ⎥⎦ .

Функция Uˆ , доставляющая минимум в выражении (8), определяется формулой

1 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2

2

⎜− ⎟

ˆ ( , ) = ⎜⎜ Ε(τ, ,l l1 2 ) ⎟⎟. (12)

U t l

⎜ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+ e6 1( −τ) )l2 ⎟

⎜− ⎟

⎜⎝ Ε(τ, ,l l1 2 ) ⎟⎠

Задача математического программирования (10) формулируется следующим образом:

.

Ее решение в силу равенства l2 = ± 1−l12 сводится к проблеме максимизации функции одного переменного l1 ∈ −[ 1,1]. Максимум целевой функции и вектор, на котором этот максимум достигается, соответственно имеют вид

0

0 0 0 l1 ⎞ ⎛−0.316⎞

ε ε= ( )l =11.874 > 0, l = ⎜ 0 ⎟ = ⎜ .

l2 ⎠ ⎝−0.949⎠

Подставляя l0 в (12,) находим управление

1 e−(1−τ) (1+e6 1( −τ) )l10 + 16 e−(1−τ) (− +1 e6 1( −τl) )l20 ⎞

2

⎜− ⎟

⎜ Ε(τ,l l10, 20 ) ⎟

U 0 ( )t = ⎜ ⎟,

3 e−(1−τ) (− +1 e6 1( −τ) )l10 + 12 e−(1−τ) (1+e6 1( −τ) )l20 ⎟

2

⎜ − ⎟

⎜⎝ Ε(τ,l l10, 20 ) ⎟⎠

удовлетворяющее необходимым условиям оптимальности.

Подставим это управление в исходное дифференциальное уравнение и проинтегрируем полученное уравнение с заданными начальными условиями.

Ниже на рис. 8 приводятся графики изменения фазовых координат по времени для найденного закона движения объекта

Рис. 8

Вычислим координаты фазового вектора в конечный момент времени и финальное расстояние от него до целевого множества

0 x10 ( )1 ⎞ ⎛45.817⎞ 0 0

x ( )1 = ⎜x20 ( )1 = ⎜15.805, I U⎡⎣ ( )⋅ ⎤⎦ = ρ(x ( )1 ,M ) =11.874.

Непосредственно убеждаемся в справедливости равенства

ε ε0 = (l0 ) = I U0 (⋅)⎤.

Таким образом, стратегия U 0 является оптимальной стратегией, а отвечающая ей траектория движения объекта – оптимальной траекторией. Для сравнения вычислим финальное расстояние от фазового вектора до терминального множества в случае, когда в качестве допустимого программного управления взята вектор- функция

12 e−(1−τ) (1+e6 1( −τ) )l10 + 16 e−(1−τ) (− +1 e6 1( −τl) )l20 −0.5⎞ ⎜− ⎟

⎜ Ε1 (τ,l10,l20 ) ⎟ u t( ) = ⎜ ⎟,

⎜ 23 e−(1−τ) (− +1 e6 1( −τ) )l10 + 12 e−(1−τ) (1+e6 1( −τ) )l20 + 0.5 ⎟ ⎜ − ⎟

⎜⎝ Ε1 (τ,l10,l20 ) ⎟⎠

где

Ε1 (τ, ,l l1 2 ) = ⎡⎡ 12 e−(1−τ) (1+e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l2 −0.5⎤2 +

⎢⎣⎣ ⎦

2

+⎡⎣ 23 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+ e6 1( −τ) )l2 + 0.5⎤⎦ ⎤⎦⎥ .

Пусть x( )⋅ = x(⋅,t0,x V0. ( )⋅ ). Тогда

x1 ( )1 ⎞ ⎛45.878⎞

x2 ( )1 ⎟⎠ = ⎜⎝ ⎟, I u⎡⎣ ( )⋅ ⎤ =⎦ 11.923.

⎝ 15.733⎠

Таким образом,

I u⎡⎣ ( )⋅ ⎤⎦ =11.923 >11.8735 = I U⎡⎣ 0 (⋅)⎤⎦ .

Пример 6*. В условиях предыдущего примера принимается, что

⎧⎪⎛u1 2⎫⎪ P = ⎨⎜ ⎟∈R≤1⎬.

⎪⎩⎝u2 ⎠⎭⎪

Тогда

1

ε( )l == − 4l +9l +50l1 +30l2 − ∫12 e−(1−τ) (1+ e6 1( −τ) )l1 + 16 e−(1−τ) (− +1 e6 1( −τ) )l d2 τ−

0

3 e−(1−τ) (− +1 e6 1( −τ) )l1 + 12 e−(1−τ) (1+ e6 1( −τ) )l d2τ.

0

Функция Uˆ , доставляющая минимум в выражении (8), определяется формулой

ˆ ( , ) = ⎝⎜−−signsign⎡⎣⎡1232 ee−−((11−−ττ)) ((1− ++1e6 1e( 6 1−(τ−)τ))l1)l+1 +16 e12e(1−−(τ1)−τ()− +(11+ee6 16 1(( −−ττ)) ))ll22 ⎤⎦⎦⎤⎟⎞⎠⎟⎟ , (13)

U t l

а задача математического программирования (10) формулируется следующим образом:

ε(l) → max, l12 +l22 =1.

Ниже приводится ее численное решение

l0 ⎞ ⎛ 0.304 ⎞ l = ⎜ 0 ⎟ = ⎜ , ε ε= ( )l = 9.036 > 0.

0 1 0 0

l2 ⎠ ⎝−0.953⎠

Подставляя l0 в (13), находим программное управление

U 0 ( )t = ⎜⎛ −sign z⎣⎡ 1 ( )t ⎦⎤ ⎟⎞, (14)

⎜⎝−sign z⎡⎣ 2 ( )t ⎤⎦⎟⎠

где

z t e e l e e l , z t e e l e e l t .

Моменты переключений управления (14) определим из анализа графиков

функций z1 ( )t ,z2 ( )t , t∈[0,1], представленных на рис. 9.

Рис. 9

Из условия z1 ( )t = 0 находим момент времени t ≈ 0.36245, в который происходит переключение первой компоненты вектора оптимального управления. Очевидно, что вторая компонента этого вектора все время остается постоянной.

Приведем (см. рис. 10) графики зависимостей компонент вектора управления (14) от времени

U1 U2

Рис. 10

Финальное расстояние от фазового вектора до терминального множества при управлении (12) равно I U0 = ρ(x0 (1),M ) = 9.036. Соотношение

I U 0 =ε ε0 = (l0 )

здесь снова выполняется и, следовательно, управление (12) является оптимальным. Финальное расстояние до терминального множества оказалось меньше того, что было получено в примере 5. Этот результат ожидаемый, так как область изменения вектора управляющих параметров в рассматриваемом случае шире, чем в примере 5.

Для сравнения вычислим финальное расстояние от фазового вектора до терминального множества, когда в качестве допустимого программного управления взята вектор- функция

.

⎝ ⎠

Пусть x( )⋅ = x(⋅,t0,x u0, ( )⋅ ). Тогда

x1 ( )1 ⎞ ⎛58.334⎞

x2 ( )1 ⎟⎠ = ⎜⎝19.866⎠, I u⎡⎣ ( )⋅ ⎤⎦ =10.513.

Таким образом,

I u⎡⎣ ( )⋅ ⎤⎦ =10.513 > 9.036 = I U⎡⎣ 0 (⋅)⎦⎤ .

Рассмотрим управляемый объект, динамика которого описывается линейными дифференциальными уравнениями с переменными коэффициентами.

Пример 7*.

x1 = x3,

x2 = x4,

x3 = (cost x) 3 +tx4 +u1,

1

x2 = x3 +(sint x) 4 +u2 , t +1

⎧⎪⎛u1 ⎞22 2 ⎫⎪

uP = ⎨⎜ ⎟∈R u1 +u2 ≤1⎬, t∈[0,1],

⎪⎩⎝u2 ⎠⎪⎭

⎧⎪⎛ m1 ⎞ 22 2

k = 2, M = ⎨⎜ R(m1 −5) +(m2 − 4) ≤1⎬ ,

⎩⎪⎝m2 ⎠⎭⎪

x1 ( )0 = x2 (0) = x3 (0) = x4 (0) = 0.

Построим фундаментальную матрицу Коши для однородной системы дифференциальных уравнений и запишем выражение (4) для данного случая

ε0 = max ⎢−max m l, + min q l, ⎥ = max ⎢−max(l n1 1 +l n2 2 +5l1 + 4l2 )+


l S∈ (0,1) m Mq{G t( 0 0,x T, )}2 l S∈ (0,1) n=1


⎛0 0⎞ ⎛ x11 (1,τ) x12 (1,τ) x13 (1,τ) x14 (1,τ)⎞

⎜ ⎟ ⎜ ⎟⎥

+ min⎜⎜10 00⎟⎟⎜⎛⎝uu12 ⎟⎞⎠, ⎜⎜ xx3121 ((11,,ττ)) xx3222 ((11,,ττ)) xx3323 ((11,,ττ)) xx3424 ((11,,ττ))⎟⎟dτ⎥⎥⎥ =

⎜⎜0 1⎟⎟⎠ ⎜⎜⎝ x41 (1,τ) x42 (1,τ) x43 (1,τ) x44 (1,τ)⎟⎦⎥

⎛ 0 ⎞ ⎛l x1 11 (τ)+l x2 21 (τ)⎞

⎜ ⎟ ⎜ ⎟

1 2 1⎜ 0 ⎟,⎜l x1 12 ( )τ +l x2 22 ( )τ ⎟

= max0,1 ⎡− −⎣ 1 (5l + 4l )+ ∫0 minu P∈⎜u1 ⎟ ⎜l x1 13 ( )τ +l x2 23 ( )τ ⎟ l S∈ ( )

⎜⎜⎝u2 ⎟⎟⎠ ⎜⎜⎝l x1 14 ( )τ +l x2 24 ( )τ ⎟⎟⎠

⎡⎤


= − +1 l Smax∈ (0,1) ⎢ −(5l1 + 4l2 )+ ⎡x13 (1, )l1 + x23 (1,τ)l2 ⎤ + ⎡2 x14 (1,τ)l1 + x24 (1,τ)l2 2 dτ⎥.

⎣ 0 ⎦

Задача математического программирования (10) здесь принимает вид

ε(l) = − −1 (5l1 + 4l2 )−

d → max, l =1.

Приведем ее решение

0 ⎛−0.779⎞ 0

l = ⎜ , ε( )l = 4.596.

⎝−0.627⎠

Заметим, что построить фундаментальную матрицу Коши в аналитическом виде в данном примере не удается. Это обстоятельство в некоторой степени осложняет численное решение задачи математического программирования. Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле

x13 (1,t l) 10 + x23 (1,t l) 20

⎜−⎟

0 ⎜⎟

U ( )t = ⎜ 0 0 ⎟ , (15)

x14 (1,t l) 1 + x24 (1,t l) 2

⎜⎟

⎝⎠

где

Ε(t l, 10,l20 ) = (x13 (1,t l) 10 + x23 (1,t l) 20 )2 +(x14 (1,t l) 10 + x24 (1,t l) 20 )2 .

Закон движения объекта определяется путем интегрирования основной системы дифференциальных уравнений с заданными начальными условиями, в которую подставлено программное управление (15). Ниже на рис. 11 приводятся графики изменения первых двух координат фазового вектора от времени

Рис. 11

Финальное значение проекции фазового вектора на первые две координаты и расстояние от нее до терминального множества задается равенствами

{x0 ( )1 }2 = ⎜⎜⎛ xx1200 ( )( )11 ⎟⎟⎠⎞ = ⎜⎝⎛0.4910.641⎠⎟⎞, I U⎣⎡ 0 ( )⋅ ⎤⎦ = ρ({x0 ( )1 }2 ,M ) = 4.596 .

Непосредственно проверяется, что

ε ε0 = (l0 ) = I U0 (⋅)⎤

и устанавливается, что программное управление U 0 (⋅) является оптимальным.

Для сравнения вычислим финальное расстояние от проекции фазового вектора на первые две координаты до терминального множества для случая, когда в качестве допустимого программного управления взята вектор функция

x t l x t l

⎜− 0 0 ⎟

Ε1 (t l, 1 ,l2 ) u t( ) = ⎜⎟, t∈[0,1].

x t l x t l

⎜⎟

⎝⎠

Здесь

.

Пусть x( )⋅ = x(⋅,t0,x u0, ( )⋅ ). Тогда

x1 ( )1 ⎞ ⎛0.703⎞

x2 ( )1 ⎟⎠ = ⎜⎝0.193⎟⎠, I u⎡⎣ ( )⋅ ⎤⎦ = 4.74077 ⎜

Таким образом,

I u⎡⎣ ( )⋅ ⎤⎦ = 4.74077 > 4.596 = I U⎡⎣ 0 (⋅)⎤⎦ .

Пример 8*. В условиях предыдущего примера принимается, что

⎧⎪⎛u1 2⎫⎪ P = ⎨⎜ ⎟∈R≤1⎬.

⎪⎩⎝u2 ⎠⎭⎪

Тогда

0 ⎡ 1 ⎤

ε = − +1 l Smax∈ 0,1 ⎢ −(5l1 + 4l2 )− ∫x13 (1,τ)l1 + x23 (1,τ)l2 + x14 (1,τ)l1 + x24 (1,τ τ)l d2 ⎥.

( )

⎣ 0 ⎦

Вектор- функция Uˆ определяется формулой

U t l lˆ ( , ,1 2 ) = ⎛⎜−sign x⎣⎡ 13 (1,τ)l1 + x23 (1,τ)l2 ⎤⎦⎞⎟, (14)

⎜⎝−sign x14 (1,τ)l1 + x24 (1,τ)l2

а задача математического программирования (8) здесь принимает вид

1

ε( )l = − −1 (5l1 + 4l2 )− ∫ ⎡x13 (1,τ)l1 + x23 (1,τ)l2 + x14 (1,τ)l1 + x24 (1,τ τ)l2 d → max, l =1.

0

Приведем ее решение

0 ⎛ −0.791⎞ 0

l = ⎜ , ε( )l = 4.282.

⎝−0.612⎠

Подставляя l0 в (12), находим управление

⎛−sign x13 (1,τ)l10 + x23 (1,τ)l20 ⎤⎞

U 0 ( )t t . (15)

⎜⎝−sign x14 (1,τ)l10 + x24 (1,τ)l20 ⎝ ⎠1

Из графиков компонент вектора управления (15), представленных на

рис. 12

U1 U2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Рис. 12.

видно, что оптимальное управление постоянно на всем промежутке времени [0,1]. Оптимальный закон движения объекта определяется путем интегрирования основной системы дифференциальных уравнений с заданными начальными условиями, в которую подставлено оптимальное программное управление (15). Ниже на рис 13 приводятся графики изменения первых двух координат фазового вектора от времени

Рис. 13

Финальное значение проекции фазового вектора на первые две координаты и расстояние от нее до терминального множества задается равенствами

0 x10 ( )1 ⎞ ⎛0.821⎞ 0 0

{x ( )1 }2 = ⎜⎜ x20 ( )1 ⎟⎟= 0.771, I U⎡ ( )⋅ ⎤= ρ({x ( )1 }2 ,M ) = 4.282 .

Вновь подтверждается выполнение равенства

I U 0 (⋅)⎤=ε ε0 = (l0 ).

Найденное расстояние меньше того, что было получено в примере 7. Этот результат ожидаемый, так как область изменения вектора управляющих параметров в рассматриваемом примере шире, чем в примере 7.

Для сравнения вычислим финальное расстояние от проекции фазового вектора на первые две координаты до терминального множества для случая, когда в качестве допустимого программного управления взята вектор- функция

1, 0, 0.1 1, [0, 0.9)

u t = ⎜ ⎟ u1 ( )t = u2 t = .

u2 ( )t ⎠ ⎪⎩ 1 t ∈[0.1,1] ⎪⎩−1 t∈[0.9,1]

Пусть x( )⋅ = x(⋅,t0,x U0, ( )⋅ ). Тогда

x1 ( )1 ⎞ ⎛0.499⎞

x2 ( )1 ⎟⎠ = ⎜⎝0.652⎠, I U⎡⎣ ( )⋅ ⎤⎦ = 4.60949 .

Таким образом, I u⎡⎣ ( )⋅ ⎤= 4.60949 > 4.282 = I U0 (⋅)⎤.

2.5. Случай подвижного левого и свободного правого конца траектории. Будем предполагать, что в постановке задачи 1 множество S0 Rn содержит более одной точки и является компактным множеством в Rn . Сформулируем получившуюся задачу.

Задача 2. Найти допустимую программную стратегию U 0 ( )⋅ ∈Π[t T0, ], доставляющую минимум функционалу

I U (⋅)⎤= Φ(x T( )), Φ∈C1 (R1 )

при ограничениях

x = A t x( ) + B t u( ) +C t( ), xRn, uP Rr , θ0 ={t0},θ1 ={T}, x0 S0 Rn, S1 = Rn .

Обозначим

Γ(t S T0, 0, ) = ∪ G t x T( 0, 0 , ).

x0∈S0

Из непрерывной зависимости области достижимости от начального положения x0 S0 (см. формулу Коши) и компактности множества S0 следует, что множество Γ(t S T0, 0, ) ⊂ Rn также является компактным, поэтому решение задачи

2 существует.

Пусть пара доставляет решение задачи 2.

Очевидно, что программная стратегия U 0 (⋅ ∈Π) [t T0, ] будет оптимальной для задачи 1, если принять S0 ={x00}, а остальные условия задачи 1 считать совпадающими с соответствующими условиями задачи 2. Тогда по теореме 4 должно выполняться

B( )t U 0 (t),ψ0 (t) = max B t u( ) ,ψ0 (t) (1)

u P

для почти всех t ∈[t T0, ], где

. (2)

Условия (1) и (2) не позволяют однозначно определить программную стратегию управления, претендующую на решение задачи 2, поскольку они содержат n неизвестных параметров, образующих вектор начальных условий

x . Для их определения выведем так называемые условия трансверсальности на левом конце траектории.

Пусть

S0 ={xRnϕi ( )x ≤ 0, i =1, ,m},

где ϕi : Rn R1, i =1, ,m -заданные непрерывно дифференцируемые по совокупности аргументов функции. Дополнительно предположим, что для множества

S0 выполнено следующее условие регулярности: для всех xS0 набор векторов

∂ϕi ( )x 0

, iI ( )x ={i∈{1, ,mi ( )x = 0}

x

является линейно независимым.

Оптимальное начальное положение фазового вектора x00 удовлетворяет равенству

T T

Φ x T = Φ⎜⎜ X T t, x + X T,τ τ τ τB U d + X T[ ,τ τ τ]C( )d ⎟⎟ =

t0 t0

T T

= minx0∈S0 Φ⎜⎜ X [T t, 0 ]x0 + ∫ X T[ ,τ]B( )τ τ τU 0 ( )d + ∫ X T[ ,τ τ τ]C( )d ⎟.

t0 t0

⎧µ0

⎪ ⎪

⎪µ1

По теореме Кароша – Джона [22] существует вектор ⎬ ≠ 0, для которого

⎪ ⎪

⎪⎩µm ⎪⎭

справедливы соотношения

T T

∂Φ⎜⎜ X T t[ , 0 ]x00 + ∫ X T[ ,τ τ τ τ]B( )U 0 ( )d + ∫ X T[ ,τ τ τ]C( )d

µ0 ⎝ t0 t0 ⎠ +

x0

m ∂ϕi

+i=1 µi x0 ; (3)

µϕi i 0, µi 0, i 1, ,m ; (4)

µ0 ∈{0,1}. (5)

Заметим, что в силу регулярности множества S0 , в условии (5) можно сразу записать µ0 =1. Действительно, пусть µ0 = 0 . Тогда из условий (3) и (4) следует, что

µ = 0 ⇒ µ = 0 , (6)

i=1 x0 x0

причем среди чисел µi , iI 0 ( )x есть числа, отличные от нуля. Равенство (6) про-

тиворечит линейной независимости набора векторов . Остается

признать, что µ0 =1.

Вычисляем

∂Φ ⎛ T 0 T

X T t[ , ]x + X T[ ,τ τ τ τ]B( )U ( )d + X T[ ,τ τ τ]C( )d ⎟ =

x0 0 0 t0 t0 ⎟⎠x0=x00

= X Tp = − .

x

Теперь условие (3) можно переписать в виде

0 m ∂ϕi

ψ ( )t0 = i=1 µi x .

Таким образом, доказана следующая теорема.

Теорема 6. Пусть пара доставляет ре-

шение задачи 2. Тогда необходимо

B( )t U 0 (t),ψ0 (t) = max B t u( ) ,ψ0 (t)

u P

при почти всех t ∈[t T0, ]. В случае, когда для множества S0 выполнены условия регулярности, существует набор чисел µ1 ≥ 0, ,µm ≥ 0 таких, что

0 m ∂ϕi 0

ψ ( )t0 = i=1 µi x , µϕi i (x0 ) = 0, i =1, ,m.

Пример 9*. Рассмотрим линейный управляемый динамический объект

x1 = x2 +u x1, 2 = −x1 +u2, t∈[0,π];

u1 ⎞ ⎧ ⎛u1 ⎞ 22 2 ⎫

u = ⎜ ⎟, uP = ⎨u = ⎜ ⎟∈Ru1 +u2 ≤1⎬,

u2 ⎠ ⎩ ⎝u2 ⎠ ⎭

⎧⎪⎛ x1 2⎫⎪

S0 = ⎨⎜ ⎟∈R − 25− x + x2 ≤ 0, x1 x2 +5 ≤ 0⎬

⎪⎩⎝ x2 ⎠⎪⎭

I U⎡⎣ ⎤⎦ x x .

Условия рассматриваемого примера совпадают с условиями примера 2 за исключением граничных условий на левом конце траектории. В данном примере множество S0 содержит более одной точки. Множество S0 показано на

рис. 14.

x2

Рис. 14

Повторяя выкладки из примера 2, приходим к тому, что

⎛ ψ1

⎜⎟

U tˆ ( ,ψ) = ,ψ≠ 0,

⎜⎟

⎜⎟

⎝⎠

а объединенная система дифференциальных уравнений имеет вид

ψ1

x1 = x2 +,

ψ ψ12 + 22 ψ2

x2 = −x1 +, (7)

ψ12 +ψ22

ψ1 = −ψ2 , ψ2 1.

Выпишем граничные условия. На правом конце траектории они тождественны условиям, полученным в примере 2

ψ1 ( )π = −6x1 (π),ψ2 (π) = −4x2 (π). (8)

В соответствии с теоремой 6 выпишем граничные условия на левом конце траектории

ψ0 ( )0 =µ1 ∂ ⎛⎜− 4⋅ 25− x12 + x2 ⎟⎞+µ2 ∂ (x1 − x2 +5) =

x ⎝ 5 ⎠ ∂x

⎛ 4x1 ⎞ ⎛ 4x1

⎜ 2 ⎟ ⎛ 1 ⎞ ⎜µ1 2 +µ2

= µ1 ⎜ 5 25− x1 ⎟+µ2 ⎝⎜−1⎟⎠ = ⎜⎜ 5 25µ µ1 −− x12 ⎟⎟⎠ ,

⎜ 1 ⎟⎠ ⎝

⎛ 4 2

µ1 − ⋅ 25− x1 + x2 = 0, µ2 (x1 x2 +5) = 0, µ µ1 ≥ 0, 2 ≥ 0 .

⎝ 5 ⎠

Общее решение системы дифференциальных уравнений (7) имеет вид

ψ1 (t c c, 1, 2 ) = c1 cost +c2 sint, ψ2 (t c c, 1, 2 ) = c2 cost c1 sint ,

tc1 cost tc2 sint ,

x1 (t c c c c, 1, 2, 3, 4 ) = +c3 cost + + c4 sint c +c c +c

x2 (t c c c c, 1, 2, 3, 4+c4 cost − −c3 sint . (9)

Выпишем граничные условия с учетом равенств (9).

На левом конце

4x

10 , c2 = µ µ1 2 , 2

c3 = x10,

На правом конце

c4 = x20 , µ1 ≥ 0,

µ2 ≥ 0.

(10)

⎛⎜ πc1 + c3 ⎞⎟, −c2 = 4⎛⎜ πc2 +c4 ⎞⎟. (11)

c1 = 6

c12 +c22 c12 +c22

В результате получилась система из восьми уравнений относительно восьми c c c c1, 2, 3, 412, x10,x20 неизвестных. Последовательно рассмотрим четыре случая: 1) µ µ1 = 0, 2 = 0, : 2) µ µ1 > 0, 2 = 0, : 1) µ µ1 = 0, 2 > 0, : 1) µ µ1 > 0, 2 > 0.

Случай 1. Из первых двух равенств в (10) вытекает, что

c1 = c2 = 0 ⇒ ψ0 (t) ≡ 0, t ∈[0,π].

Из граничных условий (8) следуют равенства x1 (π) = x2 (π) = 0. Покажем, что

⎛ ⎞0

⎜ ⎟∉Γ(0,S0,π). Для этого достаточно установить справедливость неравенст-

⎝ ⎠0 ва

l Smax∈ (0,1) ⎣⎢⎡q G tmin( 0 0,x T, ) q l, ⎤ = l Smax∈ (0,1 ⎢⎡minx0∈S0 X [π,0]x l0, +π0 minu PX [πτ, ]u l d, τ⎥⎤ > 0. (12)

⎥⎦ ) ⎣⎦

Последовательно вычисляем

⎛ cos(t −τ) sin(t −τ)⎞

X [t,τ] = ⎜ ⎟,X [π,0]x0, l = −l x1 10 l x2 20 ,

−sin(t −τ) cos(t −τ)

min X [πτ, ]u l, 1.

u P

В результате неравенство (12) принимает вид

lmax minl ⎢⎣⎡ x S (−l x1 10 −l x2 20 )⎥⎦⎤ >π. (13)

Минимум линейной формы, стоящей в левой части неравенства (13), может достигаться лишь в тех начальных позициях, которые лежат на дуге эллипса.

Тогда левая часть неравенства (13) вычисляется по формуле

= 3.527 >π,

и неравенство (13) имеет место. Таким образом, случай 1 не дает решения задачи оптимального управления.

Случай 2). Граничные условия принимают вид

4x10 4

c1 1, c2 1 , , x10 x20 +5 ≤ 0, (14)

5 25− x102

⎛ πc1 ⎞ ⎛ πc2 ⎞

c3 = x10, c4 = x20 , µ1 > 0 , c1 = 6⎜+ c3 ⎟, −c2 = 4⎜+c4 . (15) ⎜⎝ c12 +c22 ⎟⎠ ⎜⎝ c12 +c22 ⎟⎠

Эти условия противоречивы, так как в силу второго равенства в (14) выполняется c2 > 0. Тогда из второго и четвертого равенств в (15) следует, что x20 < 0 и x0 S0 .

Случай 3). Граничные условия принимают вид

c1 2 , c2 = −µ2 , , x10 x20 +5 = 0 , (16)

⎛ πc1 ⎞ ⎛ πc2 ⎞

c3 = x10, c4 = x20 , µ2 > 0 , c1 = 6⎜+ c3 ⎟, −c2 = 4⎜+c4 ⎟. (17)

⎜⎝ c12 +c22 ⎟⎠ ⎜⎝ c12 +c22 ⎟⎠

Решением системы (16), (17) будут числа c1 =1.337, c2 = −1.337, c3 = −2.444, c4 = 2.556,µ2 =1.337 > 0, x10 = −2.444, x20 = 2.556.

Подставляя их в (7), определяем оптимальную программную стратегию и оптимальную траекторию объекта. Ниже на рис. 15 приводится вид этой траектории. x2

Рис. 15

Оптимальное значение функционала равно

I Ux x .

В примере 4 значение функционала на оптимальном управлении было

«хуже» и равнялось величине 0.562 . Такой результат является ожидаемым,

⎛−3⎞ так как начальная точка x0 = ⎜ ⎟ из примера 4 принадлежит множеству S0 ⎝ 2 ⎠

данного примера.

Случай 4). Граничные условия принимают вид

4x10 4

c1 12 , c, x10 x20 +5 = 0 ,

5 25− x102

⎛ πc1 ⎞ ⎛ πc2 ⎞

c3 = x10, c4 = x20 , µ1 > 0, µ2 > 0 , c1 = 6⎜+ c3 ⎟, −c2 = 4⎜+c4 .

⎜⎝ c12 +c22 ⎟⎠ ⎜⎝ c12 +c22 ⎟⎠

Эта система имеет два решения.

Первое решение

c1 =11.150, c2 = 0, c3 = −5, c4 = 0, µ1 = −8.79 10⋅ 7 , µ2 = −8.79 10⋅ 7 ,

x10 = −5, x20 = 0 .

Второе решение

c1 =1.093, c2 = −3.589, c3 = −1.098, c4 = 3.902,µ1 = −3.043< 0,µ2 = 0.545,

x10 = −1.098, x20 = 3.902 .

Оба решения не удовлетворяют предположениям четвертого случая.

Таким образом, задача оптимального управления имеет единственное решение, которое было получено в третьем случае.

Пример 10*. Рассмотрим линейный управляемый динамический объект

x1 = 2x1 + 2x2 −30x3 +u1, x2 =10x1 x2 −35x3 +u2, x3 = 2x1 x2 + x3 +u3,

⎧ ⎛u1 ⎞ ⎫

⎪ ⎜ ⎟ 3

uP = ⎨u = u2 R ui ≤1, i =1,2,3, t ∈[0,1]

⎪ ⎜⎝u3 ⎟⎠ ⎪⎭

⎧⎛ x1 ⎞⎫

⎪⎜ ⎟ 3x2 x3

x0 ∈S0 = ⎨⎪⎜⎜ x2 ⎟∈R+ 6 + 3 ≤1, x1 ≤ 0, − x2 ≤ 0, − x3 ≤ 0⎪⎬;

⎩⎝ x3 ⎟⎠⎭

I U( )⋅ ⎤= x1 (1)+ 2x2 (1)− x3 (1) → min .

Условия рассматриваемого примера совпадают с условиями примера 3 за исключением граничных условий на левом конце траектории. В данном примере множество S0 содержит более одной точки. Множество S0 показано на

рис. 16.

Рис. 16

Повторяя выкладки из примера 3, приходим к тому, что

Uˆ1 (t,ψ)⎞ ⎧⎪ signi ], ψi < 0

ˆ ( ,ψ) = ⎜⎜Uˆ2 (t,ψ)⎟⎟,Uˆi (t,ψ) = ⎪⎨любоечисло ψi = 0,

U t

⎜⎜⎝Uˆ3 (t,ψ)⎟⎟⎠ ⎩⎪⎪из−[0sign,1],[ψ ψi ], i > 0.

Объединенная система дифференциальных уравнений принимает вид

x1 = 2x1 + 2x2 −30x3 +Uˆ1 (t,ψ), x2 =10x1 x2 −35x3 +Uˆ2 (t,ψ), x3 = 2x1 x2 + x3 +Uˆ3 (t,ψ),

ψ1 = −2ψ ψ ψ1 −10 2 −2 3, ψ2 = −2ψ ψ ψ1 + 2 + 3, ψ3 = 30ψ ψ ψ1 +35 2 3.

В данном примере сопряженная система дифференциальных уравнений интегрируется независимо от основной системы. В результате с учетом граничных условий

ψ1 (1) = −1,ψ2 (1) = −2,ψ3 (1) =1

получим вектор-функцию ψ0 (t), t ∈[0,1]. Эта функция тождественна той, что была построена в примере 3.

Тогда оптимальная программная стратегия имеет вид

⎧ 1, t ∈⎡0, tˆ),

произвольноечисло

U t = ⎨ t = tˆ, , U t U t t ,

из[−1,1 ,]

⎩ −1, t ∈(tˆ,1 .⎤

где tˆ = 0.741061.

Подставим ее в исходную систему дифференциальных уравнений

x1 = 2x1 + 2x2 −30x3 +U10 (t),

x2 =10x1 x2 −35x3 +U20 ( )t , (18)

x3 = 2x1 x2 + x3 +U30 ( )t ,

В соответствии с теоремой 6 выпишем граничные условия на левом конце траектории. С учетом равенств

x1 x3 x2 ϕ1 (x x x1, 2, 3 ) = + + −1,, (−9) 6 3

ϕ2 (x1,x x2, 3 ) = x1, ϕ3 (x x x1, 2, 3 ) = −x2, ϕ4 (x x x1, 2, 3 ) = −x3 ,

имеем

19 µ µ ψ1 + 2 = 1 ( )0 , 16 µ µ ψ1 − 3 = 2 (0), 13 µ µ ψ1 − 4 = 3 ( )0 ,

x1 x3 x2

µ1 ⎢ + + −1⎥ = 0, µ2x1 = 0, µ3x2 = 0, µ4x3 = 0,

(−9) 6 3

µ1 ≥ 0, µ2 ≥ 0, µ3 ≥ 0, µ4 ≥ 0 . (19)

Условия (19) однозначно определяют следующий набор параметров:

µ1 = 2050.13,µ2 = 346.69,µ3 = 468.885,µ4 = 0, x100 = 0, x200 = 0, x300 = 3.0 .

Проинтегрируем систему(18) с полученными начальными условиями

x100 ⎞ ⎛ ⎞0

⎜ 0 ⎟ ⎜ ⎟

x( )0 = ⎜ x20 ⎟ = ⎜ ⎟0

⎜⎝ x300 ⎟⎜ ⎟⎝ ⎠3

и вычислим значение функционала на оптимальном управлении. Имеем

I U0 (⋅)⎤= −2344.02.

В примере 3 значение функционала на оптимальном управлении было «хуже» и равнялось величине −366.188. Такой результат является ожидаемым, так как

⎛−3⎞

начальная точка x0 = 2 из примера 3 принадлежит множеству S0 данного

⎜⎝ 1 ⎟⎠

примера.

2.6. Минимизация расстояния до целевого множества в случае подвижного левого конца траектории. Рассмотрим частный случай задачи 2, исследованной в пункте 2.5. Именно, будем предполагать, что функция Φ , определяющая критерий качества, имеет смысл евклидового расстояния от проекции фазового вектора на часть своих (k первых (k n)) координат до некоторого выпуклого компактного множества M Rk . Относительно множества S0 Rn дополнительно предположим, что оно выпукло.

Пусть

Γ(t S T0, 0, ) = ∪ G t x T( 0, 0 , ).

x0∈S0

Из непрерывной зависимости области достижимости от начального положения x0 S0 (см. формулу Коши) компактности и выпуклости множества S0 следует, что множество Γ(t S T0, 0, ) ⊂ Rn также является компактным и выпуклым. Предположим, что выполняется {Γ(t0,S T0, )}k M = ∅. Полагаем

ε0 = min{ε> 0{Γ(t0,S T0, )}k Mε ≠ ∅}.

Из компактности множества Γ(t S T0, 0, ) следует существование минимума в правой части последнего равенства и справедливость соотношения

ε0 = I U0 (⋅)⎤> 0.

Вычислим величину ε0 . По теореме 1.30 [22] условие

{Γ(t0,S T0, )}k Mε ≠ ∅ будет иметь место тогда и только тогда, когда

q∈ Γ{ min(t S T0 0, , )}k l q, ≤χ(M ε, ),l l S(0, 1)={s Rk s =1}.

Отсюда следует, что

ε0 = min⎨⎧ε> 0min l q, ≤ χ(Mε, )l ∀ ∈l S (0, 1) =

q∈ Γ{ (t0 0,S T, )}k

⎡⎤

= max ⎢−maxm Mm l, + q∈ Γ{ min(t S T0 0, , )}k q l, ⎥⎦ . (1) l S∈ (0,1) ⎣

По аналогии с пунктом 2.4. можно показать, что максимум в (1) достигается на единственном векторе l0 S(0,1) и получить другую форму записи равенства (1)

Тр T Тр

0

ε = maxl=1 ⎢−maxm Mm l, + minx0∈S0x0, X T t[ , 0 ] l+ ∫minu PB( )τ u X, [T,τ τ]ld +

⎢⎣ t0

T

+∫C( )τ , XТр[T,τ τ]ld ⎥ . (2) t0 ⎥⎦

l

⎜ ⎟

0 Rn .

Здесь обозначено l =

⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠

Теорема 7. Пусть ε0 > 0 и пара , U 0 ( )⋅ ∈Π[t T0, ] является

решением задачи оптимального управления. Тогда

x00, XТр[T t, 0 ]l0= min x0, XТр[T t, 0 ]l0 (3)

x0∈S0

B( )t U 0 ( )t , XТр[T t l, ] 0= min B t u( ) , XТр[ (4)

u P

l0

⎜ ⎟

при почти всех t ∈[t T0, ], где l0= 0 Rn .

⎜⎜⎝ 0 ⎟⎟⎠

Доказательство. Из равенства (2) при l= l0 выводим

T

0 = −max m l, 0 + minx0∈S0 x0, XТр[T t l, 0 ] 0∗ + ∫minu PB( ) ( )τ τu , XТр[T,τ τ]l0∗ d +

t0

T

+∫C( )τ , XТр[t,τ τ]l0d .

t0

Пусть нарушается какое-либо из условий (3) - (4). Тогда одно из неравенств (или оба сразу)

x00, XТр[T t l, 0 ] 0∗ ≥ min x X0, Тр[T t l, 0 ] 0∗ ,

x0∈S0

TT

B( )τ U 0 ( )τ , XТр[T,τ τ]l0d ≥ ∫minu PB( ) ( )τ τu , XТр[T,τ τ]l0d . (5)

t0 t0

будет строгим. По аналогии с пунктом 2.4 с учетом условия (5) вычисляем

0 0 0 0 ⎡0⎤



ε = I x U0 ,

m M

T

( )⋅ ⎤= ρ({x ( )T }k ,M ) = maxl=1 ⎣−maxm Mm l, + {x ( )T }k ,l⎦ =

t0

+ x00, XТр[T t l, 0 ] 0B( )τ U 0 ( )τ ,

XТр[t,τ τ]l0d > −max m l, + min x0,

m Mx0S0


T T

+∫minu PB( )τ u X, Тр[T,τ τ]l0d + ∫ C( )τ , XТр[t,τ τ ε]l0d = 0 .

t0 t0

Получили противоречие. Теорема доказана.

Последовательность действий по решению задачи управления динамической системой на основе теоремы 7 в целом аналогична той, что была описана в пункте 2.4. Отличие состоит лишь в том, что задача математического программирования (4.7) здесь принимает вид

l ⎞⎛ l

⎜ ⎟⎜ ⎟

ε( )l = −χ(M l, )+ min X T t[ , 0 ]x0,0 X T[ ,τ τ τ]B( )Uˆ ( ,l), 0 dτ+

x0S0⎜ ⎟⎜ ⎟

⎜⎜⎝ 0 ⎟⎟⎠⎜⎜⎝ 0 ⎟⎟⎠

+X t[ ,τ τ]C( ), dτ→ max , l =1. (6)

Эта задача всегда имеет решение, а в случае когда ε ε0 = ( )l0 > 0 , это решение единственное. Другое отличие касается начальных условий для фазового вектора: их следует выбирать из соотношения (3). Также как и в пункте 2.4, достаточным условием оптимальности найденного управления будет являться совпадения величины ε0 и значения функционала на этом управлении.

Пример 11*. Рассматривается следующая управляемая система:

x1 = x3,

x2 = x4,

x3 = (cost x) 3 +tx4 +u1,

1

x2 = x3 +(sint x) 4 +u2, t +1

⎪⎧⎛u1 ⎞ 2 2 2 ⎪⎫

uP = ⎨⎜ ⎟∈R u1 +u2 ≤1⎬, t∈[0,1],

⎪⎩⎝u2 ⎠ ⎪⎭

⎧⎪⎛ m1 ⎞ 2 2 2

k = 2, M = ⎨⎜ R (m1 −5) +(m2 − 4) ≤1⎬ ,

Фундаментальная матрица Коши для однородной системы дифференциальных уравнений, опорная функция множества M и функция Uˆ здесь совпадают с теми, что были построены в примере 7. Вычисляем

x10 ⎞ ⎛l1

⎜ ⎟ ⎜ ⎟

minx0, ψ0( )T = min X [1,0]x20 ,l2 =

x0∈S0x0∈S0⎜ x30 ⎟ ⎜ 0 ⎟

⎜⎜ x40 ⎟⎟⎠ ⎜⎜⎝ 0 ⎟⎟⎠

⎝ = min0 0 ⎡l1 (x11 [1,0]x10 + x12 [1,0]x20 + x13 [1,0]x30 + x14 [1,0]x40 )+ x S

+l2 (x21 [1,0]x10 + x22 [1,0]x20 + x23 [1,0]x30 + x24 [1,0]x40 )⎤=

= min0 0 ⎡x10 (l x1 11 [1,0]+l x2 21 [1,0])+ x20 (l x1 12 [1,0]+l x2 22 [1,0])+ x S

+x + + + = =

0∈ 0

i=1

= − (0.2)2 β12 (l l1, 2 ) (+ 0.1)2 β22 (l l1, 2 ) (+ 0.1)2 β32 (l l1, 2 ) (+ 0.2)2 β42 (l l1, 2 ) = −Ξ(l l1, 2 ), где обозначено

βi (l l1, 2 ) = l x1 1i [1,0]+l x2 2i [1,0 ,] i =1,2,3,4 .

При этом

β1 (l l1, 2 ) (⋅ 0.2)2 β2 (l l1, 2 ) (⋅ 0.1)2

x10 (l l1, 2 ) = − , x20 (l l1, 2 ) = − , Ξ(l l1, 2 ) Ξ(l l1, 2 )

β3 (l l1, 2 ) (⋅ 0.2)2 β4 (l l1, 2 ) (⋅ 0.1)2

x30 (l l1, 2 ) = − , x40 (l l1, 2 ) = − . (7) Ξ(l l1, 2 ) Ξ(l l1, 2 )

Выпишем задачу математического программирования (6)

T

ε( )l = − −1 (5l1 + 4l2 )−Ξ(l l1, 2 )− Ε(τ,l l10, 20 )dτ→ max, l =1,

t0

где

Ε(t l, 10,l20 ) = (x13 (1,t l) 10 + x23 (1,t l) 20 )2 +(x14 (1,t l) 10 + x24 (1,t l) 20 )2 .

Решением этой задачи будет

l10 = −0.781, l20 = −0.625,ε(l0 ) = 4.287.

Подставляя вектор l0 в (7), находим оптимальное начальное положение фазового вектора

x10 = 0.101, x20 = 0.202, x30 = 0.057, x40 = 0.123. (8)

Оптимальная программная стратегия задается формулой

x13 (1,t l) 10 + x23 (1,t l) 20

⎜−⎟

0 ⎜⎟

U ( )t = ⎜ 0 0 ⎟ . (9)

x14 (1,t l) 1 + x24 (1,t l) 2

⎜⎟

⎝⎠

Оптимальный закон движения объекта определяется путем интегрирования основной системы дифференциальных уравнений с начальными условиями (8), в которую подставлено оптимальное программное управление (9). Ниже на рис. 16 приводятся графики изменения первых двух координат фазового вектора от времени

Рис. 16

Финальное значение проекции фазового вектора на первые две координаты и расстояние от нее до целевого множества задаются равенствами

0 x10 ( )1 ⎞ ⎛0.872⎞ 0 0 0

{x ( )1 }2 = ⎜⎜ x20 ( )1 ⎟⎟= ⎜0.697, ρ(x (1),M ) = 4.287 =ε( )l .

Последнее равенство означает оптимальность найденного программного управления.

В примере 7 значение функционала на оптимальном управлении было

«хуже» и равнялось величине 4.596 . Этот результат объясняется тем, что

⎛ ⎞0

⎜ ⎟

0 начальная точка x0 = ⎜ ⎟ из примера 7 принадлежит множеству S0 данного

⎜ ⎟0

⎜ ⎟⎜ ⎟⎝ ⎠0

примера.

Пример 12*. В условиях предыдущего примера принимается, что

⎧⎪⎛u1 2⎫⎪ P = ⎨⎜ ⎟∈R≤1⎬.

⎩⎪⎝u2 ⎠⎭⎪

Тогда вектор функция Uˆ определяется формулой

U t l lˆ ( , ,1 2 ) = ⎛⎜−sign x⎣⎡ 13 (1,τ)l1 + x23 (1,τ)l2 ⎦⎤⎞⎟, (10)

⎜⎝−sign x14 (1,τ)l1 + x24 (1,τ)l2

а задача математического программирования (6) здесь принимает вид

ε( )l = − −1 (5l1 + 4l2 )−Ξ(l l1, 2 )−

1

−∫⎡x13 (1,τ)l1 + x23 (1,τ)l2 + x14 (1,τ)l1 + x24 (1,τ τ)l2 d → max, l =1.

0

Решением этой задачи будут числа

l10 = −0.794, l20 = −0.608,ε(l0 ) = 3.973.

Подставляя вектор l0 в (7), находим оптимальное начальное положение фазового вектора

x10 = 0.103, x20 = 0.197, x30 = 0.057, x40 = 0.121. (11)

Оптимальная программная стратегия задается формулой

U 0 ( )t = ⎛⎜−sign x⎡⎣ 13 (1,τ)l10 + x23 (1,τ)l20 ⎤⎦⎟⎞, t ∈[0,1]. (12)

⎜⎝−sign x14 (1,τ)l10 + x24 (1,τ)l20

Из графиков компонент вектора оптимального управления, представленных на

рис. 17,

U1 U2

0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1

Рис. 17.

видно, что оптимальное управление постоянно на всем промежутке времени [0,1]. Оптимальный закон движения объекта определяется путем интегрирования основной системы дифференциальных уравнений с начальными условиями (11), в которую подставлено оптимальное программное управление (12). Ниже приводятся графики изменения первых двух координат фазового вектора от времени.

Рис. 18

Финальное значение проекции фазового вектора на первые две координаты и расстояние от нее до терминального множества задаются равенствами

0 x10 ( )1 ⎞ ⎛1.053⎞ 0 0 0

{x ( )1 }2 = ⎜⎜ x20 ( )1 ⎟⎟ = ⎜0.975, ρ(x (1),M ) = 3.973 =ε( )l .

Последнее равенство означает оптимальность найденного программного управления.

Полученный результат лучше, чем в примере 8 (4.282 ) и лучше, чем в примере 11 (4.287 ). Это объясняется тем, что в первом случае точка x0 из примера 8 принадлежит множеству S0 данного примера, а во втором случае тем, что множество P из примера 11 вложено в множество P данного примера.

Упражнения для самостоятельной работы

1. Найти ошибку в рассуждениях.

Рассмотрим управляемый динамический объект

u1 ⎞ ⎧⎪⎛u

x1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜

u2 ⎠ ⎪⎩⎝

x10 ⎞ ⎛ ⎞0

⎜ ⎟ = ⎜ ⎟, t0 = 0,T =1, Φ( )x = (x −0.25) +(x − 2) .

x20 ⎠ ⎝ ⎠0

Критерий качества Φ здесь имеет смысл расстояния от финального положения фазового вектора до точки M , положение которой задается вектором

⎛0.25⎞

rM = ⎜ ⎟. Тогда оптимальное управление (одно из возможных) имеет вид

⎝ 2 ⎠

0 ⎛0.25⎞

u ( )t = ⎜ , t ∈[0,1].

⎝ 1 ⎠

Покажем, что управление u0 (⋅) не удовлетворяет условиям принципа максимума Л.С. Понтрягина. Действительно, выпишем функцию Л.С. Понтрягина

H t x u( , , ,ψ ψ ψ) = 1 1u + 2u2 .

Максимум этой функции достигается, когда

uˆ1 = sign1 ), uˆ2 = sign2 ).

Сопряженная система здесь записывается так:

ψ1 = 0,ψ2 = 0 ⇒ψ10 (t) = c120 (t) = c2 .

Управления, подозрительные на оптимальность, удовлетворяют условию

uˆ1 = sign c( 1 ) = const u, ˆ2 = sign c( 2 ) = const.

После подстановки управлений u uˆ1, ˆ2 в основную систему дифференциальных уравнений получим

x1 = sign c( 1 ), x2 = sign c( 2 ).

Интегрируя основную систему, с учетом начальных условий находим

x10 ( )t = sign c t( )1 , x20 ( )t = sign c( 2 )t x10 (1) = sign c( 1 ), x20 ( )1 = sign c( )2 .

Выпишем условия трансверсальности в конечный момент времени

− ⇒


⎝⎛⎜⎜ψψ1200 ( )( )11 ⎠⎞ ⎜⎜

⎟⎟ = −⎜

⎜⎜

x10 (1)−0.25 ⎞

(x10 ( )1 −0.1)2 +(x20 ( )1 −2)2

⎟ ⇒ x20 ( )1 −2 ⎟

⎟ (x10 ( )1 −0.1)2 +(x20 ( )1 −2)2 ⎟⎟


sign c( 1 )−0.25

c1 = − 2 2 ,


(sign c( )1 0.1) +(sign c( )2 2)

c2 = − sign c( )2 −2 .

⎪ 2 2

⎪⎩ (sign c( )1 −0.1) +(sign c( )2 −2)

Пусть c10,c20 - решение этой системы. Очевидно, что c c . Тогда оптимальное управление должно привести управляемую точку в вершины квадрата. Управление u0 (⋅) этому условию не удовлетворяет.


2. Для линейных управляемых динамических систем, описанных в упражнениях раздела 1 (дифференциальные уравнения движения, начальные условия, отрезок времени управления), решить задачу оптимального управления со следующими функционалами:

Рассмотреть два случая геометрических ограничений на вектор управляющих параметров


⎧⎛u1

⎪⎜ ⎟

1) P = ⎨⎜u2 ⎟

⎪⎩⎜⎝u3 ⎟⎠

⎫ ⎧⎛u1 2 2 2 ⎪ ⎪⎜ ⎟ u1 +u2 +u3 ≤1⎬, 2) P = ⎨u2

⎪⎭ ⎪⎩⎜⎝u3 ⎟⎠

u ≤1, i =1,2,3⎬.

⎪ ⎭


Убедиться, что результат управления во втором случае будет «лучше», чем в первом случае. Задачу оптимального управления следует решить двумя способами. Первый способ состоит в использовании необходимых условий оптимальности в форме принципа максимума Л.С. Понтрягина, второй способ – в форме прицеливания на опорный вектор к множеству области достижимости.

Проверить выполнение достаточных условий оптимальности.

3. Решить приведенные выше задачи оптимального управления в предположении, что начальное положение фазового вектора не фиксировано. Считать, что


3. ЗАДАЧА ЛИНЕЙНОГО ПРЕДЕЛЬНОГО БЫСТРОДЕЙСТВИЯ

3.1. Постановка задачи линейного предельного быстродействия и существование ее решения. Линейную задачу теории оптимального управления назовем задачей линейного быстродействия, если:

1) минимизируемый функционал имеет форму Лагранжа с подынтеграль-

ной функцией f 0 ≡1;

2) начальный момент времени фиксирован θ0 ={t0 };

3) конечный момент времени не фиксирован θ1 ∈{TT > t0};

4) левый и правый конец траектории закреплены S0 ={x0}, S1 ={0}, x0 ≠ 0 ,

5) область изменения управляющих параметров P Rr выпукла.

Теорема 1 (Существование решения задачи линейного быстродействия.) Пусть для некоторого момента времени T > t0 выполнено включение

0∈G t( 0,x T0, ),

где G t x T( 0, 0, ),T > t0 - область достижимости управляемого объекта. Тогда задача линейного быстродействия имеет решение.

Доказательство. По предположению теоремы

Τ ={T > t00∈G t( 0,x T0, )} ≠ ∅ .

Обозначим T 0 = inf T . Достаточно показать, что

T∈Τ

0∈G t( 0,x T0, 0 ). (1)

Рассмотрим последовательность

{Tk} →T 0, Tk ∈Τ, k =1,2,

Включение (1) следует из замкнутости области достижимости, непрерывной зависимости ее от T и включений

0∈G t x T( 0, 0, k ), k =1,2,

Теорема доказана.

Момент времени T 0 будем называть оптимальным временем перехода.

3.2. Необходимые условия оптимальности программной стратегии.

Пусть выполнены условия теоремы 1. Полагаем

ε[ ]T = maxl=1 q G t∈ min( 0 0,x T, ) q l, ⎥⎦ = maxl =1 F l T( , ), T t0 , (1)

L T0 ( ) ={l0 ( )T S(0,1) F l( 0 ( )T ,T)= l Smax∈ (0,1) F l T( , )}, T t0 ,

где

T T

F l T( , ) =X T t[ , 0 ]x0, l + ∫minu PX T[ ,τ]B( )τ u l d, τ+ ∫ X t[ ,τ τ τ]C( ), l d .

t0 t0

По лемме 2.1 функция ε является непрерывной. Условие ε[T] > 0 будет необходимым и достаточным для того, чтобы 0∉G t x T( 0, 0, ). Отсюда следует, что оптимальное время перехода T 0 совпадает с наименьшим из корней уравнения ε[T] = 0 , лежащим правее начального момента времени t0 .

Теорема 2 (необходимые условия оптимальности). Пусть T 0 - оптимальное время перехода и U 0 ( )⋅ - программное управление, решающее задачу линейного быстродействия. Тогда

B( )t U 0 ( )t , XТр T 0,t l0 = minu PB t u X( ) , Тр T 0,t l0 , (2)

для всех l0 L0 (T 0 ) и при почти всех t t T0, 0 .

Доказательство. Допустим, что условие (2) нарушается. Тогда существует вектор l0 L T0 ( ) и множество T ∈⎡t T0, 0 ненулевой меры, на котором выполняется неравенство

B(t U) 0 ( )t , XТр[T t l, ] 0 > min B t u( ) , XТр[T t l, ] 0 , tT .

u P

Следовательно,

T0 T0

B( )τ U 0 ( )τ , XТр T 0,τ τ⎤l0 d > ∫ minu PB( )τ u, XТр T 0,τ τ⎤l0 d . (3)

t0 t0

Из равенства x0 (T 0 ) = 0 и условия (3) выводим

0 =x0 (T 0 ),l0

T0T0

X T0,t0 x0, l0 X T0B( )τ τU 0 ( ), l dτ+ ∫ X T0,τ τ⎤C( ), l0 dτ=

0 t0

T0 T0

=X T0,t0 x0, l0B( )τ U 0 ( )τ , XТр T 0,τ τ⎤l0d + ∫X T0,τ τC( ), ldτ>

t

T0

> X T0,t0 x0, l0 minu PB( )τ u, XТр T 0,τ τ⎤l0 d + ∫ X T0,τ τ⎤C( ), l0 dτ>=

0 t0

=ε(T 0 ) = 0.

Получили противоречие, которое и доказывает справедливость теоремы.

Заметим, что условие (2) доказанной теоремы должно выполняться обязательно для всех векторов l0 L0 (T 0 ). Покажем это на примере.

Пример 1. Рассмотрим следующую задачу линейного быстродействия:

u1 ⎞ ⎧⎪⎛u1 2⎫⎪

x1 = u1, x2 = u2, u = ⎜ ⎟∈P = ⎨⎜ ⎟∈R≤1⎬,

u2 ⎠ ⎪⎩⎝u2 ⎠⎭⎪

x10 ⎞ ⎛ ⎞1

⎜ ⎟ = ⎜ ⎟, t0 = 0, .

x20 ⎠ ⎝ ⎠1

Очевидно, что здесь оптимальное время перехода T 0 =1, а оптимальное программное управление (см. рис. 1) имеет вид

0 ⎛−1⎞

U ( )t = ⎜ , t ∈[0,1].

⎝−1⎠

Проверим выполнение условий теоремы 2. Имеем

T

ε[ ]T = maxl =1 ⎢l1 +l2 + ∫ u1min≤1,u2 ≤1(u l1 1 +u l d2 2 ) τ⎥ =

⎣ 0⎦

= maxl=1 ⎡l1 +l2 −( l + l T.

Наименьшим корнем уравнения ε[T] = 0 является момент времени T 0 =1. При этом

L0 (T 0 ) = ⎪⎨⎧l = ⎛⎜l1 ⎞⎟ l =1, l1 ≥ 0,l2 ≥ 0 ⎫⎪⎬.

⎩⎪ ⎝l2 ⎠⎭⎪

Условие (2) здесь принимает вид

l U10 10 ( )t +l U20 20 (t) = u1min≤1,u2 ≤1(l u10 1 +l u20 2 ), t∈[0,1 ,] . (4)

Очевидно, что оптимальное управление U 0 удовлетворяет соотношению (4),

l0 0 ⎛ ⎞1 0 0 при всех векторах ⎜ ⎟ . Однако, для одного вектора l = ⎜ ⎟L (T )

l2 ⎠ ⎝ ⎠0

⎛−1⎞ этому условию удовлетворяет, например, управление U ( )t = ⎜ , t∈[0,1], кото⎝+1⎠

рое заведомо не является оптимальным.

Приведем последовательность действий по решению задачи управления динамической системой на основе теоремы 2. По формуле (1) находим выражение для функции ε. Решаем уравнение ε[T] = 0 . Наименьший корень T 0 > t0 , если таковой найдется, будет оптимальным временем перехода. Далее определяется множество L0 (T 0 ), которое является не пустым в силу непрерывности функции F и компактности множества S(0,1). Для каждого вектора l0 L0 (T 0 ) по формуле (2) строится программное управление. По теореме 2 среди построенных управлений обязательно содержится управление U 0 ( )⋅ , для которого выполняется равенство x t( 0,x U0, 0 (⋅),T 0 ) = 0. Управление U 0 (⋅) и будет оптимальным. Приведенный алгоритм будет эффективным, если множество L0 (T 0 ) содержит ровно один элемент l0 , а условие (2) определяет управление U 0 однозначно по существу.

Пример 2*. Рассмотрим следующую задачу линейного быстродействия

x1 = x2 +u1,

x2 = −x1 +u2,

⎧⎪⎛u1 ⎞22 2 ⎫⎪

uP = ⎨⎜ ⎟∈R u1 +u2 ≤1⎬,

⎩⎪⎝u2 ⎠⎭⎪

t0 = 0, x10 =1, x20 =1.

Фундаментальная матрица Коши здесь имеет вид

⎛ cos(t s) sin(t s)⎞

X t s[ , ] = ⎜ ⎟.

−sin(t s) cos(t s)

Вычисляем


⎡ ⎛ cosT

= maxl =1 ⎢⎣⎢ ⎝⎜−sinT

ε[T] =

sinT ⎞⎛ ⎞1 ⎛l1 Tu1 ⎞ ⎛cos(T −τ) −sin(T −τ)⎞ ⎛l1 ⎞⎤

cosT ⎠⎝ ⎠⎟⎜ ⎟1 , ⎝⎜l2 ⎠⎟+ ∫min⎝⎜u2 ⎠⎟, ⎝⎜ sin(T −τ) cos(T −τ) ⎟⎠ ⎝⎜l2 ⎟⎠dτ⎥⎦⎥ =

= max ⎡l (cosT +sinT)+l (−sinT + cosT)−


T

−∫ d ⎥ .

0 ⎦

Минимум подынтегрального выражения достигается на векторе

ˆ (τ, ,l T ) = −⎛⎜l1 cos(T −τ)−l2 sin(T −τ)⎞⎟∈P,τ∈[0,T].

U

l1 sin(T −τ)+l2 cos(T −τ)

Выражение для функции ε здесь принимает вид

ε[T] = max ⎡⎣l (cosT +sinT)+l (−sinT +cosT)−T⎦⎤ =

2 −T ,

где

L0 ( )T ={l0 ( )T }, l0 ( )T = 1 ⎛cosT +sinT .

⎝−sinT +cosT

Таким образом,

ε0 [T] = 0 ⇒T 0 = 2 .

Вычисляем оптимальное управление

1 ⎛−(cos 2 +sin 2)cos( 2 −t)+ −( sin 2 + cos 2)sin( 2 −t)⎞

U 0 ( )t =⎜⎜ ( ) ( ) ( ) ( ) ⎟⎟⎟.

⎜ − cos 2 +sin 2 sin 2 −t − −sin 2 +cosT cos 2 −t

⎝⎠

Подставляя его в дифференциальные уравнения движения и интегрируя последние с заданными начальными условиями, находим

x10 ( )t = − 12 (− +2 2t)(cost +sint), x20 ( )t = − 12 (− +2 2t)(cost −sint).

Очевидно, что

x10 ( 2) = x20 ( 2) = 0.

Таким образом, построенное управление U 0 (t) является оптимальным.

Ниже на рис. 2 приводится оптимальная траектория движения

Рис. 2

Рассмотрим задачу линейного быстродействия для управляемого объекта, динамика которого описывается линейными дифференциальными уравнениями с переменными коэффициентами. Пример 3*

x1 = (cost x) 1 +tx2 +u1,

1 (5)

x2 = x1 +(sint x) 2 +u2, t +1

⎧⎪⎛u1 ⎞22 2 ⎫⎪

uP = ⎨⎜ ⎟∈R u1 +u2 ≤ 3⎬,

⎩⎪⎝u2 ⎠⎭⎪

t0 = 0, x10 =1, x20 =1.

Построим фундаментальную матрицу Коши для однородной системы дифференциальных уравнений и запишем выражение для функции ε. Имеем

x11[T,0] x12[T,0]⎞⎛ x10 ⎞ ⎛l ⎞ ⎛u1 ⎞ ⎛ x11[T,τ] x12[T,τ]⎞Тр l1

ε[ ]T = maxl =1 ⎜ ⎟⎜ ⎟, ⎜⎜ ⎟ ⎜, ⎟ ⎜ ⎟dτ=

⎢⎣ ⎝ x21[T,0] x22[T,0]⎠⎝ x20 ⎠ ⎝ 2 ⎠ ⎝u2 ⎠ ⎝ x21[T,τ] x22[T,τ]⎠ ⎝l2 ⎠⎥⎦

⎡ ⎛ x11[T,0]+ x12[T,0]⎞ ⎛l1 ⎞⎞ ⎛l x1 11[T,τ]+l x2 21[T,τ]⎞⎤

= maxl =1 ⎢ ⎜ ⎟ ⎜, ⎟⎟ ⎜, ⎟dτ⎥ =

⎢⎣ ⎝ x21[T,0]+ x22[T,0]⎠ ⎝l2 ⎠2 ⎠ ⎝l x1 12[T,τ]+l x2 21[T,τ]⎠⎥⎦

= max ⎡⎣(x [T,0]+ x [T,0])l +(x [T,0]+ x [T,0])l

T

−3⋅∫⎥ .

0 ⎦

Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле

x ⎞ ⎜−⎟

⎜ ⎟

U 0 ( )t = 3⋅⎜ 0 0 0 0 ⎟, t ∈⎡t T0, 0 , l0 L0 (T 0 ), (6)

x14 (T ,t l) 1 + x24 (T ,t l) 2 ⎟

⎜−⎟

⎜⎟

⎝⎠

где

Ε(t l, 10,l20,T 0 ) = (x13 (T 0,t l) 10 + x23 (T 0,t l) 20 )2 +(x14 (T 0,t l) 10 + x24 (T 0,t l) 20 )2 .

В данном случае

0 0 0 0 0 0.617752

T = 0.662, L (T ) { }= l , l = ⎜ ⎟.

⎝0.786372⎠

Подставим управление (6) в дифференциальные уравнения (5) и проинтегрируем их с заданными начальными условиями. Непосредственно проверяется, что для полученного закона движения x0 (t), t ⎡0,T 0 выполняется

0 ⎛−0.0000134271⎞ ⎛ ⎞0

x (0.662) = ⎜ ⎟ ≈ ⎜ ⎟.

⎝−0.0000148833⎠ ⎝ ⎠0

Таким образом, построенное управление U 0 (t) является оптимальным. Ниже на рис. 3 приводится оптимальная траектория движения

Рис. 3

Пример 4*.

x1 = −x1 + 2x2 −2x3 +u2 +u3, x2 = x1 −3x2 x3 +u1 +u3, x3 = −x1 + 4x2 −2x3 +u1 +u2, t0 = 0, x10 =1, x20 =1, x30 =1.

В данном примере матрицы A и B имеют вид

⎛−1

A = ⎜ 1

⎜−1

2

−3

4

−2⎞

−1⎟,

−2⎟⎠

⎛0

B = ⎜1

⎜1

1

0

1

1⎞

1.

0⎟⎠

Заметим, что собственными числами матрицы A являются действительные числа -1, -2, -3.

Построим фундаментальную матрицу Коши для однородной системы дифференциальных уравнений и запишем выражение для функции ε. Имеем

e−3(T −τ) (2−4eT −τ +3e2(T −τ) ) −e−3(T−τ) (5−8eT −τ +3e2(T−τ) ) −e−3(T−τ) (1− 4eT −τ +3e2(T−τ) )⎞

⎜ ⎟

X t[ ,τ] = ⎜⎜ e−2(T −τ) (− +1 eT −τ) −e−2(T −τ) (− +2 eT −τ) −e−2(T−τ) (− +1 eT −τ) ⎟⎟

⎜ −3(T −τ) T −τ 2(T −τ) −3(T −τ) T −τ 2(T−τ) −3(T−τ) T −τ 2(T−τ)

e (2−3e +e ) −e (5−6e + e ) −e (1−3e + e ) ⎟

⎝ ⎠

⎡ 3 T

ε[ ]T = max ⎢m l l l T( 1, 2, ,3 )+ ∑∫mini k l l l Ti ( 1, 2, , ,3 τ τ)u di ⎥ =

l=1 u≤1

i=1 0

⎡ 3 T

= max ⎢m l l l T( 1, 2, ,3 )+ ∑∫ k l l l Ti ( 1, 2, , ,3 τ)dτ,

l=1 ⎣ i=1 0

где

m l l l T( 1, 2, ,3 ) = −( 4e−3T +8e−2T −3eT )l1 +(2e−2T eT )l2 + −( 4e−3T + 6e−2T eT )l3 , k1 (l l l T1, 2, , ,3 τ) = −6e−3(T−τ) (l1 +l3 )−2e−(T−τ) (3l1 +l2 +l3 )+3e−2(T−τ) (4l1 +l2 +3l3 ),

k2 (l l l T1, 2, , ,3 τ) = e−3(T −τ) (l1 +l3 ),

k3 (l l l T1, 2, , ,3 τ) = −3e−3(T−τ) (l1 +l3 )+e−2(T −τ) (4l1 +l2 +3l3 ) .

Программная стратегия, удовлетворяющая необходимым условиям оптимальности, определяется по формуле

Ui t sign ki l l l T t t T i .

В данном случае

⎛ 0.332184 ⎞

T 0 = 0.44738, L T0 ( 0 ) { }= l0 , l0 = −0.705538 .

⎝ 0.625998

По теореме 2.4 каждая из компонент оптимального программного управления должна иметь не более трех переключений. Убедимся в этом, приведя графики их изменения на промежутке времени 0,T 0 .

u1 u1

1.5 1.5

1

0.5

0.1 0.2 0.3 0.4

t

-0.5

-1

0.1 0.2 0.3 0.4

1 0.5

t -0.5

-1

-1.5 -1.5

Рис. 4

На рис. 4 видно, что первая компонента оптимального программного управления переключается в момент времени t= 0.426649, третья компонента – в момент времени t∗∗ = 308253, а вторая компонента остается все время постоянной.

Непосредственно проверяется, что для полученного закона движения x0 ( )t , t ∈⎡0,T 0 выполняется

⎛−0.000568689⎞ ⎛ ⎞0

x0 (0.44738) = −0.000411838⎜ ⎟⎜ ⎟0 .

⎜⎝−0.000184312⎟⎠ ⎜ ⎟⎝ ⎠0

Таким образом, построенное управление U 0 (t) является оптимальным.

Ниже на рис. 5 приводится оптимальная траектория движения

Рис. 5.

Упражнения для самостоятельной работы

Для линейных управляемых динамических систем

x1 = −3x1 + 4x2 −6x3 +u1, x1 = −2x1 −4x2 −60x3 +u1, x2 = x1 −2x2 + 2x3 +u2, x2 = −4x1 x2 −51x3 +u2,

а) x3 = 2x1 x2 +3x3 +u3, б) x3 = 2x1 −2x2 + x3 +u3, t0 = 0, x10 = −1.43859, t0 = 0, x10 = 3.84645,

x20 = 0.580455, x30 =1.35472, x20 = 4.12477, x30 = −0.591971,

x1 = 2x1 + 4x2 −16x3 +u1, x1 = −3x1 x2 −5x3 +u1, x2 = 2x1 x2 + 21x3 +u2, x2 = x1 x2 +u2,

в) x3 = −2x1 −2x2 + x3 +u3, г) x3 = x1 + x2 + 2x3 +u3, t0 = 0, x10 =15.3151, t0 = 0, x10 = −1.56927,

x20 = −11.9799, x30 = 3.9094 x20 = −0.473713, x30 =1.2287

решить задачу быстродействия. Рассмотреть два случая:

⎧⎛u1 ⎞⎫ ⎧⎛u1 ⎞ ⎫

1) P = ⎨⎪⎜⎜u2 ⎟⎟∈R u312 +u22 +u32 =1⎪⎬, 2) P = ⎪⎨⎜⎜u2 ⎟⎟∈R3 ⎪⎬

⎪⎜⎝u3 ⎟⎠⎪⎭ ⎩⎪⎜⎝u3 ⎟⎠ ⎭⎪

Показать, что оптимальное время перехода в первом случае больше, чем во втором. Обосновать этот результат.


4. ЛИНЕЙНАЯ ЗАДАЧА ТЕОРИИ ОПТИМАЛЬНОГО УПРАВЛЕ-

НИЯ КАК ФУНКЦИОНАЛЬНАЯ ПРОБЛЕМА МОМЕНТОВ

4.1. Сведение задачи теории оптимального управления к функциональной проблеме моментов. Рассмотрим задачу теории оптимального управления, в которой θ0 ={ }t0 1 ={T}, S0 ={x0}, S1 ={xT }, P = Rr , а минимизируемый функционал имеет вид

T

I[u()⋅ ]= ∫ f0 (u( )τ )dτ. (1)

t0

Класс программных стратегий отождествим с множеством Lrp [t0 ,T] измеримых по Лебегу r -мерных вектор-функций U :[t T0, ]→ Rr , для которых функция

U ( )p , p∈[1,∞) суммируема на [t0 ,T] в смысле Лебега.

Относительно минимизируемого функционала I дополнительно предположим:

1) для всех U ( ) L t T справедливо неравенство I U⎡⎣ ( )⋅ ⎤≥ 0, причем

I U⎡⎣ ( )⋅ ⎤= 0 тогда и только тогда, когда U t( ) = 0 почти всюду на [t0 ,T];

2) для всех U1 ( ) U2 ( ) L t T0 справедливо неравенство

I U1 (⋅)+U2 (⋅)⎤I U1 (⋅)⎤ + I U2 (⋅)⎤;

3) для всех U ( )⋅ ∈L t Trp [ 0, ] , λ∈R1 имеет место равенство

I λU (⋅)⎤= λI U(⋅)⎤.

Условия 1)-3) позволяют истолковать функционал I как некоторую норму

на функциональном пространстве Lrp [t0 ,T].

Следуя [17], осуществим сведение задачи теории оптимального управления к функциональной проблеме моментов. Пусть U L t T – некоторое программное управление, переводящее фазовый вектор из положения x0 в момент времени t0 в положение xT в момент времени T , и x( )⋅ = x(⋅,t x U0, 0, (⋅)). Тогда с учетом x( )T = xT по формуле Коши получим

T T

xT = X T t[ , 0 ]x0 + ∫ X t[ ,τ]B( ) ( )τ τ τu d + ∫ X t[ ,τ τ τ] W ( )d . (2)

t0 t0

Введем обозначения

H T[ ,τ] = X T[ ,τ τ τ]B( ), ,t ∈[t T0, ],

T

c = xT X[T,t0 ]x0 − ∫ X[t,τ]W( )τ dτ.

t0

Определение 1. Матрицу H[T,τ], t,τ∈[t0,T] будем называть переходной матрицей объекта.

Условие (2) перепишем с учетом введенных обозначений

T с = ∫ H[t,τ]u( )τ dτ.

t0

Пусть h(i) [t,τ τ] , ,t ∈[t T0, ] , i =1, ,n – строки переходной матрицы. Тогда последнее равенство в координатной форме имеет вид

T

сi = (h( )i [t])T , U ( )τ τd , i =1, ,n. (3)

t0

Вектор-функции h[ ]i ( )⋅ = (h( )i [T,⋅])T , i =1, ,n отождествим с элементами линейно-

го функционального пространства Lqr [t0,T], где 1 + 1 = 1. Такое предположение

p q

правомерно, так как функции h[i] (⋅), i =1, ,n непрерывны на [t0 ,T]. В дальнейшем это пространство функций будем называть основным для рассматриваемой задачи оптимального управления. Обозначим его символом Ω[t0 ,T].

На основании теоремы о представлении линейных функционалов на пространстве функций [16] можно установить взаимно однозначное соответствие между линейными функционалами ϕ, определенными на пространстве Ω[t0,T] и программными управлениями u(⋅) формулой

T

ϕu [h()⋅ ]= ∫h( )τ , u( )τ dτ, h()⋅ ∈Ω[t0 ,T]. (4)

t0

Формула (4) позволяет отождествить совокупность программных управлений с пространством Ω[t0 ,T], сопряженным к основному пространству, т.е. с пространством линейных функционалов, определенных на Ω[t0 ,T]. Превратим линейное пространство Ω[t0 ,T] в нормированное, определив для каждого его элемента h()⋅ ∈Ω[t0 ,T] норму

T h()⋅ = sup h( )τ , u( )τ dτ, I[u()⋅ ]≤1. (5)

u( )t0

В силу предположений 1)-3) формула (5) действительно определяет некоторую норму ⋅ на основном пространстве Ω[t0 ,T] [16], при этом естественная норма

в сопряженном пространстве Ω[t0,T] совпадает с функционалом I[u(⋅)]. Таким образом, задача об оптимальном управлении свелась к следующей функциональной проблеме моментов.

Задача 1. Пусть h[ ]1 , ,h[n] H , где H – линейное нормированное простран-

ство и c1, ,cn R1 . Требуется найти линейный функционал ϕ0 H , для которого

ϕ0[h[i]]= ci ,i =1, ,n , (6)

и такой, что среди всех других функционалов ϕ∈H , удовлетворяющих условию (6), он имел бы наименьшую норму .

Выведем необходимые и достаточные условия разрешимости задачи 1. Прежде всего, заметим, что если c1 = = cn = 0 , то решением проблемы моментов будет тривиальный функционал. Поэтому в дальнейшем этот случай рассматривать не будем. Полагаем

n [ ]i1 n

Q = ⎨h = ∑lihli R ,i =1, ,n, ∑lici =1⎬.

i=1 i=1 ⎭

Справедливы следующие утверждения.

Лемма 1. Пусть ϕ∈H линейный функционал, удовлетворяющий условию

(6). Тогда

ϕ[h]=1, ∀hQ .

Доказательство. Для всех hQ имеем

n n n .

i=1 ⎦ i=1 i=1

Лемма доказана.

Лемма 2. Существует элемент h0 Q , удовлетворяющий условию

= min h . (7)

hQ

Доказательство. Сначала предположим, что элементы h[ ]i , i =1, ,n ли-

n нейного пространства H независимы, т. е., что для них равенство ∑αih[ ]i = 0

i=1

возможно лишь при нулевом наборе констант αi R1, i =1, ,n.

В линейном пространстве H рассмотрим последовательность элементов

n n

{ }hs , hs = ∑lish[ ]i H, ∑cilis =1, s =1,2, , (8)

i=1 i=1

для которой lim hs = inf h . Заметим, что справедливо неравенство

s→∞ hQ

0 ≤ inf h < +∞. (9)

hQ

Для каждого номера s =1,2, обозначим

lsmax = max lis .

i∈{1, ,n}

Достаточно показать, что последовательность {lsmax } ограничена. Допустим противное. Полагаем

lis

lis = max , i =1, ,n, s =1,2,

ls

Очевидно, что lis≤1, i =1, ,n, и для всех номеров s =1,2, среди чисел l1s , ,lns

l1∗s

⎜ ⎟

хотя бы одно является единицей. Тогда последовательность векторов ls= ⎜ ⎟

lns

l10∗ ⎞

⎜ ⎟

имеет предельную точку l ⎜ ⎟ ≠ 0. В силу линейной независимости элемен-

ln0 ⎠

n тов h[ ]i H, i =1, ,n, будет выполнено . Каждый член последователь-

i=1

ности (8) можно представить в виде

hs = lsmax ⎛⎜∑n lish[ ]i ⎟, s =1,2, .

i=1 ⎠

Переходя к пределу в равенстве

n

lish[ ]i, s =1,2,

i=1

по подходящей подпоследовательности, получим противоречие с условием (9). Случай, когда набор элементов h[i] H, i =1, ,n не является независимым, сводится к предыдущему случаю путем замены в (8) зависимых элементов линейными комбинациями независимых элементов. Лемма доказана. Определение 2. Элемент

n

h0 = ∑li0h[ ]i ,

i=1

удовлетворяющий условию (7), назовем «минимальным», а его норму обозначим

символом ρ0 .

Теорема 1 (необходимые условия разрешимости проблемы моментов). Пусть функционал ϕ0 H решает функциональную проблему моментов (задачу

1). Тогда

0 0 1

ρ > 0 и ϕ ≥ 0 .

ρ

Доказательство. Предположим, что ρ0 = 0 . Тогда h0 = 0. Последнее невозможно. Действительно, с одной стороны, из линейности функционала ϕ0 вытекает, что ϕ0 [h0 ]= 0 , а, с другой стороны, в силу h0 Q и леммы 1 должно быть ϕ0 [h0 ]=1. Таким образом, ρ0 > 0 .

С учетом вложения Q H дадим оценку для величины ϕ0 . Имеем:

0 ∗ ϕ(h) ϕ(h) 1 1 1

ϕ = sup≥ sup= sup = = 0 . hH h hQ h hQ h inf h ρ

hQ

Теорема доказана.

Обозначим через

~ ⎧ n [ ]i1

H = ⎨h = ∑lihli R ,i =1, ,n, ⎬

i=1 ⎭

~ подпространство пространства H . Заметим, что для произвольного hH разложение

n

h = ∑lih[ ]i (10)

i=1

не всегда однозначно. Тем не менее, справедливо следующее утверждение.

0 ~ n

Лемма 3. Пусть ρ > 0 . Тогда для любого hH величина lici , где l1, ,ln

i=1

– коэффициенты разложения (10), полностью определяется элементом h H и не зависит от конкретного вида разложения (10).

~

Доказательство. Допустим противное. Тогда найдется hH , для кото-

рого

n n n n

h = ∑li 'h[ ]i = ∑li ''h[ ]i , ∑li 'ci ≠ ∑li ''ci . (11)

i=1 i=1 i=1 i=1

Из условий (11) выводим, что

∑(li '−li '')h[ ]i = 0, ∑(li '−li '')ci ≠ 0 . (12)

i=1 i=1

n

Первое равенство в (12) разделим на величину ∑(li '−li '')ci ≠ 0. Имеем

i=1

n (li '−li '') [ ]i

h = 0.

n

i=1 ( )

l j '−l j '' c j

j=1

Обозначим

(l '−l '')

li = n i i , i = 1, ,n .

∑(l j '−l j '')c j

j=1

n

Тогда lici =1 и равенство (13) запишется в виде

i=1

n n

lih[ ]i = 0, ∑lici =1.

i=1 i=1

(13)

n n

Последнее означает, что 0∈Q, а это противоречит условию ρ0 > 0 . Лемма доказана.

Теорема 2 (достаточные условия разрешимости проблемы моментов). Пусть ρ0 > 0 . Тогда проблема моментов имеет решение – функционал ϕ0 . При этом

0 ∗ 1

ϕ = 0 .

ρ

Доказательство. Определим функционал ϕ~: H~ R1 , положив

ϕ~[ ]h = ∑n lici , hH~ . (14)

i=1

Здесь li ,i =1, ,n – коэффициенты разложения (10). В силу леммы 3 функционал (14) определен однозначно. Кроме того, он линеен. Действительно, для всех

~ α,β∈R1, h,gH имеет место равенство ϕ~[αh + βg]=ϕ~⎡α∑n li[ ]h h[ ]i + β∑n li[ ]g h[ ]i =ϕ~⎡n [ ] [ ] ci =

i=1 i=1 ⎦ ⎣ i=1 ⎦ i=1

n n

=α∑li[ ]h сi + β∑li[ ]g ci =αϕ~[ ]h + βϕ~[ ]g .

i=1 i=1

Выполнение равенств

ϕ~[h[i]]=ϕ~[0⋅h[ ]1 + +1⋅h[i] + + 0⋅h[n]]= ci , i =1, ,n.

для функционала ϕ~ очевидно.

Обозначим

l1 ⎞n

⎜ ⎟ ⎧⎫

l = ⎜ ⎟, L = ⎨llici =1⎬

⎜⎝ln ⎟⎠ ⎩i=1 ⎭

и вычислим норму функционала ϕ~ как линейного функционала, определенного

~ на линейном нормированном пространстве H . Имеем:

=

По следствию из теоремы Хана-Банаха [16 ] линейный функционал ϕ~

~ может быть продолжен с подпространства H на все пространство H без увеличения его нормы. Обозначим это продолжение через ϕ0 . Легко видеть, что для функционала ϕ0 выполнены условия (6), а величина его нормы совпадает с нижней оценкой из теоремы 1 для нормы функционала, решающего задачу 1. Следовательно, функционал ϕ0 является искомым. Теорема доказана. Теорема 3(принцип максимина). Пусть ϕ0 H – решение задачи 1, h0 Q

– «минимальный» элемент и G = ⎨ϕ∈H ϕ ⎬. Тогда

⎩⎭

ϕ0 (h0 )= maxϕ[h0 ].

ϕ∈G

Доказательство. Для всякого функционала ϕ∈G справедливо

ϕ(h0 ) ≤ ϕ ∗ h0 = 10 ⋅ρ0 =1. ρ

С другой стороны, в силу леммы 1 имеет место равенство ϕ(h 0 )=1. Теорема доказана.

Применим теоремы 1-3 к рассматриваемой линейной задаче теории оптимального управления. В результате получим следующее утверждение.

Теорема 4. Задача оптимального управления имеет решение тогда и только тогда, когда для r-мерной вектор-функции h0 (⋅), найденной из условия (7), где определяется формулой (5), а

n [ ]i

Q = ⎨h( )⋅ = l hi ( )⋅lL,

i=1 ⎭

справедливо неравенство h = ρ0 > 0. При этом I, и оптимальное

управление на минимальном элементе h0обладает свойством максимума

T T

h0 ( )τ , u 0 ( )τ dτ= max ∫ h0 ( ) ( )τ , uτ dτ. (15)

I

t0 ρ t0

Опираясь на утверждение теоремы 4, сформулируем правило решения задачи об оптимальном управлении.

На первом этапе следует посредством формулы (5) ввести норму на линейном пространстве r -мерных функций Ω[t0 ,T]. На втором – строится «минимальный» элемент h0 ()⋅ из условия (7), и на третьем – из условия (15) определяется оптимальное управление u0 (⋅).

4.2. Управляемость линейной динамической системы. Важной характеристикой динамической системы является ее управляемость. Определение 3. Линейная динамическая система

x = A t x( ) + B t u( ) (1)

называется вполне управляемой на промежутке времени [t T0, ], если для любых векторов x0,xT Rn существует такое программное управление u( )⋅ , что для него выполняется равенство

x(⋅,t x u0, 0, (⋅)) = xT .

Относительно системы (1) дополнительно предположим, что элементы матриц A t( ) и B( )t непрерывно дифференцируемы не менее чем n −1 раз по переменной t на промежутке времени [t T0, ]. Полагаем

d d

L t1 ( ) = B t( ), L2 ( )t = A t L t( ) 1 ( )− L t1 ( ), ,Ln ( )t = A t L( ) n1 ( )t Ln1 ( )t . dt dt

Сконструируем матрицу

K t( ) = (L t1 ( ), ,Ln (t))

размера n×(r n⋅ ).

Теорема 5. Пусть существует момент времени t∈[t T0, ] такой, что rang K t⎡⎣ ( )= n . Тогда система (1) вполне управляема на промежутке времени

[t T0, ].

Доказательство. Достаточно установить, что для всех cRn, c ≠ 0 спра-


ведливо неравенство

n

ρ0 ( )c =h0 (c,⋅) = minn l hi [ ]i ( )⋅

l ci i =1i=1

i=1

= minn(X T[ ,⋅]B( )⋅ )T l =

l ci i =1

i=1


=(X T[ ,⋅]B( )⋅ )T l0 ( )c > 0.

Допустим противное. Тогда существует вектор cRn такой, что ρ0 (c) = 0. Это возможно, если по переменной t на промежутке [t T0, ] выполняется тождество

(X T t B t[ , ] ( ))T l0 ( )c= (X T t L t[ , ] 1 ( ))T l0 (c) = (L t1 ( ))T (X T t[ , ])T l0 ( )c= 0 . (2)

Продифференцируем (2) по переменной t . Имеем

d ⎡(L t( ))T (X T t[ , ])T l0 ( )c⎤ = d ⎡(X T t B t[ , ] ( ))T l0 ( )c⎤ = dt 1 dt ⎣ ⎦

d T 0 ∗ ⎛ d T T 0 ∗

= −X T t A t B t[ , ] ( ) ( )+ X T t[ , ] B t( )l ( )c = −A t B t( ) ( )+ B t( )(X T t[ , ]) l ( )c =

dt ⎠ ⎝ dt

d T T 0 ∗ T T 0 ∗

= −A t L t( ) 1 ( )+ L t1 ( )(X T t[ , ]) l ( )c = (L2 ( )t ) (X T t[ , ]) l ( )c = 0 . (3)

dt

Дифференцируя (3) по переменной t еще n−2 раза включительно по аналогии получим

dtd ⎣⎡(L2 ( )t )T (X T t[ , ])T l0 ( )c⎤ = (L3 ( )t )T (X T t[ , ])T l0 ( )c= 0,

………………………………………………………

d ⎡(L ( )t )T (X T t[ , ])T l0 ( )c⎤ = (L ( )t )T (X T t[ , ])T l0 ( )c= 0 .

dt n1 n

t ∈[t T0, ]. (4)

Обозначим

g c t( , ) = (X T t[ , ])T l0 (c)∈Rn, t∈[t T0, ].

Заметим, что g c t( , ) ≠ 0 для всех t ∈[t T0, ]. Перепишем тождества (2)-(4) в виде

(L t1 ( ))T g c t( , ) = 0, (L2 ( )t )T g c t( , ) = 0, ,(Ln ( )t )T g c t( , ) = 0, t∈[t T0, ]. (5) Из равенств (5) следует, что в любой момент времени t ∈[t T0, ] ненулевой nмерный вектор g c t( , ) ортогонален каждому из столбцов матрицы K t( ). В том числе и в момент времени t∈[t T0, ] он ортогонален каждому из n линейно независимых столбцов матрицы K t( ). Последнее невозможно. Следовательно, ρ0 ( )c≠ 0. Теорема доказана.

Пример 1. Покажем, что динамическая система из примера 2.7.

x1 = x3,

x2 = x4,

x3 = (cost x) 3 +tx4 +u1,

1

x2 = x3 +(sint x) 4 +u2 t +1

но находим

⎛0

⎜0

A t( ) = ⎜0

⎜0

0

0

0

0

1

0 cost

1

1+t

0 ⎞

⎟ ⎛0

1 ⎜

⎟ 0

t , L t1 ( ) = B =

⎟ ⎜1 sint⎟⎟ ⎜⎜⎝0

⎛ 1

0⎞ ⎜

0 d ⎜ 0

, L2 ( )t = A t L t( ) 1 ( )− L t1 ( ) = ⎜cost

0⎟ dt

1⎟⎠ ⎜⎜ 1

⎝1+t

0 ⎞

1

t ,

⎟ sint⎟ ⎠

⎛0

⎜0

K t( ) = ⎜1

⎜0

0 1 0 ⎞

0 0 1 ⎟

0 cost t .

1 ⎟ 1 sint⎟ 1+t

Вычислим определитель матрицы K t( ). Имеем

является вполне управляемой. Действительно, достаточно установить линейную независимость первых четырех столбцов матрицы K t( ). Последователь-

0 0 1 0

0 0 0 1 0 0 1

1 0

1 0 cost t0 t=1≠ 0 .

0 1

1 0 1 sint

0 1 sint

1+t

Таким образом, ранг матрицы K t( ) равен четырем при всех t ∈[0,1] и рассматриваемая динамическая система является вполне управляемой.

В частности, пусть A = const, B = const . Тогда K = (B AB, , , An1B) и проверка полной управляемости системы (1) сводится к доказательству равенства rang K[ ] = n.

Пример 2. Покажем, что динамическая система из примера 2.3.

x1 = 2x1 + 2x2 −30x3 +u1, x2 =10x1 x2 −35x3 +u2, x3 = 2x1 x2 + x3 +u3,

является вполне управляемой. Действительно, достаточно установить линейную независимость первых трех столбцов матрицы K . В силу

⎛1

B = ⎜0

⎜0

этот факт очевиден.

0

1

0

0⎞

0

1⎟⎠

4.3. Управление по критерию «минимум энергии». Конкретизируем процедуру построения оптимального управления, описанную выше, для случая, когда минимизируемый функционал имеет вид

T

I[u()⋅ ]= ⎢∫u( ) ( )τ , uτ dτ⎥ . (1)

⎢⎣t0

Эта величина играет роль оценки количества энергии, затрачиваемой в процессе управления динамическим объектом. Нетрудно видеть, что функционал (1) удовлетворяет условиям 1)-3) предыдущего пункта.

Для реализации первого этапа процедуры построения оптимального управления необходимо решить следующую задачу:

T T

u( )τ , h( )τ dτ→ max, ∫ u( )τ , u( )τ dτ=1.

t0 t0

Эта задача является изопериметрической задачей вариационного исчисления. Ее решение записывается в виде

uh () ,

где постоянная λ∈R1 вычисляется путем подстановки управления uh (⋅) в уравнение связи. В результате вычислений получим

1 ⎡T ⎤⎡T

λ= − 2 ⎢⎢⎣t∫0 h( ) ( )τ, hτdτ⎥⎥⎦ , uh ()⋅ = h()⋅ ⎣⎢⎢t∫0 h( ) ( )τ , hτ dτ⎦⎥⎥ .

Тогда норма на пространстве Ω[t0 ,T] определяется формулой

T ⎤ ⎡T h()⋅ = ⎢∫ uh ( )τ, uh ( )τdτ⎥ = ⎢∫ h( ) ( )τ, hτ dτ⎥ .

⎢⎣t0 ⎥⎦ ⎢⎣t0 ⎥⎦

Второй этап процедуры, состоящий в построении «минимального» элемента h0 ()⋅ , сводится к задаче математического программирования следующего ви-

да:

Tn nn T

∫ ∑l hi [ ]i ( )τ ,∑l hi [ ]i ( )τ τd = ∑ ⎢∫h[ ]i ( )τ , h[ ]j ( )τ τd l li j → min, lL.

t0i=1 i=1i j, =1 t0

Или по-другому:

n n

i∑, j=1αijlil j → min, ∑i=1 cili =1,

где

T

αij = ∫h[ ]i ( )τ , h[ ]j ( )τ τd , ,i j =1, ,n. (2)

t0

l10 ⎞

⎜ ⎟

Пусть вектор l 0 = ⎜ ⎟ – решение этой задачи. Тогда «минимальный» элемент

⎜⎝ln0 ⎟⎠

вычисляется по формуле

n h l h .

i=1

Заключительный третий этап построения оптимального управления снова сводится к решению изопериметрической задачи вариационного исчисления

tTu( )τ , h0 ( )τ dτ→ max, tT0 u( )τ , u( )τ dτ= ( 10 )2 .

0 ρ

Ее решением является вектор-функция

0 1 0 1

U ( )⋅ = − h ( )⋅ , µ∈R , 2µ

где

T

µ ⎢∫h0 ( )τ , h0 ( )τ dτ⎥ ρ0 = − .

⎢⎣t0

Таким образом, оптимальное управление, решающее задачу теории оптимального управления, имеет вид

U h l h h , (3)

(ρ0 ) (ρ0 ) i=1 i=1

0 li0

где νi = 2 ,i =1, ,n . Очевидно, что

0 )

0 ⎡T 0 0⎤1

I U( )⋅ ⎤= ⎢⎢⎣t0 U ( )τ , u ( )τ τd ⎥⎦⎥ = ρ0 .

Воспользовавшись соотношениями (3), укажем другой способ формирования оптимального управления, который быстрее и проще приводит к цели. Подставив выражение (3) в равенство (1.3), получим

Tnn Tn

ci = ∫ h[ ]i ( )τ ν τ τ ν, ∑ 0j h[ ]j ( ) d = ∑ 0j h[ ]i ( )τ , h[ ]j ( )τ τ ναd = ∑ 0j ij , i =1, ,n . (4)

t0=1j=1 t0 j=1 j

Таким образом, решение задачи об оптимальном управлении можно начинать непосредственно с решения системы линейных алгебраических уравнений

(4), а оптимальное программное управление вычислять по формуле (3).

Итак, оптимальное управление для случая минимизации «энергии» единственно, непрерывно в каждой точке интервала [t0 ,T], пропорционально «минимальному» элементу h0 ()⋅ и зависит линейно от краевых условий. Пример 3*. Рассмотрим линейный управляемый динамический объект

x1 = 2x1 + 2x2 −30x3 +u1, x2 =10x1 x2 −35x3 +u2, x3 = 2x1 x2 + x3 +u3, t0 = 0,T =1;

x10 = −3, x20 = 2, x30 =1; xT1 = −80.7746, xT 2 = −147,179, xT3 = −8.94415;

1

I U⎡ ( )u ( ) u ( ) u ( ) . (5)

⎣ 0 ⎦

В рассматриваемом примере дифференциальные уравнения движения динамического объекта и начальное положение фазового вектора взяты из примера 2.3. Конечное положение фазового вектора совпадает с той точкой фазового пространства, в которую переводит в конечный момент времени фазовый вектор оптимальное управление из примера 2.3.

Последовательно вычисляем

x11 [t,τ] x12 [t,τ] x13 [t,τ]⎞

X t[ ,τ] = x21 [t,τ] x22 [t,τ] x23 [t], H t[ ,τ] = X t[ ,τ]B = X t[ ,τ],

x31 [t,τ] x32 [t,τ] x33 [t,τ]

x11 [1,τ]⎞ ⎛ x21 [1,τ]⎞ ⎛ x31 [1,τ]⎞

h[ ]1 ( )τ = ⎜⎜ x12 [1,τ]⎟⎟ , h[ ]2 ( )τ = ⎜⎜ x22 [1,τ]⎟⎟ , h[ ]3 ( )τ = ⎜⎜ x32 [1,τ τ]⎟⎟, ∈[0,1],

⎜⎝ x13 [1,τ]⎠⎟ ⎝⎜ x23 [1,τ]⎟⎠ ⎝⎜ x33 [1,τ]⎠⎟

1 ⎛α α α11 12 13 ⎞ ⎛4770.34 8405.45 469.812⎞

⎜ ⎟ ⎜ ⎟ αij = ∫h[ ]1 ( )τ , h[ ]i ( )τ τd , ,i j =1,2,3 ⇒ α α α21 22 23 = 8405.45 14824.4 832.786.

0 ⎜⎝α α α31 32 33 ⎟⎠ ⎜⎝469.812 832.786 48.3062⎟⎠

c1 ⎞ ⎛ xT1 ⎞ ⎛ x10 ⎞ ⎛−67.4743⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟

c2 ⎟ = ⎜ xT 2 ⎟− X [1,0]⎜ x20 ⎟ = −⎜ 115.885⎟.

⎝⎜c3 ⎠⎟ ⎝⎜ xT3 ⎟⎠ ⎜⎝ x30 ⎟⎠ ⎜⎝−5.34546⎠⎟

Запишем систему линейных алгебраических уравнений (4)

α11 1ν αν αν+ 12 2 + 13 3 = c1, αν αν αν21 1 + 22 2 + 23 3 = c2, . αν αν αν31 1 + 32 2 + 33 3 = c3

Ее решением будут числа

ν10 = 0.0682083, ν20 = −0.0954224, ν30 = 0.871024 .

Тогда оптимальное управление определяется по следующей формуле:

U t h h h t .

Вычислим функционал (5) на оптимальном управлении

0 ⎡ 1 0 0

I U⎡ ( )= ⎢ U ( )τ ,U ( )τ τd ⎥ =1.34153.

⎣ 0 ⎦

Заметим, что для оптимального управления из примера 2.3 функционал (5) принимает значение 3 =1.73205 >1.34153. Такой результат является естественным, поскольку оптимальное управление в примере 2.3 определялось из условия минимума другого критерия, а не функционала (5).

Проверим проведенные вычисления. Покажем, что полученное управление переводит фазовый вектор из положения x0 в положение xT за время [0,1]. Действительно проинтегрируем систему дифференциальных уравнений

x1 = 2x1 + 2x2 −30x3 +U10 (t), x2 =10x1 x2 −35x3 +U20 ( )t , x3 = 2x1 x2 + x3 +U30 ( )t

с начальными условиями x10 = −3, x20 = 2, x30 =1. В результате получим

⎛0.000303⎞

x0 ( )1 − xT = ⎜0.000484⎟ ≈ 0 .

⎝0.000011

Пример 4*. Дифференциальные уравнения движения динамического объекта имеют вид

x1 = x3,

x2 = x4 ,

x3 = (cost x) 3 +tx4 +u1,

1

x2 = x3 +(sint x) 4 +u2 , t +1 t0 = 0,T =1,

x10 = x20 = x30 = x40 = 0, xT1 = 0.640532, xT 2 = 0.491302, xT3 =1.61672, xT 4 =1.31002,

1

I U⎡ ( )⎤u ( ) u ( ) . (6)

⎣ 0 ⎦

В рассматриваемом примере дифференциальные уравнения движения динамического объекта и начальное положение фазового вектора взяты из примера 2.7. Конечное же положение фазового вектора совпадает с той точкой фазового пространства, в которую переводит в конечный момент времени фазовый вектор оптимальное управление из примера 2.

Последовательно вычисляем

x11 [t,τ] x12 [t,τ] x13 [t,τ] x14 [t,τ]⎞ ⎛0 0⎞ ⎛ x13 [t,τ] x14 [t,τ]⎞

⎜ ⎟ ⎜ ⎟ ⎜ ⎟

X t[ ,τ] = ⎜⎜ xx3121 [[tt,,ττ]] xx3222 [[tt,,ττ]] xx3323 [[tt,,ττ]] xx3424 [[tt,,ττ]]⎟⎟, H t[ ,τ] = X t[ ,τ]⎜⎜10 00⎟⎟ = ⎜xx3323 [[tt,,ττ]] xx3424 [[tt,,ττ]]⎟⎟

⎜⎜⎝ x41 [t,τ] x42 [t,τ] x43 [t,τ] x44 [t,τ]⎟⎠⎟ ⎜⎜⎝0 1⎟⎟⎠ ⎝⎜⎜ x43 [t,τ] x44 [t,τ]⎟⎟⎠

x [1,τ]⎞ ⎛ x [1,τ]⎞


h[ ]1 ( )τ = x13 [1,τ]⎞ , h[ ]2 τ

14 1,τ

αij

x23 [1,τ]⎞ [ ]3 33 [ ]4 43

= , h τ = , h τ = , τ∈[0,1],

24 [1,τ] 34 [1,τ] 44 [1,τ]

1

= ∫h[ ]1 ( )τ , h[ ]i ( )τ τd , i j, =1,2,3,4 ⇒

0


⎛α α α α11 12 13 14 ⎞ ⎛0.766436

⎜ ⎟ ⎜

⎜α α α α21 22 23 24 ⎟ = ⎜0.303602

⎜α α α α31 32 33 34 ⎟ ⎜ 1.51071

⎜⎜α α α α41 42 43 44 ⎟⎟⎠ ⎜⎜⎝0.779061

0.303602

0.557218

0.764328

1.12012

1.51071

0.764328

3.3364

1.89574

0.779061⎞

1.12012 ,

1.89574 ⎟

2.6037

c1 ⎞ ⎛ xT1 ⎞ ⎛ x10 ⎞ ⎛0.640532⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 2 ⎟ = ⎜ T 2 ⎟− X [1,0]⎜ x20 ⎟ = ⎜0.491302⎟. c x

c3 ⎟ ⎜ xT3 ⎟ ⎜ x30 ⎟ ⎜ 1.61672 ⎟

⎜⎜⎝c4 ⎟⎟⎠ ⎜⎜⎝ xT 4 ⎟⎟⎠ ⎝⎜⎜ x40 ⎟⎠⎟ ⎜⎜⎝ 1.31002 ⎟⎟⎠

Запишем систему линейных алгебраических уравнений (4)

α11 1ν αν αν αν+ 12 2 + 13 3 + 14 4 = c1, αν αν αν αν21 1 + 22 2 + 23 3 + 24 4 = c2,

αν αν αν αν31 1 + 32 2 + 33 3 + 34 4 = c3, αν αν αν αν41 1 + 42 2 + 43 3 + 44 4 = c4.

Ее решением будут числа

ν10 = −0.982227, ν20 = −0.833006, ν30 = 0.790821, ν40 = 0.579604 .

Тогда оптимальное управление определяется по следующей формуле:

U t h h h h t .

Вычислим функционал (5) на оптимальном управлении

⎡ 1 ⎤

00 0

I U( )⋅ ⎤= U ( )τ ,U ( )τ τd ⎥ = 0.999712.

⎣ 0 ⎦

Заметим, что для оптимального управления из примера 2.7 функционал

(6) принимает значение 1.0 > 0.999712. Такой результат является естественным, поскольку оптимальное управление в примере 2.7 определялось из условия минимума другого критерия, а не функционала (6).

Проверим проведенные вычисления. Покажем, что полученное управление

U 0 ( )⋅ переводит фазовый вектор из положения x0 в положение xT за время [0,1]. Действительно проинтегрируем систему дифференциальных уравнений

x1 = x3,

x2 = x4 ,

x3 = (cost x) 3 +tx4 +U10 (t),

1 0

x2 = x3 +(sint x) 4 +U2 ( )t , t +1

с начальными условиями x10 = x20 = x30 = x40 = 0. В результате получим

⎛ −1.68561⎞

⎜ ⎟ x x .

⎜ −1.6007 ⎟

⎜⎜⎝−2.40392⎟⎟⎠

4.4. Управление по критерию «минимум силы». Конкретизируем процедуру построения оптимального управления, описанную выше, для случая, когда минимизируемый функционал имеет вид

I u( )⋅ ⎤= vrai max u( )τ = vrai max u( )τ τ, u( ) . (1)

τ∈[t T0, ]τ∈[t T0, ]

В случае, когда вектор управляющих параметров представляет собой силу (обобщенную силу), функционал (1) оценивает наибольшее значение по модулю этой силы. Отсюда следует вынесенное в заголовок параграфа название рассматриваемого функционала. Нетрудно видеть, что функционал (1) удовлетворяет условиям 1)-3) пункта 4.2.

Для реализации первого этапа процедуры построения оптимального управления необходимо решить следующую задачу:

T

t0 u( )τ , h( )τ τd → max, vrayτ∈[t T0max, ] u( )τ τ, u( ) =1. (2)

Максимум интеграла в (2) достигается, когда подынтегральная функция принимает максимальное значение почти всюду на промежутке [t T0, ]. Максимальное значение этой функции можно получить, решив следующую задачу математического программирования:

u h, → max, u u, =1, u h, ∈Rs . (3)

Максимальным значением целевой функции в (3) служит величина h h, . Тогда норма на пространстве Ω[t0 ,T] определяется формулой

T h( )⋅ = ∫ h( )τ , h( )τ τd .

t0

Второй этап процедуры – построение «минимального» элемента h0 (⋅) – сводится к задаче математического программирования следующего вида:

T n n T n

∫ ∑l hi [ ]i ( )τ , ∑l hi [ ]i ( )τ τd = ∫∑ h[ ]i ( )τ , h[ ]j ( )τ ll di j τ→ min, lL,

t0 =1 i=1 t0 i j, =1 i

l10 ⎞

⎜ ⎟

Пусть вектор l 0 = ⎜ ⎟ – решение этой задачи. Тогда «минимальный» элемент и

⎜⎝ln0 ⎟⎠

его норма вычисляются по формулам

n T

h l h 0 h0 ( )τ , h0 ( )τ τd

i=1 t0

соответственно.

Заключительный третий этап построения оптимального управления сводится к следующей задаче на максимум:

T 01

t0 u( )τ , h ( )τ τd → max, vraiτ∈[t T0max, ] u( )τ τ, u( ) = ρ0 .

Ее решением является вектор-функция

0 1 h0 (τ) 0

u ( )τ = 0 ⋅ , h (τ τ) ≠ 0, ∈[t T0, ], (4)

ρ h0 ( )τ , h0 ( )τ

которая и будет оптимальным в смысле функционала (1) управлением. Очевидно, что

I u0 ( )⋅ ⎤= vrai max u0 ( )τ τ, u0 ( ) =.

τ∈[t T0, ]

Для сравнения заметим, что критерий качества (3.1) («минимум энергии»), вычисленный на программном управлении (4) принимает значение:

T 1 h0 ( )τ 1 h0 ( )τ 1 T h0 ( )τ τ, h0 ( ) T t0

t∫0 ρ0 ⋅ h0 ( )τ τ, h0 ( ) , ρ0 ⋅ h0 ( )τ τ, h0 ( ) dτ= ρ0 t∫0 h0 ( )τ τ, h0 ( ) dτ= ρ0 . (5)

Пример 5*. Рассмотрим линейный управляемый динамический объект из

примера 4

x1 = 2x1 + 2x2 −30x3 +u1, x2 =10x1 x2 −35x3 +u2, x3 = 2x1 x2 + x3 +u3, t0 = 0,T =1;

x10 = −3, x20 = 2, x30 =1; xT1 = −80.7746, xT 2 = −147,179, xT3 = −8.94415. Поставим задачу управления этим объектом по критерию качества «минимум силы»

I U⎡⎣ ( )⎤. (6)

Для решения задачи управления последовательно вычисляем


x11 [t,τ]

X t[ ,τ] = x21 [t,τ]

x31 [t,τ]

x11 [1,τ]⎞ h[ ]1 ( )τ = ⎜⎜ x12 [1,τ]⎟⎟ ,

⎜⎝ x13 [1,τ]⎟⎠

c1

⎜ ⎟

x12 [t,τ] x13 [t,τ]⎞

x22 [t,τ] x23 [t], H t[ ,τ] = X t[ ,τ]B = X t[ ,τ], x32 [t,τ] x33 [t,τ]

x21 [1,τ]⎞ ⎛ x31 [1,τ]⎞

h[ ]2 ( )τ = ⎜⎜ x22 [1,τ]⎟⎟ , h[ ]3 ( )τ = x32 [1,τ τ], ∈[0,1],

⎜⎝ x23 [1,τ]⎟⎠ ⎜⎝ x33 [1,τ]⎟⎠

xT1 ⎞ ⎛ x10 ⎞ ⎛−67.4743⎞

⎜ ⎟ ⎜ ⎟ ⎜ ⎟


c2 ⎟ = ⎜ xT 2 ⎟− X [1,0]⎜ x20 ⎟ = −⎜ 115.885⎟.

⎝⎜c3 ⎠⎟ ⎜⎝ xT3 ⎠⎟ ⎝⎜ x30 ⎟⎠ ⎜⎝−5.34546⎠⎟

Запишем задачу математического программирования по определению

минимального элемента h0 ( )⋅ ∈Ω[0,1]. Имеем

1

l h1 [ ]1 ( )τ +l h2 [ ]2 ( )τ +l h3 [ ]3 ( )τ , l h1 [ ]1 ( )τ +l h2 [ ]2 ( )τ +l h3 [ ]3 ( )τ τd → min,

0

l c2 2 +l c3 3 . (7)

l c1 1 +l c2 2 +l c3 3 =1⇔ l1 =

c1

Эта задача эквивалентна следующей задаче на безусловный минимум

∫10 l c2 2 c+1 l c3 3 h[ ]1 ( )τ +l h2 [ ]2 ( )τ +l h3 [ ]3 ( )τ , l c2 2 c+1 l c3 3 h[ ]1 ( )τ +l h2 [ ]2 ( )τ +l h3 [ ]3 ( )τ τd → min по переменным l2 и l3 . Ее решением будут числа

l20 = −0.038468, l30 = 0.28735.

Из равенства (6) находим

l10 = −0.103653.

Тогда

h t l h l h l h t ,

1

ρ0 = ∫ h0 ( )τ τ τ, h0 ( ) d = 0.731198.

0

Оптимальное управление определяется по формуле (4). При этом

0 1

I U( )⋅ ⎤= ρ0 =1.36762.

Рис. 1

Из него видно, что функционал (6) для этого управления принимает значение

1.53213 >1.36762 = I U0 ( )⋅ ⎤. Такой результат является естественным, поскольку оптимальное управление в примере 3 определялось для критерия «минимум энергии», а не «минимум силы». Обратно, из формулы (5) следует, что критерий «минимум энергии» на управлении U 0 (⋅) принимает значение 1.36762. Этот результат «хуже», чем величина1.34153, которая была получена на оптимальном в смысле критерия «минимум энергии» управлении в примере 3.

Для проверки проведенных вычислений, покажем, что полученное управление U 0 ( )⋅ переводит фазовый вектор из положения x0 в положение xT за время [0,1]. Действительно, проинтегрируем систему дифференциальных уравнений

x1 = 2x1 + 2x2 −30x3 +U10 (t), x2 =10x1 x2 −35x3 +U20 ( )t , x3 = 2x1 x2 + x3 +U30 ( )t

с начальными условиями x10 = −3, x20 = 2, x30 =1. В результате получим

⎛0.0000773993⎞

x0 ( )1 − xT = 0.000215504 ≈ 0 .

⎝0.0000639765

Пример 6*. Дифференциальные уравнения движения динамического объекта имеют вид

x1 = x3,

x2 = x4 ,

x3 = (cost x) 3 +tx4 +u1,

1

x2 = x3 +(sint x) 4 +u2 , t +1 t0 = 0,T =1,

x10 = x20 = x30 = x40 = 0, xT1 = 0.640532, xT 2 = 0.491302, xT3 =1.61672, xT 4 =1.31002. Поставим задачу управления этим объектом по критерию качества «минимум силы»

I U⎣ ( ). (8)

Для решения задачи управления последовательно вычисляем

x11 [t,τ] x12 [t,τ] x13 [t,τ] x14 [t,τ]⎞ ⎛0 0⎞ ⎛ x13 [t,τ] x14 [t,τ]⎞

⎜ ⎟ ⎜ ⎟ ⎜ ⎟

X t[ ,τ] = ⎜⎜ xx3121 [[tt,,ττ]] xx3222 [[tt,,ττ]] xx3323 [[tt,,ττ]] xx3424 [[tt,,ττ]]⎟⎟, H t[ ,τ] = X t[ ,τ]⎜⎜10 00⎟⎟ = ⎜⎜ xx3323 [[tt,,ττ]] xx3424 [[tt,,ττ]]⎟⎟

⎜⎜⎝ x41 [t,τ] x42 [t,τ] x43 [t,τ] x44 [t,τ]⎟⎠⎟ ⎜⎜⎝0 1⎠⎟⎟ ⎝⎜⎜ x43 [t,τ] x44 [t,τ]⎟⎟⎠

[ ]1 ⎛ x13 [1,τ]⎞ [ ]2 ⎛ x23 [1,τ]⎞ [ ]3 ⎛ x33 [1,τ]⎞ [ ]4 ⎛ x43 [1,τ]⎞

h ( ) = h ( ) = h ( ) = h ( ) = ∈[ ],

1,τ [1,τ] [1,τ] [1,τ]

14 24 34 44

c1 ⎞ ⎛ xT1 ⎞ ⎛ x10 ⎞ ⎛0.640532⎞ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ 2 ⎟ = ⎜ T 2 ⎟− X [1,0]⎜ x20 ⎟ = ⎜0.491302⎟. c x

c3 ⎟ ⎜ xT3 ⎟ ⎜ x30 ⎟ ⎜ 1.61672 ⎟

⎜⎜c4 ⎟⎟⎠ ⎜⎜⎝ xT 4 ⎟⎟⎠ ⎝⎜⎜ x40 ⎟⎠⎟ ⎜⎜⎝ 1.31002 ⎟⎟⎠ ⎝

Запишем задачу математического программирования по определению мини-

мального элемента h0 ( )⋅ ∈Ω[0,1]. Имеем

1

l h1 [ ]1 ( )τ +l h2 [ ]2 ( )τ +l h3 [ ]3 ( )τ , l h1 [ ]1 ( )τ +l h2 [ ]2 ( )τ +l h3 [ ]3 ( )τ +l h4 [ ]4 ( )τ τd → min ,

0

l c2 2 +l c3 3 +l c4 4 . (9)

l c1 1 +l c2 2 +l c3 3 +l c4 4 =1⇔ l1 =

c1

Эта задача эквивалентна следующей задаче на безусловный минимум:

1 4 4

l c2 2 +l c3c13 +l c4 4 h[ ]1 ( )τ + i=2 l hi [ ]i ( )τ , l c2 2 +l c3 3c1 +l c4 4 h[ ]1 ( )τ + i=2 l hi [ ]i ( )τ τd → min

0

по переменным l l2, 3 и l4 . Ее решением будут числа

l20 = 0.76217, l30 = 0.00721295, l40 = 0.947403.

Из равенства (9) находим

l10 = 0.947403.

Тогда

h t l h l h l h l h t ,

1

ρ0 = ∫ h0 ( )τ τ τ, h0 ( ) d = 0.999996

0

Оптимальное управление определяется по формуле (4). При этом

0 1

I U( )⋅ ⎤= ρ0 =1.00000

На рис. 2 приведен график изменения величины для

оптимального управления из примера 4

Рис. 2

Из него видно, что функционал (8) для этого управления принимает значение 1.01073 >1.00000 . Такой результат является естественным, поскольку оптимальное управление в примере 4 определялось для критерия «минимум энергии», а не «минимум силы». Обратно, из формулы (5) следует, что критерий «минимум энергии» на управлении U 0 (⋅) принимает значение 1.00000. Этот результат «хуже», чем величина 0.999712 , которая была получена на оптимальном в смысле критерия «минимум энергии» управлении в примере 4.

Для проверки проведенных вычислений, покажем, что полученное управление U 0 ( )⋅ переводит фазовый вектор из положения x0 в положение xT за время [0,1]. Действительно, проинтегрируем систему дифференциальных уравнений

x1 = x3,

x2 = x4 ,

x3 = (cost x) 3 +tx4 +U10,

1 0

x2 = x3 +(sint x) 4 +U2 t +1

с начальными условиями x10 = x20 = x30 = x40 = 0. В результате получим

⎛ 0.0000221525 ⎞

⎜ ⎟

x0 ( )1 − xT = ⎜−0.0000337122⎟ ≈ 0.

⎜ −0.000318149 ⎟

⎜⎜⎝ 0.000376441 ⎟⎟

Упражнения для самостоятельной работы

Для линейных управляемых динамических систем

x1 = −3x1 + 4x2 −6x3 +u1, x1 = −2x1 −4x2 −60x3 +u1, x2 = x1 −2x2 + 2x3 +u2, x2 = −4x1 x2 −51x3 +u2,

а) x3 = 2x1 x2 +3x3 +u3, б) x3 = 2x1 −2x2 + x3 +u3, t0 = 0,T =1, t0 = 0,T =1,

x10 = 0, x20 = 0, x30 = 0, x10 = 0, x20 = 0, x30 = 0,

x1 = 2x1 + 4x2 −16x3 +u1, x1 = −3x1 x2 −5x3 +u1, x2 = 2x1 x2 + 21x3 +u2, x2 = x1 x2 +u2,

в) x3 = −2x1 −2x2 + x3 +u3, г) x3 = x1 + x2 + 2x3 +u3, t0 = 0,T =1, t0 = 0,T =1, x10 = 0, x20 = 0, x30 = 0, x10 = 0, x20 = 0, x30 = 0.

решить задачу оптимального управления по критерию «минимум энергии»

⎡ 1 3 ⎤

I u⎡⎣ ( )⋅ ⎤⎦ = ⎢∫∑ui ( )τ dτ

⎣ 0 i=1 ⎦

и по критерию «минимум силы»

I ⎡⎣u( )⋅ ⎤⎦ = vrai d .

τ∈[t T0, ] 0

В каждом случае сравнить оптимальную величину функционала с его значением на управлении, найденном из условия оптимальности другого критерия.


ПРИЛОЖЕНИЕ

Пример 1.3.

Ввод правых частей дифференциальных уравнений

=

H

2 b v1 2 b c y4^2 Sin@y1 y2D −

∗ − y2

H y2D^2LDLê, H H @ @@ HD D @LDLêLLLL< D

H@ Sin y1 y2

y2 +

∗ − y2

2 a b c^2 Cos y1 y2 ^2 ;

Вычисление матрицы А

A = Transpose y1 Y1,Y2,Y3,Y4 ,

y2 @8 8 <

y3

y4 88 <<<D;

MatrixForm

8v2 0 @ Dê y1 0,y4 0,v1 0,

i

Вычисление{ матрицы В

B = Transpose v1,

v2 8Y1,Y2,Y3,Y4@8Dê

MatrixForm.

8

y1 0,y2 0,y3 0, v2 0

0− 0<− y

00

abbc2 abcc2 k{

Пример 1.4.

Построение матрицы X ( )t = (x( )1 ( )t ,x( )2 ( )t ,x( )3 ( )t ) и ввод матрицы A

X

t t

@;

0@ DD −@10D@∗ CosD @tD@@ DD −4 Cos@@tDD+@2D∗ Sin@ @DtDy{

1 4 1

A=1 1 1;

i2 4 1{y

kПроверка того факта, что каждый столбец матрицы X является решением

дифференциального уравнения

X' t A.X t

0,0,D 0 @ DD

матрицы X (0)

Det X 0 −10@ @ DD

Пример 1.5.

Построение Фундаментальной матрицы Коши

2 Exp 3 t 7 Cos t + Sin t 3 Cos t Sin t

Z@tD =τk Exp@3@∗ tDD Cos@tD@D2 Sin@ D@@@DLt@DDDDê @@SinLDDD@tD @ @D Dy{;

0 10 Cos t 4 Cos t + 2 Sin t

X_ = Z t . Inverse Z t .t → τ

7Sin t − τ ,

− − τ + @− τ , H @ D ,

1 H2 3t−3τ − 2Cos@t − τD − @− τ DL=,

2Sin@t − τDL,

101H 3 3t−3τ − 3Cos@ t − τD + Sin@ t − τDL ,

82SinH@t − τD, −4Sin@@t − τDD,Cos@@t − τDDL=+ Sin@t − τD<=.

Проверка равенства (1)

Simplify MatrixForm X s,s

1 0 0@@ @ DDD k0 0 1y{

0 1 0

Проверка равенства (2)

Simplify MatrixForm Inverse X t,τ −X τ,t 0 0 0@ @ @ @ DD @ DDD

0 0 0

k

0 0 0y{

Проверка равенства (3)

1 4 1

A =1 1 1;Simplify MatrixForm t X t, τ − A.X t, τ

2 4 1

i

0 0 0ky{ {y@ @ @ D @ DDD

0 0 0

0 0 0

k Проверка равенства (4)

Simplify MatrixForm τ X t,τ +X t,τ .A k0 0 0y{@ @ @ D @ D DD

0 0 0

0 0 0

Пример 1.7. Определение движения на промежутке [0,1)

u0 t_ = 1;Dv0 = DSolve x' t u0 t ,x 0 0 ,x t ,t ;

t @@ DD @ Dê @ @8 @ DD @ D @ D < @ D D x0 t_ = x t .Part Dv0,1,1

Определение движения на промежутке [1,[2])

u1 t_ = t;Dv1 = DSolve x' t u1 t ,x 1 == x0 1 ,x t ,t ;

x1@@Ht_1+DDt= xL@t.Part@Dv1,1,1@8 @ DD @ D @ D @ D< @ D D

1 2

u2 t_ = −t;Dv2 = DSolve x' t u2 t ,x 2 == x1 2 ,x t ,t ;

x21@@Ht_9 −DD = xL@t.Part@Dv2,1,1@8 @DD @ D @ D @ D< @ D D

2 t2

Определение движения на промежутке [3,4]

u3 t_ = −1;Dv3 = DSolve x' t u3 t ,x 3 == x2 3 ,x t ,t ; x3@@t_DD = x@t.Part@Dv3,1,1@8 @DD @ D @ D @ D< @ D D

3 − t

Построение движения в целом на промежутке [0,4] x t_ := x0 t ;t 0 t < 1 x@t_DDDD@:@= x1D @@@@8tDêDêDêDê;t ≥<D1flflflt < 2

x@@@t_ := x2 t ;t 2 t < 3 x t_ := x3 t ;t 3

Plot x t , t,0,4

Пример 1.8.

Ввод программного управления

,u2@t_D<=8t,2t<

Решение задачи Коши

x1' t

998x2'@t@8tD→ 1@H@D<2==D D @ D 1,xL2@ D <, x1 t@ ,x2 t

x1 DDD 6 6 + 6t + 3t2 + 2t3 , x2@@t → 1 + t

Ввод фундаментальной матрицы Коши и начального положения фазового вектора

B;X t, τ_ = 1 t − τ ; uu1N@@ττDD@N; D J0 1 N

u2

=

Формула Коши

t

X τ .B.u@τD τ 1 + t

99

Пример 1.9.

Ввод программного управления Sin

D i t u t_ = Cos

Sin t , Cos t , t

88 Ввод@ D<k фундаментальной8@ D@{ D< 8 << матрицы Коши и начального положения фазового

вектора Z

Xkt_,i τ_@D = yD @@ZD@tD.H@Inverse D@ D @Z@tDDê@.tD → τ@ DLD; @ D{y i;

1 0 0

B=0 1 0;

0 0 1

k

i1 {

1y x0 =1 ;

Формула{ Коши

t

X1@t_D = X@t,0D.x0 + 0 X@t, τD.B.u@τD τ;


Проверка граничных условий на правом конце траектории

1

NAHPart@Transpose@X1@1DD.X1@1D,1,1DL^ 2E

46.531

Вычисление функционала

49.7931

Пример 2.2.

Решение сопряженной системы дифференциальных уравнений

Sopr = DSolveψ1' t ψ2 t , ψ2' t −ψ1 t , ψ1 ψ2@ ;D @ D @ D @ D<

1t .Sopr, ψ2 t .Sopr Cos@@tD− C@1DSin@tD<< @ Dê <

системы дифференциальных уравнений с оптималь-

ными управлениями

Osn = DSolvet t ψ^21@+ ψtD2@tD^2 , x2'@ D @ D è @ D @ D @@tDD^2 =,

t t ,t

x1 = t .Osn

tD>, <

::è@

:è @@DD + @@DD @ D @ D è @@DD2 + @@DD2 − C@3DSin@tD>>

Решение нелинейной системы уравнений Относительно неизвестных

C C1, 2

= .

Fin 3,Ax20 Ax1π, 88 ψ<2π8 −<4@8∗8Ax2<π 8, << ê<D <

C1 , C2 , C3 , C4 =

.Fin,C4 .Fin 88 < 8 <,8 <,8 <<

147

Подстановка найденных констант в общее решение объединенной системы дифференциальных уравнений

8

x10 t_ ,x20 t_ , ψ10 t_ , ψ20 t_ =

C 1 C1,C 2 C2,C 3 C3,C 4 C4

3x1.Cos@@@@t@tDDDD,x2D@ D @tD@,@ ψDD1@@@@DtDDD,2@@@D@tDDD<êD @.@D D<@ D@@DD@ <D<

8 +0.845845tCos t +2.Sin t −0.533429tSin t ,

2.Cos t −0.533429tCos t +3.Sin t −0.845845tSin t ,

2.0562Cos t −1.29673Sin t ,−1.29673Cos t −2.0562Sin t

ParametricPlot x10 t ,x20 t , t,0, π ,

AxesLabel 8"x@81","x@2D"<D @ D< 8 <

Graphics

Исследование поведения решения сопряженной системы

Plot ψ10 t , ψ20 t , t,0, π ,

AxesLabel@8 @ →D8"t","@ D<ψ1,ψ28"<D <

Graphics

Вычисление оптимального значения функционала

3 x10 π ^2 + 2 x20 π ^2

0.56252@ D @ D

Проверка постоянства функции Понтрягина

Q@t_20D = ψ10@tDik@x20D @tèD + è@ψD @ D + ψ@ D y{^2 y{ +

ψ t ∗ik−8x10 t + ψ20 ;

t

Graphics

Вычисление значения функционала на произвольном управлении

Srav =

NDSolve

@y1D<DtAtDDD +8y2è@@tHDD<<@+ @D8=@8LDê@@DDψH10@t@@D+D<+D@0.1ψ208@tLD − 0.1<<EL^2 , t

− @@ ψ10 t 0.1 ^2 ,

y1 0 == −3,y2 0 2 , y1 t ,y2 t , t,0, π ;

y1 t_ ,= y1 t .Srav,y2 t .Srav ;

388∗ y1@@πD^2 + 2 y2@ D^2

0.598124

Пример 2.3.

Интегрирование сопряженной системы с граничными условиями

Sopr = DSolve@

@

, tD,

,

tD ψ1 t_ , t_ , ψ3@ D<<@ D<=

Re.Sopr , Re @ Dê D

@ @ Dê D<решения сопряженной системы

Plotψ1 t , t,0,1 , AxesLabel@ D →88"t","ψ<1"<D

ψ1

Graphics

Plotψ2 t , t,0,1 , AxesLabel@ D →88"t","ψ<2"<D

ψ2

Graphics

Plotψ3 t , t,0,1 , AxesLabel@ D →88"t","ψ<3"<D

700ψ3

Graphics

Определение момента переключения управления

FindRoot ψ1 t 0, t,0.6,0.8 t → 0.741061@ @<D 8 <D

Интегрирование основной системой с полностью определенными оптимальными управлениями и с начальными условиями

Osn =

NDSolve@

x2' t 10 x1 t x2 t 35 x3 tD −

1,

8x1t_ D, 3.,x2@@0DD 2@,xD3@0D@==<DD1.<,

88x1 @ DDD<@@ DêDê@ D D<, @@ DêD<< = D x1@,x2 t ,x3 t ;

Re@@x1 t,

8Re@x3 t

Вычислениеоптимального значения функционала

x1 1 + 2 x2 1 x3 1

366.188@ D @ D @ D

Сравнение с неоптимальным управлением

Srav =

DSolve@

tD −

1, y10@DD−3.,y2@@0D@DD<2@@,y@DD3D<<Dê@0D@==D1.D<,

t t ,t ; D , y3 t_ =

Re y1 @y2 t .Srav ,

y1

365.348@ D @ D @ D

Проверка постоянства функции Понтрягина

PlotQHPlotRangeHH2t_210D∗x1∗=x1@@x1Q@t@D@tt+DD x2→8@ D8862,864x3<@1,D∗ψ<3D@Lt D2@tD@t+DDL∗ψ1@tD+

Graphics

Пример 2.5.

Построение фундаментальной матрицы Коши

Resh1 =

DSolve x11' t 2 x11 t + 9 x21'@8@DtD x11@@D@D<tD + D2 x21@ @Dt, t ,x21 t ,t ; x12't 2 x12 t + 9 x22 t ,

@ Dt;

x22'@8t x12D@D<tD + 2 x22@@@DD<tD 8 @@DD<<@DDê <,

tx21 t ,

t .Resh2,x21 t .Resh1,

X =.t 1 − τ

:: подынтегральногоD−1+τH−1+ 6H1−τLL>,: и61 внеинтегрального−1+τH−1+ 6H1−τLL, 12 −1выражений+τH1+ 6H1−τLL>> функции

ипсилон

XT = Transpose X ;L = l1 ;

= − 4 ∗ @ D+ 9 l2^2Jl2N+ 50 l1 + 30 l2

;

τ

=

Построениедвух ветвей функции ипсилон

Eps1 l1_; Eps2@@l1_DD = Dob2 NIntegrate@ @ D 8 <<DD;

Решение задачи математического

u = −1;If Eps1 1 < Eps2 1 ,S = Eps2 1 = u;

l20 = − u^2 ;

DoAu = è1 1000.u^2 è A@ @ D uD;DE

m10 = u;m20 = − 1 u^2,P

m20 E;If P > S,S @ D m20 ,

",l10," ","l20=",l20,

l10 D

Построение оптимального управления

f2^2, ;

x1@t@DD<,x2@D D8 @@ D<<D< 88

@8

Координаты фазового вектора в конечный момент времени

8

x1 1 ,x2 1

8

45.817,15.8054@ D @<D<

Вычисление финального расстояния

F ϕ_ =

@HHx1D@1 DL^2L^ 21;

NDSolve y1' t,

y2' t@8D y1@@@@D<tDDD<<+ 2 8@ @D Dê @ D @ @D 0,y2@0D< 0<,

t ,

y2 t_ .ReshY,y2

Координаты фазового y1 1 ,y2 1 @ D @ D<

финального расстояния

FY ϕ_ =

@y1D@1D − y2@1D − 30 3 Sin@ϕDL^2L^ 12;

FindMinimumHH

811.923,8ϕ → −1.78491@ @<<D 8 Пример<D 2.6.

Построение фундаментальной матрицы Коши

Resh1 =

DSolve x11' t 2 x11 t + 9 x21'@8@DtD x11@@D@D<tD + D2 x21@ @Dt, t ,x21 t ,t ; x12' t 2 x12 t + 9 x22 t ,

88= Jx22'x11t@8@Dtt,D8x12x12@@@D@D<ttD<D + D82@∗Dêx22@@@DD<tD 8 @@DD<<@DDê <,@ Dê < x12 t ,x22 t ,t ;

x118 @@ x12 t , x21 t , Xx21@ D<Dê@@tDD x22@@tDDNê.t 1 − τ x11 t .Resh1,x12 t .Resh2,x21 t .Resh1,x22 t .Resh2 ;

Построение подынтегрального и внеинтегрального выражений функции

ипсилон

двух ветвей

l10 0.304 l 0.952672 Eps0 9.03586

Анализ оптимального управления

τ → t,l1 l10,l2 l20<

Graphics

Plotz2t , t,0,1 ,PlotRange → −4,0

D 8 < -0.5 0.2 0.4 80.6 0.8<D

-1

-1.5

-2 -2.5

Graphics

Определение момента переключения

FindRoot z1 t 0, t, 0,1 Построение@ @< D оптимального8 8 управления<<D

t 0.36245

U10 t_ ,U20 t_ = −Sign z1 t , Sign z2 t Plot@U10D@tD,@8t,0,1D< 8<,AxesLabel@ @ DD8"t","U@ 1"@<DDD<

@ U1

Graphics

Plot@U20@tD,8t,0,1<,AxesLabel 8"t","U2"<,PlotRange 8−1,1<D

Graphics

Интегрирование уравнений движения для оптимального управления

Graphics

Координаты фазового вектора в конечный момент времени

x1 1 ,x2 1

53.2155,18.4742@ D= @ D< − < − ∗ ϕ + − − ∗ ϕ

Вычисление финального расстояния

1

ϕ_ x1 1 50 2 Cos ^2 x2 1 30 3 Sin ^2 ^ ; FindMinimumHH @@FD@ϕD, ,0,2@ DL<D H @ D @ DL L

2

ϕ → −1.35749 произвольного

системы уравнений с введенным управлением

NDSolve y1' t 2 ∗ + V1, 888y2'@@DD<t@8D 8y1@@@@D<tDDD<<+8 ∗ 8 <@DDDê D 0@,y2@0D 0<<,

.ReshY,y2 t .ReshY

@Координаты фазового вектора в конечный момент времени

y1 1 ,y2 1

858.3336,19.866@ D @ D<

финального расстояния

FY 50 2 Cos ϕ ^2 + y2 1 30 3 Sin ϕ ^2 ^ 1;

FindMinimum@ D HH @FY@ @D << @ DL<D H @ D @ DL L 2

10.5125, ϕ→−1.00394

8

Пример 2.7.

Построение фундаментальной матрицы Коши

Resh1 =

NDSolve x11' == x41 t , x31' A9, @ D

x41'x41 t ,x11 0 1,

0,x31 0 == 0,x41 @ D @ D

;

Resh2 <E

, t D

,x12 0 0,

1,x32 0 ==@0D,x42 @ D @ D

;

Resh3 <E

,

D ,x13 0 0,

D 1@,x43 @ D @ D @ D D @ D

;

Resh4 <E

,

+ t x44 t D

,x14 0 0,

0,x44 @ D


@D<DêDD,x24, t; @tt

8 @ Dê.Resh2t;, @ Dê

8 @@ DêDê.Resh4,x24< @ Dê

@ Dê <

t; D<<@ Dê.Resh1,<E

t = D<<@t.Resh2,

x43 t = D<<@t.Resh3,

t =

D<<@t.Resh4,


x11 t x12 t x13 t x14 t

X t_ =x21x31@@@@ttDDDD@ x22x32D @@@@ttDDDD x33x23@@@@ttDDDD x34x24@@@@ttDDDDy{;Y@sD = Inverse@X@sDD;

@ Dx41 t x42 t x43 t x44 t

MK s_ =kX@1D.Y s ;

@ ПостроениеD подынтегрального и внеинтегрального выражений функции ипсилон

l1 0 0

l1^2 ;

двух ветвей функции ипсилон @

Print "l10=",l10," ","l20=",l20," ","Eps0=",

S l10D=−0.779 l20=−0.627024 Eps0=4.59607

Построение оптимального управления

f1 f2 ;

8

U10 t_<D,U209è@t_D< = 8U1,U2<èê.8τ → t,l1 = l10,l2 l20<;

@ оптимального управления

Resh =

NDSolve x1'x4 t , x3' A9+ U10@ D@tD,@ D @ D

x4't + U20 t ,x1 0 0,

t,0,1 ;

88 x2@@@DDD< 8@ D@@D<D@@Dê8D8 @@D<D<< ==88@0@Dê,@D<<D<E 8 @ Dê <D<

, x2 t_ ,t_ =

@ Dê@.Resh,x2D @ D<t .Resh,x3 t .Resh,x4 t .Resh

Plot8 @8x1 t ,x2 t , t,0,1 ,AxesLabel "t","x1,x2"

x1,x2

Graphics

Координаты фазового вектора в конечный момент времени x1 1 ,x2 1

8

0.640532,0.491302@ D @ D< < 1

Вычисление финального расстояния

x1 1 5 ^2 + x2 1 4 ^2 ^ 2 1

4.59606HH @ D L H @ D L L

Ввод произвольного управления

V1,V2 = −f1 + 0.5 ,

è@H <D 9è@−HLf2f1D<−+0.5H0.5L^2 + HL−f2 −=;0.5L^2 <

f1 + 0.5 ^2 + −f2 0.5 ^2

V10 t_ ,V20 t_τ → t,l1 l10,l2 l20 ;

Интегрирование уравнений с введенным управлением

ReshY =

NDSolve y1' t y3 t ,y2' t ,

888 y3'@@@Dê@DD<A9D 8@ D@ D<∗ y3@ DêD<<<@EtD,@ D @@DêD < y4' + 1 t + Sin t V20 t ,y1 0 0,

y2 0,y3 0 == 0,y4 0 == 0

,y2 t;

, y2t_ =

y1 t .ReshY,y2t .ReshY,y4 t .ReshY

Координаты фазового конечный момент времени y1 1 ,y2 1

80.70276,0.193406@ D @ D< < 1

Вычисление финального расстояния

HHy1@ L^2L^ 2 1

4.74077

Пример 2.8.

Построение фундаментальной матрицы Коши

Resh1 =

NDSolve x11' t x31 t ,x21' t == x41 t , x31' A9 + 1 tD, @ D

x41'x31 t + Sin t

8

x110,x31 0 == 0,x41 0 == 0 , x11@@ D @<E; =

Resh2 =

NDSolve x12' t, x32' A9 @ D @ D @ D, @ D

x42'

8

x12 1,x32 0 == 0,x42 0 == 0 , x12@@ D @<E; =

Resh3 =

NDSolve x13' t == , x33' A9t Cos t @ D

x43' ,

x13 ,

Resh4 =@ DD @ D@ D @ D @@DD< 8 @ D<E = x13@t

NDSolve x14' t x34 t ,x24' t == x44 t , x34' A9@ D

x44',

x14 0,x34 , 888x41@@t@DêD<DêDD @ D; @@DêD @ D< @@8D<<D<<@@ <E =

x118 t@ , t t = x14 t

x11 t .Resh1,x31 t .Resh1,

t x42 t =

.Resh2,x32 t .Resh2, .Resh2 ; @

t , x43 t =

@@ DêDê < @ Dê.Resh3,x33@@ D<<D<<@@tDêDê.Resh3,

x44 t =

.Resh4,x24 .Resh4,x34 t .Resh4,

@ Dê <


x11 t x12 t x13 t x14 t

X t_ =x21x31@@@@ttt@DDDD@@x22x32x42DDD@@@@tttDDDD x23x33@@@@ttDDDD x24x34@@@@ttDDDDy{;

@ Dx41 x43 t x44 t

Y s = Inversek X s ;

MK@@Ds_D = X@1D.Y s ;

Построение подынтегрального и внеинтегрального выражений функции ипсилон

l1 0 0

L =l20 y;B =i0 01 0y;

00 1

f2 Transpose B . τ .L ; @DDf2DLL;

=

двух ветвей функции ипсилон

Eps1 l1_ = Dob1 ; Eps2<<DD;

u = −u;

l20AA = −èèA1 u^2,S@ D Eps1@@1DD;l10@ D D u;l208@ D= èè1 − <u^2E EE;

Do u 1000.

If= ;m10 = u;

m20Eps1 u ;m10 = u;m20 = 1 u^2 ;

If P >m10;l20 = m20 , i,200,220 ;

Print@ @"l10=",l10," ","lD 20=",l20," ",

"Eps0=",S

l10=−0.791 l20=−0.611816 Eps0=4.28152

Построение оптимального управления f1 , Sign f2 ;

8

U10 t_ @ =D @ D<

8 @ D<ê.8@ D<t,l1 l10,l2 ;

Анализ оптимального управления

PlotU10 t , t,0,1 ,AxesLabel "t","U1"

Graphics

PlotU20 t , t,0,1 ,AxesLabel "t","U2"

Graphics

Интегрирование уравнений движения для оптимального управления

Resh =

NDSolve t x3 t ,x2' t x4 t ,

x3' t U10D@tD, D

x4' t t , x1 0,x3 ,

88 x1@@tDD,x28@tD@ D<@DêD8 @@D<D< 88@@DêD<<<E x18 t_@ D<=

x1 tt .Resh,x3 t .Resh, 8x4@@tDêDê@ D 8 @ D< 8 <D <

Plot x1t,0,1 ,

AxesLabel@81,x2"

x1,x2

Graphics

Координаты фазового вектора в конечный момент времени x1 1 ,x2 1

8

0.820538,0.770994@ D @ D< <

Вычисление финального расстояния

x1 1 5 ^2+ x2 1 4 ^2 ^ 12 1

4.28151HH @ D L H @ D L L

Ввод произвольного управления

V10 t_ ,V20 t_ =

1,D<1D,If@t>0.9,1,1D<

Интегрирование системы уравнений с введенным управлением

=

NDSolve t y3 t ,y2' t y4 t ,

y3' t + t ,

y4' t ∗ @ D tD,

y1,

@tD,y2 t=

88 @@t_@DêDD<,8y2@ D@<D<@8Dê@ D< 8 @@ DêD<< =

t .ReshY,y2 t .ReshY,

8y4t.ReshY

Координаты фазового вектора в конечный момент времени y1 1 ,y2 1

8

0.499235,0.651947@ D @ D< < 1

Вычисление финального расстояния HHy1@1D − 5L^2 + Hy2@1D − 4L^2L^ 2 1

4.60949

Пример 2.9

Область начальных положений фазового вектора

a = 5;b = 4;k = 1;

Plot a^2 x^2,2 + k x + 3 , x, a,a ,

a

AxesLabel "x ","x "

Уравнения, описывающие границы области начальных положений фазового вектора 4 è

ϕ1x1,x2= x2 − ∗ 25 x1^2;

5

ϕ2x1,x2= x1 x2 + 5;

@ ОпределениеD точек пересечения прямой и эллипса

Gran = NSolve ϕ1 x1,x2 0, ϕ2 x1,x2 0 , x1,x2

88x1 → −5.,x2@8→ 0.@<, 8x1D→ −1.09756,x2@ D 3.90244< 8 << <D

Решение совместной системы дифференциальных уравнений для оптимальных управлений

Sopr = DSolve ψ1' t ψ2 t , ψ2' t −ψ1 t , 8ψ=1@DSolve@tt, ψ2@8tx1x1'D<@t,t@@t+DDD<<D; x2@8@tDD@+ψ2èC@t@D@D@DψD1C@@t@=DDêD<@ D <

ψ1C t_ , ψ2C t_ = ψ1 t .Sopr, ψ2 t .Sopr ;

88Osn DD< A9@8 ψ1C t ^2 + ψ2C t ^2 ,

x2'@ D @ D ψ1C t ^2 + ψ2C t ^2 ,

88x1@t_@1@@DDDD<D,x2C1,C@8t_@@DD<@,@D2DψD<<1→E@C2,Ct_è8, ψ@32@@Dêt_D@D<D<ê= @ D @ Dê< < x1 t ,x2 t ,t ;

x1C8 t , x2C t = x1 t .Osn,x2 t .Osn ;

8 x1C t ,x2C t , ψ1C t , ψ2C t .

8C@DD@ D → C3,C 4 C4

Случай 1

Построение фундаментальной матрицы Коши

Resh1 =

DSolve x11' t x21 t ,x21' t x11 t ,

x11@00@8D 10,x,x@ 2122D @00D @01<D,,8x11@@tDD,x21@tD<@ ,tD D;

Resh2 =

DSolve x12' t x22 t ,x22' t x12 t ,

x12@@@8 @ D D8@@Dê<D@8D<x12@8@tDD,x22@ D<<@@DêtD<@ ,tD D; 8888X8@t_,@t_D<− τDD=DJ8,Sinx21x11@@@@<tttD<@DD− τx12x22D<,@@tt8DD−Sin.t@t − τtD− τ @ D<< x11 t , x12 t , x21 t , x22 t =

x11 t .Resh1,x12 t .Resh2,x21 t .Resh1, x22 t .Resh2 ;

Cos ,Cos t − τ

Вычисление@ внеинтегрального слагаемого

X0 = x10 ;L = l1 ;U = u1 ; 88Transposel1x10Jx20N@X,0JD<<l2.X0ND.L Ju2N

− − l2x20

Вычисление подынтегрального слагаемого

Collect Part Transpose X π, τ .U .L,1,1 , u1,u2

u2 −l2Cos@= @HτD−D@l2Cos+ l1Sin@τ@DEDL<@DL@+ u1H@DDLl1CosD @τD −Dl2Sin8 @τDL<D a1,a2H < è@8 + l1Sin τ ,

l1Cos τ − l2Sin τ ;

SimplifyH A a1^2 + a2^2

"

l12+l22

Вычисление максимина

Aw = Array aw,200 ;Bw Array ;

F x_,l1_@= −l1 xD+ èè1 4 ∗ è25D − x^2;

@ D = −l1 x 1 l1^2 5 25 x^2;

= −1 + = −5;S = F x,l1

DoA @@If@@F@x,l1@ DD> F@x@+ δ ∗ i,l1@@D,SD <<DEE@ @ i,l1DD,DD

= j,0,200

Do F1 x,l1 ;

Do i,l1 ,S = F1 x + δ ∗ i,l1 ,

j,0,200 ;

Max

3.52737

Случай 3

Prim =

NSolve C1 µ2,C2 == −µ2,x10 x20 + 5 0,C3 == x10,

C4 ==A9x20,iè−C1 π ∗6 iC1^2π ∗ C1y{= y{,

C2 4 C1^2 +C2C2^2 + C4,

µ2,x10,x20 ;

C1 , C2 ,C3 , C4 , µ2 , x10 , x20 = .Prim,C4ê <<8ê.Prim,<<

.Prim ê значения функционала

3 x1π ^2 + 2 x2 π ^2

0.372455@ D @ D

Оптимальная траектория

ParametricPlot@8x1@tD,x2@tD<,8t,0,1<D

Graphics

Случай 4

Clear C1,C2,C3,C4, µ2,x10,x20

Первое@ решение D

Gran,1,2

− µ2, D<

C3 x1,C4 x2, C1 6C3,

C1^2 C2^2

88 ==A9 ∗ == π ∗ è− +∗ iky{è= 8π ∗+C1 +y{ µ µ <E

C2

C2 4C4, C1,C2,C3,C4, 1, 2

è

C1^2 + C2^2

k→ →− →

→−× −7 µ →− ×

C3 x1,C4 x2, C1 6C3,

C1^2 C2^2

88 →→==A9 ∗ k ==µπ ∗→−→−è− +∗ ik{yµè= →−→8π ∗+C1 + {y µ µ <E

C2

C2 4C4, C1,C2,C3,C4, 1, 2

C1^2 + C2^2

C1 1.09307,C2 3.58865,C3 1.09756,

C4 3.90244, 1 3.04339, 2 0.545264 <<

Пример 2.10

Множество S0

Plot3D 3 1 + 1 x1 1 x2 , x1, 9,0 ,

8x2,0,6A <J,AxesLabel9 6 8"xN1","x8 2","x3<"<E

SurfaceGraphics

Интегрирование сопряженной системы

Sopr =

NDSolve @D @ D @ D @tD,

∗ ψ ∗ ψ ,

1.D ,

;

888 @ D< 8 @ ψ2D<@t8 @88@88@ 0D<<.,ψ1.@<<<<<<.SoprD@D@D@ D<D<<D<<

InterpolatingFunction@ Dê , <> t ,

InterpolatingFunction 0.,1. , <> t ,

InterpolatingFunction@88 , <> t

Определение начальных

Nach =

NSolve 1 ∗ µ1 + µ2 ψ1 0 , 1 ∗ µ1 − µ3 ψ2 0 ,

A9− µ94 ψ3 0 , @ D 6 @ D

µ ∗ − 1 0,

µ2 0, µ3 x20 0, µ4 x30 0 ,

1, 2, µ3, µ4,x10,x20,x30

µ1 → −1070.08, µ2 → 0., µ3 → −51.1497,

88µ4 → −1040.07,x10 → −9.,x20 → 0.,x30 → 0. ,

µ1 → 2050.13, µ2 → 346.69, µ3 → 468.885, <

,

8

µ4 → −937.77,x10 → 0.,x20 → 6.,x30 → 0. ,

µ1 → 0., µ2 → 118.898, µ3 → 127.197, < 8µ4 → −683.376,x10 → 0.,x20 → 0.,x30 → 0.<< x10,x20,x30 = x10,x20,x30 .Part Nach,2

Интегрирование основной системы дифференциальных уравнений с оптимальными

80.,0.,3. <управлениями < 8 и оптимальными начальными@ D условиями

Osn = NDSolve@

+

x3'@ D ∗ @ D− @ D @ D ψ3 t , x1@@ D @@DD< @8 D<< <D @ DD

t

, @ D , x3 t_ 888 @ DêD<.Osn,x2@t.Osn,x3@88 t

InterpolatingFunctiont , 88InterpolatingFunction@88@880.,1.<<<< <>D@D@D@tD<D<<D<

InterpolatingFunction 0.,1.t ,

8 Вычисление оптимального значенияфункционала x1 1 + 2 x2 1 x3 12344.02@ D @ D @ D

Пример 2.11

Построение столбцов матрицы Коши

Resh1 =

NDSolve x11' == x41 t , x31' A9, @ D

x41'x41 t ,x11 0 1,

0,x31 0 == 0,x41 @ D @ D

;

Resh2 <E

, t D

,x12 0 0,

1,x32 0 ==@0,xD 42 @ D @ D

;

Resh3 <E

,

@ D @@DD @DD @ @D D @=D @ D,x13<DE @0D 0,

x231,x43 ,

;

Resh4 , t D

,x14 0 0,

,x24 t t ;

@DêD<DD @0,x44 D<<@ Dê <E @ D

,

t .Resh1,

; t t =

@ Dê @tD<<@t.Resh2,

.Resh2 ;

t , x43 t =

8 @ D<<@t.Resh3,

888 @@ DêDêDê < @x34Dê@tD<,8x44@tD<<@ Dê=

.Resh4,x24 t .Resh4,x34 t .Resh4,

x44 t .Resh4 ; @ Dê

фундаментальной матрицы Коши X[1,s]

x11 t x12 t x13 t x14 t

X t_s_D== x21x31@D@@@ttDDDD@ x22x32D @@@@ttDDDD x33x23@@@@ttDDDD x24x34@@@@ttDDDDy{;Y@sD = Inverse@X@sDD;

@Dx41@t x42 t x43 t x44 t

MKkX 1 .Y s ;

Построение слагаемого для начальных условий

x10 l1

x0 =x20x30y;l = il20 y;

x400

Z =HPartH @ MK{ @0D.x0D.l,1,1D L L

l1 1.x10 @1.7491x30 + 0.243323x40 + l2 0.x10

x0 Array α,4 ;Array β,4 ;

@ D @ D ; 8K8= ki‚α@iD^2@@∗ β@iD<−β^2DD@ D∗ α@ D^2,@@−β@3D∗ αD<D @ D

Z,x30

4

i=1

x10,x20,x30,x40 =

1 ^23 ^2

,K ,

4D^2

Построениеподыинтегрального выражения и оптимальной стратегии

, f3 t_ , f4 t_ = Transpose MK t .l;

s ^2;U1@ D< s_,l1_,l2_ = − f3ss ;

U2@ D f@ssDDD; @8 @ D<< D f@@D@D @ DD

Решение задачиматематического программирования

l1 = −1;l2 = 0;

S = −1 5 l1 + 4 1 l1^2 K NIntegrate f s , s,0,1 ;

j = 0;l10 = l1;l20è= l2; @ @ D 8 <D

Do l1 = −1 + i ;l2 = − 1 l1^2;

WA= −W1>−S,S5 l1=1000.W;l104 l2=−l1;l20K èNIntegrate= l2;j@=fi@DsD,88s,0,1D <D;<E

If , i,215,220 ;

Print@ @j," ",l10," ",l20," ","S=",S

219 −0.781 −0.624531 S=4.28676

Построение оптимальной траектории и оптимального начального положения

l1,l2 = l10,l20 ; x10,x20,x30,x40

< 8 < 8 <

t , 8 @@@@ DDt 8Cos@ D t ∗@y3D t +@tD<∗ y4 t + U1 t,l10,l20@@DDê D,<D

+ t,l10,l20 ,

8 D08 @@D<<D<E @0D x40=,

y1;@

y1 t_=

88y1 t 8t.Osn,y4 t .Osn ;

терминального множества

H

y1

4.28675@ D L H @ D L

Оптимальный закон движения Plot@8y1@tD,y2@tD<,8t,0,1<D

0.8

0.6

0.4

0.2 0.4 0.6 0.8 1

Graphics

Пример 2.12

Построение столбцов матрицы Коши

Resh1 =

NDSolve x11' == x41 t , x31' A9, @ D

x41'x41 t ,x11 0 1,

0,x31 0 == 0,x41 @ D @ D

;

Resh2 <E

, t D

,x12 0 0,

1,x32 0 ==@0D,x42 @ D @ D

;

Resh3 <E

,

@ D @@DD @DD @ @D D @=D @ D,x13<DE @0D 0,

x231,x43 ,

;

Resh4 , t D

,x14 0 0,

0,x44 @ D

@DêD<DD,x24 @t t D<<@ Dê <E;

,

t .Resh1,

; t t =

@ Dê @tD<<@t.Resh2,

.Resh2 ;

t , x43 t =

8 @ D<<@t.Resh3,

88 @ DêDê < @x34Dê@tD<,8x44@tD<<@ Dê=

.Resh4,x24 t .Resh4,x34 t .Resh4,

8x44@t.Resh4 @ Dê

фундаментальной матрицы Коши X[1,s]

x11 t x12 t x13 t x14 t

X@@t_D D=ix21x31@ @@@@tt@DDDDX@@x22x32DDD@@@@ttDDDD x33x23@@@@ttDDDD x34x24@@@@ttDDDDy{;

Dx41 t x42 t x43 t x44 t

Y s = Inversek s ;

MKs_ = X 1 .Y s ;

ПостроениеD слагаемого для начальных условий

x10 l1

x0 =x20y;l = il20 y;

x30

x400

Z = Part Transpose{ k @MK{ @0D.x0D.l,1,1D;

Решение@ задачи минимизации Z по переменным x0 Array α,4 ;Array β,4 ; @ D @ D ;

@ D @ D< и оптимальное начальное

положение (в зависимости от l)

4

K = i α@iD^2 ∗ β@iD^2y^;

i=1

=

8∗ α@2D^2, −β@3D∗ α@3D^2,

@ D @ DD =; @ D K K

Построение подынтегрального выражения и оптимальной стратегии f1 t_ , f4 t_ =

Transpose @ D< @ DD @@ @@ DDDD @f3@@sDD<<+ f4@sDD;

s_,l1_,l2_

s_,l1_,l2_

Решение задачи математического программирования

l1 = −1;l2 = 0;

S = −1 5 l1 + 4 1 l1^2 K

NIntegrate sè, s,0,1 ;j = 0;l10 = = l2;

Do WA<D;<E

If >; Print@ @ D

206 −0.794 −0.607918 S=3.97259

Анализ оптимального управления

Plot@8U1@t,l10,l20D,U2@t,l10,l20D<,8t,0,1<D

2

1.5

0.5

Graphics

Построение оптимального начального положения

8 закона <

Osny4 t ,

t,l10,l20 ,

y4'@tDD A91@ D∗@y3D@t@DD+ Sin@ D@tD@∗ y4D@@DtD@+ U2@@@t,l10,l20DD D= D,

y1 x10,y2 0 x20,y3 0 x30,y4 0 x40 , 88Plot8 @@@8@@Dêy1DD<@tD8,y2@ D@@tD<@ 8D @@D<D<<D@ 88Dê@ D<<<E @ Dê < y1t ; y18 t_ , =

y1 t .Osn,y2t .Osn,y4 t .Osn ;

Graphics

Вычисление оптимального расстояния до терминального множества

y1 1 5 ^2+ y2 1 4 ^2 1

3.97259 @ D L H @ D L

Пример 3.1.

Построение фундаментальной матрицы Коши

Resh1 =

DSolve t x21 t ,x21' t x11 t ,x11 0 == 1, x21 D < 8 @ D,x21D @tD<@,tDD; @ D @ D

Resh2 =@

DSolve x12' t x22 t ,x22' t x12 t ,x12 0 0, x22@0@8D<D @ D @,x22D @tD<@,tDD; @ D @ D

x11 t .Resh1,x21 t .Resh1 ;

888 @ D<< 8x12@@tDêDê.Resh2,x22@@tDêDê.Resh2<<;

.t t s;

J X @@ DD @@ DDNê

J@CosSin@@ssВвод−−DttDD − CosSinоптимального@ −−tD N DD управления

Интегрирование уравнений движения для оптимального управления

Fin = DSolve x1' t x2 t + u10 t ,x2' t x1 t + u20 t , 8 x1@@ @0D<D<D == 1@8,x@@ 2@@0DD 1<,@8x1D @tD,x2@ D@tD<,t@DD; @ D @ D

x1 t_ = x1 t .Fin;

x2 t_ = x2 t .Fin;

Оптимальная траектория

ParametricPlotA8x1@tD,x2@tD<,9t,0,è2=E

Graphics

Пример 3.2. Ввод начальных условий

x01 J, 1N

88 < 8Построение<< фундаментальной матрицы Коши

Resh1 =

NDSolve x11' t Cos t x11 t + t x21 t , x21'@ A9tD =t 8 ∗ x21@tD<E,x11@ D @0D 1,

x21 0@D 0 ,;

Resh2 =

NDSolve x12'+ ∗ t ,

x22'@@A9DtD t@+ 1D ∗ x12@tD+ Sin@tD∗ x22@t<@E,x12@@@DDDDêDê@0D 0,<<

x22 0 1,;

x11x11 t t .Resh1 ; t .Resh2 ;

Inverse X s ;

JD @@@DDD @@@DDDN @ D

@Построение функции ипсилон

l= ll21 ;Vne=PartTranspose MKT,0.x0 .l,1,1;Vsp=Transpose MKT,s .l;

PodJT_,s_,l1_,l2_N @ = Part Vsp,1,1@H @ D^2+LDPart Vsp,2,1D ^2 ^12; @ @ DD Eps@@T_,l1_,l2_D=VneD H3NIntegrate@ D@Pod@T,s,l1,l2@ D,8Ds,0,TL <D

2.27631l1+ 2.08901l2− 3NIntegrate Pod T,s,l1,l2 , s,0,T Ввод оптимального времени@ @ переходаD 8 <D

T=0.662;

Определение опорного вектора

A=FindMinimum EpsT,l1,l2 +100l1^2+l2^21 ^2, l1,0.1,0.2, l2,0.1,0.2 ; l10,l208 <=8l1<@ê.Part@ @A,2,1DD,l2ê.PartH @A,2,2D<;L 8 < 8 <D

l0= l10,l20

0.617752,0.786373

8EpsT,l10,l20 <

−0.0000122584@ D

Построение оптимального управления

Upr=t_Transpose3@PartMK@@T,tUpr,1DD.l0;u10Part^2+@Upr,2Part@t_@DUpr,2D=−3DPartLUpr,1Par^2t+@PartUpr,@1Upr,2D D^2L^21 ; u20@ D=− H D H^2 ^; D

Интегрирование уравнений движения для оптимального управления

Fin = NDSolve x1' t Cos t x1 t + t x2 t + u10 t ,

8 x2'@@ @D<D< A9@@1DêDê @ D @ D @ D <E+ u20@@tDD,x1@@0DD 1,

x2 0 t,0,T ;

x1 t_ 8

x2 t_ = t

Оптимальная траектория

ParametricPlot@8x1@tD,x2@tD<,8t,0,T<D

Graphics

Проверка попадания в начало координат

8x1−0.0000134271@TD,x2@TD< , −0.0000148833

8 <

Пример 4.3

Ввод начального и конечного положений фазового вектора

X0

XT 80.7746, 147.179, 8.94415

80.7746,

< матрицы Коши

DSolve x11'x31 t , x21'D @@8@@Dtx12'DD t @ D < 8 @ D @ DD@x32D @@ D<D x31' t 20 1,

x21 0 0,x31 0 t ,x31 t ,

t ; Resh2 =

DSolvet , x22'@8D @ D < 8 @ D @ DD@ D @@ D<D

x32'+ t 0,

x22 1,x32 t ,x32 t ,

t ; @

Resh3D =

DSolve t x33 t , x23'@8 @ D 8888888 x33'D@@@@@ @@@@@@DDD<DDêDDêDDê8 @@@DD<D<ê<@@888@@@D +@DDêDDê<@D<<D<<@ @ DD<<0 @0D<, x23 0t ,x23t , t ; x21 t,

Re x11 x21 .Resh1,

Re x31 .

x12 t, τ , x22 t, τ , x32 t, = Re x12 t .Resh2,Re .Resh2,

Re@ x32 t .Resh2 . − τ ; x13 t, τ x23 t, τ , x33 t, τ =

Re.Resh3,

Re. X t, τ =;

@ D k @@ DD @@ D @ {


Построение матрицы перехода

MK τ = τ .t 1;

8

h1@@ D @ _D,h3_D< = MK@τD;

коэффициентов в системе линейных алгебраических уравнений ,

h1<D@τD.h3@τD,,0,1<D<

= NIntegrateh2 τ .h1 τ , τ,0,1 ,

h2<D@τD.h3@τD,,0,1<D<

8a31,a32,a33 = <

8

NIntegrate h3< @τDD<.h1@ D,8 ,0,1<<<DDD<, NIntegrate@h3@@,

NIntegrate@@h3 τ

469.812,832.786,48.3062

Решение системы алгебраических уравнений

c1,c2,c3.X0;

V = Solvea13 v3, c2 a21@8

c3 a31, v1,v2,v3 ;

88.V< <D ê

оптимального

h3 t ;

@ D значения@ D функционала

NIntegrate u10 t ,u20 t ,u30 t . H 8u10@tD,u20@8 @@tDD,u30@@tD<D,8t,0,1@ D< <DL^ 21

1.34153

Вычисление критерия "минимум силы" на построенном управлении для примера 2

PlotAHu10@tD^2+u20@tD^2+u30@tD^2L^<E

Graphics FindMinimum u10t ^2+u20t ^2+u30t ^2 ^12, t,0,1 A H @ D @ D @ D L 8 <E

оптимального закона движения

Resh0 =

NDSolve @ + u10@DtD,

u20 t ,

D @ D @ D @< @tD,@

t,0,1 t_ =

88D<<.Resh0D,

вычислений XTx10 1 ,x20 1 ,x30 1 8 @ D @ D @ D<

Пример 4.4

Ввод матрицы В и конечного положения фазового вектора

0 0

B =0 01 0y{;XT = 80.640532,0.491302,1.61672,1.31002<;

k

0 1

Построение матрицы Коши и матрицы перехода

Resh1 =

NDSolve x11' == x41 t , x31' A9, @ D

x41'x41 t ,x11 0 1,

0,x31 0 == 0,x41 @ D @ D

;

Resh2 <E

, t D

,x12 0 0,

1,x32 0 ==@0D,x42 @ D @ D

;

Resh3 <E

,

D ,x13 0 0,

D 1@,x43 @ D @ D @ D D @ D

;

Resh4 <E

,

@ D+ Sin t @ ,x14D 0 0, @ D @ D 0,x44 1 @ D <E @ D t , t,0,1 ;

D<Dê @tD .Resh1,x31@ D< 8D<<@t.Resh1,

tD<< Dê=

t .Resh2,

, x43 t =

D<<@t.Resh3,

8 @ DêDê t< @ Dê tD<<@ Dê=

.Resh4,x24 t .Resh4,

x44@@tDêDê.Resh4<; @ Dê

x11 t x12 t x13 t x14 t

@ D x41x31 t x42 t t

X@tsD@ == InverseDx21@@@@@ttDDDD@HDx22x32@ @@Dê@DD @@@DDD< @@DD{D; <L @ D

Y k X t ..Y s ; h1 s_ ,h2 s_ ,h3 s_ s_ = MK s

Построение и решение линейных уравнений a11,a12,a13,a14 =

8

NIntegrate h1 τ τ τ,0,1 NIntegrate@@@@h1@@ DD @@ DD 88 <<<DDD<

NIntegrate h1, NIntegrate h1 τ .h4 τ , τ,0,1

=

,

8

NIntegrate@@@ @@ DD @ D 8 <D

NIntegrate

τ .h4 τ , τ,0,1

=

,

@@@τDDDD.h3@@@@τDDDD,8888τ,0,1<<<<<DDDD<,

1.51071,0.764328,3.3364,1.89574@ τ τ τ

8

a41,a42,a43,a44 =

NIntegrate h4 τ <.h1@@τDD,88τ,0,1<<DD,

8NIntegrate@@@h4@@@@τDD.h2 τ , τ,0,1

NIntegrate h4,

0.779061,1.12012,1.89574,2.6037

V= @8 < ∗ v1 + a12 v2 + a13 v3 + a14 v4, c2 a21 v1 + a22 v2 + a23 v3 + a24 v4, c3 a31 v1 + a32 v2 + a33 v3 + a34 v4,

; v1 , v2 <D

Построение оптимального управления

u10 t_ ,u20 t_ =v1h1 t +v2h2 t +v3h3 t +v4h4 t ;

@ВычислениеD @ оптимальногоD< @ значенияD функционала@ D @ D @ D HNIntegrate@8u10@tD,u20@tD<.8u10@tD,u20@tD<,8t,0,1<DL^

0.999712

Построение оптимального закона движения

Resh0 =

NDSolve t x30 t ,x20' t x40 t ,

x30'@@DDDD @@DD @@DD @ D @ D @tDD,@ D

x40' + 1 ∗ + ∗ + u20 t , x100,x30 @D D== 0 ,

x10t ,x20 t ,x40@ t ,

8 @ @ x30D t_@ D<,8 @@DêD<<<E .Resh0,x30@ D< t .Resh0,

правильности вычислений

−1.68561 1.60071 × 106, −2.40392 × 106

<

Пример 4.5

Ввод начального и конечного положений фазового вектора

X0;

XT 80.7746,

8−80.7746, 147.179, < матрицы Коши

Resh1 =

DSolve x11'x31 t , x21'@8@t@ D

x31'D tDD @@DD < @8D @ D@ D @ DD@0D @1,D<

x21 0@D 0,x31 0 t ,x31 t ,

t ; @

Resh2 =

DSolve x12' tx32 t , x22'@8@ D x32'+ t 0,

x22 1,x32 0@DD== 0<,@8x12D @tD,x22@ D @ D,x32@ D @tD<, tD; @ D @

Resh3 =

DSolve t x33 t , x23'@8@@ DDDDê @D@DD <@ 8@@@DDDDê@@ @ D @@D<D

x33'+ 0 0, x23 0t ,x23t , t ; x21 t, x31 888888ReD@@x11@@x12x32@@t@D<DDêtDDê8 @@ <<D<D<êê@x21888 @ @DDê<<.Resh1,D<<D<< D<<

Re x31 . ;

x12 t, τ , x22 t, τ , x32 t, = Re .Resh2,Re.Resh2, Re.Resh2 . − τ ;

x13 t, τ x23 t, τ , x33 t, τ = Re .Resh3,Re.Resh3, 8 Re@@ @DDê .

X t, τ =; @ D@ @ {

Построение

MK τ = τ 1;

J

Ro@l2_,l3_D=NIntegrate@Pod,l2,l3D,,0,1<D

NIntegrateMinel=FindMinimum@Pod@τ,l2,l3D,<D

0.731198, l20.038468,l3 <D Minel,1D

l20,l30 = Minel,2,1,l3 .Part Minel,2,2 ;

@c3L D ê @ D< H

−0.103653 l10,l20,l30<

8

−0.103653,0.038468,0.28735

;

Построение@ D оптимального@ D @ управленияD

u0 τ = 1 h0 τ ;

@ D Ronol è @ D D

τ_ ,u20 τ ,u30 τ_ =u0 τ ;

ВычислениеD @ оптимальногоD @ D< значения@ D функционала

Part@Minel,1D

0.731198

Построение оптимального закона движения

Resh0 =

NDSolve

@ + u10@tD,

u20 t ,

8 @ @< @tD,@ D

@ D @ D@t 8t,0,1@ D <D

t_ =

88 D<<Dê.Resh0D,

вычислений

XTx10 1 ,x20 1 ,x30 1

80.0000773993,0.000215504,0.00006397658 @ D @ D @ D<<


БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Алексеев В. М., Тихомиров В. М., Фомин С.В. Оптимальное управление. М.: Наука, 1979. 432 с.

2. Афонасьев А.П., Дикуссар В.В., Милютин А.А., Чуканов С.В. Необходимые условия в оптимальном управлении. М.: Наука. 1990. 318 с.

3. Беллман Р. Процессы регулирования с адаптацией. М.: Наука, 1964. – 360 с.

4. Благодатских В.И. Введение в оптимальное управление. М.: Высшая школа, 2001, 239 с.

5. Болтянский В. Г. Математические методы оптимального управления. – М.:

Наука, 1969. 408 с.

6. Варга Дж. Оптимальное управление дифференциальными и функциональными уравнениями. М.: Наука, 1977. 624 с.

7. Васильев Ф. П. Численные методы решения экстремальных задач. М.: Наука, 1988. 549 с.

8. Габасов Р. Ф., Кириллова Ф. М. Оптимизация линейных систем. Минск: Изд.во БГУ, 1973. 246 с.

9. Габасов Р. Ф., Кириллова Ф. М. Принцип максимума в теории оптимального управления. Минск: Наука и техника, 1974. 272 с.

10. Гамкрелидзе Р.В. Основы оптимального управления. Тбилиси: Изд-во ТГУ, 1977. 254 с.

11. Дикуссар В.В. Милютин А.А. Качественные и численные методы в принципе максимума М.: Наука, 1989. 144 с.

12. Дьяконов В.П. Математика 4.: Учебный курс. СПб.; М., Харьков, Минск, 2001. 654 с.

13. Зеликин М.И. Оптимальное управление и вариационное исчисление. М.:

Изд.-во МГУ, 1985

14. Канторович Л. В., Акилов Г. П. Функциональный анализ. М.: Наука, 1977. 741 с

15. Карманов В. Г. Математическое программирование. М.: Наука, 1986. 288 с.

16. Колмогоров А. Н., Фомин С. В. Элементы теории функций и функционального анализа. – М.: Наука, 1976. – 544 с.

17. Красовский Н. Н. Теория управления движением. М.: Наука, 1968. 476 с.

18. Красовский Н. Н. Игровые задачи о встрече движений М.: Наука, 1970. 420 с.

19. Красовский Н. Н., Субботин А. И., Позиционные дифференциальные игры

М.: Наука, 1974. 456 с.

20. Кротов В. Ф. Основы теории оптимального управления. М.: Высшая школа, 1990. 429 с.

21. Лутманов С. В. Программное оптимальное управление динамическими объектами. Пермь: Изд.-во ПГУ, 1994. 120 с.

22. Лутманов С.В. Курс лекций по методам оптимизации. Ижевск: РХД 2001.

363 с.

23. Матвеев А.С., Якубович В.А. Оптимальные системы управления: обыкновенные дифференциальные уравнения. Специальные задачи.- СПб.: Изд.-во СПбГУ, 2003. 537 с.

24. Милютин А.А., Илютович А.Е., Осмоловский Н.П., Чуканов С.В. Оптимальное управление в линейных системах. М.: Наука, 1974. 268 с.

25. Понтрягин Л. С., Болтянский В.Г., Гамкрелидзе Р. В., Мищенко Е.Ф. Математическая теория оптимальных процессов. М.: Наука. 1993. 392 с.

26. Понтрягин Л. С. Обыкновенные дифференциальные уравнения. – М.: Наука, 1983. – 332 с.

27. Поляк Б. Т. Введение в оптимизацию. М.: Наука, 1983. 384 с.

28. Пшеничный Б.Н. Выпуклый анализ и экстремальные задачи. М.: Наука,

1980. 320 с.

29. Рокафеллер Р. Выпуклый анализ. М.: Мир. 1973. 470 с.

30. Сухарев А.Г., Тимохов А.В., Федоров В.В. Курс методов оптимизации. М.: Наука, 1986. 328 с.

31. Флеминг У., Ришел Р. Оптимальное управление детерминированными и стохастическими системами. М.: Мир, 1978. 318 с.

32. Янг Л. Лекции по вариационному исчислению и оптимальному управлению. М.: Мир, 1974. 448 с.

Учебное издание

Сергей Викторович Лутманов

ЛИНЕЙНЫЕ ЗАДАЧИ ОПТИМИЗАЦИИ

ЧАСТЬ 2

Оптимальное управление линейными динамическими объектами

Редактор Л.Л. Савенкова

Корректор А.Ю. Морскова

Компьютерная верстка С.В. Лутманов

Подписано в печать 14.09. 2005. Усл. печ. л. 11.39. Уч.-изд. л. 10.5 Размер 1 МБ

Редакционно-издательский отдел Пермского государственного университета 614990 Пермь, ул. Букирева, 15

Электронный адрес в Интернете: info @ psu. ru


[1] ab−c cos (y1 − y2 )

относительно переменных y1, y2, y3, y4 .

Проведем линеаризацию дифференциальных уравнений (16) в окрестности пары

[2] Определение движения на промежутке [2,3)


Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Цены ниже, чем в агентствах и у конкурентов

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Бесплатные доработки и консультации

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Гарантируем возврат

Если работа вас не устроит – мы вернем 100% суммы заказа

Техподдержка 7 дней в неделю

Наши менеджеры всегда на связи и оперативно решат любую проблему

Строгий отбор экспертов

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +
Новых работ ежедневно
computer

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

avatar
Математика
Физика
История
icon
137666
рейтинг
icon
5834
работ сдано
icon
2641
отзывов
avatar
Математика
История
Экономика
icon
137419
рейтинг
icon
3044
работ сдано
icon
1326
отзывов
avatar
Химия
Экономика
Биология
icon
92238
рейтинг
icon
2003
работ сдано
icon
1260
отзывов
avatar
Высшая математика
Информатика
Геодезия
icon
62710
рейтинг
icon
1046
работ сдано
icon
598
отзывов
Отзывы студентов о нашей работе
51 584 оценки star star star star star
среднее 4.9 из 5
Финансовый Университет при Правительстве РФ
работа выполнена оперативно, не придраться! исполнитель очень выручил. :)
star star star star star
МГУТУ
Спасибо огромное за досрочно выполненную работу. Ответственный исполнитель всем рекомендую.
star star star star star
Волгау
Отзывчивый человек, пошла на встречу и в цене и в требованиях. Рекомендую, все быстро и ка...
star star star star star

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Обзор приговоров

Другое, Криминология

Срок сдачи к 25 апр.

только что

Конспект урока по русскому для 3 класса

Контрольная, Русский язык с методикой преподавания

Срок сдачи к 22 апр.

1 минуту назад

решить вариант 10

Контрольная, типология объектов недвижимости

Срок сдачи к 30 апр.

2 минуты назад

написать отчет

Отчет по практике, Анализ хозяйственной деятельности

Срок сдачи к 22 апр.

3 минуты назад

пройти итоговый тест

Тест дистанционно, Английский язык

Срок сдачи к 20 апр.

3 минуты назад

Написать индивидуальный проект на какую нибудь социальную...

Другое, Обществознание

Срок сдачи к 30 апр.

4 минуты назад

Рассчитать материальный баланс на один цикл загрузки

Курсовая, технология химических производств

Срок сдачи к 26 апр.

4 минуты назад

Тестирование по маркетингу

Тест дистанционно, Маркетинг

Срок сдачи к 22 апр.

4 минуты назад

сделать практикум весь

Лабораторная, Информационные технологии

Срок сдачи к 1 июня

5 минут назад

Выполнить реферат по введение в экономическую теорию.

Реферат, Экономика

Срок сдачи к 24 апр.

5 минут назад

Решить задачи по Жилищному праву

Решение задач, жилищное право

Срок сдачи к 19 апр.

5 минут назад

Сделать курсовую

Курсовая, Информационые сети и комуникации

Срок сдачи к 19 апр.

6 минут назад

Доказать

Решение задач, Математическая логика

Срок сдачи к 24 апр.

7 минут назад

Сделать курсовую

Курсовая, Оценка бизнеса

Срок сдачи к 26 апр.

7 минут назад
8 минут назад

3 задания

Контрольная, аналитическая геометрия

Срок сдачи к 30 апр.

8 минут назад

Решить 2 задачи

Решение задач, Гражданское право и процесс

Срок сдачи к 24 апр.

9 минут назад

Помощь в решении заданий в СДО

Решение задач, теория вероятностей

Срок сдачи к 17 мая

9 минут назад
planes planes
Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.

«Всё сдал!» — безопасный онлайн-сервис с проверенными экспертами

Используя «Свежую базу РГСР», вы принимаете пользовательское соглашение
и политику обработки персональных данных
Сайт работает по московскому времени:

Вход
Регистрация или
Не нашли, что искали?

Заполните форму и узнайте цену на индивидуальную работу!

Файлы (при наличии)

    это быстро и бесплатно