В. Ф. Кротов Институт проблем управления ран




Скачать 42,26 Kb.
НазваниеВ. Ф. Кротов Институт проблем управления ран
Дата03.02.2016
Размер42,26 Kb.
ТипДокументы
УДК 62-505.3; 530.145. PACS 03.65 – w; 02.30.Yy.


Управление квантовыми системами и некоторые идеи

теории оптимального управления

В.Ф. Кротов

Институт проблем управления РАН,

Москва, Профсоюзная, 65,

Тел.: (495) 334-91-59, Е-mail: vfkrotov@ipu.ru




Введение

Проблема управления квантовыми системами – одна из наиболее актуальных научно–технических проблем, связанная с новейшими физическими нанотехнологиями. Конечная цель здесь – создание регулярных методов синтеза переменного электрического поля (лазерного излучения), управляющего микроскопическими состояниями атомов и молекул. Успешное внедрение на уровень квантовых систем современных техник управления, инструментария лазерной физики и квантовой электроники, реализующего «хирургию» атомов и молекул, открыло уникальные возможности для создания новых материалов, миниатюризации компьютерной памяти, и других технологий. Эта проблема оказалась также благодарным объектом для математиков, специализирующихся в области теории управления. Математические методы синтеза управления квантовыми системами основаны на некоторых идеях теории оптимального управления, адекватных свойствам этих систем. Здесь эти идеи анализируются и развиваются применительно к особенностям КС. Помимо сложности фазового пространства, выражающегося в высокой размерности аппроксимирующих схем, это характерная нелинейность задачи оптимального управления для таких систем и следующие из нее сингулярности решений, создающие известные пробелы в возможностях оптимизации. На основе полученных результатов эти пробелы устраняются, расширяется сфера применения алгоритмов синтеза управления, повышается их эффективность и быстродействие.

1. Постановка задачи.

В квантовой механике (КМ) синтезированы детерминированная динамика волновой функции (ВФ) и статистическая связь последней с наблюдаемыми величинами: динамическая и статистическая части квантовой системы (КС). Синтез управления целиком связан с первой, вторая же обусловливает выбор критериев. Пусть вектор координат системы, пробегающий область ; – ее ВФ (комплексная), на границе области ; ВФ рассматривается как элемент комплексного гильбертова пространства с нормой и соответствующим произведением

(1)

где – значок комплексного сопряжения, – элементарный объем координатного пространства. Полное описание динамического состояния КС содержится в ВФ , но здесь в этом качестве удобнее использовать пару . Динамика КС описывается дифференциальными уравнениями Шрёдингера.

(2)

где время; постоянная Планка; заданная функция; – электрическое поле, зависящее только от времени, свободно выбираемое в пределах ; – гамильтонов оператор системы; например, для частицы массы , управляемой монохроматической радиацией с переменной амплитудой: , – оператор (дифференциальный) кинетической энергии, – потенциальная энергия, – оператор дипольного момента. Все операторы в КМ – эрмитовы, а функционалы – квадратичные формы (КФ). При любом выборе управления система (2) имеет динамический инвариант

(3)

Последнее равенство диктуется статистическим смыслом ВФ. Т. е. область достижимости управляемой КС есть единичная сфера в H.

Необходимо выбрать функцию так, чтобы она минимизировала заданный функционал:

(4)

адекватный целям управления. Здесь – соответствующий оператор; знак минус обусловлен тем, что во многих случаях максимизируется положительная квадратичная форма. Это – задача оптимального управления для процессов в функциональном пространстве состояний H.

Замечание. Иногда применияются и критерии более общего вида:

(5)

где – эрмитов оператор, зависящий от , – заданная функция, функционал определен (4). Особенно часто:

(6)

(см. об этом ниже).

2. Особенности задачи.

Рассмотрим ординарную задачу оптимального управления

(7)

(8)

где – эвклидово пространство размерности с произведением ; вектор , вектор–функция , функции и компактное множество заданы, множество допустимых процессов , удовлетворяющих (8). В соответствии со сказанным в п.1 ограничимся случаем: скаляр, , , . Причем случаи и , как мы увидим, алгоритмически существенно различны. овымое управлениеупр

Для практических вычислений гильбертов вектор аппроксимируется вектором , и задача (2), (4) – задачей (7), (8). Адекватная размерность вектора очень велика: для молекулы с 6 – 7 степенями свободы, это – первая особенность задачи, фильтрующая выбор алгоритмов. Вторая, – комплексность ВФ, – не столь существенна для алгоритмизации; третья – отсутствие ограничений на состояние, включая терминальные ограничения; четвертая: (2) суть линейные однородные уравнения с управляемыми коэффициентами специального вида, в представлении (7):

(9)

где , матричные операторы, , зависящие от .

Для различных модификаций задачи (2), (4), (6) выведены необходимые условия оптимальности типа краевых задач для уравнений Эйлера и принципа максимума Понтрягина [1] (текст и ссылки), [2]. Но непосредственное их использование для синтеза управления возможно только применительно к «игрушечным» моделям малой размерности. Эффективный инструмент для решения задач (7), (8) с большим , и соответственно, для (2), (4): методы итеративного улучшения программы управления. В настоящее время применительно к КС используются два таких алгоритма: градиентный (ГрМ) и глобальный (ГлМ). Перечисленные особенности задачи создают удобные предпосылки для их применения.

3. Методы последовательного улучшения программы управления.

Выделим из (7) «подзадачу улучшения». Имеется допустимый, но не оптимальный процесс . Требуется улучшить его, отыскав процесс , такой, что .

Повторяя эту операцию, получим улучшающую последовательность , . Предел мы здесь не исследуем, сосредоточившись на операции улучшения и некоторых оценках последовательности.

Унифицированное описание интересующей нас группы методов дает техника достаточных условий оптимальности [3]. Запишем семейство представлений функционала с непрерывной, дважды дифференцируемой по функцией в качестве параметра:

(10)

(11)

(12)

Здесь и далее нижний значок означает дифференцирование по соответствующей переменной.

Существенную роль в решении задачи улучшения играют сопряженные уравнения



(13)

которые определяют вектор-функцию .

3.1. Градиентный метод. Пусть , удовлетворяет (13). Будем искать процесс , достаточно близкий к , чтобы знак разности был тот же, что и у ее главной линейной части

(13)

где , – вариация программы управления. Зададим так, что правая часть (14) положительна. Пусть при достаточно малых : , , и траектория определена управлением в силу (8). Тогда существует , такое что , .

Таким образом, процесс улучшения программы управления сводится к следующим шагам: 0. инициализация: дано , находим , решая задачу Коши (8) с ; 1. находим и , решая линейную задачу Коши (13), либо, не запоминая , , – задачу Коши для уравнений (8), (13) при с начальными условиями и (13); 2. установим вариацию программы управления так, чтобы правая часть (14) была положительной; 3. Для различных , найдем решения задачи Коши (8) при . Величину следует выбрать так, чтобы выполнялось , .

Выражение (13) дает градиент функционала в пространстве управлений . Эти методы развивались в работах Келли и др. [4], Энеева [5], Брайсона [6], и других.

3.2. Глобальный метод улучшения управления. Обозначим

(15)

Опишем операцию улучшения. Инициализация подобна п. 0. из 3.1. 1. Конструируем функцию , такую что

(16)

(17)

2. Из (15) находим и определяем процесс согласно уравнению и начальным условиям (8).

Теорема, [3]. Имеем: . Если условие , не выполняется, то .

Воспроизводя эту операцию, получим улучшающую последовательность . Основное звено этого метода, [7], – конкретный способ построения функции на каждой итерации. Их варианты с подробным описанием см. в [8], [9], [3].

3.3. Линейные системы с управляемыми коэффициентами. Пусть справедливо (9). Зададим: . Имеем

(18)

(19)

Здесь ()T – значок транспонирования. Функция выпукла по . Таким образом, первое условие (19) необходимо и достаточно для (16). Если функция вогнута, то второе условие (19) необходимо и достаточно для (17). Т. е. функция удовлетворяет (16), (17) и глобальный улучшающий алгоритм воспроизводит алгоритм градиентного метода с заменой в п.п. 2, 3 на , при этом существенно упрощая последний, поскольку исключается настроечный параметр , и бесконечно малые теоретически шаги заменяются конечными.

3.4. Особые режимы. Пусть и . Имеем:

(20)

(21)

Пусть при выполнении п.3 операции улучшения при . Значение оказывается не фиксировано. Доопределим его значением , реализующим равенство

. Дифференцируя последнее, получим с учетом (20), (21):

(22)

Это решение назовем особым, или сингулярным, режимом улучшенного управления. Оно появляется в улучшающей последовательности в качестве полуфабриката особого режима оптимального управления, если последний содержится в оптимальном процессе, и ограничено условием . Этот режим получен в рамках глобального метода. Градиентный метод здесь неприменим: , соответственно, улучшающий сдвиг управления не определен, а управление не следует из логики метода и, вообще, противоречит его условиями (малость ).

Характерна возможная неединственность улучшенного процесса . При определенных условиях имеется альтернатива: «сойти» с особого режима или остаться на нем. Именно, если в момент выполняется одно из неравенств

(23)

то соответственно

(24)

Замечание 1. Терминальные условия (19) и совместны только при специальных значениях . Поэтому, вообще, для выполнения 2-го и последующих улучшений необходимо, чтобы участок улучшаемой траектории, примыкающий к , был неособым:

Замечание 2. Пусть управление имеет несколько компонент:

, ; (25)

Изложенный алгоритм применим к улучшению по при фиксированном , так что можно считать: , . В последовательности эти шаги чередуются с улучшениями других компонент управления.

4. Квантовые системы.

Постановка задачи – в п.1. Она относится к классу задач п.п. 2.3, 2.4 в соответственно обобщенном пространстве состояний. Роль матричных операторов , играют операторы , , действующие в . Их дополнительное свойство – самосопряженность, и как следствие, – (3).

4.1. Условия применимости методов улучшения. ГрМ применим к задаче (4), только на ранних итерациях и если поиск начинается далеко от экстремума и не сказываются эффекты особого режима, либо – при отсутствии последнего в составе оптимального процесса (что не характерно). При наличии добавки (6) он применим без оговорок (см. об этом ниже).

Применимость глобального улучшения регламентируется в п. 2.2 требованием вогнутости функции , чему соответствует неотрицательность формы . Покажем, что для КС оно смягчается до требования знакоопределенности последней и, как правило, выполняется. Наиболее характерные критерии оптимальности – максимум или минимум вероятности того, что к моменту значения наблюдаемых величин, или соответствующие состояния, окажутся в пределах заданного множества . Пусть наблюдаемые – энергия или импульс, имеющие собственные значения и функции . Имеем: , . Это – положительная КФ. Задача , соответствующая максимизации , отвечает требованиям применимости метода. Задача не отвечает им, но ей эквивалентна задача , где – дополнение до числовой оси. Последняя обладает необходимой выпуклостью. Аналогично обстоит дело, если наблюдаемые – координаты, и соответственно .Таким образом, и максимизация, и минимизация реализуема этим методом либо непосредственно, либо альтернативной заменой .

4.2. Операция улучшения. Запишем базисные конструкции этих методов, учитывая особенности задачи. Улучшающая функция теперь – линейный действительный функционал: , где заданная вектор- функция, , как и соответствующие ей в силу (13):







Дифференциальные уравнения итераций:

(26)

(27)





В соответствии с п.п. 2.3, 2.4, операция глобального улучшения будет следующей.

0. Инициализация, прямая прогонка. Выбирается функция и интегрируется уравнение Шредингера (2) для c начальным значением , получается траектория и соответствующее значение функционала .

1. Обратная прогонка. Решается задача Коши (26a), , и находится .

2. Прямая прогонка. Решаем задачу Коши (26), , , воспроизводя и определяя новую траекторию , управление согласно (27), и соответствующее значение функционала или .

Применение операции градиентного улучшения к задаче (6) воспроизводит хорошо известные схемы. Методы гарантируют только нахождение локального минимума (понтрягинская экстремаль).

4.3. Энергия поля как регламентирующий фактор управления. Функционал интерпретируется как расход энергии на управление, а минимизация суммы это компромисс между качеством достижения главной цели (4) и экономией энергии. Но содержание этого компромисса требует прояснения. Если энергия лазерного излучения есть регламентирующий фактор управления, то его следует ввести в постановку задачи в виде ограничения:

(28)

где – предельное допустимое значение энергии. Этому ограничению отвечает сопряженная функция: .

Решается задача улучшения при и проверяется (28). Если , то ограничение (28) несущественно; если , то решается семейство задач улучшения с параметром , который подбирается так, что . Как видим, редукция не тождественна учету ограниченности энергии.

4.4. Сравнение методов глобального и градиентного последовательного улучшения. ГрМ имеет локальный характер, улучшение требует семейства прогонок с настроечным параметром ε и гарантируется только при малых его значениях. Соответствено, сходимость происходит медленно. ГлМ не содержит настроечных коэффициентов и реализуется единственной парой прогонок: обратной и прямой. ГрМ не содержит достаточных инструментов для улучшения и генерирования особого режима, т. е. – оптимизации КС с критерием качества (4): оптимальная траектория состоит из кусков и особого режима , для которого градиент и, соответственно, улучшающий сдвиг управления не определен, а управление не следует из логики метода и, вообще, не допускается его условиями (малость ). Поэтому при пользовании ГрМ обычно к функционалу (4) добавляется слагаемое (26). Оно регуляризует ГрМ, но вносит неясность в физический смысл критерия (см. выше) и обусловливает недоиспользование ресурса управления для главной цели (4): ухудшается и сходимость последовательности улучшений сравнительно с ГлМ, и качество конечного результата. ГлМ не имеет этих осложнений и применяется либо напрямую к исходной задаче (4), либо к редуцированной, хотя и в нем не все обстояло благополучно с особым режимом. Теоретически сингулярная дуга улучшенной траектории автоматически реализуется ГлМ как скользящий режим. Поэтому в [3] предлагалось не выделять ее специально. Однако реализация такого подхода оказывается связана с существенными вычислительными трудностями. Регулярное управление , полученное здесь, снимает эти трудности.

ГрМ применялся к КС еще до появления ГлМ, лучше освоен физиками, и большинство задач решается им. Применение ГлМ к проблемам управления КС было предложено в [9,10], и к настоящему времени его можно считать достаточно внедренным. Его преимущества нашли подтверждение в исследованиях управления квантовым состоянием молекул и задач физической химии, магнитного резонанса, задач квантовой оптики, и других актуальных направлений, опубликованных в [11 – 17] и других работах. Следует выделить [14], где этим методом в модификации [11] оптимизируется нелинейная управляемая КС, выпадающая за рамки уравнений (2). Это – так называемый бозонный конденсат, особое макроскопическое состояние вещества, открытое и исследованное советскими физиками, нобелевскими лауреатами (именно за эти работы) П.Л. Капицей и Л.Д. Ландау. Интересный сравнительный анализ был сделан в [11, 12]. Показано, что ГлМ существенно уменьшает необходимое количество вычислений, если поиск начинается далеко от экстремума. Численные эксперименты на нескольких КС с критерием (6) хорошо это демонстрируют. Сходимость происходит очень быстро в самом начале поиска. Новые перспективы управления КС, ориентированные на синтез компьютерной памяти методами квантовой оптики, открывает [17].

Работа выполнена в рамках Программы № 15 «Проблемы анализа и синтеза интегрированных систем управления для сложных объектов, функционирующих в условиях неопределенности» отделения энергетики, машиностроения, механики и процессов управления РАН.

Автор благодарит А.В. Булатова и А.В. Горшкова за консультации и обсуждение работы.

Аббревиатуры: КМ – квантовая механика; ВФ – волновая функция; КС – квантовая система; (ГлМ) – глобальный метод; (ГрМ) – градиентный метод.

СПИСОК ЛИТЕРАТУРЫ


  1. Rabitz H. Control of microworld chemical and physical processes. In: Encyclopedia of Computational Chemistry, J. Wiley & Sons Ltd, Chichtster, 1998, v.1, p. 573 – 580.

  2. Krotov V.F. Global Methods in Optimal Control Theory, Marcel Dekker Ink., New-York, Basel, 1996. 384с.

  3. Kelley H. J. // Gradient theory of optimal flight paths. MRS J, 1960, 30 (10).

  4. Энеев T. M. // Приложение градиентного метода в теории оптимального управления. Космические исследования, 1966, т.4 (N 5).

  5. Bryson A. E. and Ho Y. Ch. Applied Optimal Control, Hemisphere Publishing
    Corporation, Washington, D.C. (1975).

  6. Кротов В.Ф. , Фельдман И.Н. // Итеративный метод решения экстремальных задач. В сб.: Моделирование технико-экономических процессов, ред. Кротов В.Ф.. Москва (1978), с. 22 – 35.

  7. Кротов В.Ф., Фельдман И.Н. // Итеративный метод решения задач оптимального управления. Изв. АН СССР, Техн. Кибернетика, 1983, N 2, с. 162 – 167.

  8. Кротов В.Ф., Коннов А.И. // О глобальных методах последовательного улучшения управляемых процессов. Автомат. и Телемех., 1999, N 10, с. 77 - 88.

  9. Казаков В.А., Кротов В.Ф. // Оптимальное управление взаимодействием света и вещества. Автомат. и Телемех., 1987, N 4, с. 9 - 15.

  10. 13. Krotov V. F. Global methods to improve control and optimal control of
    resonance interaction of light and matter. Lecture Notes in Control and Infor-
    mation Sciences, Vol. 121, Springer-Verlag, New York , 1988, р. 267 – 298.

  11. Somloi J., Kazakov V. A., and Tannor D. J. // Controlled dissociation of I2 via optical transitions between the X end B electronic states. Chemistry Physics, 1993, 172, 85 - 98.

  12. Somloi J., Kazakov V. A., and Tannor D. J. Physical Review A, 60, 3081, 1993.

  13. Rangan C. and Bucksbaum P.H. // Optimally shaped terahertz pulses for phase retrievial in a Rydberg-atom data register. Physical Review A, 64, 033417 (2001).

  14. Sklarz S.E. and Tannor D.J. // Loading a Bose – Einstein condensate onto an optical lattice: an application of optimal control theory to the nonlinear Shroedinger equation. Physical Review A 66, 053619 (2002).

  15. Calarco T., Dorner U., Julienne P.S., Williams C.J. and Zoller P.// Quantum computations with atoms in lattices: Marker qubits and molecular interactions. Physical Review A 70, 012306 (2004).

  16. Khaneja N, Reiss T., Rehlet C., Shulte-Herbrueggen T., Glaster S.J. // Optical control of coupled spindynamics: design of NMR pulse sequences by gradient ascent algorithms. Jornal of Magnetic Resonance 172 (2005), 296 – 305.

  17. Gorshkov A.V., Calarco T., Lukin M.D., Sorensen A.S.// Photon storage in Λ-optically dence atomic media. Physical Review A, 77, 043806 (2008).







Похожие:

В. Ф. Кротов Институт проблем управления ран iconВедущий научно-образовательный центр
Российской академии наук институт проблем информатики ран (ипи ран), Учреждением Российской академии наук институт проблем управления...
В. Ф. Кротов Институт проблем управления ран iconМинистерство образования и науки российской федерации
Васильев С. Н., академик ран (Институт проблем управления ран, Москва). Индивидуализация учебного процесса в компьютерных обучающих...
В. Ф. Кротов Институт проблем управления ран iconПрограмма VIII всероссийской конференции с международным участием «горение твердого топлива»
Чл корр. Ран лихолобов В. А., Институт проблем переработки углеводородов Сибирского отделения ран. Председатель Омского научного...
В. Ф. Кротов Институт проблем управления ран iconИнститут Проблем Экологии и Эволюции им. А. Н. Северцова ран кафедра Биологической Эволюции мгу государственный Дарвиновский музей
Павлов Дмитрий Сергеевич академик, директор Института проблем экологии и эволюции ран
В. Ф. Кротов Институт проблем управления ран iconИнститут химической кинетики и горения со ран институт водных и экологических проблем со ран
В рамках мероприятия планируется издание материалов конференции, избранные доклады будут опубликованы или получат рекомендации к...
В. Ф. Кротов Институт проблем управления ран iconУчреждение российской академии наук
Учреждение Российской академии наук Институт проблем управления им. В. А. Трапезникова ран (ипу ран), именуемый в дальнейшем «Заказчик»,...
В. Ф. Кротов Институт проблем управления ран iconА. Г. Чхартишвили (Москва, Институт проблем управления ран)
В 1944 г вышла монография Дж фон Неймана и О. Моргенштерна «Теория игр и экономическое поведение» (см русский перевод [3]), в которой...
В. Ф. Кротов Институт проблем управления ран iconПрограмма III всероссийской конференции
Институт проблем технологии микроэлектроники и особо чистых материалов ран, Черноголовка
В. Ф. Кротов Институт проблем управления ран iconМетодические рекомендации по оценке эффективности инвестиционных проектов
Институт системного анализа ран, Центральный экономико-математический институт ран и др
В. Ф. Кротов Институт проблем управления ран iconПрограмма-минимум кандидатского экзамена по специальности 05. 13. 10
Высшей аттестационной комиссии по управлению, вычислительной технике и информатике при участии Института проблем управления ран,...
Разместите кнопку на своём сайте:
Библиотека


База данных защищена авторским правом ©lib2.znate.ru 2012
обратиться к администрации
Библиотека
Главная страница