Моделирование и анализ данных
2023. Том 13. № 3. С. 96–112
doi:10.17759/mda.2023130307
ISSN: 2219-3758 / 2311-9454 (online)
Сравнение классических подходов машинного обучения с гибридными квантовыми подходами в прикладных задачах
Аннотация
Работа направлена на анализ потенциальных преимуществ использования квантовых подходов в прикладных задачах искусственного интеллекта. В данной работе поставлена задача классификации медицинских изображений, извлеченных из гистопатологических снимков срезов лимфатических узлов. Будет дана теоретическая база, используемая для построения квантовых и гибридно-квантовых элементов вычисления, используемых в статье. Будут рассмотрены квантовые аналоги классических алгоритмов машинного обучения и нейронных сетей. В работе будет дано поэтапное описание преобразования данных, построение моделей и их обучение с последующим анализом полученных результатов и производительности симуляции квантовых вычислений.
Общая информация
Ключевые слова: машинное обучение, нейронные сети , квантовые вычисления, ядерный трюк, схемы, оптимизация
Рубрика издания: Методы оптимизации
Тип материала: научная статья
DOI: https://doi.org/10.17759/mda.2023130307
Получена: 19.05.2023
Принята в печать:
Для цитаты: Ахмед С.Х. Сравнение классических подходов машинного обучения с гибридными квантовыми подходами в прикладных задачах // Моделирование и анализ данных. 2023. Том 13. № 3. С. 96–112. DOI: 10.17759/mda.2023130307
Полный текст
Введение
Современное состояние науки и общества ставит перед машинным обучением и нейронными сетями задачи по совершенствованию алгоритмов потоковой обработки большого объема данных, скорости обучения и предсказания, выделения карт признаков применимых в смежных задачах. Текущие алгоритмы вычисляются на машинах, базирующихся на идеях классической физики. В основном, говоря о машинах в рамках искусственного интеллекта, мы прежде всего обращаем внимание на вычислительные элементы системы: центральный процессор и видеокарты. Нейронные сети, в основном, стараются по максимуму эксплуатировать ресурсы, предоставляемые видеокартой, осуществляя большинство вычислений на ней. Тем не менее часть вычислений так или иначе выполняется на центральном процессоре. Классические алгоритмы МО в основном эксплуатируют ресурсы центрального процессора. И все они работают на принципах классической физики.
Можно показать, что современная модель вычислений не является энергоэффективной. Это обусловлено выделением тепла при диссипации бита информации, так как при вычислении мы используем преимущественно необратимые преобразования, а следовательно, имеем сторонние эффекты в виде увеличения температуры системы, которая потенциально сказывается на увеличении чипсета центрального процессора в процессе проектирования ЦП и общем состоянии системы, а также снижения КПД всей системы, за счет выделения энергии.
Немаловажными критериями выбора и обучения моделей являются обобщающая способность алгоритма, выражающаяся в способности выделять выразительные карты признаков и робастность модели к шумам. Оно выражается в способности модели не только быть устойчивой к шумам, которые имеются в данных, но и к шумам порожденных в процессе генерации предсказания модели. Это в свою очередь влечет за собой желание получить высокую сходимость результатов без больших стохастических смещений. Для удовлетворения этих требований было предложено множество методов и средств, которые проистекают из вероятностной интерпретации моделей или эвристик: регуляризация, ранняя остановка, грамотная инициализация весов, увеличение размера пакета данных подаваемых на вход моделей. К сожалению, они обладают своими недостатками и добавляют вычислительной сложности алгоритмам.
Перспективным направлением, на субъективный взгляд автора, является смена вычислительной парадигмы. Ранее было отмечено, что современные вычисления преимущественно базируются на необратимых операциях и гейтах, что влечет за собой побочные эффекты. В свою очередь квантовые вычислительные системы используют, в основном, обратимые унитарные трансформации (эволюции). В силу специфики построения и реализации квантовых систем, мы не имеем непосредственный доступ к промежуточным состояниям, получаемых в процессе вычисления. Чтобы получить финальные результаты мы все-таки должны использовать деструктивную операцию, называемую “Измерением”. Однако на выходе мы имеем интересные результаты, с желаемыми свойствами и потенциальный прирост вычислительной и энергетической эффективности за счет особенностей пространства, в котором мы работаем.
Далее, будет дан необходимый теоретический минимум теории квантовых вычислений, необходимый для понимания происходящих в экспериментах процессов. Будут рассмотрены несколько экспериментов, проводившиеся с целью сравнения и анализа полученных результатов с учетом точности, размера выборки, объема требуемой памяти для симуляции подобных вычислений на компьютерах и зависимости времени работы от количества используемых признаков.
Вариационные схемы
Квантовая вариационная схема (VQC) – квантовая схема, содержащая в своем составе изменяющиеся параметры, способные обучаться и подстраиваться под необходимые условия или обучаться. Как можно заметить вариационные схемы в этом смысле очень похожи на нейронные сети, в которых есть собственные параметры, называемые весами. Поэтому считается, что квантовые вариационные схемы можно применять в задачах, в которых мы можем применять и классические нейронные сети.
Благодаря постулатам квантовой механики известно, что состояния замкнутой системы изменяется унитарным оператором. Машинное обучение ищет отображение нашего признакового описания в результирующее, то можно рассматривать это, как некоторый процесс эволюции нашего входного состояния системы, под действием унитарного преобразования, заданного нашей моделью. В нейронных сетях и машинном обучении мы работаем с явными и неявными параметрическими моделями, следовательно мы можем позиционировать процесс обучения модели, как процесс подгонки вариационных параметров системы.
Нам нужен механизм удобной реализации параметризованных квантовых схем. Для этого нам потребуются операторы поворота, рассмотренные ранее, а также теорема [Нильсен М.А, 2010]:
Теорема 1 о представлении унитарных однокубитовых операторов: Любой унитарный оператор можно представить как произведение операторов поворотов умноженный на глобальную фазу:
– углы поворота. Следовательно, можно интерпретировать наши параметры, как углы поворота, на которые текущее состояние системы осуществляет поворот в квантовом пространстве.
Можно показать, что VQC, без дополнительных элементов, являются линейными классификаторами. Основной отличие заключается в пространстве, на которое отображается признаковое описание и способ его изменения после постоянных обновлений параметров.
Экспериментальная часть
В данной работе поставлена задача классификации медицинских изображений, извлеченных из гистопатологических снимков срезов лимфатических узлов PCAM [Набор данных PCAM]. Этот набор данных содержит 262.144 тренировочных примеров и 32.768 тестовых. Каждый пример представляет собой цветное изображение размера 96x96. Пример тренировочных объектов представлен на Рис. 1. Из данного набора формировались наборы данных произвольного размера, с целью оценки вычислительной нагрузки на симулятор.
Набор данных прошел следующие этапы предобработки:
- Перевод из RGB в серый. Это делается для уменьшения объема признакового описания, подаваемого на вход квантовым сетям.
- Нормализация, приведение значений пикселей в интервал . Это делается для того, чтобы квантовые операторы, используемые в вариационной схеме, корректно отрабатывали на предоставляемых данных.
- Выделение главных компонент методом PCA. Так как операционная размерность квантовых схем мала, нам нужно уменьшить размерность подаваемых на вход данных, для исполнения квантовых частей алгоритма
Рис. 1 Примеры изображений набора данных PCAM
Результаты предобработки данных изображены на Рис. 2. Левое изображение представляет оригинальное изображение после приведения значений пикселей к диапазону , а правое восстановленное изображение из главных компонент выделенных PCA.
Рис. 2. Результаты работы PCA для двух главных компонент
Эксперименты производились на локальном симуляторе Aer на базе библиотеки qiskit [Квантовый симулятор Aer]. Важно отметить, мы оперируем сложно вычислимыми классически вариационными схемами, что увеличивает в разы накладные расходы для симуляции процесса вычислений.
Характеристики вычислительной машины, на которой производилась симуляция представлены в табл. 1.
Таблица 1. Характеристики вычислительной машины, на которой осуществлялись эксперименты
Название |
Значение |
ОС |
Windows 11 Pro |
CPU |
Intel Core i5-12400F |
GPU |
Nvidia RTX 3070 TI |
ОЗУ |
32 ГБ DDR4 |
Результаты эксперимента и исходный код можно найти в [Ахмед].
Параметризация и обучение
В рамках данной работы VQC использовались в следующих сценариях:
- Средство обучаемого кодирования классических данных в квантовые. Было построено параметрическое кодирование входных данных, с целью подбора эффективного квантового представления.
- Ядро для метода SVM
- Классификатор
- Линейный слой в нейронной сети
В качестве базовых строительных блоков VQC в данной работе использовались следующие квантовые схемы:
- Эволюционная схема Паули-Z второго порядка (далее ZZFeature), которая рассматривалась в статье [5, 6], используется как средство отображения классических данных в квантовые аналоги, а также как признаковое описание в QSVM
Рис. 3. Эволюционная схема Паули-Z второго порядка
- Аппаратно-эффективная SU(2) 2-локальная схема, рассмотренная в [Sukin Sim, Peter]. В данной статье она также используется не только как классификатор, но и как дополнительная параметризация формируемого признакового описания в связке ZZFeature, тем самым мы учим не только делать предсказания, но эффективному отображению классических данных в квантовые.
- Схема реальных амплитуд — это эвристическая пробная волновая функция, используемая в качестве аналога в приложениях химии или схем классификации в машинном обучении, рассмотренная в [Sukin Sim, Peter]
Важно, чтобы полученные схемы были сложно воспроизводимы классическими вычислениями,
Рис. 4. Аппаратно-эффективная SU(2) 2-локальная схема
чтобы мы могли говорить, о квантовом превосходстве. Один из весомых ресурсов для этого, это создание запутанных состояний, которым обладают указанные схемы. Кроме того, мы будем повторять элементы квантовых схем, чтобы увеличить глубину схемы и усложнить классическим компьютерам их воспроизводимость.
Кроме того, в данной статье используется метод QKA [Jennifer] (Quantum Kernel Alignment) для обучения произвольного ядра, для последующего применения в методе SVM и QSVM. Оно представляет собой комбинацию первых двух квантовых схем с дополнительной параметризацией входов.
Рис. 5. Cхема реальных амплитуд
В качестве алгоритмов оптимизации были использованы для алгоритмы оптимизации SPSA [8,9, 10] и COBYLA[J. D. Powell], с постоянной скоростью обучения. Число эпох варьировалось от 20 до 200 эпох.
Экспериментальная часть
На базе этого набора данных была обучения модель GDensenet [S. Veeling, J] с точностью 89.8 процентов и AUC 90. Эти показатели мы будем использовать для эталона и смотреть, насколько мы приблизимся к ней используя разные подходы и урезанные размеры данных.
SVM и квантовые ядра
В качестве отправной точки, воспользуемся классическим алгоритмом SVM с ядром RBF. Результаты можно увидеть в табл. 1. Важно заметить, что обучение производилось на очень маленьком подмножестве нашего искомого набора данных.
Дальнейшим шагом стало применение квантового ядра совместно с классическим SVM. В качестве простого квантового ядра была использована эволюционная схема Паули-Z второго порядка, как средство перевода классических данных в квантовые состояния c последующим применением алгоритма QKE.
Таблица 2.
Отчет по классификации классического SVM
|
precision |
recall |
F1 |
0 |
0,58 |
0,85 |
0,69 |
1 |
0,90 |
0,67 |
0,78 |
accuracy |
|
|
0.74 |
macro avg |
0,74 |
0,77 |
0,73 |
Результаты можно увидеть в табл. 2. Можно заметить, что данная модель незначительно отличается от SVM с RBF. Отклонения по метрикам лежат в сотых долях. В среднем полученный классификатор работает аналогично.
Таблица 3.
Отчет по классификации классического SVM со схемой Паули-Z второго порядка
|
precision |
recall |
F1 |
0 |
0,54 |
0,87 |
0,67 |
1 |
0,92 |
0,67 |
0,77 |
accuracy |
|
|
0,73 |
macro avg |
0,73 |
0,77 |
0,72 |
Можно предположить, что в данной задаче, с малыми размерами набора данных выбранное квантовое ядро работает схожим образом, что и RBF. Следовательно, мы имеем алгоритм не хуже классического.
Следующим шагом будет являться использование алгоритма QKA на нашем наборе данных. Как было сказано ранее, будет обучаться сложная квантовая схема, которая отвечает за преобразование в желаемое признаковое описание. В качестве оптимизатора используется алгоритм COBYLA максимальное число итераций 10. Далее будет показано, что данное ограничение на число итераций важно из-за сложности симуляции выбранного ядра: пространственных издержек, для представления состояний и временных. В результате оптимизации получились веса следующие значения параметров:
θ = (4,10959419; -0,12426796; 7,06728907; -2,16221777; 2,12913752; -1,83197286; 3,27282962; -0,63694887)
По результатам представленным в табл. 3, можно заметить, что даже после 10 итераций модель имеет метрики не хуже, чем классический SVM с RBF или SVM со схемой Паули-Z. Это дает основание полагать, что при увеличении числа итераций оптимизации, модель может сойтись к решению имеющему более высокие метрические показатели. Более того, стоит отметить, что полученное ядро отдает большее предпочтение метрике precision, нежели recall.
Таблица 4.
Отчет по классификации классического SVM с обученным квантовым ядром
|
precision |
recall |
F1 |
0 |
0,85 |
0,56 |
0,67 |
1 |
0,67 |
0,90 |
0,77 |
accuracy |
|
|
0,73 |
macro avg |
0,76 |
0,73 |
0,72 |
Далее воспользуемся квантовым SVM без подгонки гиперпараметров. Здесь наблюдается достаточно заметный прирост по среднему значению precision в отличии от классического SVM. Интересной спецификой является то, что среднее по полноте и F1 метрике не меняется. Кроме того, показатели QSVM совпадают с метриками QSVM с предобученным на 10 итерациях ядром, что показывает, что ядро можно доучить и увеличить метрики.
Основной проблемой, с которой столкнулся автор была проблема производительности, так как в качестве ядер использовались сложно вычислимые на классическом компьютере. Кроме того, требовался большой объем оперативной памяти для хранения промежуточных состояний требовалось в районе 6-7 ГБ оперативной памяти. Загрузка ЦП составляла в районе 20-25%
Таблица 5.
Отчет по классификации квантового SVM
|
precision |
recall |
F1 |
0 |
0,88 |
0,56 |
0,68 |
1 |
0,68 |
0,92 |
0,78 |
accuracy |
|
|
0,74 |
macro avg |
0,78 |
0,74 |
0,73 |
FNN, VQC, и гибридные нейронные сети.
Для данного эксперимента был выделен набор данных размерами 500, 1000 изображений. Размер выборки для валидации составляет 100 изображений. Число главных компонент варьировалось от 2 до 5.
В качестве базовой архитектуры мы рассмотрим полносвязную нейронную сеть прямого распространения, имеющую в своем составе два скрытых слоя размерностью 1024. В качестве алгоритма оптимизации использовался Adam со параметром скорости обучения 0,01. Число главных компонент составляет 2. Алгоритм учился 100 эпох, в конце каждой эпохи оценивалась валидационная ошибка. Результаты обучения и сравнение с гибридной моделью представлены на Рис. 6. Слева представлена история изменения функции потерь, справа изменение точность модели. Красным цветом обозначены значения, соответствующие классической модели.
Первое что бросается в глаза, это то, что величина ошибки на валидации ниже ошибки на обучении. Этому есть несколько причин:
- Структура исходного набора данных и специфика задачи.
- Объем набора данных для валидации.
Обратим внимание на поведение модели во время обучения модели. Видно, что на протяжении всего обучения, модель вела себя достаточно шумно и нестабильно имея при этом точность в районе 62%. Также стоит обратить внимание на медленную сходимости функции потерь на обучении.
Ранее было рассмотрено применение классического алгоритма SVM с квантовой ядерной функцией ядра. Почему бы не рассмотреть применение квантовых в качестве составляющих элементов сети. Были построены две архитектуры гибридной полносвязной сети, в которой квантовые вариационные схемы выступали в роли классифицирующего последнего слоя. Для первой гибридной модели была использована вариационная схема состоящая из эволюционной схемы Паули-Z второго порядка, в качестве отображения на карты признаков, и схемы реальных амплитуд, в качестве вариационного слоя. Результаты и сравнение с классической моделью представлены на Рис. 6.
Обратим внимание на скорость и характер сходимости модели. Значения функции потерь гибридной модели сходится быстрее и имеет заметно ниже значения, нежели классическая модель. Тот же характер сходимости можно заметить и на валидационной выборке, однако, нельзя не отметить некоторую нестабильность в процессе обучения модели. Она также присутствует и в классической модели, но гораздо слабее.
Тем не менее, можно заметить, что гибридная модель стабильно имеет более высокие показатели точности и более стабильна, в среднем выдавая точность в районе 64%. Менее очевидно это прослеживается и для валидационной выборки. Видно, что использование квантового слоя позитивно сказалось на поведении модели, выступая в роли направляющего стабилизатора.
Рис. 6 Сравнение гибридных и классических моделей
Вторая квантовая модель получилась из первой заменой схемы реальных амплитуд на Аппаратно-эффективную SU(2). Результаты обучения модели и сравнение с классической представлены на Рис. 7. Как и на прошлом рисунке сплошная линия отражет метрику на обучении, пунктирная на валидации. Бросается в глаза, характер сходимости функции потерь на обучении: она сошлась к оптимальным значениям гораздо быстрее, нежели классическая модель. Можно заметить момент, когда функция потерь рассматриваемой модели на обучении стала расти. В этот момент можно было остановить обучение модели. Более того, это отчетливо видно и на валидационных данных. Метрики второй гибридной модели стабильно лучше метрик классической модели. Кроме того, метрика на обучении (в районе 66%) существенно выше классической (в районе 62-63%). Аналогичное превосходство в среднем заметно и на валидационном наборе данных.
Вторая гибридная модель также существенно превзошла результаты классической модели. Сравним построенные гибридные модели, и сделаем выводы о применимости квантовых элементов в процессе обучения нейронных сетей.
Сравнение построенных гибридных моделей представлено на Рис. 8. Можно сказать, что гибридная модель на основе SU(2) схема по всем характеристикам ведет себя лучше чем модель на базе вещественных амплитуд: выше сходимость функции потерь на всех этапах оценки модели, выше стабильность, лучше метрики на обучении, стабильнее на валидации.
Рис. 7 Сравнение второй гибридной модели с классической моделью
В табл. 6 представлены средние и медианные показатели метрик на валидации для рассматриваемых моделей. Можно заметить, что гибридная модель на базе ZZFeature имеет среднюю метрику выше чем у остальных моделей, а медианную равную медианной гибридной модели на основе SU(2).
Таблица 6.
Средние и медианные метрики обученных моделей на валидации на 2 главных компонентах.
Архитектура модели |
Средняя точность, % |
Медианная точность, % |
классический FFN |
69,22 |
69 |
FFN + ZZFeature + RealAmplitude |
71,63 |
72 |
FFN + ZZFeature + SU(2) |
71,27 |
72 |
Сравним поведение классической нейронной сети с VQC на разном числе главных компонентов. Для этого была подготовлена следующая параметризация квантовой схемы:
- Параметризация входного представления с помощью аппаратно-эффективной SU(2) 2-локальной схемы
Рис. 8 Сравнение гибридных моделей.
- Отображение в признаковое описание производится с помощью эволюционной схема Паули-Z второго порядка
- В качестве вариационного классификатора используется схема реальных амплитуд.
Базовым алгоритмом оптимизации для вариационных схем был выбран алгоритм SPSA с скоростью обучения 0,1, со случайными изменениями компонентов градиента 0,05. Число эпох было установлено в 200. На Рис. 9 изображено сравнение скорости сходимости функции потерь в процессе обучения, для разных показателей главных компонент. В табл. 7 представлены значение точности для VQC и рассматриваемой нейронной сети, а также величина отклонения в процентах значений VQC от полносвязной сети. CFFN – сокращение от ClassicalFeed Forward Network. Рядом с названием число главных компонент, используемых для признакового описания.
Стоит обратить внимание на крайне медленное изменение значений функции потерь VQC по отношении к классическим моделям. Кроме того, квантовая схема выдает более высокие значения функции потерь, нежели классические модели. Однако, при этом на валидационной выборке показатели точности VQC в среднем выше, чем у FFN на 6-10 процентов, при 4-5 кубитах и на 20 процентов при 6 кубитах.
Можно сделать вывод на основании этих данных, что наш квантовый алгоритм, в среднем, работает лучше, чем полносвязная сеть на рассматриваемой задаче. Однако надо принять во внимание время, требуемое для обучения VQC, используя классический симулятор. Этот
Рис. 9 Сравнение сходимости VQC и полносвязной нейронной сети.
график представлен на Рис. 10. По горизонтальной оси расположено число главных компонент, по вертикальной время в секундах, требуемое для обучения модели.
Можно сделать вывод на основании этих данных, что наш квантовый алгоритм, в среднем, работает лучше, чем полносвязная сеть на рассматриваемой задаче. Однако надо принять во внимание время, требуемое для обучения VQC, используя классический симулятор.
Таблица 7.
Метрики алгоритмов в зависимости от количества главных компонент.
Число главных компонент |
VQC, % |
FFN, % |
Отклонение, % |
3 |
63,2 |
67,4 |
-6,2 |
4 |
71 |
64,6 |
9,9 |
5 |
67,2 |
62,8 |
7 |
6 |
71,4 |
59,4 |
20,2 |
Этот график представлен на Рис. 10. По горизонтальной оси расположено число главных компонент, по вертикальной время в секундах, требуемое для обучения модели. Из полученного графика можно увидеть, что в среднем при увеличении числа главных компонент на единицу, мы имеем прирост в 1000 с или 16,6 минут к процессу обучения VQC.
Рис. 10 Время вычисления VQC на классическом компьютере в зависимости от количества главных компонент
Выводы
В рамках данной работы были обучены квантовые ядра для метода опорных векторов и произведено сравнение классических алгоритмов и полученными гибридными моделями. На малых объемах выборки, разница между гибридными и классическими алгоритмами машинного обучения при выбранной схеме кодирования и вариационных элементах несущественна. Однако потенциально интересным приложением является метод QKA, который в перспективе может стать одним из самых используемых методов для построения квантовых ядер.
Были построены гибридные архитектуры нейронных сетей. Они демонстрируют превосходство над классической моделью в поставленной задаче, c сжатой информацией, имеющейся в распоряжении. Как было показано в данной задаче, модель, использующая аппаратно-эффективную SU(2), обладает полезными интересными свойствами, демонстрирует более стабильное поведение и быструю сходимость, в отличии от гибридной нейронной сети на базе операторов Паули, которая лучше классической, но менее стабильнее и медленее указанной выше. Улучшение результатов свидетельствует о наличии существенной пользы применения квантовых слоев в нейронных сетях.
Было проведено сравнение нейронных сетей с вариационными квантовыми классификаторами. VQC имеет меньшую скорость сходимости и большие значения функции потерь, но выше метрические показатели. Это показывает потенциальную применимость VQC в задачах классификации при сжатии данных.
Временной анализ показывает сложности, возникающие при вычислении квантовых схем на симуляторах. Это свидельствует об ограничениях классической вычислительной парадигмы и перспективность квантовых вычислительных систем.
Литература
- Нильсен М.А, Чуанг И.Л, Квантовые вычисления и квантовая информация // Cabridge, 2010, ISBN: 9781107002173, DOI: https://doi.org/10.1017/CBO9780511976667, 702 с.
- Набор данных PCAM [Электронный ресурс] // Github, URL: https://github.com/basveeling/pcam
- Квантовый симулятор Aer библиотеки Qiskit [Электронный ресурс] // IBM, URL: https://qiskit.org/ecosystem/aer/stubs/qiskit_aer.AerSimulator.html
- Ахмед С.Х. Исходный код экспериментов [Электронный ресурс] // Github, https://github.com/Untronix0nly/Quantum-Hybrid-Machine-Learning
- Sukin Sim, Peter D. Johnson and Alan Aspuru-Guzik, Expressibility and entangling capability of parameterized quantum circuits for hybrid quantum-classical algorithms, Advanced Quantum Technology 2 (2019) 1900070, doi:10.1002/qute.201900070, arXiv:1905.10876.
- Vojtech Havlicek, Antonio D. Córcoles, Kristan Temme, Aram W. Harrow, Abhinav Kandala, Jerry M. Chow and Jay M. Gambetta, Supervised learning with quantum enhanced feature spaces, Nature 567, 209-212 (2019), doi.org:10.1038/s41586-019-0980-2, arXiv:1804.11326.
- Jennifer R. Glick, Tanvi P. Gujarati, Antonio D. Corcoles, Youngseok Kim, Abhinav Kandala, Jay M. Gambetta, Kristan Temme, Covariant quantum kernels for data with group structure, doi: 48550/arXiv.2105.03406, arXiv: 2105.03406v2
- Spall, J. C., “A Stochastic Approximation Technique for Generating Maximum Likelihood Parameter Estimates,” Proceedings of the American Control Conference, Minneapolis, MN, June 1987, pp. 1161–1167.
- Spall, J. C.,“Multivariate Stochastic Approximation Using a Simultaneous Perturbation Gradient Approximation,” IEEE Transactions on Automatic Control, vol. 37(3), pp. 332–341.
- Spall, J.C., "Overview of the Simultaneous Perturbation Method for Efficient Optimization" 2. Johns Hopkins APL Technical Digest, 19(4), 482–492.
- J. D. Powell, "A direct search optimization method that models the objective and constraint functions by linear interpolation," in Advances in Optimization and Numerical Analysis, eds. S. Gomez and J.-P. Hennart (Kluwer Academic: Dordrecht, 1994), p. 51-67.
- S. Veeling, J. Linmans, J. Winkens, T. Cohen, M. Welling. "Rotation Equivariant CNNs for Digital Pathology". arXiv:1806.03962
Информация об авторах
Метрики
Просмотров
Всего: 244
В прошлом месяце: 14
В текущем месяце: 6
Скачиваний
Всего: 104
В прошлом месяце: 5
В текущем месяце: 4