Суррогатное моделирование

Введение в суррогатное моделирование, часть I: основы

Подход машинного обучения для ускорения инженерного проектирования

В инженерии проектирование продукта в значительной степени зависит от тщательного анализа характеристик продукта при различных параметрах конструкции. Эти анализы в основном выполняются с помощью высокоточного и трудоемкого компьютерного моделирования.

Чтобы быстрее продвигать продукт на рынок, ключевым моментом является ускорение анализа на основе моделирования. С этой целью подход на основе данных, называемый суррогатным моделированием, в последнее время становится все более популярным в различных инженерных областях.

В части I этого блога мы сосредоточимся на основах этого метода, рассмотрев следующие аспекты:

  • Мотивация: зачем нужен метод для ускорения компьютерного моделирования?
  • Решение: как суррогатное моделирование помогает ситуации?
  • Подробности: как на самом деле применить суррогатное моделирование?

Ключевые выводы из части I перечислены в конце этой статьи.

Во части II мы проработаем тематическое исследование, чтобы продемонстрировать ключевые шаги в практическом суррогатном моделировании.

В части III мы кратко поговорим о некоторых передовых концепциях для дальнейшего расширения возможностей суррогатного моделирования.

Оглавление
· 1. Необходимость ускорения компьютерного моделирования
· 2. Суррогатное моделирование
2.1 Идея
2.2 Характеристики
· 3. Рабочий процесс суррогатного моделирования
3.1 Выборка
3.2 Выходные оценки
3.3 Построение суррогатной модели
3.4 Активное обучение
3.5 Расширение обучающего набора
· 4. Ключевые выводы
· Дополнительная литература
· Об авторе

1. Необходимость ускорения компьютерного моделирования.

Компьютерное моделирование предназначено для прогнозирования поведения физической системы путем решения математических уравнений соответствующего физического процесса. Например, инженеры используют аэродинамическое моделирование для расчета сопротивления и подъемной силы самолета и используют структурное динамическое моделирование для определения прочности крыльев самолета.

Эти симуляции ценны, поскольку они дают инженерам глубокое понимание производительности продукта без фактического создания продукта, тем самым играя решающую роль в виртуальном прототипировании.

Чтобы облегчить эффективный и надежный процесс проектирования, инженерам обычно необходимо выполнить:

  • анализ чувствительности, чтобы изучить поведение продукта при изменении параметров конструкции;
  • оптимизации, чтобы найти оптимальные параметры конструкции, обеспечивающие максимальную производительность и / или минимальную стоимость;
  • анализ риска (или количественная оценка неопределенности), чтобы рассчитать риск выхода продукта из строя, когда параметры конструкции являются неопределенными.

Вышеупомянутые анализы имеют одну общую черту, а именно, все они требуют большого количества прогонов моделирования, где каждый прогон принимает различные комбинации проектных параметров в качестве входных данных. (Примечание: почему для анализа рисков требуется несколько прогонов моделирования, вы можете проверить мой предыдущий пост: Управление неопределенностью в вычислительной науке и технике)

К сожалению, компьютерное моделирование, как правило, обходится недешево: в промышленности на выполнение одного моделирования, выполняемого в кластере, обычно требуется несколько дней. Следовательно, анализ, требующий большого количества прогонов моделирования, приведет к чрезмерным вычислительным затратам, что сделает их невозможными на практике.

Итак, как мы можем решить эту проблему? Суррогатное моделирование может пролить свет на это.

2. Суррогатное моделирование.

2.1 Идея

Вот как помогает суррогатное моделирование: оно создает статистическую модель (или суррогатную модель), чтобы точно аппроксимировать выходные данные моделирования. Впоследствии эту обученную статистическую модель можно развернуть, чтобы заменить исходное компьютерное моделирование при выполнении анализа чувствительности, оптимизации или анализа рисков.

Поскольку однократная оценка обученной статистической модели, как правило, намного быстрее, чем однократная оценка исходного моделирования, выполнение сотен и тысяч оценок выходных данных при различных комбинациях проектных параметров больше не является проблемой. Одним словом, методы суррогатного моделирования делают эти дорогостоящие анализы доступными.

2.2 Характеристики

Суррогатная модель, также известная как метамодель или эмулятор, обучается с использованием подхода, основанного на данных. Его обучающие данные получаются путем зондирования выходных данных моделирования в нескольких разумно выбранных местах в пространстве параметров проекта. В каждом из этих мест проводится полное моделирование для расчета соответствующих выходных данных моделирования.

Собирая пары входных данных (параметры проектирования) и соответствующие им выходные данные в обучающий набор данных, мы можем построить статистическую модель на основе полученного набора данных.

Хм, обучение прогностической модели на основе помеченного набора обучающих данных, это похоже на контролируемое машинное обучение? Да, в самом деле! Суррогатное моделирование - это частный случай контролируемого машинного обучения, применяемого в области инженерного проектирования. Эти популярные методы машинного обучения, такие как полиномиальные регрессии, опорные векторные машины, гауссовские процессы, нейронные сети и т. Д., Также широко используются в качестве суррогатных моделей для ускорения процессов проектирования и анализа продукта.

Благодаря этой связи инженеры могут удобно использовать устоявшиеся практики машинного обучения для создания, проверки и выбора суррогатных моделей и эффективно бороться с соответствующими проблемами недостаточного / переобучения.

3. Рабочий процесс суррогатного моделирования.

3.1 Отбор проб

Начнем с создания исходных обучающих данных. Для этого мы тщательно отбираем образцы проектных параметров из их пространства параметров. Эта практика также известна как Планирование экспериментов.

На этом этапе предпочтительно, чтобы образцы были равномерно распределены по пространству параметров. Это полезно, поскольку мы можем иметь представителей приближенного отношения ввода-вывода из всех областей исследуемого пространства параметров. Обычно схемы выборки с заполнением пробелов используются для создания выборок с вышеупомянутым свойством. Самая известная в этой категории - Схема латинского гиперкуба.

3.2 Оценка результатов

После того, как мы определили исходные обучающие выборки, нам нужно вычислить соответствующие выходные значения, запустив их. После сборки пар выбранных обучающих выборок и их соответствующих выходных значений у нас теперь есть исходный обучающий набор данных.

3.3 Постройте суррогатную модель

На этом этапе мы строим суррогатную модель, используя данные обучения, собранные на предыдущем этапе. Здесь следует использовать устоявшиеся практики машинного обучения для проверки и выбора моделей, чтобы направлять процесс обучения модели. Кроме того, передовые методы машинного обучения, такие как упаковка и ускорение, могут еще больше повысить производительность суррогатной модели.

3.4 Активное обучение

Как правило, аналитик не может предвидеть количество выборок, необходимое для построения точной суррогатной модели. Это определяется сложностью приближенного отношения ввода-вывода. В результате имеет больше смысла пополнять обучающий набор данных по мере обучения. Эта практика известна как Активное обучение.

С этой целью мы можем использовать специально созданные обучающие функции, чтобы помочь нам определить следующий образец с наибольшей информационной ценностью. Эти обучающие функции предназначены для распределения выборок по регионам, где

  • суррогатная модель считается неточной или неопределенной,
  • или в регионы, где находятся особенно интересные комбинации проектных параметров, такие как регион, который, возможно, содержит глобально оптимальные значения проектных параметров.

3.5 Расширение набора обучающих данных

После идентификации нового образца выполняется новый прогон моделирования для вычисления соответствующего выходного значения. Впоследствии суррогатная модель повторно обучается на расширенном наборе обучающих данных. Мы повторяем этот процесс, пока не будем удовлетворены точностью суррогатной модели.

4. Основные выводы

В этом блоге мы познакомили с фундаментальными идеями суррогатного моделирования:

  • Дизайн продукта основан на компьютерном моделировании для оценки характеристик продукта и изучения новых дизайнерских идей.
  • Многие прогоны моделирования могут оказаться слишком дорогостоящими с точки зрения вычислений, что серьезно ограничивает разработку продукта и эффективность анализа.
  • Методы суррогатного моделирования, которые создают недорогие статистические модели для точной аппроксимации результатов моделирования, могут решить эту проблему.
  • Суррогатное моделирование - это частный случай машинного обучения с учителем, применяемого в области инженерного проектирования.
  • Вместо обучения на заранее заданном наборе данных суррогатные модели используют активное обучение для обогащения обучающих данных по мере обучения, что значительно повышает эффективность и точность обучения.

В следующем блоге мы рассмотрим промышленный пример, чтобы увидеть, как суррогатное моделирование используется для облегчения визуализации зависимостей и ускорения количественного анализа неопределенности. Увидимся там!

Дальнейшее чтение:

[1] Александр И. Форрестер, Андраш Собестер, Энди Дж. Кин, Инженерное проектирование с помощью суррогатного моделирования: Практическое руководство, 2008.

об авторе

Я доктор философии. исследователь, работающий над количественной оценкой неопределенности и анализом надежности для аэрокосмических приложений. Статистика и анализ данных составляют основу моей повседневной работы. Мне нравится делиться тем, что я узнал в увлекательном мире статистики. Проверьте мои предыдущие сообщения, чтобы узнать больше, и свяжитесь со мной в Medium и Linkedin.