Одним из аспектов аспирантуры, который мне до сих пор запомнился, был упор на исследование операций, системную инженерию и практическое применение. Это был первый раз, когда я познакомился с такими методами, как оптимизация, моделирование и регрессия; Наряду с обучением и поиском мы в Kado называем их методами героев.
Между академическими кругами и промышленностью существовал континуум, при этом большая часть исследовательской работы финансировалась компаниями или государством. Мы увидели применение многих изученных нами методов в контексте реальных проблем в производстве, складском хозяйстве, дистрибуции, логистике, финансах, алгоритмах и других областях.
Перед моими глазами открылся этот удивительный мир — с этой диаспорой методов, которые решали разные задачи. Регрессия была одним из методов, которым обучали в одном классе. Однако сегодня машинное обучение является основным. Это тот, который взял все остальные в мейнстрим.
Ради аргумента поместите проблемы машинного обучения и науки о данных в одну корзину — проблемы, управляемые данными. Эти вам, вероятно, знакомы. Большие данные, Data Science & Engineering, структурированные и неструктурированные и так далее.
Есть еще одна категория — проблемы, основанные на принципах, методах, алгоритмах и математике; законы и теоремы имеют приоритет над данными. Принципиальные задачи. Это сложные математические системы в различных областях — инженерный дизайн, дизайн лекарств, финансовые рынки, управление цепочками поставок, социальные системы и т. д. — моделируемые математикой на основе принципов и законов.
Методы, о которых я упоминал ранее — оптимизация, симуляция и даже обучение — здесь очень уместны. Из них получается эффективный вспомогательный персонал.
Я создал МНОГО ресурсов по этой теме. Вот мой курс Дизайн-мышление для методов героев. Вот мой YouTube канал с превью видео курсов. Вот мой сайт; перемещайтесь по курсам, чтобы найти бесплатные превью и PDF-файлы.
Обертка оптимизации может приятно удивить вас калибровкой, которую вы не ожидали. Сложные математические системы имеют параметры, которые необходимо настроить. Такая задача может быть поставлена как задача оптимизации (или поиска), если можно математически выразить цели производительности системы, а также ограничения. Идея может заключаться даже не в том, чтобы найти лучший ответ, а в том, что он направлен правильно. Методы поиска и планирования и эвристической оптимизации являются кандидатами на настройку и калибровку математических систем.
Моделирование может выявить эмерджентное поведение, которое является проницательным. Иногда вы хотите знать, как системы работают в различных условиях. Математические системы могут иметь входы и выходы, а также один или несколько шагов процесса. Если вещи нелинейны, иногда может быть нелегко обнаружить и предсказать поведение, особенно если оно возникает. Вот где обертка моделирования может действительно помочь. Запуская симуляции — даже с достаточно хорошо известными входными параметрами — могут возникнуть удивительные взаимодействия и поведение.
суррогатный ученик может действовать как эффективный фильтр. Суррогаты могут заменить математические системы и действовать как первоначальные фильтры, особенно если вычисления требуют очень больших ресурсов. Моделирование — отличный пример этого; одна из проблем моделирования — определить, какие наборы значений входных признаков необходимо смоделировать. Без какого-либо полезного руководства задача состояла бы в том, чтобы смоделировать все комбинации, то есть полное пространство признаков. Как вы понимаете, это практически невозможно и крайне неэффективно. Обучая учащегося на прошлых данных моделирования, результирующая модель может выступать в качестве суррогата для моделирования и идентифицировать только те входные комбинации, которые необходимо смоделировать. Конечно, вам все равно нужно будет смоделировать их, но, как видите, количество симуляций можно значительно сократить.
В Кадо мы учим тому, как создавать оболочки для сложных математических систем. Если вы рассматриваете проблему машинного обучения как сложную математическую систему, настройка и обучение такой системы включает настройку параметров. Неудивительно, что самые популярные методы обучения — градиентные и/или эволюционные — включают в себя процесс оптимизации. С этой точки зрения оптимизатор можно использовать для калибровки модели машинного обучения. Уже одно это является доказательством силы методов героев в качестве оберток.