[ML0to100] — S1E8

При пакетном обучении система неспособна к постепенному обучению: ее необходимо обучать, используя все доступные данные.

Сначала система обучается, а затем запускается в производство и запускается без обучения; он просто применяет то, что узнал.

Если вы хотите, чтобы система пакетного обучения знала о новых данных (например, о новом типе спама), вам необходимо обучить новую версию системы с нуля на полном наборе данных (не только на новых данных, но и на старых. ), затем остановите старую систему и замените ее новой.

Это простое решение часто отлично работает. Весь процесс обучения, оценки и запуска системы машинного обучения можно довольно легко автоматизировать.

Если ваша система должна адаптироваться к быстро меняющимся данным (например, для прогнозирования цен на акции) или система должна иметь возможность учиться автономно и у нее ограниченные ресурсы (например, приложение для смартфона или марсоход на Марсе), тогда вам понадобится более реактивное решение (алгоритмы, способные к постепенному обучению, например, системы онлайн-обучения).

Читать далее - Что такое онлайн-обучение? [S1E9]

Сводные шпаргалки, заметки, флэш-карты, записные книжки Google Colab, коды и т. д. будут предоставлены в дальнейших уроках по мере необходимости.

Прочтите всю серию «S1» [ML0to100], чтобы узнать о следующем:

  • Что такое машинное обучение, какие проблемы оно пытается решить, а также основные категории и фундаментальные концепции его систем.
  • Шаги в типичном проекте машинного обучения
  • Обучение путем подбора модели к данным
  • Оптимизация функции стоимости
  • Обработка, очистка и подготовка данных
  • Выбор и инженерные особенности
  • Выбор модели и настройка гиперпараметров с помощью перекрестной проверки
  • Проблемы машинного обучения, в частности, недостаточная и переоснащенная (компромисс смещения / дисперсии)
  • Наиболее распространенные алгоритмы обучения: линейная и полиномиальная регрессия, логистическая регрессия, k-ближайшие соседи, машины опорных векторов, деревья решений, случайные леса и ансамблевые методы.
  • Уменьшение размерности обучающих данных для борьбы с «проклятием размерности»
  • Другие методы неконтролируемого обучения, включая кластеризацию, оценку плотности и обнаружение аномалий. Часть II, Нейронные сети и глубокое обучение, охватывает следующие темы:
  • Что такое нейронные сети и чем они хороши для построения и обучения нейронных сетей с использованием TensorFlow и Keras
  • Наиболее важные архитектуры нейронных сетей: нейронные сети с прямой связью для табличных данных, сверточные сети для компьютерного зрения, повторяющиеся сети и сети долгосрочной краткосрочной памяти (LSTM) для обработки последовательностей, кодировщики / декодеры и преобразователи для обработки естественного языка, автокодеры и генеративные состязательные сети (GAN) для генеративного обучения
  • Методы обучения глубоких нейронных сетей
  • Как создать агента (например, бота в игре), который может изучать хорошие стратегии методом проб и ошибок, используя обучение с подкреплением
  • Эффективная загрузка и предварительная обработка больших объемов данных
  • Обучение и масштабное развертывание моделей TensorFlow

Заявление об ограничении ответственности - эта серия основана на заметках, которые я создал для себя на основе различных прочитанных мною книг, поэтому часть текста может быть точной цитатой из какой-нибудь книги, я бы упомянул эту книгу, но даже я не знаю, к какой книге принадлежит абзац, потому что это компиляция. Это лучше для читателя, поскольку он скомпилировал в одном месте все многообещающие книги по машинному обучению, доступные на рынке.