[ML0to100] — S1E8
При пакетном обучении система неспособна к постепенному обучению: ее необходимо обучать, используя все доступные данные.
Сначала система обучается, а затем запускается в производство и запускается без обучения; он просто применяет то, что узнал.
Если вы хотите, чтобы система пакетного обучения знала о новых данных (например, о новом типе спама), вам необходимо обучить новую версию системы с нуля на полном наборе данных (не только на новых данных, но и на старых. ), затем остановите старую систему и замените ее новой.
Это простое решение часто отлично работает. Весь процесс обучения, оценки и запуска системы машинного обучения можно довольно легко автоматизировать.
Если ваша система должна адаптироваться к быстро меняющимся данным (например, для прогнозирования цен на акции) или система должна иметь возможность учиться автономно и у нее ограниченные ресурсы (например, приложение для смартфона или марсоход на Марсе), тогда вам понадобится более реактивное решение (алгоритмы, способные к постепенному обучению, например, системы онлайн-обучения).
Читать далее - Что такое онлайн-обучение? [S1E9]
Сводные шпаргалки, заметки, флэш-карты, записные книжки Google Colab, коды и т. д. будут предоставлены в дальнейших уроках по мере необходимости.
Прочтите всю серию «S1» [ML0to100], чтобы узнать о следующем:
- Что такое машинное обучение, какие проблемы оно пытается решить, а также основные категории и фундаментальные концепции его систем.
- Шаги в типичном проекте машинного обучения
- Обучение путем подбора модели к данным
- Оптимизация функции стоимости
- Обработка, очистка и подготовка данных
- Выбор и инженерные особенности
- Выбор модели и настройка гиперпараметров с помощью перекрестной проверки
- Проблемы машинного обучения, в частности, недостаточная и переоснащенная (компромисс смещения / дисперсии)
- Наиболее распространенные алгоритмы обучения: линейная и полиномиальная регрессия, логистическая регрессия, k-ближайшие соседи, машины опорных векторов, деревья решений, случайные леса и ансамблевые методы.
- Уменьшение размерности обучающих данных для борьбы с «проклятием размерности»
- Другие методы неконтролируемого обучения, включая кластеризацию, оценку плотности и обнаружение аномалий. Часть II, Нейронные сети и глубокое обучение, охватывает следующие темы:
- Что такое нейронные сети и чем они хороши для построения и обучения нейронных сетей с использованием TensorFlow и Keras
- Наиболее важные архитектуры нейронных сетей: нейронные сети с прямой связью для табличных данных, сверточные сети для компьютерного зрения, повторяющиеся сети и сети долгосрочной краткосрочной памяти (LSTM) для обработки последовательностей, кодировщики / декодеры и преобразователи для обработки естественного языка, автокодеры и генеративные состязательные сети (GAN) для генеративного обучения
- Методы обучения глубоких нейронных сетей
- Как создать агента (например, бота в игре), который может изучать хорошие стратегии методом проб и ошибок, используя обучение с подкреплением
- Эффективная загрузка и предварительная обработка больших объемов данных
- Обучение и масштабное развертывание моделей TensorFlow
Заявление об ограничении ответственности - эта серия основана на заметках, которые я создал для себя на основе различных прочитанных мною книг, поэтому часть текста может быть точной цитатой из какой-нибудь книги, я бы упомянул эту книгу, но даже я не знаю, к какой книге принадлежит абзац, потому что это компиляция. Это лучше для читателя, поскольку он скомпилировал в одном месте все многообещающие книги по машинному обучению, доступные на рынке.