В этой серии публикаций подробно рассказывается о каждом уроке курса «Введение в машинное обучение для программистов», предлагаемого Fast.ai.

Почему я должен читать эту серию? Чем отличаются мои заметки к курсу Fast.ai?

С моей личной целью стать Data Scientist с большим количеством практических «как» и достаточным количеством теоретических «почему», эта серия сообщений Medium объединит лучшее из обоих миров:

С одной стороны, курсы и уроки, предлагаемые Fast.ai, учат студентов, как эффективно применять методы машинного обучения и глубокого обучения. Благодаря стилю обучения сверху вниз учащиеся могут очень быстро анализировать данные, строить модели и достигать результатов с визуальным пониманием концепций высокого уровня. (Оригиналы видеолекций и их подробные видеоконспекты, созданные другими студентами, можно найти здесь.)

С другой стороны, я также обнаружил, что существует неограниченный контент, публикуемый академическими учреждениями и другими энтузиастами DS. На этом «диком западе» бесплатной информации существует бесконечная широта и глубина тем, по которым можно бродить и изучать бесконечно.

В этой средней серии будут обобщены выводы каждого урока и рассмотрены математические расчеты, поддерживающие каждую концепцию.

Вы уже слышали о Fast.ai?

Fast.ai — это много вещей.

Хотя по определению это «исследовательский институт, призванный сделать глубокое обучение более доступным», на практике это, по сути, библиотека Python для глубокого обучения, сообщество практиков всех уровней и серия бесплатных онлайн-курсы, которые учат как практическому применению библиотеки fast.ai, так и концепциям «необходимо знать», чтобы быть эффективным практиком машинного обучения.

Прежде чем читать дальше, я настоятельно рекомендую вам быстро посетить веб-сайт fast.ai и убедиться в этом самостоятельно. Джереми Ховард и его команда могут фактически изменить подход к машинному обучению и глубокому обучению. Вместо традиционных аудиторных лекций, сосредоточенных на чистой математике и доказательствах, все курсы fast.ai используют стиль сверху вниз и фокусируются на том, как эффективно применять методы и алгоритмы, и только при необходимости углубляясь в технические детали на высоком уровне. понять, какую технику применять и когда.

Самое лучшее в Fast.ai то, что вам даже не нужно использовать библиотеку Fast.ai

Хотя fast.ai построен на Pytorch (а Pytorch построен на Torch), и вы на самом деле можете быть пользователем Keras и/или TensorFlow, знания из каждого курса не зависят от фреймворка. Все рассмотренные концепции, методологии, советы и приемы являются основополагающими для любой среды глубокого обучения. Хотя это выходит за рамки этой средней серии, ознакомьтесь с этой ссылкой для высокоуровневого сравнения различных сред глубокого обучения.

Введение в машинное обучение для программистов

Один из пяти курсов, предлагаемых Fast.ai

Хотя этот конкретный курс не включает глубокое обучение, рассмотренные концепции являются основополагающими как для машинного обучения, так и, в конечном счете, для глубокого обучения:

Урок 01 — Введение в случайные леса
Урок 02 — Глубокое погружение в случайный лес
Урок 03 — Производительность, проверка и интерпретация модели
Урок 04 — Важность функций, интерпретатор дерева
> Урок 05 — Экстраполяция и RF с нуля
Урок 06 — Продукты данных и кодирование в реальном времени
Урок 07 — RF с нуля и градиентный спуск
Урок 08 — Градиентный спуск и логистическая регрессия
Урок 09 — Регуляризация, скорость обучения и НЛП
Урок 10 — Дополнительные данные НЛП и столбцов
Урок 11 — Встраивания
Урок 12 — Полное описание Россмана, этические вопросы

Ссылки на каждый урок и пост ниже (будут обновлены):