Уровни обучения

  • Проверьте уровень воды
  • Погрузитесь в концептуальные глубины
  • Изучите практические концепции
  • Продвижение проекта

Проверьте уровень воды (ориентировочное время: 6–8 недель)

Изучите Python
→ OOPS в Python
→ Обработка файлов
→ Обработка исключений
→ Регулярные выражения
→ Функциональное программирование
→ Основы Flask и Django
Практические задачи

Изучите Numpy
→ Плейлист Numpy
→ Практические задачи

Изучите Pandas
→ Плейлист Pandas
→ Практические задачи

Изучите визуализацию данных
→ Matplotlib
→ Seaborn

Изучите описательную статистику
Статистика

Изучите процесс анализа данных
Анализ данных

Изучите EDA (исследовательский анализ данных)
Одномерный анализ
→ Многомерный анализ
→ Профилирование Pandas
→ EDA на наборе данных о ценах на жилье: Нажмите здесь
→ EDA в наборе данных Титаник: Нажмите здесь
→ EDA в наборе данных о сердечных заболеваниях: Нажмите здесь
→ EDA в наборе данных об Олимпийских играх: Нажмите здесь
→ EDA в Набор данных по диабету PIMA: Нажмите здесь
→ EDA по набору данных о выживании Хабермана: Нажмите здесь
→ EDA по набору данных по раку молочной железы: Нажмите здесь
→ EDA по набору данных IPL: нажмите здесь

Изучите основы машинного обучения
→ Что такое машинное обучение?
→ ML, DL и AI
→ Типы машинного обучения
→ Применение машинного обучения < br /> → Работа в Datascience
→ Как работать с данными CSV, JSON и SQL?
→ Инструменты, используемые в ML

Погружение в концептуальные глубины (ориентировочное время: 9–18 недель)

Подробнее о тензорах
→ Что такое тензоры?

Расширенная статистика
→ Ковариация
→ Коэффициент корреляции Пирсона
→ График QQ
→ Доверительный интервал
→ Проверка гипотез
→ Chisquare Тест
→ Anova Test
Плейлист

Основы теории вероятности
→ Вероятность условия
→ Независимые события
→ Теорема Байеса
→ Равномерное распределение
→ Биномиальное распределение
→ Бернаулли Раздача
→ Раздача Poission
Плейлист

Основы линейной алгебры
→ Представление табличных данных
→ Векторы
→ Матрицы
→ Умножение матриц
→ Скалярное произведение
→ Уравнение строки в N-dm
→ Собственный вектор и собственные значения
→ Список воспроизведения

Основы исчисления
→ Общая картина производных
→ Максимумы и минимумы
→ Список воспроизведения

Алгоритмы машинного обучения
→ Линейная регрессия
→ Градиентный спуск
→ Логистическая регрессия
→ Метод опорных векторов
→ Наивный байесовский метод
→ K ближайших соседей
→ Деревья решений
→ Случайный лес
→ Бэггинг
→ Adaboost
→ Повышение градиента
→ Xgboost
→ PCA ( Анализ основных компонентов)
→ Кластеризация KMeans
→ Иерархическая кластеризация
→ DBSCAN
→ T-sne

Показатели машинного обучения

Компромисс отклонения от смещения

Регуляризация

Перекрестная проверка

Изучите практические концепции (ориентировочное время: 18–26 недель)

Сбор данных
→ Анализ веб-страниц
→ Получение данных из API

Работа с отсутствующими значениями
→ Обработка отсутствующих числовых данных
→ Обработка отсутствующих категориальных данных
→ Отсутствующий индикатор
→ Импутатор KNN
→ MICE< br /> → Kaggle Notebooks и практические наборы данных: нажмите здесь

Масштабирование функций/нормализация
→ Стандартизация
→ Нормализация

Методы кодирования признаков
→ Порядковое кодирование
→ Кодирование меток
→ OHC
→ Хеширование признаков

Преобразование признаков
→ Преобразование журнала
→ Преобразование Бокса-Кокса
→ Преобразование Йео Джонсона
→ Дискретизация

Работа с конвейерами
→ Преобразование столбцов
→ Конвейеры Sklearn

Обработка данных о дате и времени
→ Работа с данными о времени и дате

Работа с выбросами
→ Что такое выбросы?
→ Обнаружение выбросов
→ Удаление выбросов с помощью метода Z-оценки
→ Удаление с использованием метода IQR
→ Процентильный метод

Построение признаков
→ Построение признаков

Выбор признаков
Выбор признаков с помощью SelectKBest и рекурсивного исключения признаков
→ Выбор признаков методом хи-квадрат
→ Исключение признаков назад
→ Отбрасывание признаков с использованием корреляции Пирсона коэффициент
→ Важность признаков с использованием Random Forest
→ Рекомендации по выбору признаков

Перекрестная проверка
→ Что такое перекрестная проверка?
→ Метод удержания
→ Перекрестная проверка K-Fold
→ Пропустить одну перекрестную проверку
→ Перекрестная проверка временных рядов

Моделирование-наложение и смешивание
→ Стекирование
→ Смешивание
→ LightGBM
→ CatBoost

Настройка модели
→ GridSearchCV
→ RandomSearchCV
→ Настройка гиперпараметров

Работа с несбалансированными данными
→ Блокнот Kaggle: Нажмите здесь
→ SMOTE в наборе данных quora: Нажмите здесь

Обработка мультиколлинеарности
→ Что такое мультиколлинеарность?
→ Практический пример
→ VIF в мультиколлинеарности

Утечка данных
Что такое утечка данных?
→ Практика:› Утечка данных в паре вопросов Quora Набор данных: Нажмите здесь
→ Практика:› Данные Утечка данных кредитной карты: Нажмите здесь

Обслуживание вашей модели
Развернуть модель на Heroku
Развернуть модель на AWS
Развернуть модель на GCP
Развернуть Модель на Azure

Продвижение проекта

500 (ИИ, машинное обучение, глубокое обучение, компьютерное зрение, НЛП):
Нажмите здесь

Примечание. Все еще работаю над ресурсами, потому что со временем технологии меняются.