Уровни обучения
- Проверьте уровень воды
- Погрузитесь в концептуальные глубины
- Изучите практические концепции
- Продвижение проекта
Проверьте уровень воды (ориентировочное время: 6–8 недель)
Изучите Python
→ OOPS в Python
→ Обработка файлов
→ Обработка исключений
→ Регулярные выражения
→ Функциональное программирование
→ Основы Flask и Django
→ Практические задачи
Изучите Numpy
→ Плейлист Numpy
→ Практические задачи
Изучите Pandas
→ Плейлист Pandas
→ Практические задачи
Изучите визуализацию данных
→ Matplotlib
→ Seaborn
Изучите описательную статистику
→Статистика
Изучите процесс анализа данных
→Анализ данных
Изучите EDA (исследовательский анализ данных)
→Одномерный анализ
→ Многомерный анализ
→ Профилирование Pandas
→ EDA на наборе данных о ценах на жилье: Нажмите здесь
→ EDA в наборе данных Титаник: Нажмите здесь
→ EDA в наборе данных о сердечных заболеваниях: Нажмите здесь
→ EDA в наборе данных об Олимпийских играх: Нажмите здесь
→ EDA в Набор данных по диабету PIMA: Нажмите здесь
→ EDA по набору данных о выживании Хабермана: Нажмите здесь
→ EDA по набору данных по раку молочной железы: Нажмите здесь
→ EDA по набору данных IPL: нажмите здесь
Изучите основы машинного обучения
→ Что такое машинное обучение?
→ ML, DL и AI
→ Типы машинного обучения
→ Применение машинного обучения < br /> → Работа в Datascience
→ Как работать с данными CSV, JSON и SQL?
→ Инструменты, используемые в ML
Погружение в концептуальные глубины (ориентировочное время: 9–18 недель)
Подробнее о тензорах
→ Что такое тензоры?
Расширенная статистика
→ Ковариация
→ Коэффициент корреляции Пирсона
→ График QQ
→ Доверительный интервал
→ Проверка гипотез
→ Chisquare Тест
→ Anova Test
→ Плейлист
Основы теории вероятности
→ Вероятность условия
→ Независимые события
→ Теорема Байеса
→ Равномерное распределение
→ Биномиальное распределение
→ Бернаулли Раздача
→ Раздача Poission
→ Плейлист
Основы линейной алгебры
→ Представление табличных данных
→ Векторы
→ Матрицы
→ Умножение матриц
→ Скалярное произведение
→ Уравнение строки в N-dm
→ Собственный вектор и собственные значения
→ Список воспроизведения
Основы исчисления
→ Общая картина производных
→ Максимумы и минимумы
→ Список воспроизведения
Алгоритмы машинного обучения
→ Линейная регрессия
→ Градиентный спуск
→ Логистическая регрессия
→ Метод опорных векторов
→ Наивный байесовский метод
→ K ближайших соседей
→ Деревья решений
→ Случайный лес
→ Бэггинг
→ Adaboost
→ Повышение градиента
→ Xgboost
→ PCA ( Анализ основных компонентов)
→ Кластеризация KMeans
→ Иерархическая кластеризация
→ DBSCAN
→ T-sne
Показатели машинного обучения
Компромисс отклонения от смещения
Регуляризация
Перекрестная проверка
Изучите практические концепции (ориентировочное время: 18–26 недель)
Сбор данных
→ Анализ веб-страниц
→ Получение данных из API
Работа с отсутствующими значениями
→ Обработка отсутствующих числовых данных
→ Обработка отсутствующих категориальных данных
→ Отсутствующий индикатор
→ Импутатор KNN
→ MICE< br /> → Kaggle Notebooks и практические наборы данных: нажмите здесь
Масштабирование функций/нормализация
→ Стандартизация
→ Нормализация
Методы кодирования признаков
→ Порядковое кодирование
→ Кодирование меток
→ OHC
→ Хеширование признаков
Преобразование признаков
→ Преобразование журнала
→ Преобразование Бокса-Кокса
→ Преобразование Йео Джонсона
→ Дискретизация
Работа с конвейерами
→ Преобразование столбцов
→ Конвейеры Sklearn
Обработка данных о дате и времени
→ Работа с данными о времени и дате
Работа с выбросами
→ Что такое выбросы?
→ Обнаружение выбросов
→ Удаление выбросов с помощью метода Z-оценки
→ Удаление с использованием метода IQR
→ Процентильный метод
Построение признаков
→ Построение признаков
Выбор признаков
→Выбор признаков с помощью SelectKBest и рекурсивного исключения признаков
→ Выбор признаков методом хи-квадрат
→ Исключение признаков назад
→ Отбрасывание признаков с использованием корреляции Пирсона коэффициент
→ Важность признаков с использованием Random Forest
→ Рекомендации по выбору признаков
Перекрестная проверка
→ Что такое перекрестная проверка?
→ Метод удержания
→ Перекрестная проверка K-Fold
→ Пропустить одну перекрестную проверку
→ Перекрестная проверка временных рядов
Моделирование-наложение и смешивание
→ Стекирование
→ Смешивание
→ LightGBM
→ CatBoost
Настройка модели
→ GridSearchCV
→ RandomSearchCV
→ Настройка гиперпараметров
Работа с несбалансированными данными
→ Блокнот Kaggle: Нажмите здесь
→ SMOTE в наборе данных quora: Нажмите здесь
Обработка мультиколлинеарности
→ Что такое мультиколлинеарность?
→ Практический пример
→ VIF в мультиколлинеарности
Утечка данных
→ Что такое утечка данных?
→ Практика:› Утечка данных в паре вопросов Quora Набор данных: Нажмите здесь
→ Практика:› Данные Утечка данных кредитной карты: Нажмите здесь
Обслуживание вашей модели
→ Развернуть модель на Heroku
→ Развернуть модель на AWS
→ Развернуть модель на GCP
→ Развернуть Модель на Azure
Продвижение проекта
500 (ИИ, машинное обучение, глубокое обучение, компьютерное зрение, НЛП):
→ Нажмите здесь
Примечание. Все еще работаю над ресурсами, потому что со временем технологии меняются.