Публикации по теме 'data-analytics'


Дорожная карта (с подробными темами), чтобы стать специалистом по данным / инженером по машинному обучению
Что ж, если вы хотите начать изучать науку о данных, это довольно просто, если вы будете регулярно проверять каждую тему, усердно учиться и усердно практиковаться (и это само по себе шутка, если вы понимаете, о чем я). Но, если честно, это не так сложно, как кажется…. Поверьте мне!! Мне было трудно взламывать горы и холмы, чтобы проложить Дорогу вокруг них. Итак, вот оно… просто идите шаг за шагом, и вы должны быть на пути к цели науки о данных. (0.5) Основы Python..

Введение в MLFlow
MLFlow - это платформа с открытым исходным кодом для управления полным жизненным циклом машинного обучения. Имеет четыре основных компонента и функции. MLFlow Tracking - ведение учета проведенных экспериментов с данными и результатами. Результаты можно было сравнить по разным параметрам. Проекты MLFlow - для упаковки кода в формат, обеспечивающий возможность многократного использования и воспроизводимого выполнения на многих платформах. Им можно поделиться с другими специалистами по..

Навыки, необходимые для анализа данных
Аналитика данных — это междисциплинарная область, которая включает в себя извлечение значимых идей и знаний из необработанных данных, чтобы помочь в принятии решений и бизнес-стратегиях. Чтобы преуспеть в анализе данных, вам нужен разнообразный набор навыков, охватывающий различные области. Вот ключевые навыки, необходимые для анализа данных: Статистика . Для аналитиков данных очень важна прочная база статистики. Вы должны хорошо разбираться в описательной и логической статистике,..

Воссоздание анимации Gapminder в двух строках Python с помощью Plotly Express
Отказ от ответственности: используется новый модуль plotly_express , Gapminder Animation не кодируется с нуля с использованием 2 строк Это один из знаковых моментов визуализации данных, когда Ханс Рослинг представил знаменитую Gapminder Animation в своем выступлении на TED , которое является одним из самых просматриваемых выступлений на TED за всю историю. С тех пор это стало эталоном для всех, кто занимается визуализацией, чтобы воспроизвести ее, чтобы продемонстрировать свое..

#КБ Очистка данных III
Дорогие друзья! Вы заметили препятствие на дороге, что теперь? Хотя может возникнуть соблазн просто избежать или удалить эти выбросы из вашего набора данных, чтобы очистить данные, на самом деле это может привести к систематической ошибке и исказить общую картину. 👋Джош Дейл и 👋 я покажут вам несколько методов обработки выбросов, которые могут помочь снизить риск получения неверных выводов из вашего анализа. Как обрабатывать выбросы данных Правильная обработка проблем..

Выбор функций: ключевой метод повышения точности моделей
Здравствуйте друзья, Это мой первый блог, и я полностью помогу вам понять ключевые инструменты науки о данных 😉. Мой первый блог основан на выборе функций. Выбор функций  – это процесс выбора оптимального количества функций из большого набора функций. Есть несколько преимуществ этого процесса выбора признаков, а также существуют различные методы, доступные для этого процесса выбора признаков. В этом блоге мы рассмотрим эти преимущества и различные методы выбора функций. Почему..

Все о линейной регрессии
Всякий раз, когда кто-то начинает с машинного обучения, самый первый алгоритм, который он должен выучить, — это линейная регрессия. Линейную регрессию можно рассматривать как «a b c» машинного обучения. Это самый простой, но один из самых используемых и мощных алгоритмов в машинном обучении. В этом посте мы рассмотрим только теоретический аспект линейной регрессии. ГЛАВНАЯ ИДЕЯ Прежде чем углубляться в технические аспекты алгоритма, давайте немного познакомимся с идеей линейной..