Публикации по теме data

Публикации по теме 'data'

Жизненный цикл проекта Data Science

Мы часто говорим о науке о данных, но на самом деле не знаем, что все проекты Data Science работают. Итак, сегодня мы посмотрим, как работает любой проект Data Science. Как правило, любой проект Data Science состоит из 5 этапов. Обнаружение данных (получение данных) Это самый первый шаг любого проекта Data Science - найти данные, и данные могут быть в любом формате, например, данные могут быть в структурированных данных (данные, которые являются высокоорганизованными и..

От кого зависят пользователи npm?

Новый способ просмотра данных npm, чтобы определить, от кого мы больше всего зависим. Реестр npm предоставляет огромное количество полезных открытых данных . Многие люди, в том числе и я, в прошлом проводили достаточно много анализа зависимостей. В этом анализе я хотел сосредоточиться на активной зависимости и активной поддержке . Я остановился на процессе, в котором я просматриваю выпуски пакетов в течение заданного периода времени. Это дает мне хорошее представление о..

Машинное обучение

Машинное обучение — это область, изучающая, как заставить компьютеры учиться. Другими словами, алгоритм машинного обучения — это компьютерная программа, которая учит компьютеры программировать себя так, чтобы нам не приходилось явно описывать, как выполнять задачу, которую мы хотим выполнить. Когда люди говорят о машинном обучении, они говорят, что основанные на математике вычисления, аналитические методы и отличные практики программирования создают хорошее сочетание для машинного..

Машинное обучение для анализа НФЛ

Чтобы просто посмотреть результаты прогноза, смотрите усеченную историю здесь . Это первая статья из серии статей о машинном обучении для анализа НФЛ. В течение сезона я буду пересматривать модели, тестировать новые параметры и пытаться предсказать различные переменные. Это личный проект, который я делаю с помощью и при поддержке K2 Data Science , и все методы можно найти на моем GitHub . Сегодня мы рассмотрим несколько более сложные взаимосвязи переменных и попытаемся различить..

D3.JS — ДЕМИСТИФИЦИРОВАННЫЙ

D3.js — это библиотека javascript, используемая для создания интерактивных диаграмм на основе данных. Его можно использовать для создания самых крутых диаграмм. У него очень крутая кривая обучения. Но как только вы поймете основы D3.js, вы сможете заставить самые крутые графики работать на вас. В этом уроке мы собираемся создать линейную диаграмму, отображающую мое использование Интернета в 2020 году. Я собираюсь рассказать вам, как построить простую линейную диаграмму с помощью..

Наблюдатель за выбросами с нуля с R

Наблюдатель за выбросами с нуля с R Краткое руководство по выявлению выбросов в многомерном пространстве. Аудитория В этом коротком сообщении блога мы рассмотрим основы распространенного метода автоматического кодирования - разложения матрицы - для обнаружения выбросов. Мы будем использовать базовую функцию в R для кодирования модели обратной проекции PCA для матричной декомпозиции. Целевая аудитория этого сообщения в блоге - это тот, кто имеет базовые знания в области..

Особенности Pandas за 5 минут

Достаточно, чтобы начать использовать его эффективно В этом руководстве я выскажу свое мнение о том, сколько достаточно, чтобы начать работу с одной из лучших библиотек исследования данных Python, правильно, Pandas . Идя дальше, я предполагаю, что у вас есть базовые знания Python и файла CSV (значения, разделенные запятыми)/Excel, который вы хотите изучить. Используйте pip для установки панд: pip install pandas Создайте новый файл Python (explore_csv.py), добавьте первую..