Публикации по теме 'data-analytics'


Плохие полицейские: анализ 33 358 обвинений в адрес сотрудников полиции Нью-Йорка
Подробное описание жалоб на сотрудников полиции Нью-Йорка с 1985 года. Полиция Нью-Йорка получила сокращение бюджета на миллиард долларов после протестов против #DefundThePolice. Я проанализировал все гражданские жалобы на сотрудников полиции Нью-Йорка с сентября 1985 года по январь 2020 года, чтобы понять контекст этих протестов. Изучение данных В наборе данных содержится 33 358 заявлений, 12 056 из которых являются уникальными инцидентами (некоторые жалобы содержат несколько..

Научите себя SQL
Базы данных являются частью нашей повседневной жизни, и возможность общаться с ними очень важна. SQL — это S структурированный Query язык , который представляет собой язык программирования для хранения, обработки и извлечения данных, хранящихся в реляционной базе данных. SQL является стандартным языком для системы реляционных баз данных. Все системы управления реляционными базами данных (RDMS), такие как MySQL, MS Access, Oracle, Sybase, Informix, Postgres и SQL Server, используют SQL..

#KB Логистическая регрессия — Введение
Дорогие друзья! Знаете ли вы модели логистической регрессии? Эти модели широко используются в машинном обучении для прогнозирования бинарных результатов на основе независимых переменных. В этой статье я представлю всесторонний обзор логистической регрессии, от основных концепций до показателей оценки и практических приложений. Вы готовы? Пойдем! 🚀 Логистическая регрессия Логистическая регрессия — это особый вид обобщенной линейной модели (GLM), в которой используется..

РАЗГОВОР О МОЕМ ПУТЕШЕСТВИИ В МАШИННОМ ОБУЧЕНИИ (ЧАСТЬ 1)
Случайное чаепитие с другом заставило меня задуматься о моем переходе к технологиям. Мне всегда приятно вспоминать предысторию моего машинного обучения . Переход был облачным! Яркой стороной действия, которое я собирался предпринять, было похищение или, возможно, пропажа без вести. Свет в туннеле был сильно затуманен. Я чувствовал себя так легко в своем собственном пространстве. Однако моя длинная глотка и аппетит к сложной работе и карьере усугубляли мой грубый комфорт. Мое..

Анализ энергопотребления сталелитейной промышленности с помощью функции SHAP Важность и EDA
Это портфолио создано для финального проекта Bootcamp Data Science. Исходный код объяснит на языке Bahasa. Этот проект анализирует, какие факторы больше всего влияют на тип энергетической нагрузки, какой фактор вызвал энергетическую нагрузку, которая классифицируется как максимальная нагрузка, насколько эффективно потребляется энергетическая нагрузка. Согласно Википедии, в статистике исследовательский анализ данных (EDA) представляет собой подход к анализу наборов данных для обобщения..

Предсказание категории товаров по названию из Russian Food Stores
Эта статья является продолжением нашей серии статей об анализе данных о потребительских товарах: Сбор данных с чеков гипермаркетов на Python и Парсинг данных каталога сайта с помощью Beautiful Soup и Selenium ». Мы собираемся построить модель, которая будет классифицировать товары по наименованию в кассовом чеке. Квитанции Till содержат данные по каждому купленному продукту, но не дают сводной информации о том, сколько в целом было потрачено на сладости или молочные продукты. Обработка..

Естественный язык в SQL с нуля с помощью Tensorflow
Полное руководство по обучению модели машинного обучения переводу вопросов/инструкций на естественном языке в SQL-запросы с использованием Tensorflow. Введение В этом посте мы рассмотрим интересную задачу: преобразование естественного языка в SQL. Академический термин для этого — интерфейс естественного языка для базы данных (NLIDB). Несмотря на то, что NLIDB все еще является областью активных исследований, создание модели для одной простой таблицы на самом деле довольно просто. Мы..