Публикации по теме 'data'


Цель Scikit-Learn 1.0
Какие новые функции и почему они так важны, чтобы стать первым крупным выпуском? С начала Scikit-Learn прошло 14 лет и 24 бета-релиза, и, наконец, он достиг версии 1.0. Это может показаться немного странным, если учесть тот факт, что Scikit-Learn уже давно используется тысячами компаний, специалистов по обработке данных, исследователей… и все считают его самой распространенной структурой для машинного обучения общего назначения. В этой статье я не хочу проводить анализ новых функций,..

очистка данных, шаг «сделай или сломай» к аналитике данных BI | КМС Технология
Но прежде чем вы начнете играть с этими блестящими алгоритмами машинного обучения, вам нужно собрать и очистить свои данные. Это не всеми любимый шаг… Я имею в виду, кто действительно любит убираться? Фактически, 60% специалистов по данным считают подготовку и очистку данных наименее приятной частью своей работы . Но очистка данных жизненно важна для эффективной аналитики данных. Прежде чем мы погрузимся во все тонкости качественной очистки данных, мы должны спросить… Что..

Разница между анализом данных и интеллектуальным анализом данных и почему важна отчетность
Две концепции анализа данных и интеллектуального анализа данных часто путают, на самом деле между ними есть большая разница. Анализ данных относится к процессу анализа большого количества собранных данных с помощью соответствующих методов статистического анализа, отбора полезной информации для получения результатов, формирования выводов и проведения подробных исследований и анализа данных. Этот процесс также поддерживает систему управления качеством. На практике анализ данных может..

Прекратите экспериментировать с машинным обучением и начните его использовать!
Прекратите экспериментировать с машинным обучением и начните его использовать! Оказывается, в подходе большинства компаний к машинному обучению, аналитическому инструменту будущего, есть фатальный изъян: 87% проектов не проходят стадию эксперимента и поэтому никогда не попадают в производство . Почему так много компаний, предположительно на основе рациональных решений, ограничивают себя просто изучением потенциала машинного обучения и даже после крупных инвестиций, найма специалистов..

Визуализация данных: ее роль и значение в BI.
В современном мире все говорят о данных, но как на самом деле что-то понять из этой огромной кучи данных? Что он пытается передать? Как это имеет смысл? Чтобы сделать вывод из таких сложных данных, пользователи широко применяют визуализацию данных — метод представления данных в виде интерактивных диаграмм и графиков, которые позволяют людям действительно понять выводы из своих данных. Визуализация данных используется для преобразования необработанных данных в диаграммы, изображения и..

Объяснение логистической регрессии
Объяснить логистическую регрессию настолько просто, насколько это возможно. В линейной регрессии переменная Y всегда непрерывна. Если переменная Y категориальна, вы не можете использовать модель линейной регрессии . Итак, что бы вы сделали, если Y - категориальная переменная с двумя классами? Для решения таких проблем, также называемых проблемами двоичной классификации, можно реализовать логистическую регрессию. Логистическая регрессия - это еще один тип алгоритма контролируемого..

Исследователи Нью-Йоркского университета изобретают новую систему анализа данных в реальном времени для гуманитарных агентств
«Слишком много времени тратится на сбор данных, - объясняют докторант Нью-Йоркского университета Кин Фам и Джулиана Фрейре из CDS в своей статье, написанной в соавторстве, - и недостаточно времени тратится на то, чтобы разобраться в этом». Как мы можем эффективно помочь нуждающимся? Трудная реальность, с которой сталкиваются гуманитарные учреждения, заключается в том, что они не могут немедленно справиться со всеми мировыми кризисами, особенно когда им мешают ограниченные финансовые и..