Публикации по теме 'analytics'


PySpark DataFrame 101: начало работы с PySpark DataFrames
Введение в PySpark PySpark — это библиотека Python, которая предоставляет API Python для Apache Spark и позволяет выполнять обработку и анализ данных в масштабе. PySpark DataFrames — это распределенная коллекция данных, организованная в именованные столбцы, подобно таблице в реляционной базе данных. PySpark DataFrame PySpark DataFrames предназначены для обработки больших наборов данных, требующих распределенной обработки на нескольких компьютерах. Они оптимизированы для..

Измените сбор данных, чтобы ускорить аналитику в реальном времени
И оптимизируйте свои конвейеры Нет ничего нового в том, что стартапы используют большие данные и искусственный интеллект для разработки более инновационных бизнес-моделей. В результате вопросы больших данных и искусственного интеллекта широко обсуждались на исполнительных и технических форумах. Но они часто обсуждались на таком высоком уровне, что люди в конечном итоге упускали детали строительных блоков таких компаний. В этой статье я расскажу об одном из самых ценных строительных..

Четыре шага по удалению отходов аналитики
Ускорьте принятие решений за счет удаления отходов аналитики Подумайте о роли аналитики в процессе принятия решений в вашей организации. Вам кажется, что аналитика используется эффективно или результативно? Или вы видите, как тратится драгоценное время и ресурсы? В экономике, где менеджеры теряют более полумиллиона дней в году из-за неэффективного принятия решений , возможности сокращения потерь огромны на всех уровнях. Вы не одиноки, когда подозреваете, что ваша организация..

Прочтите это, прежде чем использовать ROC-AUC в качестве метрики.
Ни одна метрика не идеальна. Поймите, что метрика скрывает и продвигает. Когда мера становится целью, она перестает быть хорошей мерой — закон Гудхарта Когда вы улучшаете метрику, вы в первую очередь улучшаете то, что благоприятствует метрике. Поскольку никакая метрика не может измерить все, слепая погоня за ней может быть опасной. Я хочу изучить, что это значит для ROC-AUC. Кривая рабочих характеристик приемника или кривая ROC используется для оценки бинарных классификаторов...

Причинно-следственная связь и моделирование подъема
Путь к более эффективным маркетинговым стратегиям начинается с всестороннего анализа вашей текущей клиентской базы. Этот анализ является краеугольным камнем сегментации по похожим признакам, мощного метода, который революционизирует то, как компании достигают своей целевой аудитории. Понимание клиентской базы: Путешествие начинается с углубленного анализа существующего пула клиентов. Алгоритмы машинного обучения глубоко изучают профили и поведение этих клиентов, причем не только..

Машинное обучение в сфере здравоохранения
Индустрия здравоохранения является неотъемлемой частью нашей жизни, и в последнее время, когда коронавирус атаковал мир, эта отрасль доказала, что хорошая система здравоохранения может быть сильной стороной любой страны. Несмотря на то, что отрасль здравоохранения до сих пор развивалась, остается много проблем, которые необходимо решить для укрепления отрасли здравоохранения, и именно здесь на сцену выходит машинное обучение. Машинное обучение в настоящее время является трендовой..

Data Musings - Какова цель этого блога?
Я люблю возиться с данными. В этом блоге я получу доступ к открытым данным и попытаюсь извлечь некоторые значимые идеи. Вещи, которые я использую и понимаю: R, d3.js, python, SQL Вещи, которые я сейчас изучаю: Hadoop Вещи, которые я хочу понять: "Машинное обучение", пытаясь разобраться в этой неуловимой науке Буду рад услышать ваше мнение о моих статьях. Со мной можно связаться по адресу: [email protected] Аншуман Гупта | LinkedIn..