Публикации по теме 'analytics'


Полное руководство по хакатону для соревнований по науке о данных
Введение Хакатоны - это супер весело! Острые ощущения от поиска решения в условиях ограниченного времени, высокого давления и конкуренции вызывают привыкание. Однако многочисленные ресурсы и различные подходы могут сбивать с толку. И может потребоваться хорошо структурированный подход и ресурсы, чтобы освежить в памяти ключевые концепции перед соревнованиями. Вот почему мы решили предоставить вам полное руководство по хакатонам и методам, которым вы должны следовать перед началом..

Выбор функций фильтрацией: что может пойти не так? (Спойлер: много)
Иллюстрация того, как правильно (и неправильно) выполнять выбор функции с помощью одномерной фильтрации Работа с наборами данных, которые имеют гораздо больше функций, чем количество наблюдений, теперь обычное дело во многих областях, от информатики до психологии. Это обычно называют проблемой «p› n »(где p = количество признаков и n = количество наблюдений),« проклятием размерности »или моим личным фаворитом, работая с« короткими жирными данными ». Традиционные методы, такие как..

Как BiTaksi стала лучшей службой такси, используя мощь данных?
Внедрение новой инфраструктуры данных и разработка платформы данных BiTaksi для алгоритмов машинного обучения. BiTaksi, основанная в 2013 году Назимом Салуром, является лучшей доступной службой вызова такси в Стамбуле и Анкаре. BiTaksi позволяет вам заказывать такси со своего смартфона и помогает перемещаться по городу самым безопасным способом , потому что только лицензированные водители такси могут зарегистрировать его после строгого отбора. Подход, основанный на данных BiTaksi..

Искусственный интеллект: обещание и практика
Каждый год в HIMSS обычно есть одна тема, которая в конечном итоге доминирует на выставочной площадке. Идеи и темы шоу, без сомнения, разнообразны — есть сеансы на все: от ИТ-безопасности до выгорания врачей, от долгосрочного ухода до блокчейна — но каждый год кажется, что индустрия объединяет одно модное слово. В этом году, за несколько недель до шоу, эта тема ясна: искусственный интеллект. Конечно, любые стенды, рекламирующие машинное обучение, глубокое обучение, обработку..

Работа с Млфлов
В этом посте будет показано, как MLFlow можно использовать для управления жизненным циклом машинного обучения. Я расскажу об основных компонентах MLFLow и о том, как их можно использовать. Я установил MLFlow через pip и использую бэкэнд SQLite для выполнения регистрации модели. Классификация IRIS с помощью MLFlow Приведенный ниже сценарий классифицирует цветы из набора данных IRIS, используя функции MLFlow, которые обычно используются в жизненном цикле разработки модели...

MapR использует Kubernetes и контейнеры для отделения вычислений от хранилища
Поставщики платформ больших данных известны разными вещами. Cloudera за то, что она была пионером в деле внедрения Apache Hadoop на предприятиях. Hortonworks (приобретена Cloudera в январе 2019 года) за ее неизменную приверженность открытому исходному коду и Apache Software Foundation. Мега облачный поставщик AWS за масштабирование по требованию и автоматизацию развертываний Hadoop / Spark. И MapR, для своей собственной платформы конвергентных данных, которая, по мнению аналитика..

Соединения SQL: краткий пример
Соединения SQL: краткий пример Понять, почему и как выполняются соединения SQL Изначально это сообщение в блоге было задумано как примечание к моему сообщению Pandas Join vs. Merge . Но он оказался достаточно длинным, чтобы оправдать отдельный пост (и слишком подробным для примечания). Это не должно быть исчерпывающим учебным пособием по SQL-соединениям, а скорее примером, который поможет новичкам в SQL и реляционных базах данных начать понимать, что означает объединение двух..