Публикации по теме 'data'
Мягкое введение в мир Python
Хотя я работал в области данных последние 5 лет, мои обязанности не требовали от меня обучения программированию. Я в основном сосредотачиваюсь на том, чтобы данные были правильно структурированы и эффективно визуализировались.
Кодирование / программирование всегда казалось захватывающим; поэтому я решил узнать о нем побольше. Я прошел несколько курсов по R, но решил продвинуться дальше и стать знатоком Python.
Первым шагом была установка Python ( ссылка для установки python ). Я..
Правильно ли вы разделяете набор данных?
Оценка производительности приложения - это процесс, в котором разделение набора данных является основным этапом.
Определив ситуацию, в которой подходит приложение машинного обучения, с целью оптимизации некоторых технических, операционных или бизнес-процессов и недопущения того, чтобы ваша организация обгоняла конкурентов , мы должны предпринять первые шаги для правильно построить проект.
Сначала это делается путем сосредоточения внимания на доступном наборе данных. По большей..
Как использовать Spark для прогнозирования оттока клиентов
с набором данных Sparkify от Udacity
Обзор
Этот пост представляет собой отчет о моем личном проекте с использованием Spark для прогнозирования оттока клиентов на основе подмножества макета набора данных, предоставленного Udacity, который называется набором данных Sparkify: данные веб-событий приложения, подобного Spotify.
Основная проблема заключается в том, как определить, собирается ли пользователь уйти, и мы должны быть в состоянии идентифицировать его, чтобы предотвратить..
Единство - сила - История модельной композиции
Вступление
Ранее этим летом (август 2020 г.) команды Criteo R&D с гордостью запустили проект под кодовым названием DRACuLa в производство, что значительно повысило производительность нашего движка в наших основных бизнес-кейсах.
Хотя тенденции явно склоняются в сторону «ИИ». (Искусственный интеллект), этот проект демонстрирует, что сочетание более простых методов все еще может победить магию глубоких сетей в определенных случаях.
Бытие - Почему?
С 2010 года машинное обучение (ML)..
Go Cantabular!
Управление национальной статистики Великобритании выбрало Cantabular, чтобы обеспечить гибкое распространение данных переписи 2021 года. Перепись Великобритании - важный проект как по масштабу, так и по бюджету ( оценка переписи 2011 года - 482 миллиона фунтов стерлингов на десятилетие ).
Cantabular разработан для организаций, которые хотят обмениваться статистикой, полученной из конфиденциальных и потенциально идентифицируемых данных, при одновременном обеспечении..
Наука о данных? Почему?
Все началось с моей стажировки в колледже. В то время я думал, что много знаю о данных ...
Пройдя несколько курсов по MS Excel в бизнес-школе, таких как Финансовое моделирование и Visual Basic для приложений, я разбирался в аналитике и данных для создания отчетов и сводных таблиц. Это было, когда я впервые начал работать с данными из реального мира в компании и применять кое-что из того, что я узнал в школе.
Моя карьера началась в компании, входящей в пятерку крупнейших..
Как мы создадим наше поколение, подкованное в науке о данных?
Ничего страшного, наука о данных — самая сексуальная профессия 21 века ( Harvard Business Reviews ), но наше поколение действительно готово разбираться в науке о данных?
Да, очень легко увидеть, как популярность науки о данных растет как ракета.
Но только этот график не только объясняет всю историю. Потому что, когда мы смотрим на топ-5 связанных запросов, мы видим другую сторону истории.
Совершенно очевидно, что существует большой интерес к науке о данных, но, как мы..