Публикации по теме 'data'


Мягкое введение в мир Python
Хотя я работал в области данных последние 5 лет, мои обязанности не требовали от меня обучения программированию. Я в основном сосредотачиваюсь на том, чтобы данные были правильно структурированы и эффективно визуализировались. Кодирование / программирование всегда казалось захватывающим; поэтому я решил узнать о нем побольше. Я прошел несколько курсов по R, но решил продвинуться дальше и стать знатоком Python. Первым шагом была установка Python ( ссылка для установки python ). Я..

Правильно ли вы разделяете набор данных?
Оценка производительности приложения - это процесс, в котором разделение набора данных является основным этапом. Определив ситуацию, в которой подходит приложение машинного обучения, с целью оптимизации некоторых технических, операционных или бизнес-процессов и недопущения того, чтобы ваша организация обгоняла конкурентов , мы должны предпринять первые шаги для правильно построить проект. Сначала это делается путем сосредоточения внимания на доступном наборе данных. По большей..

Как использовать Spark для прогнозирования оттока клиентов
с набором данных Sparkify от Udacity Обзор Этот пост представляет собой отчет о моем личном проекте с использованием Spark для прогнозирования оттока клиентов на основе подмножества макета набора данных, предоставленного Udacity, который называется набором данных Sparkify: данные веб-событий приложения, подобного Spotify. Основная проблема заключается в том, как определить, собирается ли пользователь уйти, и мы должны быть в состоянии идентифицировать его, чтобы предотвратить..

Единство - сила - История модельной композиции
Вступление Ранее этим летом (август 2020 г.) команды Criteo R&D с гордостью запустили проект под кодовым названием DRACuLa в производство, что значительно повысило производительность нашего движка в наших основных бизнес-кейсах. Хотя тенденции явно склоняются в сторону «ИИ». (Искусственный интеллект), этот проект демонстрирует, что сочетание более простых методов все еще может победить магию глубоких сетей в определенных случаях. Бытие - Почему? С 2010 года машинное обучение (ML)..

Go Cantabular!
Управление национальной статистики Великобритании выбрало Cantabular, чтобы обеспечить гибкое распространение данных переписи 2021 года. Перепись Великобритании - важный проект как по масштабу, так и по бюджету ( оценка переписи 2011 года - 482 миллиона фунтов стерлингов на десятилетие ). Cantabular разработан для организаций, которые хотят обмениваться статистикой, полученной из конфиденциальных и потенциально идентифицируемых данных, при одновременном обеспечении..

Наука о данных? Почему?
Все началось с моей стажировки в колледже. В то время я думал, что много знаю о данных ... Пройдя несколько курсов по MS Excel в бизнес-школе, таких как Финансовое моделирование и Visual Basic для приложений, я разбирался в аналитике и данных для создания отчетов и сводных таблиц. Это было, когда я впервые начал работать с данными из реального мира в компании и применять кое-что из того, что я узнал в школе. Моя карьера началась в компании, входящей в пятерку крупнейших..

Как мы создадим наше поколение, подкованное в науке о данных?
Ничего страшного, наука о данных — самая сексуальная профессия 21 века ( Harvard Business Reviews ), но наше поколение действительно готово разбираться в науке о данных? Да, очень легко увидеть, как популярность науки о данных растет как ракета. Но только этот график не только объясняет всю историю. Потому что, когда мы смотрим на топ-5 связанных запросов, мы видим другую сторону истории. Совершенно очевидно, что существует большой интерес к науке о данных, но, как мы..