Публикации по теме 'data'


Типы данных
Говорят, что специалист по данным — это «самая сексуальная должность в 21 веке». Почему это такая востребованная должность в наши дни? Короткий ответ заключается в том, что за последнее десятилетие произошел массовый взрыв данных, генерируемых и сохраняемых компаниями, а также вами и мной. Иногда мы называем это «большими данными», и нам хочется анализировать, извлекать закономерности, делать выводы, делать прогнозы с огромным количеством данных, лежащих вокруг. Специалисты по..

Цифровая сантехника: интеграция данных в эпоху ИИ
Эта запись блога является первой в серии статей об интеграции данных. Они предназначены для начинающих Data Scientist или Enterprise Manager, которые хотят иметь представление о том, что интеграция данных может принести «результат». Введение Большинство статей, которые публикуются о науке о данных и машинном обучении, будут в основном о «сексуальной» стороне; обычно строят модели с использованием новейших технологий, разработанных Google, Facebook или известными исследователями..

Стратегия данных — Каждый бизнес должен стать бизнесом данных
Теперь каждая компания — это компания данных, данные меняют наш мир. По мере того, как мир становится все умнее и умнее, данные становятся ключом к конкурентному преимуществу, а это означает, что способность компании конкурировать будет все больше зависеть от того, насколько хорошо мы организуем и используем наши данные, а также применяем аналитику и новые технологии. Стратегия данных может охватывать все три области: принятие решений, операции и монетизация. Использование данных для..

Предотвращение утечки данных в вашей модели машинного обучения
Все, что вам нужно знать о предотвращении утечки данных при построении модели машинного обучения. Проблема утечки данных Алгоритмы машинного обучения создают модели, которые предсказывают и классифицируют данные. Обычно рекомендуется сначала разделить доступный набор данных на два подмножества обучающих и тестовых данных. После этого модель обучается с использованием обучающей выборки, и ее успех измеряется путем сравнения ее производительности с ее производительностью с тестовым..

Мой год в данных: визуальное отражение 2019 года
Я отслеживал свои действия в течение года. Затем я визуализировал их. Вот что я узнал. Если вы скрываетесь в тени мира данных, то вы, несомненно, знакомы с подобными упражнениями. Приложения для здоровья и продуктивности предлагают больше способов отслеживать ежедневные данные, чем когда-либо прежде. Поскольку люди от природы одержимы количественной оценкой, многие специалисты по визуализации данных использовали ее как упражнение для размышлений. Это был мой 2019 год . Это был..

Данные как код - принципы, что это такое и почему сейчас?
Этот пост является частью небольшой серии, начинающейся с: Данные как код - устранение производственных дефектов для наборов данных Google Analytics . Данные как код - это простая концепция. Так же, как Инфраструктура как код . Он просто говорит: Обращайтесь с вашими данными как с кодом . И все же, после того как IaC появилась на Радаре ThoughtWorks в 2011 году , потребовалось около 10 лет, чтобы освоиться , и все еще находится в непростой ситуации, когда сторонники IaC..

Введение в дискретизацию в науке о данных
Введение в методы дискретизации для специалистов по данным Разработка функций: 4 метода дискретизации, которые необходимо изучить. Дискретизация - это процесс, с помощью которого мы можем преобразовывать непрерывные переменные, модели или функции в дискретную форму. Мы делаем это, создавая набор смежных интервалов (или бинов), которые проходят через диапазон нашей желаемой переменной / модели / функции. Непрерывные данные измеряются, а дискретные данные - Подсчитано...