Публикации по теме big-data

Публикации по теме 'big-data'

Чем занимаются сотрудники отдела аналитики данных?

Обзор должностных обязанностей различных профессий, связанных с данными: специалисты по данным / инженеры по данным / аналитики данных и т. д. Итак, либо вы видели сегодня модное слово «большие данные» в заголовках некоторых новостей, либо, может быть, вы один из тех людей, которые притворялись, что все поняли, когда ваш племянник сказал вам…

Квантовые вычисления — будущее (и настоящее) науки о данных и больших данных

В последние годы квантовые вычисления привлекли внимание в различных областях, от физики до техники, информатики, математики и статистики. Наука о данных объединяет статистические методы и алгоритмы для извлечения информации из больших объемов данных для решения сложных реальных проблем. Квантовые вычисления — это область исследований, целью которой является разработка компьютерных технологий, основанных на принципах квантовой теории. Согласно законам квантовой физики, вычислительная..

Сочетание NodeJS и NoSQL. Почему MongoDB — лучший выбор?

Node.js широко используется в веб-приложениях, потому что он позволяет приложению работать, пока оно получает данные с внутреннего сервера. Он асинхронный, управляемый событиями и помогает создавать масштабируемые веб-приложения. Несмотря на то, что Node.js хорошо работает с базой данных MySQL, идеальной комбинацией является NoSQL, такая как MongoDB, в которой схема не обязательно должна быть хорошо структурирована. MongoDB представляет данные в виде набора документов, а не таблиц,..

Шесть бесплатных книг, которые должен скачать каждый аналитик данных

Шесть бесплатных книг, которые должен скачать каждый аналитик данных Вы можете не читать все эти книги, но вы должны иметь их наготове для поиска. В следующих бесплатных книгах подробно описаны многие возможности и функции, которые вы можете выполнять с помощью R. Я рекомендую поместить эти документы в вашу коллекцию ресурсов для использования в будущем при необходимости. Вы можете даже подумать о том, чтобы прочитать несколько. Они очень доступны и отлично работают на электронных..

Смешивание: искусство слияния данных

Слияние данных или интеграция нескольких типов источников данных представляет собой ключевой компонент современного управления информацией. Возможность эффективно объединять различные типы данных открывает новые возможности для анализа данных и может привести к более точным и обоснованным решениям. Однако слияние данных не всегда просто, и в этом процессе возникает множество проблем. В этой статье мы рассмотрим искусство объединения данных, а также методы и соображения, необходимые для..

От нормы к нетрадиционной аналитике: помимо владения, к поиску данных

Шашанк Дубей Соучредитель и руководитель отдела аналитики, Tredence Масштабы больших данных, наводнение данных, 4V данных и все, что между ними… Мы все слышали так много слов, прилагательных к «данным». А многочисленные отчеты и литература подняли словарный запас и интерпретацию данных на совершенно новый уровень. В результате рынок разделился на преувеличений, реализаторов и разрушителей. Кто из них вы? Представьте это! Телеком-гигант решает инвестировать в открытие 200..

Машинное обучение с потоковой передачей Spark

Запуск алгоритмов машинного обучения с использованием Spark Streaming MLlib - это масштабируемая библиотека машинного обучения Apache Spark, состоящая из общих обучающих алгоритмов и утилит. Чтобы продемонстрировать, как мы можем запускать алгоритмы машинного обучения с помощью Spark, я взял простой пример использования, в котором наше приложение Spark Streaming считывает данные из Kafka и сохраняет копию в виде паркетного файла в HDFS. В этом конвейере приема данных мы..