Публикации по теме 'big-data'


Проектирование приложений, интенсивно использующих данные — Разметка
Введение Добро пожаловать в мою шестую статью из серии Проектирование приложений, интенсивно использующих данные . Эта статья вдохновлена ​​одной из лучших книг по инженерии данных: Designing Data Intensive Applications Мартина Клеппманна. В этой главе мы обсудим тему разделения данных. Примечание. Я не получил никакой компенсации за написание этой статьи. Пожалуйста, поддержите мои и чужие публикации, став участником Medium по этой ссылке .

Да, все люди одного уровня находятся в одном кластере.
Да, все люди одного уровня находятся в одном кластере. Моя философия для этой договоренности заключалась в том, что они будут сталкиваться с одними и теми же проблемами и работать над ними вместе. Добавление наставника может ускорить процесс, но процесс обучения в целом замедляется, поскольку есть меньшие препятствия, по которым нужно преодолевать препятствия и тренироваться. Я ожидаю, что люди будут работать как одна команда и делиться ресурсами на одном уровне, чтобы ничто не выглядело..

Управление клиническими испытаниями
Слово «клинические испытания» стало модным словом во время этой пандемической ситуации. Он сыграл решающую роль в разработке вакцины для борьбы с пандемией. В разработку вакцин вносят свой вклад эксперты из разных областей, в том числе (не ограничиваясь ими) клинические исследователи, поставщики медицинских услуг, фармацевтическая промышленность, менеджеры данных, специалисты по биостатистике, специалисты по данным и программисты клинических испытаний. Сбор данных, управление, анализ и..

Почему бизнес не может быть успешным без науки о данных? | Системы ХДата
Enterprise Data Science — ключевая технология, которая может сделать для вашего бизнеса гораздо больше, чем вы думаете. Предприятия собирают больше данных, чем когда-либо прежде. Для бизнеса вполне естественно пытаться использовать эти данные наиболее эффективным способом. Один из способов сделать это — нанять специалиста по корпоративным данным. Enterprise Data Science может сделать для вашего бизнеса гораздо больше, чем вы думаете, и это не обязательно должно быть дорого или..

Определение больших данных: где используются большие данные
Большие данные Данные станут катализатором роста бизнеса. Информационная революция приносит беспрецедентные изменения в то, как мы ведем бизнес и операции. Данные, доступные для бизнеса, сложны для чтения и требуют огромных усилий для монетизации. Но фирмы тратят свои огромные бюджеты на извлечение полезной информации из данных. Данные либо в…

Я реализовал сортировку по основанию в SQLite, и вот результат
SQLite использует внешнюю n-стороннюю сортировку слиянием для сортировки записи, когда вы выполняете инструкцию по порядку без индекса. Я заменил процедуру сортировки слиянием на сортировку по основанию, надеясь асимптотически улучшить производительность сортировки, но результат несколько удивителен. Я протестировал случайно сгенерированный набор данных и выполнил запрос «упорядочить по» для каждого вставленного миллиона строк данных. Больше всего меня поражает то, что даже с 18..

Введение в Hadoop, часть 4
Привет, ребята, В предыдущих статьях мы подробно обсудили компонент основного стека Hadoop (HDFS, YARN, MapReduce) и компоненты стека обработки данных (Apache Pig, Apache HBase, Apache Hive, Apache Cassandra, Apache Spark, Apache Storm, Apache Sqoop и т. д. ). В этой статье мы рассмотрим третий стек эхо-системы Hadoop, который является координирующим стеком. Итак, приступим… Инструменты базового стека Hadoop координируют работу различных сервисов в экосистеме Hadoop. Он..