Публикации по теме 'big-data'


Что такое базы данных NewSQL? : Гаечный ключ, Аврора, CockroachDB и TiDB
Традиционно мы использовали единые монолитные базы данных SQL для обеспечения гарантии транзакций и согласованности (ACID) и сценариев использования OLTP. Под монолитностью я имею в виду, что база данных может размещаться только на одном отдельном сервере и может масштабироваться только по вертикали за счет добавления дополнительного оборудования на тот же сервер, а НЕ масштабируется по горизонтали. Этот подход был нежизнеспособен, поскольку раньше он привлекал высокие затраты на..

5 практических применений ИИ
Почему ИИ более доступен, чем когда-либо прежде Ажиотаж вокруг современных технологий искусственного интеллекта огромен. Через день вы читаете заголовки, рекламирующие беспилотные автомобили и устройства для чтения мыслей. Ни для кого не секрет, что компании изобретают невероятные продукты. Но акцент средств массовой информации на передовых технологиях может сделать искусственный интеллект недоступным для обычных людей и бизнеса. Менее рекламируемая сторона ИИ показывает, что он на..

Линейная регрессия: что такое сумма квадратов?
Более пристальный взгляд на понимание того, почему сумма квадратов важна для науки о данных Недавно я написал статью о линейной регрессии и о том, как она используется в науке о данных. В качестве общего обзора я не слишком углублялся в инструменты или методы, которые использует линейная регрессия. Одним из таких инструментов является сумма квадратов. Сначала я собирался написать просто краткое пояснение в предыдущей статье. Однако существует несколько различных формул, используемых..

Типы архитектуры платформы данных
Насколько хорошо это отвечает потребностям вашего бизнеса? Дилемма выбора. Легко заблудиться в изобилии инструментов обработки данных, доступных на рынке прямо сейчас. В Интернете полно самоуверенных историй (часто спекулятивных) о том, какие инструменты данных использовать и как сделать наш стек данных современным в этом конкретном году . Какие инструменты обработки данных лучше всего? Кто лидер? Как выбрать правильные? Эта история для тех, кто находится в «космосе» и строит..

Streamlit против Dash против Shiny против Voila против Flask против Jupyter
Сравнение инструментов и фреймворков для мониторинга данных Панели данных - инструменты и библиотеки Практически каждая компания использует ценные данные, которые необходимы внутренним командам для анализа. Нетехнические команды часто запрашивают инструменты, чтобы упростить эту задачу. Вместо того, чтобы приставать к специалисту по данным для каждого запроса, этим командам нужны динамические панели мониторинга, на которых они могут легко выполнять запросы и просматривать..

Пространственная аналитика: основная инфраструктура современного ИТ-мира.
Пространственная аналитика , как и ГИС, считается базовой инфраструктурой современного ИТ-мира. Наука о данных — самая быстрорастущая профессия, возможности которой растут в геометрической прогрессии из года в год. Руководители корпораций во всех секторах и государственные деятели пришли к пониманию того, насколько эффективным может быть пространственный анализ в процессе принятия решений в бизнесе и обществе, обеспечивая дополнительный уровень понимания. Широкое использование..

Начало работы с Apache Spark — I
Серия статей, которые помогут вам начать работу с Apache Spark! Определение больших данных С постепенным увеличением распределенных вычислений, вычислительной мощности и множества вариантов хранения, появившихся в последнее десятилетие, термин «большие данные» стал широко использоваться. Что такое большие данные и какие данные можно назвать большими данными? По сути, мы можем описать это, используя Объем 3V Объем генерируемых данных (измеряется в байтах, мегабайтах,..