Публикации по теме big-data

Публикации по теме 'big-data'

ELTIMS — Акроним новых данных

ETL не покрывает наши современные потребности в данных Каждое утро большинство из нас начинают свой день с проверки телефонов. Мы следим за тем, что происходит в мире, общаемся с друзьями и семьей и смотрим пару видеороликов о кошках. Все эти действия требуют, чтобы в фоновом режиме происходили десятки вещей, включая курирование и загрузку данных, которые обеспечивают то, что мы хотим видеть. В совокупности мы генерируем астрономический объем данных, около 2,5 квинтиллионов байтов в..

Оптимизация массивных вставок MongoDB, загрузка 50 миллионов записей быстрее на 33%!

Оптимизация массивных вставок MongoDB, загрузка 50 миллионов записей быстрее на 33%! вступление Работа со 100 000 — 1 000 000 000 000 000 000 000 000 000 000 000 000 записей базы данных почти не проблема с текущими тарифными планами Mongo Atlas. Вы получаете максимальную отдачу от этого без какой-либо суеты, просто используя достаточное оборудование, просто используйте индексы и разбиение на страницы. Но представьте, что ваш проект недавно получил массивный набор данных о клиентах..

Я хочу положить конец недоеданию в Африке. Вот почему я обращаюсь к большим данным и алгоритмам.

Меня как африканскую женщину и диетолога больше всего огорчает тот факт, что Африка - единственный регион в мире, где масштабы недоедания растут. И это несмотря на миллиарды долларов, которые доноры вложили в этот континент, и бесчисленные вмешательства, в дополнение к обязательствам, взятым на международных саммитах, для решения этой проблемы. Я разочаровался в программах, которые мы поставили, чтобы покончить с недоеданием раз и навсегда. Для меня очевидно, что те, кто давал..

6 советов по ускорению и упрощению MLOps

6 советов по ускорению и упрощению MLOps MLOps (операции машинного обучения) - это ключ к повышению производительности бизнеса за счет внедрения науки о данных в производство. Следовательно, это важно для любой компании, которая хочет получить конкурентное преимущество с помощью ИИ. В этом посте я расскажу о шести советах и передовых методах, которые помогут ускорить и упростить ваш путь к производству, основываясь на моем опыте работы с предприятиями по всему миру. Это обзор моего..

Шесть степеней разделения между любыми двумя наборами данных

Это интересная гипотеза науки о данных, навеянная хорошо известной проблемой шести степеней разделения , утверждающая, что существует связь, включающая не более 6 связей между любыми двумя людьми на Земле, скажем, между вами и кем-либо, кто живет (скажем) в Северная Корея. Здесь связь существует между любыми двумя одномерными наборами данных одинакового размера, скажем, данными A и данными B. Утверждение состоит в том, что существует цепочка, включающая не более 6 промежуточных наборов..

Готово ли ваше предприятие к внедрению ИИ?

С каждым днем компании стремятся автоматизировать свои процессы. Организации внедрили автоматизированные процессы в обслуживании клиентов, производстве, маркетинге, сборе данных и здравоохранении, и это лишь некоторые из них. В основе автоматизации лежит машинное обучение. Машинное обучение — это разновидность ИИ, основанная на концепции, согласно которой системы/машины могут учиться на данных и выявлять шаблоны для принятия решений с минимальным вмешательством человека. Машинное..

Повышение безопасности базы данных: аутентификация ShardingSphere-Proxy

ShardingSphere-Proxy — это прозрачный прокси базы данных, поддерживающий взаимодействие с любым клиентом по протоколам MySQL, PostgreSQL или openGauss. Прокси обеспечивает аутентификацию пользователя и может адаптироваться к различным режимам аутентификации для различных протоколов базы данных. Однако есть вопрос, который редко поднимался и почти не имеет соответствующей проблемы даже в сообществе Github: «Как ShardingSphere-Proxy аутентифицирует своих клиентов?» Примечание. в этом..