Публикации по теме 'big-data'


Большой против умного
В настоящее время большие данные считаются важнейшим элементом создания конкурентных преимуществ бизнеса независимо от отрасли. Однако в мире данных больше не обязательно значит лучше. Бесчисленное количество компаний сталкивается с огромной проблемой: перегрузкой данных. И согласно http://www.forbes.com/sites/bernardmarr/2016/04/28/big-data-overload-most-companies-cant-deal-with-the-data-explosion/&refURL=&referrer= #63186446392 0'..

Точность демографии пользователей SocialBook.
Точность демографических данных youtuber в SocialBook . Я получил много запросов о том, как мы прогнозируем демографические данные для влиятельных лиц YouTube и насколько они точны. И я заметил, что есть некоторые другие платформы, утверждающие, что они также могут предсказывать демографические данные. Итак, позвольте мне сделать здесь некоторое объяснение / сравнение. Мы знаем, что с разрешения YouTube мы можем получить официальные демографические данные из API данных YouTube, и..

Наша история - радар
Следуйте за нами в нашем путешествии по данным Аналитика данных, большие данные, временной анализ, алгоритмы кластеризации, машинное обучение, искусственный интеллект, текстовая аналитика, NLP, NLG, анализ настроений, прогнозные модели, визуализации, нейронные / сущностные сетевые графы, контекстная аналитика на основе данных Эти слова действительно звучат круто, и мы тоже так думали в 2011 году. Да, мы хотели изменить мир , как и все другие стартапы, но мы также хотели создать..

О равном будущем
Equal Future доступен в виде бесплатного еженедельного информационного бюллетеня. Вы можете зарегистрироваться здесь. Equal Future — это ресурс о социальной справедливости и технологиях — веб-сайт и информационный бюллетень, издаваемые Upturn при поддержке Фонда Форда . В эпоху быстрых технологических изменений с трудом добытые победы сообщества социальной справедливости находятся под угрозой. Ключевые практические средства защиты наших гражданских прав — от судебных дел,..

Советы по достижению успеха с большими данными в науке о данных
Большие данные становятся все больше и полезнее. Некоторые компании разместили данные до того, как смогли их использовать, а теперь пожинают плоды. Реальность такова, что большие данные будут продолжать расти. Находятся ли ваши данные в электронной таблице , базе данных , хранилище данных , файловых системах с открытым исходным кодом . как Hadoop или во всех других, вам нужна гибкость, чтобы быстро подключаться к данным и консолидировать их. Не обращайте внимания на..

Масштабирование итерационных алгоритмов в Spark
Итерационные алгоритмы широко применяются в машинном обучении, связанных компонентах, ранжировании страниц и т. Д. Эти алгоритмы усложняются с итерациями, размер данных на каждой итерации и обеспечение отказоустойчивости на каждой итерации - непростая задача. В этой статье я бы подробно остановился на некоторых соображениях по работе с этими проблемами. Мы использовали Spark для реализации нескольких итеративных алгоритмов, таких как создание подключенных компонентов, обход больших..

MapR использует Kubernetes и контейнеры для отделения вычислений от хранилища
Поставщики платформ больших данных известны разными вещами. Cloudera за то, что она была пионером в деле внедрения Apache Hadoop на предприятиях. Hortonworks (приобретена Cloudera в январе 2019 года) за ее неизменную приверженность открытому исходному коду и Apache Software Foundation. Мега облачный поставщик AWS за масштабирование по требованию и автоматизацию развертываний Hadoop / Spark. И MapR, для своей собственной платформы конвергентных данных, которая, по мнению аналитика..