Публикации по теме big-data

Публикации по теме 'big-data'

PageRank — не такой уж и секретный соус Google

Хорошо известно, что первоначальная версия поисковой системы Google использовала нечто, называемое PageRank, для ранжирования результатов поиска, но знаете ли вы, насколько прост этот алгоритм? Все, что вам нужно, это матрица смежности, использующая отношения гиперссылок между веб-страницами, а затем вы можете запустить итеративный алгоритм PageRank. Вот реализация на Python: В приведенном выше примере numpy используется для выполнения всех матричных и векторных операций. Вектор P,..

Машинное обучение в социальных сетях

Посмотрите на Оливию. Тот, что в фиолетовой рубашке, говорит о трендах. Скажем, вы хотите добраться до всех Оливий одним махом. Прошли те дни, когда вы сканировали учетные записи вашего бренда в Twitter/Facebook, чтобы узнать, говорит ли Оливия о вас что-то хорошее, и если да, то пытались найти способ, как ей сохранить лояльность к бренду. Теперь повторите это для всех ваших клиентов, говорящих о вас хорошие вещи, и вашего босса, кричащего на вас, чтобы увеличить вашу прибыль. Затем..

Глобальный аппетит к ИИ и динамика пути клиента

1. Персонализация — это неправильное название. При правильном использовании искусственный интеллект позволяет нам персонализировать, не будучи навязчивым. 2. Сейчас намного сложнее влиять на PR и маркетинг, если вы сохраняете традиционный подход и игнорируете ИИ. 3. Крайне важно понять проблемы, которые необходимо решить, чтобы определить, какой метод ИИ лучше всего. 4. Чтобы добиться успеха, нельзя почивать на лаврах. Постоянные исследования и инновации будут иметь ключевое..

10 лучших костюмов на Хэллоуин для науки о данных

Удивите своих друзей и коллег одним из этих креативных костюмов на Хэллоуин, вдохновленных наукой о данных. Случайный лес Это работает только в том случае, если у вас есть компаньоны по науке о данных, которые могут присоединиться к вам в ансамбле. Чтобы этот костюм соответствовал своему названию, вам нужно убедиться в его случайности. Я рекомендую вставать чуть раньше и обматывать себя двусторонним скотчем. Затем воспользуйтесь падающими осенними листьями, погрузившись в..

Тематическое исследование: Онфидо

B2B В чем их дело? Проверка биографических данных на основе машинного обучения. Onfido использует технологию машинного обучения для предоставления более быстрых и точных услуг проверки личности, чем остальная часть довольно устаревшей отрасли, многие из которых все еще используют ручные процессы. Как они используют машинное обучение, чтобы сделать мир лучше? Совместная экономика Быстрые и простые способы проверки заявлений для обеспечения доверия — важнейшего фактора,..

Основные понятия в Spark

Ядро Apache Spark - это базовый механизм выполнения платформы Spark. Все остальные функции построены на этом движке. Он не только предоставляет функции вычисления памяти для повышения скорости, но также предоставляет общую модель выполнения для поддержки различных приложений. Кроме того, пользователи могут использовать Java, Scala и Python API для разработки приложений. Ядро Spark построено на унифицированном абстрактном RDD, который позволяет интегрировать различные компоненты Spark..

Центры обработки данных Microsoft: надежные, эффективные и работающие на большом количестве Linux

Это перепечатка (более или менее) ежедневного информационного бюллетеня ARCHITECHT за вторник. Зарегистрируйтесь здесь , чтобы получать его в свой почтовый ящик каждое утро. Во вторник из Редмонда поступило несколько интересных материалов, в основном связанных с Microsoft Azure и центрами обработки данных, в которых она работает. Они здесь: Microsoft заявляет, что 40% всех виртуальных машин в Azure сейчас работают под управлением Linux (ZDNet): это больше, чем год назад,..