Публикации по теме 'big-data'


Алгоритмическая торговая стратегия Momentum
Использование больших данных, машинного обучения и технических индикаторов для создания надежной алгоритмической стратегии моментальной торговли Вступление Большие данные полностью меняют то, как работают фондовые рынки во всем мире и как инвесторы принимают свои инвестиционные решения. Машинное обучение - практика использования компьютерных алгоритмов для поиска закономерностей в огромных объемах данных - позволяет компьютерам делать точные прогнозы и принимать человеческие..

На дворе почти 2017 год, и вы действительно должны знать о важности науки о данных и ее будущем
Наука о данных представляет собой сложное сочетание нескольких дисциплин, включая технологии, разработку алгоритмов и анализ данных. Основной целью науки о данных является аналитическое решение мультиплексных задач. Как следует из названия, данные лежат в основе этого конкретного типа науки. По своей сути наука о данных — это использование различных систем и процессов, связанных с дисциплинами, которые мы упоминали ранее, для извлечения информации, идей или знаний из данных, доступных..

Манифест данных: почему наука о данных имеет значение?
Манифест данных: почему наука о данных имеет значение? Наука о данных важна. Черт возьми, это достаточно важно, чтобы многие генеральные директора теперь спрашивают своих финансовых директоров или директоров по маркетингу: «Занимаемся ли мы какими-либо большими данными?» И достаточно часто, что даже моя мама знает, что я работаю в «науке о данных». Большинство из нас читали по крайней мере одну историю о компаниях, которые использовали науку о данных для предсказания будущего,..

Большие данные за спиной 40
Крис Вуд // Старший директор, UX Я должен кое-что признать. Последние пару лет я живу двумя жизнями. Первый в качестве специалиста по пользовательскому опыту, решающего сложные задачи анализа больших данных для нескольких различных корпоративных клиентов. Во-вторых, как кроткий владелец ранчо, желающий работать неполный рабочий день в Техас-Хилл-Кантри. Я провел несколько недель за исследованием, проектированием и представлением способов, с помощью которых пользователи могут..

Парсинг Twitter с помощью Clojure
Twitter — популярный ресурс для анализа социальных сетей и обработки естественного языка. Если мы хотим делать эти вещи в Clojure, логично, что нам нужен способ доступа к Twitter. Это простой пример того, как обрабатывать данные Twitter. вступление Первый шаг к работе с Twitter — настройка учетной записи разработчика. Я не буду вдаваться в подробности. В Твиттере есть отличная документация для разработчиков , с которой вам обязательно стоит ознакомиться, и довольно просто создать..

38 важных статей, которые должен прочитать каждый специалист по анализу данных
«Чем больше ты читаешь, тем больше узнаешь. Чем больше вы узнаете, тем больше мест вы пойдете ». - Доктор Сьюз, я могу читать с закрытыми глазами! Первоначально опубликованный Мирко Криванеком на Data Science Central , этот список содержит как внешние, так и внутренние документы, посвященные различным техническим аспектам науки о данных и больших данных. Внешние статьи Bigtable: распределенная система хранения структурированных данных Несколько полезных фактов о машинном..

AWS Athena and Glue: запрос данных S3
AWS Glue - это сервис ETL, который позволяет манипулировать данными и управлять конвейерами данных. В этом конкретном примере давайте посмотрим, как с помощью AWS Glue можно загрузить CSV-файл из корзины S3 в Glue, а затем выполнить SQL-запросы к этим данным в Athena. Вот CSV-файл в корзине S3, как показано ниже - сам набор данных доступен в репозитории GitHub, на который есть ссылка в конце этой статьи. Настройка сканера в AWS Glue Сканер используется для извлечения данных из..