Публикации по теме 'big-data'


Еженедельник по инженерии данных № 1
Конфиденциальность часто задним числом развивается в мире данных. Существует множество способов предать чью-то личную жизнь, но они очевидны в большинстве повседневных ситуаций. The New York Times написала свое мнение о конфиденциальности данных. Этот пост представляет собой хороший обзор конфиденциальности, полезных ссылок и того, какие шаги предпринимает NYT в маркетинге и рекламе конфиденциальности своих пользователей. Как The New York Times думает о вашей..

Вывод в машинном обучении и глубоком обучении: что это такое? Как это использовать? Полное руководство 2023
Вывод — это логическая операция, основанная на индукции. Вывод в машинном обучении и глубоком обучении направлен на создание эффективных прогнозов на основе обученной модели обучения. Что такое вывод машинного обучения? В машинном обучении (или автоматизированном обучении) фаза вывода относится к выполнению модели ИИ после того, как она была обучена на наборе обучающих данных, а затем проверена на наборе проверочных данных. Следовательно, это относится к развертыванию модели и..

Данные — это не новая нефть, это новая почва
Ганеша Субраманьяна Если мы заходим в любой конференц-зал или на лекцию, в наши дни нередко можно услышать « данные — самый ценный ресурс » и « данные — новая нефть ». Я тоже участвовал в этой аналогии. В конце концов, после работы со многими организациями с данными и решениями для прогнозирования будущего, наше понимание сильно отличается от этой так называемой простой аналогии. Давайте посмотрим на фундаментальный недостаток этой аналогии и на то, как он может повлиять на наши..

Почему Apache Spark является противоядием от обработки данных разных поставщиков
Ландшафт больших данных с открытым исходным кодом эволюционировал. Сегодня организации имеют доступ ко всему спектру инструментов для быстрой и эффективной обработки огромных объемов данных. Среди множества технологий с открытым исходным кодом, обеспечивающих непревзойденные возможности обработки данных, одна выделяется как лидер — Apache Spark TM. Apache Spark получает признание на предприятиях благодаря своей скорости, итеративным вычислениям и лучшему доступу к данным. Но для..

У вас есть все эти данные, что теперь?
У вас есть все эти данные, что теперь? Как говорится в одном из этих современных клише, данные - это нефть современного мира. Но это не только означает потенциальную прибыль, обнаруженную в данных. Прежде всего, это означает понимание того факта, что как необработанная сырая нефть относительно бесполезна, так и непроанализированные данные. Вот почему многие МСП хранят огромные объемы данных в различных системах или устаревших хранилищах данных. Однако это имеет смысл, поскольку..

Создание конвейера транзакционных данных с инкрементной загрузкой данных на AWS  —  Часть 1
Использование базы данных MySQL и сервисов AWS Транзакционные базы данных являются фундаментальным инструментом в мире управления данными. Эти типы баз данных предназначены для обработки больших объемов данных и обеспечивают надежный способ хранения и извлечения информации. Термин «транзакция» относится к группе связанных баз данных…

От простого к сложному: могут ли машины учиться, как люди?
Профессор Хонг Ю объясняет теорию отклика на предмет на нашем семинаре по НЛП и тексту как данным. На семинаре «НЛП и текст как данные», который состоялся в прошлый четверг, профессор Хун Ю из Медицинской школы Массачусетского университета рассказала об усилиях, которые она вместе со своими коллегами приложила для включения человеческого интеллекта и когнитивных функций для улучшения глубокого обучения с помощью новых моделей. Например, в статье «Построение оценочной шкалы с..