Публикации по теме 'big-data'


Будущее больших данных
Опрос Gartner показал, что 48% компаний инвестировали в большие данные в 2016 году, и около трех четвертей участников опроса уже инвестировали или собирались инвестировать в аналитику данных. Большие данные помогают компаниям в различных секторах, от маркетинговых до фармацевтических компаний и организаций третьего сектора. В 2018 году было предсказано, что к 2020 году объем данных, необходимых для анализа, удвоится. Forrester заявляет, что компании попытаются продать свои данные...

Почему Python так быстро растет?
Python — это один из самых распространенных языков программирования, который используется в нескольких областях, таких как веб-разработка, автоматизация, наука о данных и машинное обучение. Если вы думаете об изучении нового языка программирования, то Python может быть хорошим выбором, особенно если вы пытаетесь перейти к прибыльной карьере в области науки о данных или машинного обучения. Почему Python так быстро растет? Несмотря на всю свою мощь и гибкость, Python по-прежнему..

Изолированный лес и Писпарк
Уроки выучены Итак, после нескольких запусков реализации Isolation Forest в PySpark ml, представленной здесь , я наткнулся на пару вещей и подумал, что напишу о них, чтобы вы не тратили зря время, которое я тратил на устранение неполадок. Только плотные векторы В предыдущей статье я использовал VectorAssembler для сбора векторов признаков. Так получилось, что имеющиеся у меня тестовые данные были созданы только DenseVectors , но когда я попробовал этот пример на другом наборе..

Почему ИИ не может учиться у публики.
На прошлой неделе Microsoft закрыла свой общедоступный ИИ. платформа под названием Тай . Это имитирующий чат-бот, который пытается вести себя как подросток-миллениал. Он использует машинное обучение, наблюдая за твитами, сделанными молодым поколением, и определяет используемые ключевые слова. Он также создал шаблон для имитации соответствующей структуры предложения. Используя простой трехступенчатый массив, который можно изменить с помощью ИИ. в любое время. Твит Тэя после 24 часов..

КАК ПРЕДОТВРАТИТЬ КРАШКИ В БИЗНЕСЕ С ПОМОЩЬЮ БОЛЬШИХ ДАННЫХ?
Наука о данных объединяет информатику и статистику для решения интересных задач, связанных с интенсивным использованием данных, в промышленности и во многих областях науки. Использование больших данных позволяет компаниям отслеживать различные модели и тенденции, связанные с клиентами. Наблюдение за поведением клиентов важно для стимулирования лояльности, поэтому аналитика больших данных может помочь изменить все бизнес-операции. Системы, которые обрабатывают и хранят большие данные,..

Список проектов + Фрагменты кода оценки
В конце сессии вам необходимо закончить следующее количество проектов 6–4–2 (Микро — Мини — Мажор) Фрагменты алгоритма, которыми необходимо поделиться со мной: Линейная регрессия Кластеризация Классификация дерева решений Обнаружение аномалий Анализ настроений (+ Облако слов) Анализ временных рядов Филотаксис Визуальные элементы — круговая диаграмма/гистограмма/диаграмма Парето/прямоугольная диаграмма и диаграмма с усами/гистограмма/линейные графики и точечные диаграммы..

Использование разрозненных хранилищ данных - путешествие по миру фрагментированных данных
Бин Фан и Амелия Вонг Работая в сфере больших данных и машинного обучения, мы часто слышим от инженеров по обработке данных, что самым большим препятствием на пути извлечения ценности из данных является возможность эффективного доступа к данным. Разрозненные хранилища данных, изолированные островки данных, часто рассматриваются специалистами по обработке данных как главный виновник. В течение многих лет было много попыток решить проблемы, вызванные разрозненностью данных, но эти попытки..