Публикации по теме 'big-data'


Python vs Scala… Что выбрать при работе с Apache Spark?
Согласно Википедии, Apache Spark — это унифицированный аналитический механизм с открытым исходным кодом для крупномасштабной обработки данных. Важным решением для специалистов по работе с большими данными или инженеров по обработке данных является выбор языка для обработки данных. К счастью, Spark предоставляет API для разработки для Scala, Python, Java и R. Помимо всех этих API, Python и Scala являются наиболее популярными. Часто мы слышим вопросы типа: стоит ли использовать..

Кластеризация
Важными темами для нас являются аналитика в сфере здравоохранения и интеллектуальный анализ данных. Приложения для здравоохранения и медицинские данные пересекаются с наукой о данных и аналитикой больших данных. Понимание алгоритмов обработки больших данных. Эта статья является частью серии статей на тему Большие данные для курса информатики здравоохранения Вы можете перейти по ссылке выше, чтобы понять эту тему в контексте полного курса. Эту статью о кластеризации можно понять..

AI SERIES: На заре новой формы человеческого интеллекта
AI SERIES: На заре новой формы человеческого интеллекта Создание гибридного мышления на основе ИИ С момента появления первых приматов на Земле около 55 миллионов лет назад эволюция мозга развивалась в соответствии с довольно плоской линейной прогрессией. Затем, около 2 миллионов лет назад, когда эволюционная линия, ведущая к гомининам, наконец обозначилась, а Homo Habilis делал свои первые шаги, скорость роста объема его черепа внезапно начала экспоненциально увеличиваться примерно..

Как мы понимаем заявки на получение кредита с помощью машинного обучения?
Я всегда был большим поклонником интеллектуального обучения на основе данных и выявления потенциальных закономерностей в наборах данных. Современные финансовые данные стали огромным источником информации для интеллектуального анализа данных. В случае моделирования рисков машинное обучение использовалось для прогнозирования способности заявителей погасить свои кредиты. В этом семестре наша команда провела прогностическую модель, чтобы понять, как различные характеристики заявителей могут..

Потоковые данные IoT идут к собакам
Интернет вещей (IoT) с его повсеместными датчиками и потоками массивных данных для масштабного понимания имеет оценочную рыночную стоимость почти в 2 триллиона долларов. По-видимому, сенсоризация мира — это серьезное дело, позволяющее получить представление о людях, процессах и продуктах в почти непостижимом масштабе. Конечно, 2 триллиона долларов — это почти непостижимая цифра. Ожидается, что соответствующие прогнозы для основанных на данных данных, которые приводят к такой оценке,..

Машинное обучение долгое не очень техническое чтение.
Устройства, простота в использовании, современные технологии, Интернет, оперативность — вот некоторые из терминов, которые люди и мы постоянно использовали для обозначения того, что происходит сегодня, в другие времена технологии были далекими даже от басен и историй, которых следует опасаться, роботы, которые закончились с планетой, они похитили людей и разрушили целые города лазерными лучами, которые исходили из их глаз, эти упоминания приходят как очень небольшая часть..

РАСШИРЕННАЯ АНАЛИТИКА: БУДУЩЕЕ БИЗНЕС-АНАЛИТИКА
В этой статье рассматривается использование дополненной аналитики с помощью машинного обучения (ML) и естественного языка обработки (NLP) для повышения >Бизнес-аналитика (BI), совместное использование данных и аналитика данных с использованием концепции анализа больших данных. ВВЕДЕНИЕ Расширенная аналитика — это использование машинного обучения (ML) и обработки естественного языка (NLP) для улучшения бизнес-аналитики (BI), обмена данными и анализа данных. Программное..