Публикации по теме 'big-data'


Как интерпретировать линейную модель
Как интерпретировать линейную модель Линейная регрессия - мощный инструмент науки о данных, с которым вам обязательно нужно ознакомиться. Если нет, ничего страшного ... Прочтите статью здесь за прошлую неделю, чтобы получить хорошее представление о теме и сценарии ее использования. Итак, вы хотите описать линейную связь между набором функций и результатом. Вы решаете, что линейная регрессия - это ваш план атаки, и загружаете Rstudio или ваш любимый редактор Python. Затем вы..

Анализ основных компонентов: секретная техника воина дракона (ученого по данным)
Как начинающий специалист по данным, вы обычно работаете с наборами данных, которые (возможно, неожиданно) относительно малы. Например, набор данных с 20 столбцами и 40 000 строк кажется новичку довольно большим; однако это песчинка на пляже с точки зрения того, что возможно. Нередко на более высоком уровне данных приходится иметь дело с сотнями столбцов и сотнями миллионов строк. В небольшом масштабе можно проверять ваши данные столбец за столбцом и принимать разумные решения о том,..

Воскресный брифинг D4S #75
ВЫПУСК №75 Воскресный брифинг D4S #75 Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта. 1 ноября 2020 г.​ Дорогие друзья, ​ Добро пожаловать в воскресный брифинг, посвященный выходным в честь Хэллоуина. Мы с гордостью сообщаем о публикации последней записи в блоге из серии Причинно-следственная связь , в которой мы освещаем Формулу корректировки , способ, которым мы можем рассчитать эффекты..

Граф нейронной сети простыми словами
Сегодня в нашем цифровом мире изображения и видео повсюду, теперь мы привыкли тренировать свой мозг с помощью изображений и видео, доступных в нашей работе и повседневной жизни. Когда мы находимся на нашей любимой платформе социальных сетей, создается график наших родственников, друзей, симпатий и антипатий, который представляет межличностные отношения.

Интеллектуальный анализ правил ассоциаций: искусство обнаружения ценных ассоциаций в интеллектуальном анализе данных
Ключевые слова: анализ ассоциативных правил, глубокое обучение, машинное обучение, искусственный интеллект, анализ данных, наука о данных. Интеллектуальный анализ данных — это процесс извлечения значимой информации из больших объемов данных. Этот процесс используется для поддержки бизнес-решений, выявления тенденций и понимания поведения клиентов. Интеллектуальный анализ правил ассоциации играет решающую роль в этом процессе интеллектуального анализа данных. Интеллектуальный анализ..

Как настроить среду для Spark
Инженерия данных Как настроить среду для Spark Spark — это очень популярная платформа для работы с большими данными с открытым исходным кодом, которую используют многие компании отрасли. Здесь я хочу показать вам, как настроить среду Spark на компьютере с Linux (я использую Ubuntu 20.04.3 ). Монтаж Вот список того, что нам нужно установить: JDK ИДЕЯ Скала Искра PySpark (необязательно) Хадуп 1. ДДК JDK — это сокращение от Java Development Kit, среды разработки для..

Сочетание возможностей Hadoop, Spark и машинного обучения: мой путь
В сегодняшнюю цифровую эпоху данные — это постоянно растущий объект, который растет экспоненциально каждую секунду. Задача состоит не в том, чтобы агрегировать данные, а в том, чтобы эффективно использовать их для получения практических выводов. Чтобы вооружиться навыками, необходимыми мне для путешествия по этому огромному ландшафту, я отправился в образовательное путешествие и записался на два сложных курса, предлагаемых IBM Skills Network на Coursera. Курсы под названием «Введение в..