Публикации по теме 'big-data'
Как интерпретировать линейную модель
Как интерпретировать линейную модель
Линейная регрессия - мощный инструмент науки о данных, с которым вам обязательно нужно ознакомиться. Если нет, ничего страшного ... Прочтите статью здесь за прошлую неделю, чтобы получить хорошее представление о теме и сценарии ее использования.
Итак, вы хотите описать линейную связь между набором функций и результатом. Вы решаете, что линейная регрессия - это ваш план атаки, и загружаете Rstudio или ваш любимый редактор Python. Затем вы..
Анализ основных компонентов: секретная техника воина дракона (ученого по данным)
Как начинающий специалист по данным, вы обычно работаете с наборами данных, которые (возможно, неожиданно) относительно малы. Например, набор данных с 20 столбцами и 40 000 строк кажется новичку довольно большим; однако это песчинка на пляже с точки зрения того, что возможно. Нередко на более высоком уровне данных приходится иметь дело с сотнями столбцов и сотнями миллионов строк.
В небольшом масштабе можно проверять ваши данные столбец за столбцом и принимать разумные решения о том,..
Воскресный брифинг D4S #75
ВЫПУСК №75
Воскресный брифинг D4S #75
Еженедельный информационный бюллетень с последними разработками в области науки о данных, машинного обучения и искусственного интеллекта.
1 ноября 2020 г.
Дорогие друзья, Добро пожаловать в воскресный брифинг, посвященный выходным в честь Хэллоуина.
Мы с гордостью сообщаем о публикации последней записи в блоге из серии Причинно-следственная связь , в которой мы освещаем Формулу корректировки , способ, которым мы можем рассчитать эффекты..
Граф нейронной сети простыми словами
Сегодня в нашем цифровом мире изображения и видео повсюду, теперь мы привыкли тренировать свой мозг с помощью изображений и видео, доступных в нашей работе и повседневной жизни. Когда мы находимся на нашей любимой платформе социальных сетей, создается график наших родственников, друзей, симпатий и антипатий, который представляет межличностные отношения.
Интеллектуальный анализ правил ассоциаций: искусство обнаружения ценных ассоциаций в интеллектуальном анализе данных
Ключевые слова: анализ ассоциативных правил, глубокое обучение, машинное обучение, искусственный интеллект, анализ данных, наука о данных.
Интеллектуальный анализ данных — это процесс извлечения значимой информации из больших объемов данных. Этот процесс используется для поддержки бизнес-решений, выявления тенденций и понимания поведения клиентов. Интеллектуальный анализ правил ассоциации играет решающую роль в этом процессе интеллектуального анализа данных. Интеллектуальный анализ..
Как настроить среду для Spark
Инженерия данных
Как настроить среду для Spark
Spark — это очень популярная платформа для работы с большими данными с открытым исходным кодом, которую используют многие компании отрасли. Здесь я хочу показать вам, как настроить среду Spark на компьютере с Linux (я использую Ubuntu 20.04.3 ).
Монтаж
Вот список того, что нам нужно установить:
JDK ИДЕЯ Скала Искра PySpark (необязательно) Хадуп
1. ДДК
JDK — это сокращение от Java Development Kit, среды разработки для..
Сочетание возможностей Hadoop, Spark и машинного обучения: мой путь
В сегодняшнюю цифровую эпоху данные — это постоянно растущий объект, который растет экспоненциально каждую секунду. Задача состоит не в том, чтобы агрегировать данные, а в том, чтобы эффективно использовать их для получения практических выводов. Чтобы вооружиться навыками, необходимыми мне для путешествия по этому огромному ландшафту, я отправился в образовательное путешествие и записался на два сложных курса, предлагаемых IBM Skills Network на Coursera. Курсы под названием «Введение в..