Публикации по теме 'data'


Предварительная обработка данных
Слышали ли вы когда-нибудь о термине Мусор в мусоре на выходе ? Я думаю, что все слышали, и то же самое применимо и к алгоритмам машинного обучения. Например: если вы обучаете свою модель машинного обучения с грязными или неполными данными, будет очевидно, что вы получите неточные результаты. И это причина существования термина Предварительная обработка данных . Предварительная обработка данных — это процесс преобразования необработанных данных в значимые данные. Этапы..

Парсинг нескольких страниц веб-сайта электронной коммерции с большим количеством Javascript с помощью Selenium и Beautifulsoup
Введение Веб-скрапинг — это мощный метод сбора данных с веб-сайтов. При работе с современными веб-сайтами электронной коммерции, которые сильно зависят от Javascript и React, парсинг может стать сложной задачей. В этой статье мы покажем, как использовать Selenium и BeautifulSoup для очистки нескольких страниц списков продуктов с веб-сайта электронной коммерции с большим количеством Javascript. Настройка селена Selenium — это популярная библиотека веб-тестирования, которая может..

Изучение взаимодействия между бинарными черными дырами, часть 1 (продвинутая космология)
Подход Пенлеве-II к динамике слияния двойных черных дыр: универсальность из интегрируемости (arXiv) Автор: Хосе Луис Харамильо , Бадри Кришнан Вывод: Волна слияния бинарных черных дыр проста и универсальна. Принимая эффективное асимптотическое описание динамики, мы стремимся объяснить такую ​​универсальность в терминах базовых (эффективных) интегрируемых структур. Более конкретно, с точки зрения «среднего течения волны» мы предлагаем, чтобы быстрые степени свободы,..

Чтобы поймать гурмана после наступления темноты   — «Открытие закусочной в ночной жизни Сиднея»
Управляемое данными тематическое исследование Оссамы Моголов Введение С тех пор, как в 2014 году был принят Сиднейский закон о локаутах , интересным предметом изучения стала ночная экономика самого известного города Австралии. Из-за локаута в 1:30 и последней выпивки в 3:00 в барах, пабах и клубах в развлекательных районах Сиднея (таких как Кингс-Кросс) для сдерживания насилия, вызванного алкоголем и наркотиками, эти предприятия пострадали от снижения торговли и спроса. Учитывая,..

Что такое наука о данных?
Область науки о данных связана с выводами и информацией из данных. Для оценки и понимания сложных наборов данных эта междисциплинарная область объединяет части компьютерных наук, статистики и предметных знаний. Для получения информации и создания прогнозов на основе данных специалисты по данным используют ряд инструментов и методов, включая статистический анализ, машинное обучение и визуализацию данных. Наука о данных часто включает в себя множество важных процессов. Данные получают..

50 вопросов по SQL-запросам с примерами кода — часть III
Добро пожаловать в третью часть 50 вопросов SQL с примером кода. В этом посте мы увидим все вопросы по оконным функциям. Мы узнаем, как их использовать и где их использовать для построения запросов. Давайте начнем, а прямо перед этим, если вы еще не ознакомились с Частью I и II, пожалуйста, ознакомьтесь с ней здесь ЧАСТЬ-I и ЧАСТЬ-II Мы начнем с создания набора данных. Вместо нескольких таблиц и наборов данных мы создадим одну таблицу и создадим несколько вопросов вокруг нее...

Мне задавали один и тот же вопрос в 12 интервью с аналитиками данных  — «Как ответить»
Несмотря на то, что он не был техническим, это был простой, но важный вопрос для проверки того, как кандидаты взаимодействуют с исходными данными. До того, как приступить к своей нынешней должности, как и большинство новых выпускников, после почти двух лет обучения в аспирантуре я прошел где-то от 10 до 15 собеседований на должности аналитика данных (хотя, для справки, в итоге я работал инженером данных). Хотя большинство вопросов были простыми, я начал замечать…