Публикации по теме 'data-mining'


Методы поиска и оптимизации
заметка о курсе Data Mining Формулировка пространства состояний 1. Представление пространства состояний 2. Начальное состояние 3. Операторы 4. Критерии остановки Типы поисковых стратегий: от графа к дереву 1. Систематический (неинформированный) поиск: слепой к баллам напр. DFS, BFS 2. Эвристический (информированный) поиск: рассмотрите значения функции оценки напр. Восхождение на холм, Поиск луча, Ветвь и граница Оптимизация параметров 1. оптимизировать S(θ) в многомерном..

Аналитика больших данных и искусственный интеллект (ИИ)
Информация, генерируемая Интернетом вещей (IoT), должна быть оценена для выявления нереалистичной информации. Данные, генерируемые на порталах электронной коммерции, веб-сайтах, необходимо просеивать для выявления фейковых новостей. Однако фальшивые новости или нереальная информация обычно хорошо скрыты в сложных шаблонах данных. Это еще больше усложняет выявление фейковых новостей. Большинство экспертов по данным считают, что для выявления фейковых новостей можно использовать..

CRISP-DM готов для проектов машинного обучения
CRISP-DM готов для проектов машинного обучения Структурируйте свои проекты машинного обучения, используя сильные стороны хорошо известной модели процесса интеллектуального анализа данных, дополненной ролями и обязанностями. Этот пост был написан в соавторстве с Dr. Бернд Бахманн . Эффективный анализ больших наборов данных с помощью машинного обучения дает организациям конкурентные преимущества за счет получения информации о поведении клиентов, эффективности процессов, влиянии..

Путешествие в интеллектуальный анализ данных
Введение в интеллектуальный анализ данных и машинное обучение Учитывая, что объем данных увеличивается с каждой секундой, люди все больше склоняются к науке о данных и машинному обучению . Чтобы хорошо разбираться в них, необходимы сильные основы в области Data Mining . Понимание Data Science происходит из понимания того, что данные концептуально, как обрабатывать данные, которые нам предоставляются (данные всегда будут разными для каждой проблемы) и как эффективно..

Нет решения для больших данных
При работе с большими данными иногда может казаться, что ты Дон Кихот кидаешься к ветряным мельницам - если «… ты не разбираешься в бизнесе приключений… отойди в сторону и помолись, пока я сражаюсь с [этими гигантами] яростно и жестко. неравный бой ». (из Приключения Дон Кихота Мигеля де Сервантеса Сааведры) Ты не одинок. Большие данные поставили в тупик некоторых из лучших ученых и исследователей. Фактически, компании заработали состояние, управляя большими объемами данных и..

Предварительная обработка больших наборов данных: данные розничной торговли в Интернете с более чем 500 тыс. Экземпляров
Несколько месяцев назад у меня была возможность работать над проектом с огромным набором данных с более чем 500 000 строк ! Честно говоря, это был первый раз, когда мне пришлось обрабатывать безумный объем данных, но я подумал, что было бы весело поиграть с ними и изучить новые методы интеллектуального анализа данных. В этом посте я собираюсь объяснить, как я справился с этой проблемой и в итоге получил чистый набор данных, с которым удобно работать. Также предоставляется код R...

Путеводитель покупателя жилья на Airbnb: Нью-Йорк
С момента своего создания в 2008 году Airbnb был серьезным прорывом в гигантской индустрии гостеприимства, переопределяя статус-кво путешествий для потребителей по всему миру. Соединяя свободные частные жилые помещения с путешественниками с помощью мощной платформы, Airbnb может предложить невероятную ценность по ценам, с которыми отели просто не могут конкурировать. Нью-Йорк - 3-й по величине рынок Airbnb с около 35 тыс. активных объявлений (по состоянию на август 2018 г.)...