Публикации по теме 'data-mining'


Процесс интеллектуального анализа данных
Искусственному интеллекту не хватает важных аспектов человеческого интеллекта По сей день простая загрузка кучи данных даже в самую продвинутую машину вряд ли вернет вам что-нибудь значимое, не говоря уже о том, чтобы получить желаемый результат. Интеллектуальным системам по-прежнему нужны люди, чтобы задавать правильные вопросы, ставить цели и оценивать эффективность. В Levity мы поставили перед собой цель демократизировать машинное обучение и позволить пользователям готовить данные, а..

Процесс машинного обучения и фреймворки
Суть фреймворков процесса машинного обучения — KDD, CRISP-DM Введение Очень редко мы официально обсуждаем различные структуры процессов анализа данных, которые полезны для управления жизненным циклом наших проектов по анализу данных и машинному обучению. Суть любой структуры анализа данных и интеллектуального анализа данных заключается в сборе данных, предварительной обработке данных, анализе для поиска скрытых идей и рассказывании историй. В этом посте я кратко коснусь этих процессов,..

Что такое наука о данных, почему мы должны этим заниматься и как это делать?
Почему наука о данных? В 2012 году издание Harvard Business Review заявило, что наука о данных - самая сексуальная работа 21 века . Каждому учреждению, например правительству, стартапам и даже крупной компании, действительно нужны данные, чтобы принять быстрое и точное решение на основе существующих данных. Данные - это новая нефть , действительно актуальная для нашего времени из-за значений, которые мы можем получить из самих данных. Объем существующих данных действительно..

Сравнительный анализ временных рядов - бумажный обзор
Наука о данных , Машинное обучение Сравнительный анализ временных рядов - бумажный обзор Анализ извлечения признаков временных рядов для сравнения, кластеризации, классификации и аннотации В машинном обучении с временными рядами использование функций, извлеченных из рядов, более эффективно, чем простая обработка временных рядов в табличной форме с каждой датой / отметкой времени в отдельном столбце. Такие функции могут фиксировать характеристики рядов, такие как тренд и..

Интеллектуальный анализ данных — Что, почему, как?
Что такое интеллектуальный анализ данных? Проще говоря, интеллектуальный анализ данных — это процесс просеивания больших наборов данных для выявления и описания паттернов , обнаружения и установления отношений с целью предсказать будущие тенденции. на основе этих шаблонов и отношений . Почему интеллектуальный анализ данных актуален сейчас? Разве мы не добывали данные с незапамятных времен? И да, и нет. Это правда, что данные всегда анализировались для выявления..

Интеллектуальный анализ текста с помощью демократических дебатов
Краткое введение в анализ текста с помощью R На данный момент было проведено 6 официальных демократических дебатов, а в будущем их будет больше. Дебаты долгие и, откровенно говоря, очень скучные. Аргумент для дебатов состоит в том, чтобы представить Америке кандидатов и понять их политические позиции. Тем не менее, у Америки короткая продолжительность концентрации внимания, и с 3-часовой продолжительностью это много времени, проведенного за просмотром телевизора. Всего человек..

K Алгоритм ближайшего соседа [KNN] с примером
Алгоритм KNN используется для решения задачи классификации и регрессии. Алгоритм KNN становится медленным, когда набор данных больше. Шаг 1: определите номер ближайшего соседа, равный K. Шаг 2 . Рассчитайте расстояние с помощью формулы евклидова расстояния между экземпляром запроса и набором обучающих данных. Шаг 3 . Определите k-е минимальное расстояние путем сортировки расстояния. Шаг 4 . Запишите ближайших соседей по категориям. Шаг 5 . Сравните ближайшего..