Публикации по теме 'data-mining'
Процесс интеллектуального анализа данных
Искусственному интеллекту не хватает важных аспектов человеческого интеллекта
По сей день простая загрузка кучи данных даже в самую продвинутую машину вряд ли вернет вам что-нибудь значимое, не говоря уже о том, чтобы получить желаемый результат. Интеллектуальным системам по-прежнему нужны люди, чтобы задавать правильные вопросы, ставить цели и оценивать эффективность.
В Levity мы поставили перед собой цель демократизировать машинное обучение и позволить пользователям готовить данные, а..
Процесс машинного обучения и фреймворки
Суть фреймворков процесса машинного обучения — KDD, CRISP-DM
Введение
Очень редко мы официально обсуждаем различные структуры процессов анализа данных, которые полезны для управления жизненным циклом наших проектов по анализу данных и машинному обучению. Суть любой структуры анализа данных и интеллектуального анализа данных заключается в сборе данных, предварительной обработке данных, анализе для поиска скрытых идей и рассказывании историй. В этом посте я кратко коснусь этих процессов,..
Что такое наука о данных, почему мы должны этим заниматься и как это делать?
Почему наука о данных?
В 2012 году издание Harvard Business Review заявило, что наука о данных - самая сексуальная работа 21 века . Каждому учреждению, например правительству, стартапам и даже крупной компании, действительно нужны данные, чтобы принять быстрое и точное решение на основе существующих данных. Данные - это новая нефть , действительно актуальная для нашего времени из-за значений, которые мы можем получить из самих данных.
Объем существующих данных действительно..
Сравнительный анализ временных рядов - бумажный обзор
Наука о данных , Машинное обучение
Сравнительный анализ временных рядов - бумажный обзор
Анализ извлечения признаков временных рядов для сравнения, кластеризации, классификации и аннотации
В машинном обучении с временными рядами использование функций, извлеченных из рядов, более эффективно, чем простая обработка временных рядов в табличной форме с каждой датой / отметкой времени в отдельном столбце. Такие функции могут фиксировать характеристики рядов, такие как тренд и..
Интеллектуальный анализ данных — Что, почему, как?
Что такое интеллектуальный анализ данных?
Проще говоря, интеллектуальный анализ данных — это процесс просеивания больших наборов данных для выявления и описания паттернов , обнаружения и установления отношений с целью предсказать будущие тенденции. на основе этих шаблонов и отношений .
Почему интеллектуальный анализ данных актуален сейчас? Разве мы не добывали данные с незапамятных времен?
И да, и нет. Это правда, что данные всегда анализировались для выявления..
Интеллектуальный анализ текста с помощью демократических дебатов
Краткое введение в анализ текста с помощью R
На данный момент было проведено 6 официальных демократических дебатов, а в будущем их будет больше. Дебаты долгие и, откровенно говоря, очень скучные. Аргумент для дебатов состоит в том, чтобы представить Америке кандидатов и понять их политические позиции. Тем не менее, у Америки короткая продолжительность концентрации внимания, и с 3-часовой продолжительностью это много времени, проведенного за просмотром телевизора. Всего человек..
K Алгоритм ближайшего соседа [KNN] с примером
Алгоритм KNN используется для решения задачи классификации и регрессии.
Алгоритм KNN становится медленным, когда набор данных больше.
Шаг 1: определите номер ближайшего соседа, равный K.
Шаг 2 . Рассчитайте расстояние с помощью формулы евклидова расстояния между экземпляром запроса и набором обучающих данных.
Шаг 3 . Определите k-е минимальное расстояние путем сортировки расстояния.
Шаг 4 . Запишите ближайших соседей по категориям.
Шаг 5 . Сравните ближайшего..