Ключевые слова: анализ ассоциативных правил, глубокое обучение, машинное обучение, искусственный интеллект, анализ данных, наука о данных.

Интеллектуальный анализ данных — это процесс извлечения значимой информации из больших объемов данных. Этот процесс используется для поддержки бизнес-решений, выявления тенденций и понимания поведения клиентов. Интеллектуальный анализ правил ассоциации играет решающую роль в этом процессе интеллектуального анализа данных. Интеллектуальный анализ правил ассоциации — это метод, направленный на поиск взаимосвязей между элементами в наборах данных. Эти отношения могут быть выражены в виде набора правил. Правило состоит из посылки и заключения. Предшественник — это объект или набор объектов. Следствием является объект или набор объектов.

Например, для набора рыночных данных можно получить следующий набор правил:

Предпосылка: закуплены молоко и яйца.
Последствие: закуплен сыр.

Это правило предполагает, что клиенты, которые покупают молоко и яйца, чаще покупают сыр.

В этой статье мы рассмотрим концепцию интеллектуального анализа правил ассоциации, варианты его использования, основную терминологию и популярные алгоритмы.

Что такое анализ правил ассоциации?

Интеллектуальный анализ правил ассоциаций — это метод интеллектуального анализа данных, целью которого является поиск ассоциаций, взаимосвязей и шаблонов между элементами в наборах данных. По сути, он пытается обнаружить правила, выраженные как «Если X, то Y». Эти правила имеют широкий спектр применения, от маркетинговых стратегий до медицинской диагностики. Например, супермаркет может разработать лучшие стратегии размещения и продвижения, анализируя, какие продукты вместе покупаются в корзинах покупателей.

Основная терминология

Основная терминология интеллектуального анализа правил ассоциации состоит из следующего:

Элемент: любой элемент или продукт в проанализированном наборе данных.
Набор элементов: группы элементов, рассматриваемые вместе.
Поддержка: мера того, как часто набор элементов появляется в наборе данных.
Достоверность: Мера того, как часто правило выполняется.
Порог поддержки: критерий исключения наборов элементов, значение которых ниже указанного минимального значения поддержки.
Порог достоверности: критерий исключения правил, значение которых ниже указанного минимального уровня достоверности. ценить.

Алгоритмы анализа правил ассоциации

Для интеллектуального анализа правил ассоциации было разработано множество алгоритмов, но наиболее популярными из них являются Apriori, Eclat и FP-Growth. Эти алгоритмы обнаруживают ассоциации, применяя различные подходы. Например, алгоритм Apriori использует итеративный подход для поиска часто встречающихся наборов элементов, тогда как алгоритм Eclat предпочитает вертикальный подход.

Априорный алгоритм: обнаружение реляционных правил в интеллектуальном анализе данных

Алгоритм априори широко используется в анализе реляционных правил и особенно эффективен в таких приложениях, как анализ продуктовой корзины.

Основные принципы априорного алгоритма:

Алгоритм Apriori в основном используется для обнаружения частотных отношений между элементами в наборе элементов. Алгоритм работает в следующих шагах:

Значения поддержки и уверенности: поддержка и уверенность, основные понятия алгоритма, важны для обнаружения реляционных правил. Поддержка относится к тому, как часто набор элементов появляется в наборе данных, а достоверность относится к тому, насколько хорошо набор элементов подчиняется заданному правилу.

Минимальная поддержка и достоверность. Задаваемые пользователем минимальные значения поддержки и достоверности определяют, о каких отношениях должен сообщать алгоритм. Эти значения устанавливаются в соответствии с запросом аналитика и характеристиками набора данных.

Поиск комбинаций: сначала рассчитываются значения поддержки отдельных элементов в наборе данных. Затем создаются комбинации этих элементов и рассчитываются значения поддержки этих комбинаций.

Фильтрация: комбинации элементов ниже минимального значения поддержки исключаются. Таким образом, комбинации, которые встречаются недостаточно часто, не учитываются.

Создание правила: правила ассоциации создаются для оставшихся комбинаций элементов. Эти правила ограничены комбинациями, которые соответствуют минимальному доверительному значению.

Отчетные результаты. Алгоритм сообщает о частых комбинациях элементов в наборе данных и правилах доверенной ассоциации, полученных из этих комбинаций.

Области применения и пример сценария:

Алгоритм Apriori можно использовать в таких областях, как анализ продуктовой корзины, чтобы понять поведение клиентов и рекомендации по продуктам. Например, применяя априорный алгоритм к данным о продажах супермаркета, можно определить взаимосвязь между продуктами, которые покупатели покупают вместе. Таким образом, можно вывести полезные правила, чтобы рекомендовать другие продукты, которые покупают один товар в корзине покупателя.

Алгоритм Eclat: обнаружение реляционных правил в большом наборе данных

Основные принципы алгоритма Eclat:

Алгоритм Eclat (преобразование класса эквивалентности) используется для обнаружения реляционных правил, особенно при работе с большими наборами данных. Основные принципы этого алгоритма следующие:

Представление на основе вершин: Алгоритм Eclat обрабатывает набор данных, используя представление на основе вершин. Каждый элемент представляет собой вершину, и отношения между элементами определяются комбинациями этих вершин.

Значения поддержки: Алгоритм Eclat, как и алгоритм Априори, использует значения поддержки. Поддержка относится к тому, как часто элемент появляется в наборе данных.

Минимальное значение поддержки: Минимальное значение поддержки, установленное пользователем, определяет, о каких отношениях должен сообщать алгоритм. Это значение устанавливается в соответствии с запросом аналитика и характеристиками набора данных.

Поиск комбинаций: Алгоритм Eclat находит комбинации элементов, используя представление на основе вершин. Эти комбинации используются при расчете стоимости поддержки.

Обнаружение ассоциативного правила: Ассоциативные правила обнаруживаются на основе комбинаций элементов, обеспечивающих минимальное значение поддержки. Эти правила можно ранжировать в соответствии с заданным значением поддержки.

Области применения и пример сценария:

Алгоритм Eclat можно использовать во многих областях, таких как анализ потребительской корзины, анализ социальных сетей, анализ взаимодействия лекарств. Например, используя алгоритм Eclat для данных о продажах платформы электронной коммерции, можно определить комбинации продуктов, которые клиенты покупают вместе. Таким образом, можно получить реляционные правила, составляющие основу рекомендательных систем.

Заключение

Интеллектуальный анализ ассоциативных правил — ценный метод интеллектуального анализа данных. Возможность находить отношения между элементами в наборах данных может дать компаниям конкурентное преимущество. Благодаря этим отношениям можно принимать более эффективные решения, понимать поведение клиентов и оптимизировать бизнес-процессы. Такие алгоритмы, как Apriori, Eclat и FP-Growth, предоставляют мощные инструменты для обнаружения этих взаимосвязей. Варианты использования ассоциативного анализа правил также довольно широки и могут создавать ценность в различных отраслях.