Проще говоря, интеллектуальный анализ данных — это процесс извлечения пригодных для использования данных из большего количества необработанных данных, процесс анализа больших баз данных для создания свежих данных.

Междисциплинарный характер исследований и разработок в области интеллектуального анализа данных в значительной степени способствует успеху интеллектуального анализа данных и широкому спектру приложений.

Вот несколько примеров областей, которые оказали значительное влияние на разработку методологий интеллектуального анализа данных.

Статистика

Статистика — это наука о сборе, анализе, интерпретации и представлении данных. Интеллектуальный анализ данных неразрывно связан со статистикой. Данные и статистические модели используются в статистических исследованиях для создания инструментов прогнозирования и прогнозирования. Набор данных можно обобщить или описать с помощью статистических методов. Результаты интеллектуального анализа данных также можно проверить с помощью статистических подходов. Например, после анализа модели классификации или прогнозирования следует использовать статистическую проверку гипотез для проверки модели.

Машинное обучение

Машинное обучение — это изучение того, как компьютеры учатся на основе данных. Компьютерные системы, которые автоматически учатся распознавать сложные закономерности и принимать разумные решения на основе данных, являются одной из ключевых областей исследования. Исследования машинного обучения в задачах классификации и кластеризации часто фокусируются на точности модели. Исследования интеллектуального анализа данных подчеркивают эффективность и масштабируемость методов интеллектуального анализа огромных наборов данных, а также подходы к управлению сложными формами данных и изучению новых альтернативных методов в дополнение к точности.

Системы баз данных и хранилища данных

Для многих операций интеллектуального анализа данных требуются большие наборы данных или даже быстрые потоковые данные в режиме реального времени. В результате технология масштабируемых баз данных может эффективно использоваться при интеллектуальном анализе данных для достижения высокой эффективности и масштабируемости больших наборов данных. Кроме того, задачи интеллектуального анализа данных можно использовать для улучшения возможностей существующих систем баз данных, чтобы удовлетворить сложные потребности продвинутых пользователей в анализе данных.

Поиск информации

Исследование поиска документов или информации внутри документов известно как поиск информации (IR). Текстовые или мультимедийные документы можно найти в Интернете. Из-за быстрого роста Интернета и таких приложений, как цифровые библиотеки, цифровые правительства и информационные системы здравоохранения, огромные объемы текстовых и мультимедийных данных были накоплены и доступны онлайн. Их эффективный поиск и анализ вызвал многочисленные трудности с интеллектуальным анализом данных. В результате интеллектуальный анализ текста и интеллектуальный анализ мультимедийных данных приобретают все большее значение в сочетании с технологиями поиска информации.

Интеллектуальный анализ данных, как действительно междисциплинарный предмет, можно охарактеризовать по-разному, что неудивительно. Даже слово «интеллектуальный анализ данных» не описывает должным образом все необходимые элементы.