Какую модель использовать для решения задач машинного обучения и искусственного интеллекта?

Нематематическое руководство по математике, лежащей в основе машинного обучения

Учебник по моделям, используемым в машинном обучении, для тех из нас, кто не является статистиками.

Существуют различные алгоритмы, о которых мы постоянно слышим от специалистов по обработке данных в контексте Машинного обучения, и этот блог помогает предоставить руководство по этим алгоритмам для тех из нас, кто не является статистиками.

Алгоритмы машинного обучения в основном можно разделить на следующие категории:

  1. Обучение с учителем. Этот метод используется для построения прогнозных моделей, которые обеспечивают прогноз в неопределенной ситуации на основе ранее доступных данных. Таким образом, этот метод используется, когда доступны как входные, так и выходные данные. Обучение с учителем достигается посредством классификации или регрессии. Алгоритмы классификации классифицируют входные данные и обычно используются для распознавания изображений и речи и кредитного рейтинга. Регрессия используется в сценариях, где необходимо прогнозировать непрерывные реакции, как при прогнозировании.
  2. Неконтролируемое обучение - этот метод используется для построения модели, когда доступны только входные данные, а выходные данные недоступны. Таким образом, модель может быть обучена путем группировки и интерпретации входных данных.
  3. Обучение с подкреплением - это взаимодействие между агентом, который пытается учиться, и средой, обеспечивающей обратную связь. Эта модель обучения используется для последовательного принятия решений, когда агент выполняет действие и получает обратную связь для действия через механизм обратной связи, который либо вознаграждает, либо стоит действие, таким образом позволяя агенту учиться и позволяя ему оптимизировать свои политики, чтобы максимизировать вознаграждение и минимизировать Стоимость.

Каждый из этих методов, в свою очередь, использует лежащие в основе статистические методы. Итак, давайте теперь посмотрим на эти методы. Статистические методы в целом можно разделить на следующие 3 категории:

  1. Линейная модель - эта модель находит «наиболее подходящую» линию по набору точек данных с помощью простой формулы. Переменная, которую вы хотите предсказать (зависимая переменная), представлена ​​в виде уравнения переменных, которые вы знаете (независимые переменные). Прогноз можно получить на основе результата уравнения, введя независимые переменные и задав уравнение ответом. Основные категории используемых линейных моделей - это линейная регрессия и логистическая регрессия. Линейная регрессия используется для прогнозирования числовых значений с использованием линии «наилучшего соответствия» по всем точкам данных. Логистическая регрессия используется для задач классификации, например, вопросов типа «да / нет», групп и т. Д. Преимущество этих методов в том, что они просты в использовании. Тем не менее, недостатком является то, что они плохо работают для коррелированных характеристик (две функции, предназначенные для измерения различных характеристик, подвержены влиянию какого-то общего механизма и имеют тенденцию меняться вместе), а также не могут фиксировать сложные отношения между переменными.
  2. Модель на основе дерева. Эта модель использует серию правил if-else для генерации прогнозов на основе одного или нескольких деревьев решений. Все древовидные модели могут использоваться для прогнозирования числовых значений (регрессия) или прогнозирования категориальных значений (классификация). Основным типом модели на основе дерева является Дерево решений, а оставшиеся два метода Случайный лес и Градиентное усиление основываются на нем. Дерево решений использует серию правил If-Else, основанных на характеристиках, для формирования дерева, чтобы сопоставить возможный результат с фактическим результатом. Случайный лес - это метод, который использует множество таких деревьев решений параллельно, а градиентное усиление использует дерево решений последовательно и фокусируется на тех ветвях, которые ближе к результату. Обычно метод случайного леса предпочтительнее, когда скорость обучения имеет существенное значение, а градиентное усиление используется, когда производительность модели более важна.
  3. Нейронные сети- Эта модель основана на биологических нейронных сетях и включает использование нейронов, сложенных в виде слоев, что позволяет справляться с чрезвычайно сложными задачами. Недостатком этого метода является то, что он медленный для обучения и невозможно понять, каким образом были получены прогнозы, и, следовательно, его нельзя использовать в нормативной среде, где требуется прозрачность.

Другие модели / методы включают обнаружение аномалий, байесовскую сеть, ансамбль, обобщенную линейную модель (GLM) и т. Д.

Популярные статьи об ИИ:

1. Основы искусственного интеллекта, машинного обучения и глубокого обучения для менеджеров по продуктам

2. Несчастная сила глубокого обучения

3. Графическая нейронная сеть для обнаружения 3D-объектов в облаке точек

4. Знайте самую заметную разницу между искусственным интеллектом и машинным обучением

Как вы можете видеть выше, существуют различные модели, доступные в зависимости от варианта использования, и каждая из них имеет свои преимущества и недостатки. Поэтому всегда имеет смысл сравнивать характеристики моделей друг с другом, используя критерии сравнительного анализа, и на основе этого выбирать предпочтительную модель. После того, как модель выбрана, важно контролировать ее текущую производительность, так как производительность модели со временем может ухудшиться. Таким образом, может потребоваться настроить параметры, чтобы сделать модель более эффективной, или заменить ее другой моделью. Обычно для сравнения моделей используются следующие типы показателей:

  1. Меры классификации. Эти меры включают сравнительные критерии, включая графики рабочих характеристик приемника (ROC) и соответствующую область под кривой, коэффициенты классификации и т. д.
  2. Показатели интеллектуального анализа данных. Эти показатели включают сравнительные критерии из исследования интеллектуального анализа данных, в том числе показатели роста и прибыли и показатели прибыли и убытков.
  3. Статистические показатели: Эти показатели включают сравнительные критерии из статистической литературы, в том числе байесовский информационный критерий (BIC), информационный критерий Акаике (AIC), статистику Джини, статистику Колмогорова-Смирнова и двусторонний критерий Колмогорова-Бин-Беста. Смирнов пробы.

При построении мы должны избегать переобучения (обучения, основанного на переменных, которые на самом деле не имеют влияния), используя регуляризацию, которая уменьшает величину коэффициентов, так что влияние отдельных переменных несколько притупляется.

Таким образом, для эффективного построения модели важно объединить данные, обогатить данные, построить модели на основе данных, оценить лучшую модель и реализовать модель, а также постоянно контролировать производительность модели, чтобы настроить или заменить модель, если это необходимо.

Надеюсь, вы нашли блог полезным, и, пожалуйста, прокомментируйте модели, которые вы используете, а также дайте мне знать, если вы хотите услышать какую-либо из конкретных тем. А пока, пожалуйста, ознакомьтесь с моими другими блогами по искусственному интеллекту и машинному обучению: -

  1. Как телекоммуникационные компании могут использовать сетевую аналитику на базе искусственного интеллекта для повышения качества обслуживания своих абонентов?
  2. Открытые ИИ - революционная новая модель НЛП GPT-3
  3. Масштабирование AI для длинного хвоста автономного вождения
  4. Снижение предвзятости ИИ: к справедливому и подотчетному ИИ