Часто, когда вам предлагают задачу машинного обучения, первое, что вы делаете, это выясняете, является ли задача обучения задачей классификации или регрессии, чтобы затем вы могли выбрать алгоритм. Это простые концепции, будьте осторожны.

Классификация

В задачах классификации мы пытаемся предсказать дискретное количество значений.

Метки (y) обычно имеют категориальную форму и представляют конечное число классов. Рассмотрим следующие задачи:

  1. По заданному набору входных функций можно предсказать, является ли рак груди доброкачественным или злокачественным.
  2. Данное изображение правильно классифицируется как содержащее кошек или собак.
  3. По заданному электронному письму предскажите, является ли оно спамом или нет.

Типы классификации

(1). Двоичная классификация - когда нужно прогнозировать только два класса, обычно 1 или 0 значений.

Мультиклассовая классификация. Когда для прогнозирования требуется более двух меток класса, мы называем задачу множественной классификации. Например. прогнозирование 3 типов видов радужной оболочки, задачи классификации изображений, в которых существует более тысячи классов (кошка, собака, рыба, автомобиль,…).

Алгоритмы классификации

  • Деревья решений
  • Логистическая регрессия
  • Наивный байесовский
  • K Ближайшие соседи
  • Линейный SVC (классификатор опорных векторов)
  • так далее

Проблемы регрессии

В задачах регрессии мы пытаемся предсказать непрерывный выпуск продукции, возьмем этот пример. Учитывая размер дома, спрогнозируйте цену (реальную стоимость).

Алгоритмы регрессии

  • Линейная регрессия
  • Деревья регрессии (например, случайный лес)
  • Опорная векторная регрессия (SVR)
  • так далее

Классификация VS Регрессия

Классификация: дискретное значение Y (например, 1,2,3 и 4)

Регрессия: продолжает значения Y (например, 222,6, 300, 568,…)

Всякий раз, когда вы обнаруживаете проблему машинного обучения, сначала определите, имеете ли вы дело с проблемой классификации или регрессии, и вы можете узнать, что анализируя целевую переменную (Y), обратите внимание, что здесь вход X может быть любого вида (непрерывного или дискретного), который не не в счет, чтобы определить проблему. После определения проблемы и ознакомления с данными гораздо проще выбрать или опробовать некоторые алгоритмы.

Есть еще

Помимо классификации и регрессии, существует еще кое-что, называемое кластеризацией. При кластеризации основная цель состоит в создании групп (кластеров) на основе сходства примеров (мы вернемся к этой теме позже).

Проверь это:



Следующий:

В следующей статье мы поговорим об алгоритме линейной регрессии.

Дайте мне знать, что вы думаете, нажав "Нравится" или оставьте комментарий

Удачи!