в машинном обучении с концепциями, компонентами и примерами

В этом посте мы собираемся погрузиться в концепции контролируемого обучения или, скорее, известного как классификация в области машинного обучения. Мы обсудим определения, компоненты, примеры классификации.

Классификацию можно определить как задачу изучения целевой функции f, которая отображает каждый набор атрибутов x в один из предопределенных ярлыков y.

Пример: отнесение новости к одной из предопределенных категорий.

В сообществе Data Science или Machine Learning все, что делается с данными, называется моделированием. В контексте классификации существует два типа моделирования:

  1. Описательное моделирование. Классификационная модель может служить пояснительным инструментом для различения объектов разных классов. Пример. Модель, которая определяет тип позвонков на основе их характеристик.
  2. Прогнозное моделирование.Модель классификации также можно использовать для прогнозирования метки класса неизвестных записей.

Методы классификации наиболее подходят для прогнозирования или описания наборов данных с бинарными или номинальными категориями. Они менее эффективны для порядковых категорий (например, для классификации человека как члена группы с высоким, средним или низким доходом), потому что они не учитывают неявный порядок среди категорий.

Давайте рассмотрим все вышеперечисленные компоненты более подробно.

  1. Обучающий и тестовый набор.Все данные обычно делятся на две части: одна используется алгоритмом обучения для обучения модели (называемой обучающими данными), а другая — для оценки производительности обученной модели ( называемые тестовые данные). Для получения более подробной информации см. сообщения ниже.




2. Алгоритм обучения.Это алгоритм для поиска шаблонов в наборе данных (обучающем наборе) и связывания атрибутов этих данных с классами, упомянутыми в наборе обучающих данных, чтобы, когда тестовые данные используется в качестве входных данных, он может назначать точные классы.

Ключевой задачей алгоритма обучения является создание моделей с хорошей способностью к обобщению, то есть моделей, которые точно предсказывают метки классов ранее неизвестных записей.

3. Модель/классификатор. На самом деле выполняет классификацию. Он определяет отличие одного экземпляра данных от другого, а затем присваивает новый экземпляр данных одному из классов.

4. Индукция и дедукция. Прежде чем понять это, необходимо понять две фазы классификации. Это этап обучения и запросов.

Фаза обучения состоит из двух компонентов: индукции (обучения) и дедукции (тестирования).

Фаза запроса также известна как фаза приложения.

Теперь поговорим об этом более формально.

Формальное определение:

  • Улучшить задачу T,
  • по показателю эффективности P,
  • по опыту Э.

Это формальное определение может быть немного сложным для понимания. Это может быть лучше понято с некоторыми примерами.

Пример: классификация спама в электронной почте

  • задача T — классифицировать письма как спам/не спам
  • показатель эффективности P — доля правильно классифицированных писем
  • опыт E — электронные письма, помеченные вручную как спам/без спама

Пример: шашки

  • задание Т — сыграть в шашки
  • показатель эффективности P — % выигранных геймов в турнире
  • опыт Е — возможность играть против себя

Другие примеры включают

  • классификация клеток как злокачественных или доброкачественных на основе результатов МРТ
  • классификация галактик по их форме

Эти вышеупомянутые примеры могут быть смоделированы на основе различных подходов к обучению. Вот некоторые из этих подходов к обучению:

  1. Наивный байесовский классификатор
  2. Классификатор дерева решений
  3. Нейронные сети
  4. Классификатор на основе правил
  5. Опорные векторные машины

и многое другое.

Я раздаю бесплатную электронную книгу о постоянстве. Получите бесплатную электронную книгу здесь.

Спасибо за чтение. Я надеюсь, что любой, кто читает это, прояснил основы обучения с учителем.

Если вам нравится читать такие истории, вам следует получать мои сообщения в свой почтовый ящик, а если вы хотите поддержать меня как автора, подумайте о том, чтобы зарегистрироваться, чтобы стать участником Medium. Это 5 долларов в месяц, что дает вам неограниченный доступ к историям на Medium. Если вы зарегистрируетесь по моей ссылке, я получу небольшую комиссию без каких-либо дополнительных затрат для вас.



Больше моих постов можно прочитать здесь: