в машинном обучении с концепциями, компонентами и примерами
В этом посте мы собираемся погрузиться в концепции контролируемого обучения или, скорее, известного как классификация в области машинного обучения. Мы обсудим определения, компоненты, примеры классификации.
Классификацию можно определить как задачу изучения целевой функции f, которая отображает каждый набор атрибутов x в один из предопределенных ярлыков y.
Пример: отнесение новости к одной из предопределенных категорий.
В сообществе Data Science или Machine Learning все, что делается с данными, называется моделированием. В контексте классификации существует два типа моделирования:
- Описательное моделирование. Классификационная модель может служить пояснительным инструментом для различения объектов разных классов. Пример. Модель, которая определяет тип позвонков на основе их характеристик.
- Прогнозное моделирование.Модель классификации также можно использовать для прогнозирования метки класса неизвестных записей.
Методы классификации наиболее подходят для прогнозирования или описания наборов данных с бинарными или номинальными категориями. Они менее эффективны для порядковых категорий (например, для классификации человека как члена группы с высоким, средним или низким доходом), потому что они не учитывают неявный порядок среди категорий.
Давайте рассмотрим все вышеперечисленные компоненты более подробно.
- Обучающий и тестовый набор.Все данные обычно делятся на две части: одна используется алгоритмом обучения для обучения модели (называемой обучающими данными), а другая — для оценки производительности обученной модели ( называемые тестовые данные). Для получения более подробной информации см. сообщения ниже.
2. Алгоритм обучения.Это алгоритм для поиска шаблонов в наборе данных (обучающем наборе) и связывания атрибутов этих данных с классами, упомянутыми в наборе обучающих данных, чтобы, когда тестовые данные используется в качестве входных данных, он может назначать точные классы.
Ключевой задачей алгоритма обучения является создание моделей с хорошей способностью к обобщению, то есть моделей, которые точно предсказывают метки классов ранее неизвестных записей.
3. Модель/классификатор. На самом деле выполняет классификацию. Он определяет отличие одного экземпляра данных от другого, а затем присваивает новый экземпляр данных одному из классов.
4. Индукция и дедукция. Прежде чем понять это, необходимо понять две фазы классификации. Это этап обучения и запросов.
Фаза обучения состоит из двух компонентов: индукции (обучения) и дедукции (тестирования).
Фаза запроса также известна как фаза приложения.
Теперь поговорим об этом более формально.
Формальное определение:
- Улучшить задачу T,
- по показателю эффективности P,
- по опыту Э.
Это формальное определение может быть немного сложным для понимания. Это может быть лучше понято с некоторыми примерами.
Пример: классификация спама в электронной почте
- задача T — классифицировать письма как спам/не спам
- показатель эффективности P — доля правильно классифицированных писем
- опыт E — электронные письма, помеченные вручную как спам/без спама
Пример: шашки
- задание Т — сыграть в шашки
- показатель эффективности P — % выигранных геймов в турнире
- опыт Е — возможность играть против себя
Другие примеры включают
- классификация клеток как злокачественных или доброкачественных на основе результатов МРТ
- классификация галактик по их форме
Эти вышеупомянутые примеры могут быть смоделированы на основе различных подходов к обучению. Вот некоторые из этих подходов к обучению:
- Наивный байесовский классификатор
- Классификатор дерева решений
- Нейронные сети
- Классификатор на основе правил
- Опорные векторные машины
и многое другое.
Я раздаю бесплатную электронную книгу о постоянстве. Получите бесплатную электронную книгу здесь.
Спасибо за чтение. Я надеюсь, что любой, кто читает это, прояснил основы обучения с учителем.
Если вам нравится читать такие истории, вам следует получать мои сообщения в свой почтовый ящик, а если вы хотите поддержать меня как автора, подумайте о том, чтобы зарегистрироваться, чтобы стать участником Medium. Это 5 долларов в месяц, что дает вам неограниченный доступ к историям на Medium. Если вы зарегистрируетесь по моей ссылке, я получу небольшую комиссию без каких-либо дополнительных затрат для вас.
Больше моих постов можно прочитать здесь: