Итоги дня 005

День 005, мы подробно изучаем классификацию. Мы узнали, что модели классификации классифицируют входные данные по категориям. Другими словами; классификация — это проблема присвоения метки или категории любому входящему входному сигналу.

Сегодня мы узнаем, как алгоритмы обучения с учителем строят классификаторы на обучающих примерах с использованием алгоритмов классификации.

Двоичная и многоклассовая классификация

«Когда вы работаете над проблемой классификации, начните с определения того, является ли проблема бинарной или мультиклассовой. В задаче бинарной классификации один обучающий или тестовый элемент (экземпляр) можно разделить только на два класса» — например, если вы хотите определить, нажата ли клавиша на фортепиано или нет.

В задаче мультиклассовой классификации его можно разделить более чем на два — например, если вы хотите обучить модель классифицировать музыкальное произведение как джаз, рок, классику, афро или другие жанры.

«Имейте в виду, что проблема мультиклассовой классификации, как правило, является более сложной, поскольку требует более сложной модели».

Общие алгоритмы классификации

K Ближайший сосед (KNN)

kNN классифицирует объекты на основе классов их ближайших соседей в наборе данных. Прогнозы kNN предполагают, что объекты рядом друг с другом похожи.

KNN просматривает весь обучающий пример и находит одну точку в обучающем наборе, ближайшую к текущему вводу. Затем он выводит значение, идентичное выходу ближайшего соседа.

Лучшее использование…

· Когда вам нужен простой алгоритм для установления эталонных правил обучения

· Когда использование памяти обученной модели не вызывает особого беспокойства

· Когда скорость предсказания обученной модели не имеет большого значения

Логистическая регрессия

Соответствует модели, которая может предсказать вероятность того, что бинарный ответ принадлежит к тому или иному классу.

Из-за своей простоты логистическая регрессия обычно используется в качестве отправной точки для задач бинарной классификации.

Лучшее использование…

· Когда данные могут быть четко разделены единой линейной границей

· В качестве основы для оценки более сложных методов классификации

Вы добрались до конца дня 006. Завтра мы продолжим работу с более часто используемыми алгоритмами классификации. Спасибо, что нашли время в своем графике и позволили мне быть вашим проводником в этом путешествии.

Ссылка: Mathworks- 90221_80827v00_machine_learning_section4_ebook_v03.pdf