Давайте рассмотрим важные различия между логистической регрессией и наивными байесовскими классификаторами.

Поскольку последняя часть была интересна некоторым из моих читателей, пришло время продолжить тему классификации!

Логистическая регрессия и наивные байесовские классификаторы различаются по существенным пунктам:

Логистическая регрессия является многомерной, тогда как наивный байесовский классификатор является одномерным.

Это означает, что наивный байесовскийклассификатор рассматривает одну переменную за раз независимо от других.
наивный байесовский em>Метод классификации является одномерным и рассматриваетодно и то же доказательство несколько раз. Вот почему он возвращает вероятности, которые не откалиброваны должным образом.

Логистическая регрессия в остальном хорошо откалибрована. Иногда логистическая функция используется для калибровки других классификаторов.
Логистическая регрессия требует больше данных, чем наивный байесовский классификатор. Ему нужно меньше, потому что он одномерный и в целом проще.

Наивный байесовский классификатор также обрабатывает отсутствующие данные. Если значение неизвестно, его вклад равен нулю.Логистическая регрессия не может этого сделать.

Логистическая регрессия рассматривает все переменные одновременно. Наивный байесовский классификатор рассматривает одну переменную за раз.

Логистическая регрессия учитывает корреляцию. Наивный байесовский классификаторэтого не делает, поскольку предполагает, что атрибуты независимы.

Если некоторые переменные коррелированы, их важность будет распределена между ними в случае логистической регрессии.

В качестве бонуса мы можем наблюдать наивный байесовский классификатор и логистическую регрессию в номограмме.

Номограмма показывает коэффициенты регрессии, присвоенные отдельным значениям. Его можно использовать для исследования моделиили создания прогнозов.

Мы перетаскиваем точки для каждой переменной к соответствующему значению, а оси внизу преобразуют сумму в прогноз. В случае байесовского классификатора мы также можем оставить точку в центре, если значение неизвестно. С точки зрения изучения модели, длины линий в номограмме говорят нам, сколько баллов экземпляр данных может получить или потерять в зависимости от каждой переменной. Байесовский классификатор также может показать влияние значения на решение.

Эти, а также другие различия (например, номограмма для логистической регрессии не говорит нам о важности отдельных признаков) проистекают из общих различий между двумя методами.

Спасибо, что прочитали! Если вы хотите поделиться со мной своим мнением или идеями, вы можете свободно писать в разделе комментариев. Не стесняйтесь обращаться ко мне в Профиль LinkedIn для любых предложений или разъяснений.

Хорошего дня!