Публикации по теме 'knn'


Алгоритм K-ближайших соседей
Наян Ман Сингх Прадхан Алгоритм K-ближайших соседей (KNN) — это популярный алгоритм машинного обучения с учителем , который можно использовать как для задач классификации , так и для задач регрессии (хотя он используется больше для задач классификации). Целью этого блога являются: - Познакомить с алгоритмом KNN - Продемонстрируйте, как работает алгоритм KNN, с помощью визуальных изображений. - Ответьте, какое значение для K является лучшим - Обсудить преимущества и..

Использование регрессии K-ближайших соседей для прогнозирования цены автомобиля
Справочная информация о наборе данных Набор данных, используемый для этого проекта, был собран из UCI Machine Learning Repository . На их веб-сайте есть множество других наборов открытых данных, от небольших до крупных, для проектов машинного обучения. Наш набор данных об автомобилях содержит информацию об автомобилях. Что касается наблюдений, размер данных относительно невелик: 205 наблюдений и 26 столбцов. Информация об этом наборе данных была собрана с 1985 . Он..

Другие версии KNN: Fast Nearest Neighbours
Все мы знаем и любим знаменитый алгоритм K-NN, это один из самых простых алгоритмов для реализации. Я до сих пор помню, что это был первый реализованный мной алгоритм машинного обучения. Я предполагаю, что каждый, кто это читает, уже знает о K-NN. Алгоритм k-ближайших соседей - Википедия В статистике алгоритм k-ближайших соседей (k-NN) - это метод непараметрической классификации, впервые разработанный… en.wikipedia.org Прежде чем мы..

Сбалансированные данные и несбалансированные данные
несбалансированный набор данных — один из реальных сценариев, которые приходят к реализации модели машинного обучения. например, данные прогнозирования рака имеют много -ve по сравнению с +Ve и в интернет-индустрии, где много посетителей приходят на веб-сайт, но продукт покупается большим количеством людей. что такое сбалансированный и несбалансированный набор данных? сбалансированный набор данных, где (n1+n2=Dn) n1 и n2 примерно одинаковы. например, n1 = 580 и n2 = 420, тогда набор..

Почему важна нормализация переменных признаков в kNN?
K Nearest Neighbor — один из самых популярных алгоритмов машинного обучения, используемых как для классификации, так и для регрессии. Одной из основных причин его популярности является простота. Точка тестовых данных классифицируется или оценивается на основе значений ее k ближайших выборок. Близость точек данных обычно измеряется с помощью евклидова расстояния. Давайте разберемся, как мы рассчитываем расстояние для kNN, используя базу данных диабета индейцев пима. Набор данных содержит..

Перекрестная проверка с использованием KNN
Это третья статья в серии KNN. Если вы не прочитали первые 2 части, я предлагаю вам сначала просмотреть их. Часть-1 , Часть-2 В этой статье мы поймем, что такое перекрестная проверка, зачем она нужна и что такое k-кратная перекрестная проверка? Чтобы лучше понять необходимость перекрестной проверки, позвольте мне сначала рассказать, как определить правильное значение «K»? Предположим, нам дается набор данных, и мы разбиваем его на данные обучения и данные тестирования в соотношении..

Знакомство с K-ближайшими соседями
Введение в классификацию с использованием K ближайших соседей Пошаговый подход к созданию классификатора KNN Как практики машинного обучения, мы сталкиваемся с широким спектром алгоритмов машинного обучения, которые мы можем использовать для построения конкретной модели прогнозирования. В этой статье я сосредоточусь на одном из самых сложных алгоритмов обучения, известном как K Nearest Neighbor. Этот алгоритм можно использовать для решения проблем как регрессии, так и..