Публикации по теме knn

Публикации по теме 'knn'

KNN - Алгоритм K-го ближайшего соседа

Алгоритм KNN — это надежный и универсальный классификатор, который часто используется в качестве эталона для более сложных классификаторов, таких как Машины опорных векторов (SVM). Он может превосходить более мощные классификаторы и используется в различных приложениях, таких как экономическое прогнозирование, сжатие данных и генетика. Это один из тех алгоритмов, которые очень просты для понимания, но невероятно хорошо работают на практике. K в KNN — это гиперпараметр, который..

KNN против дерева решений против случайного леса для распознавания рукописных цифр

KNN против дерева решений против случайного леса для распознавания рукописных цифр В этой статье я попытался сравнить производительность трех алгоритмов машинного обучения, а именно дерева решений, случайного леса и k ближайших соседей для распознавания рукописных цифр из известного набора данных MNIST. Начало кодирования… Импортируем модули, загружаем наш набор данных import numpy as np import pandas as pd import matplotlib.pyplot as plt df = pd.read_csv(r"D:\ML data\digit..

Практическое введение в алгоритм K-ближайших соседей для регрессии (с кодом Python)

Из всех алгоритмов машинного обучения, с которыми мне приходилось сталкиваться, KNN оказался самым простым для освоения. Несмотря на свою простоту, он оказался невероятно эффективным при выполнении определенных задач (как вы увидите в этой статье). А еще лучше? Его можно использовать как для задач классификации, так и для задач регрессии! Однако он гораздо более широко используется для задач классификации. Я редко видел, чтобы KNN применялся для решения какой-либо задачи регрессии...

k-Ближайший сосед: прогнозирование тяжести маммографического массового поражения.

«Немедленно изменив врачей, [алгоритм] позволит нам ускорить своевременную диагностику потенциально опасного для жизни состояния». - Доктор Рэйчел Коллкут. В этой статье сформулированы основные предпосылки, необходимые для понимания k-ближайшего соседа и настройки гиперпараметров. Обучение на основе экземпляров (также известное как обучение на основе памяти ) - это семейство алгоритмов обучения, которые вместо выполнения обобщения точек данных пытаются сравнить новые экземпляры..

Обработка 15 миллиардов ближайших соседей в Spark

Обработка 15 миллиардов ближайших соседей в Spark По мере того, как мы приближаемся к выпуску сложного перекоса рекомендательных систем, я рад рассказать о некоторых технических препятствиях, которые мы преодолели, чтобы представить их вам. Наш характер бизнеса очень мультитенантный. Наш портфель клиентов насчитывает тысячи. Они приносят уникальный набор проблем. Пока у руля задачи инженерная команда работала над рекомендательной системой. Основой их по своей сути является..

Руководство для начинающих по распознаванию рукописных цифр KNN и MNIST с использованием KNN с нуля

MNIST («Модифицированный Национальный институт стандартов и технологий») - это фактический набор данных компьютерного зрения «привет, мир». С момента своего выпуска в 1999 году этот классический набор данных рукописных изображений служил основой для алгоритмов классификации тестов. По мере появления новых методов машинного обучения MNIST остается надежным ресурсом как для исследователей, так и для учащихся. Конечная цель - правильно идентифицировать цифры из набора данных,..

K-ближайшие соседи: Часть 2 Подробнее о KNN

Цель этой лекции — рассмотреть более сложные темы, связанные с KNN, и углубиться в детали. Я рекомендую вам прочитать Часть 1 , если вы еще этого не сделали. Темы, затронутые в этой лекции: KNN и проклятие многомерности Временная и пространственная сложность KNN KNN со взвешиванием функций 1. KNN и проклятие размерности Напомним общий факт: всем алгоритмам машинного обучения нужен плотный набор данных, чтобы точно предсказывать по всему пространству данных. Ошибки..