Публикации по теме 'mahalanobis'


Метрики расстояния: концепции и использование в моделях машинного обучения
Когда я начал свое путешествие по машинному обучению, я знал только о простой формуле расстояния между точкой A и точкой B в 2D-плоскости. Но как только я начал узнавать больше, я понял, что это называется евклидовым расстоянием. Но, к моему удивлению, было много типов метрик расстояния, и не только этот. Поэтому я начал изучать их все. Вот все показатели расстояния, которые я изучил за время своего путешествия по машинному обучению. Расчетные расстояния Евклидово расстояние:..

Об обнаружении выбросов с помощью Alibi Detect
Выбросы - это точки данных, которые аномально удалены от остальных наблюдений в наборе данных. В основном они возникают из-за ошибок данных (ошибки измерения или эксперимента, ошибки сбора или обработки данных и т. Д.) Или, естественно, очень необычного и отличного от нормального поведения (например, очень небольшое количество людей в возрасте старше 100 лет). Сохранение их в наборе данных может значительно исказить выводы статистического анализа и моделирования: они могут изменить..

Вопросы по теме 'mahalanobis'

Ошибка в типах double и DenseVector[Double]
Следующий код является ответом на этот вопрос: Обнаружение аномалий с помощью PCA в Spark import breeze.linalg.{DenseVector, inv} import org.apache.spark.ml.Pipeline import org.apache.spark.ml.feature.{PCA, StandardScaler,VectorAssembler} import...
118 просмотров