У меня несбалансированный набор данных с двумя классами, поэтому я подумал, что могу использовать ROC в качестве метрики вместо точности для настройки моей модели в R с использованием пакета Caret (я пробую разные методы, такие как rpart, rf..etc). Я подумал, что мы могли бы извлечь вероятности и использовать ROC в качестве метрики в алгоритмах типа дерева решений, а также с помощью каретки. Я иллюстрирую свою проблему, используя набор данных в каретке ниже. В этих данных есть три класса, но я переопределил и создал два класса для иллюстрации. Я не понимаю, почему приведенный ниже код выдает эту ошибку (я продолжаю получать ту же ошибку, когда меняю метод). Я ценю вашу помощь.
'Ошибка в train.default(x, y, weights = w, ...) : окончательные параметры настройки не могут быть определены. Кроме того: Предупреждающие сообщения: 1: info = trainInfo, : в пересчитанных показателях производительности были отсутствующие значения. 2: В train.default(x, y, weights = w, ...): отсутствующие значения найдены в агрегированных результатах.
library(caret)
data(iris)
iris$Species=as.character(iris$Species)
iris$Species[which(iris$Species=='virginica')]='versicolor'
iris$Species=as.factor(iris$Species)
fitControl <- trainControl(method = "cv",number=5,classProbs = TRUE,summaryFunction = twoClassSummary)
RF=train(Species ~ ., data = iris, method="rpart",metric="ROC", trControl=fitControl)