Я решаю задачу классификации. Я обучаю свою неконтролируемую нейронную сеть набору сущностей (используя архитектуру пропуска грамм).
Для оценки я ищу k ближайших соседей для каждой точки в проверочных данных, из обучающих данных. Я беру взвешенную сумму (веса в зависимости от расстояния) меток ближайших соседей и использую эту оценку каждой точки данных проверки.
Наблюдение. По мере увеличения числа эпох (model1
– 600 эпох, model 2
– 1400 эпох и model 3
– 2000 эпох) моя AUC улучшается при меньших значениях k
, но достигает насыщения при тех же значениях.
Что может быть возможным объяснением такого поведения?
[Перепост из CrossValidated]
model3
лучше классифицирует такие случаи, не будет ли у него лучше AUC, чем уmodel1
? - person kampta   schedule 15.02.2016