У меня проблема с классификацией, когда мои метки - это рейтинги от 0 до 100 с шагом 1 (например, 1, 2, 3, 4,).
У меня есть набор данных, в котором каждая строка имеет имя, текстовый корпус и рейтинг (0–100).
Из текстового корпуса я пытаюсь извлечь функции, которые я могу передать в свой классификатор, который будет выводить соответствующий рейтинг для каждой строки (0–100).
Что касается выбора функций, я думаю начать с простого набора слов. Однако мой вопрос заключается в алгоритме классификации. Есть ли в sci-kit learn алгоритм классификации, который поддерживает такого рода проблемы?
Я читал http://scikit-learn.org/stable/modules/multiclass.html, но описанные алгоритмы, похоже, поддерживают полностью дискретные метки, тогда как у меня есть набор непрерывных меток.
РЕДАКТИРОВАТЬ: Как насчет случая, когда я убираю свои рейтинги? Например, у меня может быть 10 ярлыков, от 1 до 10 в каждой.