Интересно, насколько полезны функции уровня запроса (например, количество терминов в запросе)? Потому что функции уровня запроса игнорируются при создании файла модели.
Файл поезда;
3 qid:1 1:2 2:1 3:0 4:0.2 5:0
2 qid:1 1:2 2:0 3:1 4:0.1 5:1
1 qid:1 1:2 2:1 3:0 4:0.4 5:0
1 qid:1 1:2 2:0 3:1 4:0.3 5:0
1 qid:2 1:3 2:0 3:1 4:0.2 5:0
2 qid:2 1:3 2:0 3:1 4:0.4 5:0
1 qid:2 1:3 2:0 3:1 4:0.1 5:0
1 qid:2 1:3 2:0 3:1 4:0.2 5:0
В этом файле первая функция — это функция уровня запроса, которая одинакова для одного и того же запроса — разные пары элементов.
Прошел обучение по SVM-рангу. Затем сгенерированный файл модели игнорирует 1-й элемент и начинает со 2-го элемента.
Сгенерированный файл модели;
1 2:0.50956941 3:-0.50956941 4:0.1913875 5:1.0382775 #