Функции уровня запроса SVM-rank

Интересно, насколько полезны функции уровня запроса (например, количество терминов в запросе)? Потому что функции уровня запроса игнорируются при создании файла модели.

Файл поезда;

3 qid:1 1:2 2:1 3:0 4:0.2 5:0
2 qid:1 1:2 2:0 3:1 4:0.1 5:1
1 qid:1 1:2 2:1 3:0 4:0.4 5:0
1 qid:1 1:2 2:0 3:1 4:0.3 5:0 
1 qid:2 1:3 2:0 3:1 4:0.2 5:0 
2 qid:2 1:3 2:0 3:1 4:0.4 5:0
1 qid:2 1:3 2:0 3:1 4:0.1 5:0 
1 qid:2 1:3 2:0 3:1 4:0.2 5:0

В этом файле первая функция — это функция уровня запроса, которая одинакова для одного и того же запроса — разные пары элементов.

Прошел обучение по SVM-рангу. Затем сгенерированный файл модели игнорирует 1-й элемент и начинает со 2-го элемента.

Сгенерированный файл модели;

1 2:0.50956941 3:-0.50956941 4:0.1913875 5:1.0382775 #

person user1766006    schedule 11.09.2015    source источник


Ответы (1)


Функции уровня запроса могут быть полезны в другой парадигме ранжирования, но Джоахимс утверждает, что:

Обратите внимание, что ранги сопоставимы только между примерами с одинаковым qid. Также обратите внимание, что целевое значение (первое значение в каждой строке файлов данных) используется только для определения порядка примеров. Его абсолютное значение не имеет значения, пока порядок относительно других примеров с тем же самым qid остается прежним.

Это означает, что функция, которая является постоянной в каждом запросе, никогда не будет использоваться моделью. Чтобы такая функция была полезной, ваша модель должна выполнять какое-то сравнение между qids.

person dmh    schedule 04.11.2015
comment
Спасибо за Ваш ответ. Вы знаете алгоритм ранжирования, который сравнивает разные qid? - person user1766006; 25.11.2015
comment
Я думаю, мне нужно лучше понять ваш вариант использования. Вероятно, лучше всего открыть новый вопрос, возможно, на перекрестной проверке Stack Exchange. - person dmh; 25.11.2015