Возможности vowpal wabbit

Мне нужно выбрать комбинацию (квадратичную и кубическую) функций из подмножества всех пространств имен. Я хочу избежать функций, которые являются одиночными. Пример:

1 1 '1-1-48112-c|m m_18 |o o_15 |s s_100390 |t t_20 |n n_5283 |d d_10023 |p p_2606 |w w_1 |f f_6.0 |g g_113119

Я хочу выбрать все функции (в соответствии с командной строкой VW я использую опцию -q m:), которые являются комбинацией с пространством имен «m». Важно отметить, что я хочу избежать всех отдельных функций, таких как t_20, m_18, o_15 и т. д.

использование параметров --ignore также удалит комбинации, которые мне не нужны.

В исходном коде кажется, что пространства имен игнорирования удаляются очень рано, до того, как будут созданы комбинации. Я готов изменить исходный код VW, если это необходимо.


person backdoor    schedule 29.11.2013    source источник


Ответы (1)


Если вы хотите использовать взаимодействие между двумя пространствами имен, одновременно игнорируя два пространства имен сами по себе, вам нужно будет создать функции взаимодействия самостоятельно и передать их в модель.

Это не должно быть слишком сложно: просто создайте новое пространство имен с конкатенацией нужных вам функций, например: 1 1 '1-1-48112-c|mynewnamespace t_20_m_18_o_15

Однако мне любопытно, почему вы хотите это сделать? Включение базовых признаков и их квадратичных взаимодействий, вероятно, даст такую ​​же, если не лучшую, точность прогнозирования, как удаление базовых признаков.

person Zach    schedule 31.03.2014