Я тренирую нейронную сеть с данными, поступающими из двух отдельных источников, эвристически:
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --oaa 10 --nn 20 --save_resume -i /tmp/weights -f /tmp/weights
Однако это вызывает ошибку о том, что «--oaa нельзя передать несколько раз». Хорошо, --save_resume
сохраняет аргументы конфигурации, поэтому я исправил:
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --save_resume -i /tmp/weights -f /tmp/weights
и все работало. Из любопытства я повторил второй подход без опции --save_resume
, все по-прежнему работало, за исключением того, что производительность модели была немного хуже.
Я бы предположил, что --save_resume
сохраняет скорость обучения и количество примеров, видимых в файле весов. Это то, что, по-видимому, происходит на выходе и подтверждает лучшую производительность. Что-нибудь еще?
Редактировать: После небольшого эксперимента я вижу, что передача исходного регрессора через -i
вызывает ошибку "опция '--oaa' не может быть указана более одного раза", а не --save_resume
.