Вариация оценки BLEU

У меня вопрос по подсчету BLUE Score для машинного перевода. Я понял, что у них могут быть другие показатели для BLEU. Я обнаружил, что код сообщает пять значений для BLEU, а именно BLEU-1, BLEU-2, BLEU-3, BLEU-4 и, наконец, BLEU, что, по-видимому, является экспоненциальным средним значением для предыдущих четырех BLEU. До сих пор мне непонятно, в чем разница между ними. У тебя есть идеи? Спасибо

P.s. Сначала я подумал, что этот вопрос скорее теоретический content и разместил его на meta stackexange. Модератор закрыл и прокомментировал это как вопрос типа stackoverflow. Так что, пожалуйста, не наказывай меня снова. знак равно


person Jürgen K.    schedule 02.06.2017    source источник


Ответы (2)


источник: http://www.statmt.org/book/slides/08-evaluation.pdf

Я не слышал о BLEU-1 и BLEU-2, но я предполагаю, что это означает 1 грамм, 2 грамма, 3 грамма и 4 грамма в формуле оценки BLEU, я имею в виду в формуле precision[i] = BLEU-i в вашем вопросе:
 введите описание изображения здесь

person Iman Mirzadeh    schedule 10.06.2017

На самом деле BLEU-n не использует только n-граммовые оценки. Он вычисляет оценки от 1 грамма до n граммов и присваивает им одинаковый вес для вычисления окончательной оценки. См. Раздел «Совокупный результат в N-граммах» по этой ссылке для получения дополнительной информации.

person Tara Eicher    schedule 14.04.2018