Обработка естественного языка в постоянно развивающемся наборе данных (английский сленг)

Целью моделей НЛП является обработка языка точно так же, как это делают люди — достаточно прагматичной, чтобы получить сленг и случайные двойные отрицания для настоящего отрицания, и достаточно семантической, чтобы работает на всю жизнь.

Но что делать, когда люди продолжают менять значение слова? Точнее, как вы относитесь к постоянно развивающемуся и постоянно меняющемуся языку, который переходит от «я за это» к «я вниз» в одном и том же поколении, чтобы означать буквально то же самое, что они хотели бы дать ему? попытка.

Большая часть наших ресурсов в академических кругах и в промышленности в определенной степени уходит на создание этой совершенноймодели, которая победит все — сбои данных, сезонные тенденции и даже случайные первоначальные неправильные классификации. Может быть, пришло время применить старую поговорку к машинному обучению — согласованность важнее интенсивности.

Следующим требованием науки о данных является постоянно совершенствующийся процесс предварительной обработки и очистки.