Исследовательская группа Microsoft представила «простой, но эффективный» метод, который значительно повышает стабильность моделей трансформаторов всего за несколько строк кода.

Крупномасштабные трансформеры достигли самых современных результатов в широком спектре задач обработки естественного языка (NLP)…