За пять лет, прошедших с момента их появления, архитектуры-трансформеры стали доминировать в области исследований обработки естественного языка. Недавно преобразователи зрения (ViT) также продемонстрировали свою мощь и потенциал в широком спектре задач компьютерного зрения. Хотя успех трансформеров во многом…