Zumo Labs представляет The Juice, еженедельный информационный бюллетень, посвященный проблемам компьютерного зрения (а иногда и обычным проблемам). Берите, пока свежо.

Неделя 26–30 июля 2021 г.

____

Слышали ли вы о броске с половины корта, который кто-то осушил во время мужского баскетбольного матча США против Франции на днях? Это может показаться не достойным освещения в печати, учитывая, что Олимпийские игры объединяют самых талантливых ныне живущих спортсменов человечества. Но спортсмен, о котором идет речь, не был ни живым, ни человеком. Toyota Cue 4, циклопическая, обожженная бельгийская вафля робота с кошмарно огромными руками, вышла на корт во время перерыва, чтобы напомнить миру, что даже наших золотых медалистов не хватит, чтобы остановить его и ему подобных.

Между прочим, Олимпийские игры уже давно стали испытательным полигоном для такого рода передовых технологий. Первая камера для фотофиниша Волшебный глаз была представлена ​​на Играх в Лондоне в 1948 году. Это был результат совместной работы британской звукозаписывающей компании Race Finish и Omega Timing. Совсем недавно Омега работала над технологией компьютерного зрения для отслеживания пляжного волейбола, который будет официально представлен на играх в этом году. Они могут похвастаться точностью 99%, но признают, что окклюзия сбила их с толку во время тренировки.

Как система будет работать теперь, когда ее будут тестировать на международной толпе разных рас и полов? Время покажет.

____

#ковабунга

США Серфинг принес домой впечатляющую победу после олимпийского дебюта этого вида спорта в этом году. Это был, конечно, результат огромного количества тренировок и тяжелой работы, но также и кое-что еще. Медицинский директор команды сказал WSJ, что они усердно искали решения для улучшения результатов спортсменов при одновременном смягчении неконтролируемых переменных, таких как ветер и приливы, и что «нашей дорожной картой было более глубокое погружение в аналитику и данные». Когда биомеханики выяснили, насколько критичен дисбаланс, они начали разработку системы машинного обучения, которая оценивает маневры и стойку. Кажется, это окупилось.

Как олимпийский серфинг пытается оседлать волну машинного обучения, через The Wall Street Journal.

#Кэсси

Кэсси, очень эффективный многомиллионный робот с коленами, которые гнутся, как у страуса, только что вошла в историю. Он преодолел 5 км в штате Орегон чуть более чем за 53 минуты без привязки и на одном заряде батареи. Кэсси использует сочетание биомеханики, существующих подходов к управлению роботами и новых инструментов машинного обучения. По данным Лаборатории динамической робототехники ОГУ, это первый двуногий робот, использующий машинное обучение для управления походкой на открытом воздухе. Джонатан Херст, профессор робототехники, руководивший разработкой Кэсси благодаря гранту Министерства обороны США, говорит, что целостный подход невероятно захватывающий и обеспечит уровень производительности, подобный животным.

Двуногий робот, разработанный в штате Орегон, вошёл в историю, научившись бегать и пробежав 5 км, через Университет штата Орегон.

#Открытый исходный код

Google AI объявил в среду о запуске набора данных с открытым исходным кодом, который содержит местоположение и площадь более 500 миллионов зданий по всей Африке. Наличие точной записи такого типа имеет жизненно важное значение для оказания помощи при стихийных бедствиях и оказания медицинской помощи, информации переписи населения и исследований окружающей среды, но неформальные поселения, сельские районы и небольшие или нечеткие постройки могут затруднить обнаружение зданий с помощью компьютерного зрения. Итак, искусственный интеллект Google вручную пометил 1,75 миллиона зданий на 100 000 изображений и обучил модель с конвейером обнаружения в стиле U-Net, который восходит вверх… сначала классифицируя каждый пиксель как здание или не здание, а затем группируя эти пиксели вместе. в отдельные экземпляры. Проект возглавил Google Research, Гана, в рамках ИИ для социального блага.

Карта зданий Африки с помощью спутниковых снимков, через блог Google AI.

#Осторожно, спойлеры

Те, кто закончил второй сезон «Мандалорца» — если вы еще не закончили и собираетесь это сделать, прекратите читать прямо сейчас — получили возможность увидеть эпическое открытие Марка Хэмилла, вернувшегося в качестве пост-RotJ Люка Скайуокера. Момент был несколько подорван цифровым эффектом омоложения, из-за которого Люк навсегда остался в сверхъестественной долине. Но вскоре появилась новая надежда. Его имя? Шамук. Ютубер в одиночку улучшил работу целой студии FX с помощью опытного дипфейка, и его видео с улучшенной сценой с тех пор набрало почти три миллиона просмотров. Возможно, тогда нам не стоит удивляться, узнав, что ILM развернулась и наняла его.

Lucasfilm наняла ютубера, который использовал дипфейки, чтобы настроить визуальные эффекты Люка Скайуокера в «Мандалорце», через IndieWire.

#Джессика

Project December — это интерфейс генерации языка в стиле чат-бота, который настолько хорошо имитирует человеческую речь, что может сбивать с толку. Это был один из первых способов взаимодействия обычных людей с GPT-3 — большой языковой моделью, обученной на полутриллионе слов, взятых из Интернета. Он не может определять время или складывать числа, он известен избыточностью и непоследовательностью и по своей сути требует регулирования. Но его способность к персонализации позволяет так же легко «болтать» со Споком, как и с давно скучающим любимым человеком. SF Chronicle долго продолжает технологически облегченную скорбь.

Симуляция Джессики: любовь и потеря в эпоху ИИ, через Хроники Сан-Франциско.

____

📄 Бумага недели

YOLOX: превосходство в серии YOLO в 2021 году

Популярная модельная архитектура, известная как YOLO, официально начала использовать схемы именования iPhone, перейдя от YOLOv5 к YOLOX (хотя эта архитектура ближе к YOLOv3, чем к YOLOv5). Эта новейшая версия YOLO включает в себя современные функции, такие как обнаружение без привязки и отсоединенная головка модели. Авторы делают интересное заявление о том, что комбинация MixUp и Mosaic (методов увеличения данных) означает, что им не нужно предварительно обучаться на ImageNet, чтобы получить свои результаты. Большая версия этого нового варианта YOLO заняла 1-е место в конкурсе Streaming Perception Challenge (семинар по автономному вождению на CVPR 2021).

____

Думаете, The Juice стоил того? Подпишитесь здесь, чтобы получать его еженедельно.