Хотел бы я начать делать карточки давным-давно

Этот пост будет охватывать содержимое карточек, которые я сделал, чтобы запомнить самые важные моменты об алгоритме YOLOv1, первоначально разработанном Джозефом Редмоном в 2015 году для обнаружения объектов.

В конце концов я сделаю пост, в котором опишу, почему я делаю карточки, какое программное обеспечение я использую (Anki) и как именно я их делаю и использую. Тем не менее, в этом посте я просто покажу, как выглядят мои карточки, на случай, если кто-то еще захочет их воспроизвести. На следующем gif-файле показан пример:

Этот пост не будет вдаваться в подробности описания алгоритма YOLOv1 — для этого есть много других ресурсов, в том числе:

Как выглядят основные карточки

Карта 1

Если вы используете Anki, это текст удаления Cloze:

Название алгоритма обнаружения объектов YOLO связано с тем, что {{c1::YOLOv1 была одной из первых одноэтапных моделей детектора объектов, что означает, что ему нужно посмотреть на изображение только один раз (YOLO означает You Only Look Once)} }

Карта 2

Если вы используете Anki, это текст удаления Cloze:

Одноэтапная модель детектора объектов означает, что она выполняет {{c1::идентификацию объектов (например, прогнозирование ограничивающих рамок)}} и {{c1::классификацию}} в сквозной дифференцируемой сети.

Карточка 3

Если вы используете Anki, это текст удаления Cloze:

Модель YOLOv1 была первой, в которой обнаружение объектов рассматривалось как проблема {{c1::regression}}.

Карточка 4

Если вы используете Anki, это текст удаления Cloze:

Архитектура модели YOLOv1 состоит из 24 слоев свертки, за которыми следуют 2 полносвязных слоя с чередующимися слоями свертки {{c1::1×1}}, сокращающими пространство признаков по сравнению с предыдущими слоями. На выходе получается тензор с высотой 7, шириной 7 и глубиной ~30, который можно рассматривать как {{c1::разделение входного изображения}} на сетку 7×7 и имеющий ~30 признаков, относящихся к {{ c1::ограничивающие рамки и уверенность в выводе.}}

Карта 5

Если вы используете Anki, это текст удаления Cloze:

Функция потерь YOLOv1 представляет собой {{c1::a модифицированную потерю суммы квадратов ошибок.}}

Дополнительные услуги

Во всех карточках выше есть раздел «Дополнительно», который появляется только после того, как я уже посмотрю ответ на обратной стороне карточки (см. гифку в начале). Эта дополнительная информация полезна, если у меня возникли проблемы с карточкой, и после того, как я увижу ответ, я хочу посмотреть текст или изображения, которые описывают некоторые детали алгоритма или дают дополнительный контекст.

Первые три рисунка взяты из оригинальной статьи: Вы только посмотрите один раз: унифицированное обнаружение объектов в реальном времени

Следующие два изображения — скриншоты из этой записи в блоге Сик-Хо Цанга.

Ну вот! Я надеюсь, что это поможет некоторым людям, пытающимся учиться всю жизнь, как я!

Первоначально опубликовано на http://fiveminutemachinelearning.wordpress.com 24 июня 2022 г.