Публикации по теме computer-vision

Публикации по теме 'computer-vision'

Все (Гугли) смотрят на меня

Парки развлечений — неделя 4 На этой неделе было расширение задания прошлой недели по созданию механического питомца/предмета. Это означало вывести моего робота-напарника на новый уровень, включая подключение его к Интернету, добавление пультов дистанционного управления помимо ИК и любых других вкусностей, ожидающих меня внутри Max/MSP. Эта неделя была посвящена OSC или Открытому управлению звуком . С технической точки зрения, OSC подобен MIDI, но для современной эпохи (не..

линейная регрессия с несколькими переменными | Часть 2

На предыдущем уроке мы заложили основы многомерной линейной регрессии, затем представили метод градиентного спуска для поиска оптимальных параметров для наших данных и, наконец, изучили практические аспекты реализации этого подхода на конкретном случае. В этой главе мы изучим, как найти оптимальные параметры, не используя метод градиентного спуска, используя более прямой подход, затем мы проанализируем этот подход и дадим некоторые указания, в каком случае лучше использовать его, а не..

Резюме доклада — В поисках TrioNet

В этом блоге я кратко изложу статью « Поиск TrioNet: сочетание свертки с локальным и глобальным самостоятельным вниманием» вкратце . В этой статье авторы предлагают новую архитектуру, которая представляет собой комбинацию свертки, локального и глобального самоконтроля. Кроме того, они вводят метод иерархической выборки для поиска нейронной архитектуры и метод совместного использования нескольких голов для самоконтроля. Поиск документа TrioNet — Ссылка Примечание . «Любой..

Как получить 1,0 балла в Digit Recognizer?

Привет! Меня зовут Макар Бадерко, я 12-летний разработчик машинного обучения. Сегодня мы попытаемся занять первое место в одном из самых популярных соревнований Kaggle по компьютерному зрению — Digit Recognition со знаменитым набором данных MNIST. Это будет не очень сложно, так что приступим! Я рекомендую вам запустить этот код в Kaggle Notebooks. Для начала давайте импортируем несколько необходимых библиотек: После этого давайте загрузим наши данные и посмотрим на образец..

Оценщик и трекер позы человека в реальном времени

Обзор Оценка позы человека может быть достигнута с помощью подхода на основе скелета, который определяет ключевые точки, такие как колени, локти и плечи, а также связи между ними на изображениях или видео. Я создал этот побочный проект, чтобы поэкспериментировать с предварительно обученными моделями компьютерного зрения на Raspberry Pi с Intel Neural Compute Stick. Приложение выполняет двухмерную оценку позы человека для нескольких человек и обнаружение человека в видеопотоках с..

Объяснение документа: Простая основа для контрастного обучения визуальным представлениям

Рассмотрение идей, представленных в документе SimCLR В этой статье мы рассмотрим SimCLR: архитектуру, которая привела сообщество исследователей компьютерного зрения к новым высотам в самоконтролируемом предварительном обучении задачам зрения. SimCLR был представлен в статье «Простая структура для контрастного обучения визуальным представлениям » Чена и др. из Google Research в 2020 году. Идеи, изложенные в этой статье, относительно просты и интуитивно понятны, но есть также новая..

Знаете ли вы, что ИИ используется для автоматического определения положения вне игры на чемпионате мира по футболу FIFA 2022…

Еще во время чемпионата мира по футболу FIFA 2018 в России Международная федерация футбольных ассоциаций начала использовать Рефери с видеоассистированием (или VAR) , команду официальных лиц, которые помогают судьям принимать решения во время матча, анализируя видеоматериалы. игры. Хотя это помогло предотвратить ошибки, которые в конечном итоге могли повлиять на результаты, ручной анализ видео для подтверждения события выполняется особенно медленно как с точки зрения ожиданий..