Публикации по теме 'computer-vision'


Учебное пособие по сетям с пространственными трансформаторами, часть 2 - Билинейная интерполяция
Самостоятельное введение Модули Spatial Transformer - популярный способ повысить пространственную инвариантность модели относительно пространственных преобразований, таких как перемещение, масштабирование, поворот, обрезка, а также нежесткие деформации. Их можно вставлять в существующие сверточные архитектуры: сразу после ввода или в более глубокие слои. Они достигают пространственной инвариантности, адаптивно преобразовывая вводимые данные в каноническую ожидаемую позу, что приводит к..

Редкий R-CNN: новый тип детектора
Сегодня мы собираемся обсудить метод , предложенный исследователями из четырех организаций, одним из которых является ByteDance AI Lab (известная своим приложением TikTok). Они предоставляют нам новый метод, называемый Sparse R-CNN (не путать с Sparse R-CNN, который работает с разреженными свертками в задачах трехмерного компьютерного зрения, таких как that ), который обеспечивает почти самую современную производительность в обнаружении и использовании объектов. создание полностью..

Сети сжатия и возбуждения
Новый уровень развития ImageNet Сети сжатия и возбуждения ( SENets ) представляют собой строительный блок для CNN, который улучшает взаимозависимости каналов практически без затрат на вычисления. Они использовались на конкурсе ImageNet в этом году и помогли улучшить результат прошлого года на 25%. Помимо этого огромного повышения производительности, их можно легко добавить к существующим архитектурам. Основная идея такова: Давайте добавим параметры к каждому каналу сверточного..

Компьютерное зрение: настоящее и будущее
Давайте начнем с размышлений о том, каким может быть зрение. Большинство людей используют его для приготовления пищи, обхода препятствий, чтения дорожных знаков, просмотра видео и выполнения сотен задач. Зрение — это чувство с самой высокой пропускной способностью; он обеспечивает пожарную часть информации о состоянии мира и о том, как действовать в этом случае. По этой причине ученые-компьютерщики уже полвека пытаются дать компьютерное зрение, породив подполе компьютерного зрения. Его..

Нейронная сеть Centroid и векторное квантование для сжатия изображений
Глубокое обучение Нейронная сеть Centroid и векторное квантование для сжатия изображений Поднимем потенциалы, на которые не обращают особого внимания Нейронная сеть Centroid (CentNN) доказала свою эффективность и стабильность алгоритма кластеризации и успешно применялась для решения различных задач. CentNN в большинстве случаев дает более точные результаты кластеризации по сравнению с K-средними и самоорганизующейся картой (SOM). Основное ограничение CentNN заключается в том,..

Враждебные примеры и функция шумоподавления
Возьмем, к примеру, распознавание лиц. Легитимные входные данные представляют собой состязательный пример, сгенерированный состязательной атакой. Как мы видим, состязательный пример почти идентичен исходному законному вводу. Следовательно, человек отнес бы его к тому же классу. Однако модель распознавания лиц чувствительна к минимальным различиям между состязательным примером и исходным допустимым вводом. Он классифицирует враждебный пример к классу, отличному от исходного класса,..

Краткий обзор истории ИИ: Часть 1
Краткий обзор истории ИИ: Часть 1 Зарождение искусственного интеллекта (1943–1955 годы): Общепризнано, что первые семена искусственного интеллекта были сделаны Уорреном МакКаллохом и Уолтером Питтсом в 1943 году. Они придумали модель искусственных нейронов, в которой каждый нейрон имеет состояние «включено» или «выключено» с переключением в состояние «включено». в ответ на раздражение достаточным количеством соседних нейронов. Они показали, что любая вычислимая функция может быть..