Публикации по теме 'convolutional-network'


FaceNet: унифицированное встраивание для распознавания лиц и кластеризации
FaceNet - это встраиваемая среда обучения для проверки лиц, распознавания / классификации и кластеризации. Структура оценивается на человеческих лицах, проверяя, принадлежат ли два лица одному и тому же человеку, и группируя лица, которые принадлежат одному человеку, как в Google Picasa. В статье основное внимание уделяется триплетным потерям. Оцениваются различные сети встраивания, такие как начальные и варианты AlexNet. Главный вывод: Triplet loss изучает вложение для классификации и..

Как решения компьютерного зрения на основе машинного обучения решают проблемы во всех отраслях
Технологии компьютерного зрения используются предприятиями для решения реальных бизнес-задач. Интеграция компьютерного зрения с технологиями приема данных помогает добиться того же. Такие секторы, как розничная торговля, финансовые услуги, страхование, автомобилестроение, СМИ и здравоохранение, развернули компьютерное зрение и машинное обучение для решения своих бизнес-задач. Сценарии использования в разных отраслях интригуют. Например, страховые компании использовали компьютерное..

Классификация белковых доменов PFAM
Мой профиль linkedin: www.linkedin.com/in/ashwin-singh-403116173 Мой профиль Github: https://github.com/ashwin4glory В этом блоге будут описаны шаги, которые необходимо предпринять для решения проблемы классификации доменов белков с использованием глубокого обучения. Мы будем иметь дело с данными PFAM, которые предоставляет kaggle. Мы сообщаем о модели глубокого обучения, которая изучает взаимосвязь между невыровненными аминокислотными последовательностями и их..

Deeplearning.ai CNN, неделя 4: специальные приложения
Приложение для распознавания лиц/передачи нейронного стиля Однократное обучение Учимся на одном примере узнавать человека снова. Обучение функции «подобие». d (img1, img2) = степень различия между изображениями. В зависимости от степени значения d проверка работает или нет. Сиамская сеть Используйте сверточную сеть для преобразования входных данных в функцию. Для этого удалите последний слой softmax для классификации, оставьте слой «128» узлов. Каждый вход будет..

Дорога к Sparse R-CNN - ключевые идеи и интуиция
Дорога к Sparse R-CNN - ключевые идеи и интуиция Краткое объяснение прежних моделей SOTA для обнаружения объектов и нововведений, которые были внесены Sparse R-CNN. Sparse R-CNN - это новый алгоритм SOTA, который был представлен на конференции 2021 года по компьютерному зрению и распознаванию образов (CVPR). Он быстрее и в некоторых случаях лучше своих предшественников. Но какие новые решения он предлагает и чем отличается от того, что было раньше? В этом блоге я попытаюсь..

Обнаружение SET-карт с использованием трансферного обучения
Как создать мощные функции из глубоких сверточных сетей Во время отпуска в прекрасной Франции я и моя семья много играли в SET , простую и элегантную карточную игру. Цель состоит в том, чтобы найти определенные комбинации карт до того, как их найдут другие. Играя в игру, мы часто смотрели на карты, гадая, есть ли еще один НАБОР, которого мы просто не видим. Так начался забавный личный побочный проект, в котором я применяю машинное обучение для нахождения комбинаций SET. В этом посте..

[2020] Речевое поколение 0: Генеративные модели речевых сигналов на основе вокодера и RNN и CNN
В этой статье я расскажу об основах генерации речи и последних разработках моделей генерации речи на основе RNN и CNN. Если вы заинтересованы, вы также можете получить доступ к версии видео или версии мандарин (中文) . Синтез речи Синтез речи (SS) — это метод создания определенной речи в соответствии с заданными входными данными, такими как тексты (преобразование текста в речь, TTS). Ядром SS является управляемость речевых компонентов, а фундаментальный метод называется вокодер [..