Публикации по теме 'convolutional-network'
FaceNet: унифицированное встраивание для распознавания лиц и кластеризации
FaceNet - это встраиваемая среда обучения для проверки лиц, распознавания / классификации и кластеризации. Структура оценивается на человеческих лицах, проверяя, принадлежат ли два лица одному и тому же человеку, и группируя лица, которые принадлежат одному человеку, как в Google Picasa. В статье основное внимание уделяется триплетным потерям. Оцениваются различные сети встраивания, такие как начальные и варианты AlexNet.
Главный вывод: Triplet loss изучает вложение для классификации и..
Как решения компьютерного зрения на основе машинного обучения решают проблемы во всех отраслях
Технологии компьютерного зрения используются предприятиями для решения реальных бизнес-задач. Интеграция компьютерного зрения с технологиями приема данных помогает добиться того же. Такие секторы, как розничная торговля, финансовые услуги, страхование, автомобилестроение, СМИ и здравоохранение, развернули компьютерное зрение и машинное обучение для решения своих бизнес-задач.
Сценарии использования в разных отраслях интригуют. Например, страховые компании использовали компьютерное..
Классификация белковых доменов PFAM
Мой профиль linkedin: www.linkedin.com/in/ashwin-singh-403116173
Мой профиль Github: https://github.com/ashwin4glory
В этом блоге будут описаны шаги, которые необходимо предпринять для решения проблемы классификации доменов белков с использованием глубокого обучения. Мы будем иметь дело с данными PFAM, которые предоставляет kaggle. Мы сообщаем о модели глубокого обучения, которая изучает взаимосвязь между невыровненными аминокислотными последовательностями и их..
Deeplearning.ai CNN, неделя 4: специальные приложения
Приложение для распознавания лиц/передачи нейронного стиля
Однократное обучение
Учимся на одном примере узнавать человека снова. Обучение функции «подобие». d (img1, img2) = степень различия между изображениями. В зависимости от степени значения d проверка работает или нет.
Сиамская сеть
Используйте сверточную сеть для преобразования входных данных в функцию. Для этого удалите последний слой softmax для классификации, оставьте слой «128» узлов. Каждый вход будет..
Дорога к Sparse R-CNN - ключевые идеи и интуиция
Дорога к Sparse R-CNN - ключевые идеи и интуиция
Краткое объяснение прежних моделей SOTA для обнаружения объектов и нововведений, которые были внесены Sparse R-CNN.
Sparse R-CNN - это новый алгоритм SOTA, который был представлен на конференции 2021 года по компьютерному зрению и распознаванию образов (CVPR). Он быстрее и в некоторых случаях лучше своих предшественников. Но какие новые решения он предлагает и чем отличается от того, что было раньше? В этом блоге я попытаюсь..
Обнаружение SET-карт с использованием трансферного обучения
Как создать мощные функции из глубоких сверточных сетей
Во время отпуска в прекрасной Франции я и моя семья много играли в SET , простую и элегантную карточную игру. Цель состоит в том, чтобы найти определенные комбинации карт до того, как их найдут другие. Играя в игру, мы часто смотрели на карты, гадая, есть ли еще один НАБОР, которого мы просто не видим. Так начался забавный личный побочный проект, в котором я применяю машинное обучение для нахождения комбинаций SET.
В этом посте..
[2020] Речевое поколение 0: Генеративные модели речевых сигналов на основе вокодера и RNN и CNN
В этой статье я расскажу об основах генерации речи и последних разработках моделей генерации речи на основе RNN и CNN. Если вы заинтересованы, вы также можете получить доступ к версии видео или версии мандарин (中文) .
Синтез речи
Синтез речи (SS) — это метод создания определенной речи в соответствии с заданными входными данными, такими как тексты (преобразование текста в речь, TTS). Ядром SS является управляемость речевых компонентов, а фундаментальный метод называется вокодер [..