Публикации по теме 'convolution-neural-net'


Распознавание эмоций по речи с помощью машинного обучения и глубокого обучения
Человеческое общение посредством разговорной речи является основой для обмена информацией и основным аспектом жизни общества с момента появления первых населенных пунктов. Таким же образом эмоции восходят к изначальному инстинкту, предшествовавшему разговорной речи, который мы знаем сегодня и который можно рассматривать как первую естественную стратегию общения. Суть проекта в обнаружении эмоций, вызываемых говорящим во время разговора. Например, речь, производимая в состоянии..

Краткий обзор статьи «Wav2Vec: неконтролируемая предварительная подготовка для распознавания речи»
Автор: Штеффен Шнайдер, Алекси Баевски, Ронан Коллоберт, Майкл Аули Обзор Неконтролируемая предварительная подготовка для обучения представлению для распознавания речи Мы предварительно обучаем простую многослойную сверточную нейронную сеть, оптимизированную с помощью задачи бинарной классификации с контрастированием по шуму. Эксперименты на WSJ снижают WER базовой линии банка фильтров log-mel на основе сильных символов до 46%, когда доступны только несколько часов расшифрованных..

Обнаружение маски лица
Face Mask Detection - это проект, основанный на искусственном интеллекте. В нем мы обнаруживаем людей с маской или без нее. В создании этого проекта у нас есть два этапа. Обучите модель с помощью свертки или любой предварительно обученной модели, которая обнаруживает маски лица на изображениях. Затем обнаруживайте лица на видео или изображениях и получайте прогнозы от нашей обученной модели. В этом проекте я использовал трансферное обучение для обучения модели на наборе данных, в..

Классификация изображений с использованием Fas14MNet
Классификация изображений с использованием Fas14MNet Что такое Fas14MNet? Fas14MNet — это сеть CNN, вдохновленная архитектурой ResNet-50, но имеющая гораздо меньше параметров. Сеть следует блочной архитектуре ResNet, но с расширением ядра и сверткой слоев по глубине, чтобы сократить всего до 2 основных слоев на блок и 3 блоков свертки в целом. ResNet-50 имеет остаточный механизм добавления, который был заменен слоем Layer Pruning после каждого блока. Fas14MNet использует только ~15..

Классификация изображений за 10 минут с помощью набора данных MNIST
Классификация изображений за 10 минут с помощью набора данных MNIST Использование сверточных нейронных сетей для классификации рукописных цифр с помощью TensorFlow и Keras | Контролируемое глубокое обучение Если вы читаете эту статью, я уверен, что мы разделяем схожие интересы и находимся / будем работать в схожих отраслях. Итак, подключимся через Linkedin ! Пожалуйста, не стесняйтесь отправить запрос на контакт! Орхан Г. Ялчин - Linkedin Прежде чем углубиться в эту..

НЛП с CNN
Пошаговое объяснение с реализацией архитектуры Keras. Сверточные нейронные сети (CNN) - это наиболее широко используемые архитектуры глубокого обучения при обработке изображений и распознавании изображений. Учитывая их превосходство в поле зрения, вполне естественно, что будут опробованы реализации в различных областях машинного обучения. В этой статье я попытаюсь объяснить важную терминологию, касающуюся CNN, с точки зрения обработки естественного языка, также будет предоставлена..