Публикации по теме 'deep'


Работа с пространствами Бэра, часть 1 (топология)
Решение бесконечных игр в пространстве Бэра (arXiv) Автор: Бенедикт Брюч , Вольфганг Томас Аннотация: изучаются бесконечные игры (в форме игр Гейла-Стюарта), в которых игрой является последовательность натуральных чисел, выбираемая поочередно двумя игроками, причем условием выигрыша является подмножество бэровского пространства ωω. . Мы рассматриваем такие игры, определяемые естественным видом автоматов четности над алфавитом N, называемые N-MSO-автоматами, где переходы..

Как работает синтез речи, часть 4 (машинное обучение)
Может ли знание сквозных моделей преобразования текста в речь улучшить нейронные системы синтеза MIDI в аудио? (arXiv) Автор: Сюань Ши , Эрика Купер , Синь Ван , Джуничи Ямагиши , Шрикант Нараянан . Аннотация: При сходстве музыки и синтеза речи из символьного ввода и быстром развитии методов преобразования текста в речь (TTS) стоит изучить способы улучшения производительности MIDI-в-аудио путем заимствования из методов TTS. В этом исследовании мы анализируем недостатки системы..

Классификация спама с помощью ПЕРЧАТКИ
Я расскажу о другом способе создания встраивания слов, потому что традиционный Word2vec может использовать любую из двух архитектур моделей для создания распределенного представления слов: непрерывный пакет слов (CBOW) или непрерывный скип-грамм . В архитектуре непрерывного набора слов модель предсказывает текущее слово из окна окружающих контекстных слов. Порядок контекстных слов не влияет на предсказание (допущение мешка слов ). В архитектуре непрерывной скип-граммы модель..

Распознавание лиц с помощью MTCNN
В этом посте я покажу, как использовать MTCNN для извлечения лиц и черт из изображений. Что такое MTCNN???? MTCNN или многозадачные каскадные сверточные нейронные сети — это нейронная сеть, которая обнаруживает лица и лицевые ориентиры на изображениях. Он был опубликован в 2016 году Zhang et al. MTCNN — один из самых популярных и точных инструментов распознавания лиц на сегодняшний день. Он состоит из 3 нейронных сетей, соединенных в каскад. Это реализация детектора лиц..

Ограничения существующих фреймворков глубокого обучения: динамическое планирование
Зачем переделывать распределенную среду глубокого обучения, такую ​​как OneFlow ? Очевидным отправным моментом является то, что исходные основные платформы глубокого обучения по своей сути несовершенны. Особенно на уровне абстракции и API они разработаны с различными недостатками, которые сильно доставляют неудобства разработчикам при их использовании. Хотя некоторые недостатки устраняются, некоторые важные проблемы по-прежнему остаются без внимания. Поэтому мы начнем серию..