Публикации по теме 'deep'
Работа с пространствами Бэра, часть 1 (топология)
Решение бесконечных игр в пространстве Бэра (arXiv)
Автор: Бенедикт Брюч , Вольфганг Томас
Аннотация: изучаются бесконечные игры (в форме игр Гейла-Стюарта), в которых игрой является последовательность натуральных чисел, выбираемая поочередно двумя игроками, причем условием выигрыша является подмножество бэровского пространства ωω. . Мы рассматриваем такие игры, определяемые естественным видом автоматов четности над алфавитом N, называемые N-MSO-автоматами, где переходы..
Как работает синтез речи, часть 4 (машинное обучение)
Может ли знание сквозных моделей преобразования текста в речь улучшить нейронные системы синтеза MIDI в аудио? (arXiv)
Автор: Сюань Ши , Эрика Купер , Синь Ван , Джуничи Ямагиши , Шрикант Нараянан .
Аннотация: При сходстве музыки и синтеза речи из символьного ввода и быстром развитии методов преобразования текста в речь (TTS) стоит изучить способы улучшения производительности MIDI-в-аудио путем заимствования из методов TTS. В этом исследовании мы анализируем недостатки системы..
Классификация спама с помощью ПЕРЧАТКИ
Я расскажу о другом способе создания встраивания слов, потому что традиционный Word2vec может использовать любую из двух архитектур моделей для создания распределенного представления слов: непрерывный пакет слов (CBOW) или непрерывный скип-грамм . В архитектуре непрерывного набора слов модель предсказывает текущее слово из окна окружающих контекстных слов. Порядок контекстных слов не влияет на предсказание (допущение мешка слов ). В архитектуре непрерывной скип-граммы модель..
Распознавание лиц с помощью MTCNN
В этом посте я покажу, как использовать MTCNN для извлечения лиц и черт из изображений.
Что такое MTCNN????
MTCNN или многозадачные каскадные сверточные нейронные сети — это нейронная сеть, которая обнаруживает лица и лицевые ориентиры на изображениях. Он был опубликован в 2016 году Zhang et al.
MTCNN — один из самых популярных и точных инструментов распознавания лиц на сегодняшний день. Он состоит из 3 нейронных сетей, соединенных в каскад.
Это реализация детектора лиц..
Ограничения существующих фреймворков глубокого обучения: динамическое планирование
Зачем переделывать распределенную среду глубокого обучения, такую как OneFlow ?
Очевидным отправным моментом является то, что исходные основные платформы глубокого обучения по своей сути несовершенны. Особенно на уровне абстракции и API они разработаны с различными недостатками, которые сильно доставляют неудобства разработчикам при их использовании. Хотя некоторые недостатки устраняются, некоторые важные проблемы по-прежнему остаются без внимания.
Поэтому мы начнем серию..