Публикации по теме 'visual-question-answering'


Новая система визуальных ответов на вопросы на изображениях 360⁰
Отвечайте на вопросы о мировоззрении на 360 градусов Визуальные ответы на вопросы (VQA) в последнее время привлекли к себе большое внимание во многих исследовательских сообществах. В этой задаче машина должна воспринимать окружающую среду визуально, понимать человеческие языки и выполнять мультимодальные рассуждения - все они являются важными компонентами для разработки современных1 систем искусственного интеллекта. За последние три года создано более двух десятков наборов данных...

Визуальный ответ на вопрос (VQA) с различными комбинациями функций
Расширения визуального ответа на вопрос В настоящее время моя работа связана с языковым моделированием, сегментацией и декомпозицией с использованием НЛП. Учитывая важную роль семантики и значения в понимании языка, я хотел вернуться к некоторым предыдущим работам в этой области, особенно к такой интересной, как визуальный ответ на вопрос (VQA), который сочетает в себе компьютерное зрение, понимание естественного языка и глубокое обучение. В этой статье представлен обзор модели VQA и..