Публикации по теме 'computer-vision'


Трехмерная реконструкция со стереоизображениями - Часть 2: Оценка позы
Вступление В нашей предыдущей публикации мы работали над пониманием функций наших камер и того, как эта информация соотносится с нашей целью полной 3D-реконструкции. Благодаря калибровке у нас теперь есть важные цифры, которые описывают характеристики наших камер, которые могут использоваться нашей программой, то есть; матрица камеры и коэффициенты искажения. На основе этой информации мы можем сфотографировать узорчатое изображение с помощью нашей камеры и вычислить, как этот объект..

Использование компьютерного зрения изменит будущее мира
Недавнее преимущество вычислительной мощности позволило нам сделать далеко идущие шаги, чтобы заглянуть прямо в будущее с такими технологиями, как искусственный интеллект и машинное обучение. Внедрение компьютерного зрения позволило нам добиться очень больших успехов в обнаружении объектов в реальном времени. Давайте посмотрим в этой статье, как компьютерное зрение поможет нам покорить будущее. Компьютерное зрение - одно из самых горячих направлений исследований в области глубокого..

FickleNet: Слабая и полууправляемая семантическая сегментация изображений с использованием стохастического вывода
Слабая и полууправляемая семантическая сегментация изображений с использованием стохастического вывода Предисловие Краткое изложение FickleNet [1] явилось результатом моего мастер-семинара на кафедре компьютерных медицинских процедур и дополненной реальности в ТУМ. Хочу поблагодарить своего куратора проекта Тарик Бдаир , а также кураторов курсов Магда Пашали и Dr. Шади Альбаркуни . Введение Для задач сегментации, в том числе медицинских, таких как сегментация опухоли, точность..

Распознавание рукописных слов
Это мой диплом, мальчики. Йо, йо, йо, как дела, ребята. Это моя первая статья об обнаружении и распознавании рукописных слов с помощью нейронных сетей. Надеюсь, вам понравится… Итак, как я узнаю рукописные слова? Прежде всего, вам нужно выбрать набор данных для обучения вашей нейронной сети. Набор данных Я выбрал базу данных рукописного ввода IAM, которую вы можете найти здесь . База данных рукописного ввода IAM содержит формы рукописного английского текста, которые можно использовать..

Моделирование оценки физиологических сигналов как проблема глубокого обучения
Начнем с небольшого упражнения. Но сначала я должен попросить вас надеть фитнес-трекер; У тебя есть один, верно? Ох .. ты думал, что упражнение было умственным? Катастрофически. Дело в том, что если вы хоть немного наблюдали за фитнес-устройством, которое сейчас находится у вас на запястье, вы заметили сияющий свет сзади (обычно зеленый). Теперь, если вы проявили любопытство или немного более наблюдательны, вы должны знать, что этот свет используется как средство (непреднамеренная..

Решение проблемы обнаружения объектов с помощью TPU Google
Недавно я участвовал в конкурсе по машинному обучению на Kaggle. Это был трек Google Open Images 2019 Challenge - Object Detection. Я был очень ограничен во времени: у меня было всего четыре недели, а обучение одной модели занимает около двух недель с 4 GPU 1080Ti. Но мне посчастливилось получить несколько кредитов TPU от Google. Поэтому я решил попробовать. Вот история. Что такое ТПУ? TPU - это специализированные микросхемы, которые хорошо справляются с матричным умножением...

Почему инженеры по машинному обучению (или специалисты по данным) не являются звездами шоу
МНЕНИЕ Почему инженеры по машинному обучению (или специалисты по данным) не являются звездами шоу Но по-прежнему являются неотъемлемой частью любой успешной рабочей силы. Эта статья - не атака на всех инженеров по машинному обучению или специалистов по анализу данных. Я инженер машинного обучения и компьютерного зрения, и эта статья основана на моих наблюдениях и опыте работы с искусственным интеллектом. промышленность. Все заявления, сделанные в этой статье, основаны на мнении...