Публикации по теме computer-vision

Публикации по теме 'computer-vision'

Создание простого распознавателя текста на Python

Как улучшить процесс создания заметок с помощью распознавателя текста В этом посте я покажу вам, как извлечь текст из изображения с помощью Python. Этот процесс просто называется «Распознавание текста» или «Обнаружение текста». Итак, как вы можете понять из названия, мы создадим простую программу на Python, которая будет извлекать для нас текст. После извлечения программа также экспортирует результат в текстовый документ. Таким образом, мы можем вести учет наших результатов. Если..

Создайте модель сегментации с помощью одной строки кода

Создавайте и обучайте модель нейронной сети для сегментации изображений самым быстрым способом. Модели нейронных сетей доказали свою высокую эффективность в решении задач сегментации, обеспечивая высочайшую точность. Они привели к значительным улучшениям в различных приложениях, включая анализ медицинских изображений, автономное вождение, робототехнику, спутниковые снимки, видеонаблюдение и многое другое. Однако построение этих моделей обычно занимает много времени, но после прочтения..

NudeNet: набор нейронных сетей для обнаружения и цензуры наготы

Примечание. Этот пост также можно прочитать здесь Обратите внимание, что после написания этого сообщения NudeDetector, NudeClassifier сильно изменились. Основные изменения 10-кратное увеличение данных, обнаружение большего количества деталей (Checkout https://github.com/notAI-tech/NudeNet/ ) Автоматическая загрузка файлов контрольных точек и поддержка Windows. В 2 раза более быстрая модель по умолчанию и в 6 раз более быстрый «быстрый» режим обнаружения. Поддержка..

Обнаружение объектов всего в 3 строках кода R с помощью Tiny YOLO

Из Википедии , Компьютерное зрение - это междисциплинарная область, которая занимается тем, как сделать компьютеры для получения высокого уровня понимания цифровых изображений или видео. С точки зрения инженерии, он направлен на автоматизацию задач, которые может выполнять зрительная система человека. Наряду с улучшениями в исследованиях компьютерного зрения развивались и проблемы, которые мы стремимся решить. Одна из проблем, над решением которой работает компьютерное зрение, - это..

Могут ли машины видеть? Понимание компьютерного зрения.

Могут ли машины видеть? Понимание компьютерного зрения. Камеры могут делать снимки, преобразовывая свет в двумерный массив чисел, известный как пиксели . Но это просто безжизненные цифры. Смысла в себе они не несут. Видение алфавита иностранного языка не означает, что вы можете прочитать и понять текст. Сфотографировать не то же самое, что увидеть. По-настоящему видеть означает понимать и интерпретировать то, на что вы смотрите, а не просто пассивно фотографировать, как турист в..

ICML 2016: Глубокие остаточные сети

Международная конференция по машинному обучению (ICML) - ведущая международная научная конференция по машинному обучению, привлекающая более 2000 участников. В этом году он проходил в Нью-Йорке, и я присутствовал на нем от Init.ai . Три обучающих семинара, которые я посетил, были весьма впечатляющими. Эти темы будут интересны всем, кто работает над диалоговыми приложениями, чат-ботами и глубоким обучением. Глубокие остаточные сети: глубокое обучение становится глубже , Кайминг Хе (..

Освоение OpenCV2 за 15 дней — День 3: фильтрация и улучшение изображений

В предыдущей главе мы работали над манипулированием изображениями с помощью OpenCV2 и упоминали изменение размера, обрезку и поворот. В этой главе мы сосредоточимся на методах фильтрации и улучшения изображений с использованием OpenCV. Фильтрация изображений включает в себя применение различных операций к изображению для изменения его внешнего вида или извлечения определенных функций. Мы рассмотрим такие методы, как размытие, повышение резкости и выравнивание гистограммы. 1...