Если вы используете компьютер как художник и выражаете свое личное видение,

Я думаю, что ваше личное видение проявляется.

~ Марвин Мински

Когда я был ребенком, я играл в видеоигры, которые казались такими реальными, и смотрел фильмы, в которых машины и технологии оживали, как если бы они жили в реальном мире. Я задавался вопросом, произойдет ли это на самом деле, или это была просто графика, которую я видел в то время, которую он нашел невероятной… Но когда этот мальчик сам решил стать частью этой области, на его вопросы были даны ответы.

Компьютерное зрение — это сочетание магии и науки для создания иллюзий реальности.

Это похоже на интеграцию интерактивных технологий,

подобно искусственному интеллекту/компьютерному зрению с магией.

~ Сам

Я считаю, что если машина способна смотреть на окружающее и понимать ситуацию, она может реагировать на нее так же, как и человек.

Технология компьютерного зрения является важным аспектом ИИ, поскольку она помогает разработать машину, которая может просматривать изображение/видео, интерпретировать его и реагировать на него. Способность машин обучаться распознаванию изображений или видео с помощью компьютерного зрения изменила весь рынок инноваций. Каждый раз, когда публикуется новое исследование компьютерного зрения, весь технологический ландшафт улучшается. Эта технология продвинула нас не только в автомобильной и розничной отраслях, но и в области медицины, спорта, социальных сетей, наблюдения и многих других областях, и она продолжает делать это изо дня в день, делая жизнь намного проще. удобнее, быстрее и с большей ясностью.

Некоторые из самых ярких приложений Computer Vision в настоящее время:

  • Amazon Go — это магазин, где можно просто выйти из дома, где не нужно ждать в длинных очередях/очередях для оформления заказа/выставления счета за купленные товары. Используя компьютерное зрение, глубокое обучение и датчики, они идентифицируют товары, взятые с полок, добавляют их в виртуальные тележки и взимать плату со счета Amazon.

Таким образом, клиент, вошедший в приложение Amazon Go, может зайти в магазин Amazon Go, выбрать товары и выйти. Квитанция будет отправлена ​​в приложение, и со счета Amazon будет снята оплата.

  • Lookout — это приложение Google, в котором используется технология машинного зрения. Он помогает слабовидящим людям идентифицировать окружающие их объекты с помощью смартфона.
  • Самоуправляемые автомобили теперь доступны для поездок по дорогам. Беспилотные автомобили используют лидар, радар и технологии технического зрения, чтобы знать, какие объекты находятся вокруг него, как далеко они находятся, и предсказывать, что они будут делать дальше.

Водители беспилотных автомобилей могут просто сидеть сложа руки, расслабляться и наслаждаться поездкой, пока машина едет сама. Такие автомобили, как Tesla, Waymo и многие другие беспилотные автомобили.

  • Точная диагностика: с помощью компьютерного зрения и машинного обучения система может точно диагностировать симптомы/заболевания. Системы с поддержкой Vision используются для точного анализа медицинских изображений, таких как рентгеновские снимки, сканирование и ультразвуковые изображения, что исключает любую возможность ложного диагноза.
  • Медицинские исследования: Компьютерное зрение в значительной степени помогает в медицинских исследованиях. Он выявляет различные закономерности из исторических сканирований, что приводит к более быстрой и ранней диагностике заболеваний в будущем. Это также помогает выявить модели поведения/движений пациентов и связать их с процессом выздоровления.
  • Фенотипирование растений: анализ здоровья и адаптации растений к окружающей среде, прогноз урожайности на основе фенотипа растений. Пример: AirSurf-Lettuce с G’s Growers — это проект фенотипирования салата на основе компьютерного зрения, реализованный в Англии. (Ссылка: https://www.nature.com/articles/s41438-019-0151-5)

Классификация зрения

Я понимаю, насколько сложна работа системы человеческого зрения. Точно так же достижение возможностей машинного зрения не менее сложно.

Компьютерное зрение имеет много общего с человеческим зрением, но между ними есть существенные различия. Зрение человека — сложный процесс, который до конца еще не изучен. Компьютерное зрение — это технологическая реализация человеческого зрения, которая позволяет компьютерам реализовать возможности человеческого зрения. Я смотрю на них и пытаюсь понять разницу между ними.

Что такое человеческое зрение?

Зрение человека — сложный процесс, который до сих пор до конца не изучен. Зрение, безусловно, является одним из самых важных из пяти чувств, и именно на него люди должны полагаться больше, чем на все остальные. Зрение – это особое чувство зрения, которое вращается вокруг света. Удивительно, как система человеческого зрения воспринимает и интерпретирует вещи. Мы видим вещи такими, какие они есть — деревья в лесу, книги на полке, безделушки на фабрике, машины на дороге и облака в небе. Никаких очевидных выводов не требуется, и требуются дополнительные усилия для интерпретации каждого объекта или сцены.

Все эти вещи зависят от глаз и от того, как они обнаруживают световые узоры и координируют свои действия с мозгом, чтобы преобразовать свет в изображения, которые мы видим. Человеческий глаз представляет собой сложную оптическую систему, очень похожую на камеру; свет отражается от объекта, на который вы смотрите, и попадает в глаза через роговицу. Затем свет проходит через зрачок и радужную оболочку, которые вместе контролируют количество света, попадающего в глаза. Когда все они работают вместе, они фокусируют свет на задней части глаза, называемой сетчаткой. Когда свет попадает на сетчатку, крошечные клетки сетчатки превращают его в электрические сигналы.

Что такое компьютерное зрение?

Компьютерное зрение использует алгоритмы для сбора предварительно определенных характеристик человеческого зрения и создания моделей и программ для имитации возможностей человеческого зрения в компьютерах. Это дает компьютерам возможность получать, анализировать и обрабатывать визуальную информацию точно так же, как это делает человеческое зрение.

Одной из наиболее распространенных реализаций компьютерного зрения является распознавание лиц, которое используется для защиты доступа к вашим мобильным устройствам. Идея компьютерного зрения состоит в том, чтобы извлекать полезную информацию из изображений и предпринимать соответствующие действия на основе этой информации. Он в основном копирует систему человеческого зрения, поэтому компьютеры могут выполнять большую часть работы людей. Для простых механических задач это не особенно сложно, но для сложных задач машину необходимо научить визуализировать и понимать визуальные данные.

Проблемы компьютерного зрения

Я вижу некоторые проблемы компьютерного зрения:

  • Неадекватное оборудование:

Технология компьютерного зрения реализуется с помощью комбинации программного и аппаратного обеспечения. Для обеспечения эффективности системы бизнесу необходимо установить камеры высокого разрешения, датчики и ботов. Это оборудование может быть дорогостоящим и, если оно неоптимально или неправильно установлено, может привести к слепым зонам и неэффективным системам CV.

  • Плохое качество данных:

Высококачественные размеченные и аннотированные наборы данных являются основой успешной системы компьютерного зрения. В таких отраслях, как здравоохранение, где технология компьютерного зрения широко используется, крайне важно иметь высококачественную аннотацию и маркировку данных, поскольку последствия неточных систем компьютерного зрения могут нанести значительный ущерб. Например, многие инструменты, созданные для обнаружения Covid-19, не сработали из-за низкого качества данных.

  • Понимание объекта с его контекстом:

Как люди, мы сможем объяснить такие эмоции, как дети, наслаждающиеся ручьем с разноцветными бумажными корабликами в солнечный день. Но машине сложно понять взаимосвязь между различными объектами на изображении.

  • Умение различать:

В случае живого объекта, статуя объекта, плакат/фотография объекта в натуральную величину.

Некоторые важные темы, которые я изучил, изучая компьютерное зрение:

  • Говоря о CNN или сверточных нейронных сетях, которые помогают мне обрабатывать пиксельные данные. Несмотря на то, что это также помогло мне в глубоком обучении выполнять как генеративную, так и описательную работу.
  • И, как следует из названия, обработка естественного языка используется для автоматизации обработки естественного языка программным обеспечением, например речи и текста.
  • Трансферное обучение — это популярный подход в глубоком обучении, при котором предварительно обученные модели используются в качестве отправной точки для задач компьютерного зрения и обработки естественного языка, учитывая огромные вычислительные и временные ресурсы, необходимые для разработки моделей нейронных сетей для этих задач, а также огромные скачки в навык, который они обеспечивают по связанным проблемам. И это очень помогло мне сэкономить время. Я могу использовать ту же модель для новых задач, не перестраивая их.
  • Трансферное обучение действительно помогло мне сэкономить время. Я могу повторно использовать одну и ту же модель для новых заданий, не перестраивая их, поскольку трансферное обучение — это популярный подход к глубокому обучению, в котором предварительно обученные модели используются в качестве отправной точки для задач компьютерного зрения и НЛП из-за требуемых огромных вычислительных и временных ресурсов. для разработки моделей нейронных сетей для этих проблем и огромных скачков в навыках, которые они обеспечивают при решении связанных с ними проблем.
  • Я также прошел через GAN, поскольку дело доходит до распознавания лиц и творчества. GAN (генеративно-состязательные сети) генерируют новые экземпляры данных, которые имитируют ваши обучающие данные. GAN могут генерировать изображения, напоминающие фотографии человеческих лиц, несмотря на то, что лица не принадлежат ни одному реальному человеку. По сути, это недавнее новое открытие в области машинного обучения.
  • И поскольку я не могу не упомянуть обнаружение объектов, это важный метод компьютерного зрения, который играет в нем важную роль. Обнаружение объектов, на мой взгляд, является основой компьютерного зрения, поскольку оно больше учит нашу машину внешнему миру, позволяя ей работать более точно.

Потому что все эти технические аспекты делают компьютерное зрение более интересным, и причины, по которым эта технология меня так восхищает!

Оставайтесь продуктивными!!