Мы каждый день сталкиваемся с брошенными животными на улицах наших городов. Некоторые из них бездомные, некоторые просто заблудились. Я стою здесь с уверенностью, что у нас все еще есть эта проблема не из-за бессердечия людей, а из-за сложного процесса поиска пропавших животных. Достижения в области технологий могут помочь нам решить эту проблему, улучшив взаимодействие с пользователем. Позвольте мне представить мою концепцию, разработанную специально для Эстонии и IxD.MA, и объяснить, как компьютерное зрение (CV) и искусственный интеллект (AI) могут сократить время и усилия, затрачиваемые на помощь животным. .

Прежде чем мы погрузимся в глубины AI и CV; вот несколько ссылок на ресурсы в Эстонии, которые могут быть полезны, если вы ищете пропавшего питомца или просто хотите помочь:

Eesti Loomakaiste Selts

Eestimaa Loomakaitse Liit

Лумус

Кодуотция

Друг на всю жизнь.Животные ищут дом.ЭСТ.Кодутуд loomad koduotsingul.EST.

Краткий обзор теории компьютерного зрения

Давайте начнем с основы, с понимания того, как работает компьютерное зрение. Понимание того, как технология воспринимает окружающую среду, позволит нам понять, как правильно реализовать CV и AI в процессе поиска.
Я так благодарен Теофилосу Аугустису за компьютерное зрение эксперта Intel Corp., который поможет детально изучить проблему.

Во-первых, современные мобильные технологии воспринимают визуальное совершенно по-другому. Все, что он видит, - это просто числа - 1 и 0. Каждая входная информация представлена ​​в виде большого кода, который должен быть структурирован в будущем. Этот процесс структурирования основан на таком математическом процессе, как Свертка. Мы можем рассматривать это как многоагентный вычислительный процесс, благодаря которому CV достигается понимание видимого. Свёртку в CV можно разделить на 4 части: 1) вход 2) фильтры 3) выход 4) модели.

Для нас действительно важны фильтры (на рис. - K), и модели, потому что все остальное - это просто вычислительные процессы. Фильтры можно описать как шаблон, который используется для анализа изображения (ввода), например RGB-фильтр для определения цвета. Фильтры обычно создаются разработчиками в зависимости от их потребностей. На заключительных этапах машинного обучения и компьютерного зрения мы можем говорить не о микроуровне, на котором CV анализирует цвета, формы или узоры, а о макроуровне - таких объектах, как собаки и кошки. После того, как входные данные проходят через фильтр, у нас есть выходные данные, которые следует классифицировать путем сравнения с моделями. Проще говоря, модели - это просто данные, миллионы фотографий кошек и собак. Таким образом, компьютерное зрение основано на машинном обучении видеть и знать. Наша цель - как можно больше тренировать CV и AI, чтобы в целом распознавать питомцев быстрее и лучше. На данный момент CV может обнаруживать и классифицировать собак и кошек, поэтому все, что нам нужно, - это просто создать отличный набор данных.

Компьютерное зрение, нейронные сети и искусственный интеллект развивались годами, и есть еще много вещей, которые нужно улучшить. На данный момент самая большая проблема - это оборудование, используемое в смартфонах. Это не так мощно, чтобы выполнять миллионы операций по обнаружению объектов так быстро, как мне хотелось бы. Чтобы решить эту проблему, я предлагаю перенести процессы распознавания на сервер, чтобы изображения не анализировались на телефоне. В нем будет задействовано как можно больше пользователей, независимо от новизны их устройства.

Описание концепции

Вернемся к проблеме бездомных животных и применим знания компьютерного зрения на практике. Поскольку CV может распознавать кошек и собак, классифицируя их по нескольким параметрам, это может сократить время и усилия, необходимые для поиска потерянного питомца.

Задача пользователя: найти потерянного питомца или помочь домашнему животному найти своего хозяина.
Разочарования: необходимость постоянно просматривать потерянные / найденные сообщения, время и усилие.
Цель: автоматизировать процесс поиска путем интеграции CV и AI с текущим UX.

Предлагаю разработать приложение на основе резюме и искусственного интеллекта, которое будет использоваться в качестве поисковой системы. Для более детального изучения этой концепции предлагаю рассмотреть все на примере нового пользовательского опыта. Исходя из задач пользователя, мы говорим о двух сценариях: 1) поиск пропавшего животного и 2) поиск хозяина пропавшего животного. В каждом из этих сценариев основную роль играет компьютерное зрение, которое анализирует изображения и сравнивает результаты с базой данных. Нет необходимости создавать такую ​​базу данных с нуля. Мы уже можем использовать существующие сообщения, размещенные в группах Facebook или на сайтах эстонских организаций. Все, что нам нужно, это API и желание организации сотрудничать.

Давайте перейдем к новому пользовательскому интерфейсу. Все начинается, когда пользователь встречает на улице бездомное животное. Сфотографировав и отправив данные на сервер, фотографию можно проанализировать с помощью компьютерного зрения и сравнить с фотографиями животных в поиске. После процесса анализа приложение показывает совпадения, а затем пользователь может сравнить результаты поиска с реальностью. Если пользователь увидит подобное животное, он узнает о нем больше информации и легко свяжется с владельцем.

Если совпадений нет, пользователь создаст сообщение о своем нахождении, тем самым расширив базу данных. Если у него нет времени или он просто не хочет этого делать, он предоставит организациям данные, которые он обнаружил. Так что со всем справились профессионалы.

Если пользователь ищет своего потерянного питомца, он будет использовать CV, чтобы проанализировать фотографию своего питомца и посмотреть, нашел ли кто-нибудь его питомца или нет. Использование компьютерного зрения для поиска домашних животных избавляет пользователя от необходимости вручную просматривать все сообщения на различных платформах.

Более того, фильтры и поиск в приложении также основаны на компьютерном зрении и его способности различать цвета, размеры, породы и т. Д. Таким образом, время и усилия, необходимые для поиска, значительно сокращаются.

Хочу выделить инструкцию как важную часть приложения. На мой взгляд, люди хотят помочь, но обычно просто не знают, как это сделать правильно. Следовательно, инструкция поможет направить пользователя в правильном направлении. К сожалению, пользователь не всегда может помочь животному, а в некоторых случаях требуется помощь профессионала. Поскольку безопасность пользователей и животных - одна из важнейших задач для нас, в целях предосторожности я составил простой контрольный список. При обнаружении проблем дело может быть передано в организацию.

Подводя итог, можно сказать, что резюме и искусственный интеллект могут помочь пользователям найти потерянных домашних животных и сократить их время и усилия. Поскольку технологии обладают избирательным зрением и могут работать с цветами и формами, а также обрабатывать массивы информации за секунды, я считаю такую ​​интеграцию разумной. Находясь на стадии разработки технологий, я считаю, что мы можем использовать их с пользой для пользователей. Желаю, чтобы искусственный интеллект не использовался в коммерческих целях, создавая множество новых проблем.