Итак, это официально - GSoC 2019 стартовал, и я был принят в CCExtractor Development с лучшим проектом, о котором я мог когда-либо мечтать, - версией Amazon Rekognition с открытым исходным кодом!

Каждое воскресенье я буду писать в блоге о достигнутом за неделю прогрессе и планах на следующую неделю. Это позволит другим ребятам следить за моим проектом, а также это очень хорошая практика моих технических навыков письма на английском языке. В конце концов, учитывая мой опыт работы с GSoC 2016, через некоторое время после проекта мне будет просто приятно читать и снова пережить это чудесное путешествие 🙂

Amazon Rekognition

Как уже упоминалось выше, мне повезло, что меня приняли на GSoC 2019, и этим летом вместе с другими ребятами из CCExtractror Development я постараюсь сделать этот мир немного более открытым!

Amazon Rekognition - это запатентованный сервис, который позволяет клиентам выполнять анализ видео и изображений. Он основан на методах глубокого обучения и компьютерного зрения, которые позволяют пользователям выполнять широкий спектр задач, от распознавания лиц до обнаружения текста. К настоящему времени вы, возможно, уже спросите - эй, Артем, что не так с этой штукой, учитывая, что она разрабатывается и поддерживается одним из сильнейших игроков в области ИИ? Ответ прост - это не открытый код!

Альтернатива Amazon Rekognition с открытым исходным кодом - это не просто забавная игрушка - проблема демократизации ИИ стоит очень остро. В марте этого года группа видных исследователей искусственного интеллекта заявила, что Amazon следует … прекратить продавать Rekognition правоохранительным органам главным образом потому, что подход Amazon непрозрачен и существует предвзятое отношение к некоторым меньшинствам. Это показывает, что открытое и прозрачное решение для видеоанализа может способствовать демократизации всей отрасли.

О проекте

Беглый взгляд на проект можно найти в моем предыдущем посте. Poor Man’s Rekognition (рабочее название) - это платформа, которая позволит пользователю выполнять различные виды анализа видео / изображений / аудио. Конечная цель (которая выходит за рамки GSoC) - создать Swiss Army Knife для решения этих проблем.

Одним из источников вдохновения для этого проекта является WebLicht - совместная инициатива немецких учреждений, призванная упростить NLP (обработку естественного языка) для различных языков. Пользователь определяет все, что ему нужно, например: стеммеры, векторизаторы, языковые модели. После этого система делает все, что ей прописал пользователь. Я уверен, что такие системы откроют поле машинного обучения для многих людей.

Также недавно я наткнулся на Студию машинного обучения - новый сервис от Microsoft, призванный упростить процесс очистки данных и обучающих моделей. Интерфейс этой платформы должен упростить каждый этап процесса машинного обучения, и я хотел бы реализовать некоторые дизайнерские идеи этой платформы в PMR.

Если вы заинтересовались этим проектом, вы можете прочитать о нем более подробно в моем предложении GSoC. Я также хотел бы ответить на все ваши вопросы об этом проекте!

Задачи на эту неделю

Поскольку эта неделя почти подходит к концу, я не буду много планировать. Некоторые из проблем, которые я хочу решить в оставшееся время этой недели, я уже определил в PoC, и я думаю, что это хорошее начало работы:

  • Оптимизация памяти - данные кадра занимают много места и нуждаются в оптимизации
  • Добавить версию YOLOv3 для графического процессора - хотя YOLOv3 доступен как современный алгоритм, доступна только версия для процессора.
  • Составьте список вопросов для обсуждения - В моем предложении GSoC я заявил, что я буду использовать период объединения сообщества, чтобы обсудить различные части проекта с сообществом и моим наставником. К концу недели я составлю список вещей, которые, на мой взгляд, стоит обсудить.

Спасибо за чтение, следите за обновлениями и не забудьте заглянуть в мой блог в воскресенье! Путешествие начинается здесь!

Первоначально опубликовано на http://fedoskin.org 9 мая 2019 г.