GSoC - Неделя 1: (17 мая - 25 мая)

Привет, добро пожаловать в мой блог!
Этим летом я буду работать с замечательными наставниками и участниками со всего мира над mlpack в рамках моего проекта GSoC, и цель этого блога - предоставить документацию о моем прогрессе на протяжении всего этого периода. лето. Хотя официальный период кодирования еще не начался, я думаю, было бы неплохо поделиться обновлениями по проекту.

Краткое описание mlpack

mlpack - это интуитивно понятная, быстрая и гибкая библиотека машинного обучения C ++ с привязками к другим языкам.

- mlpack, Github

Чтобы начать работу с mlpack, я настоятельно рекомендую взглянуть на руководства и наш репозиторий примеров. Если вы хотите внести свой вклад, вы можете взглянуть на Страницу участия.

Кратко о моем проекте - алгоритмы ИНС в mlpack

Обнаружение объектов - одна из самых серьезных проблем компьютерного зрения, и такие алгоритмы, как YOLOv3 и tiny-YOLOv3, играют очень важную роль в их решении. Предложение направлено на реализацию tiny-YOLOv1, tiny-YOLOv3 и YOLOv3. Предложение также направлено на реализацию инструментов визуализации, загрузчиков данных и основных функций, необходимых для решения проблемы обнаружения объектов с использованием любого другого алгоритма.

К концу проекта я надеюсь получить такое же крутое видео, как это.

Прогресс на текущий момент

На этой неделе я завершил свою работу по добавлению поддержки загрузчика данных в репозиторий моделей с помощью нескольких служебных функций, таких как функции для загрузки файлов, выполнения контрольных сумм и настройки cmake и ci.yaml для тестирования. Спасибо замечательным людям в сообществе, которые помогли мне запустить его, особенно на машине с Windows.

Наряду с этим я также работал над реализацией IoU (пересечение по объединению) и метрики NMS (не максимальное подавление), обе из которых были объединены и теперь являются частью mlpack.

Ближе к концу недели я начал работать над добавлением дополнительных служебных функций в репозиторий моделей, которые включают разархивирование файла для всех ОС без дополнительных зависимостей, а также функциональность List Directory, которую я использую как часть загрузчика данных для обнаружения объектов.

Я также написал вики-страницу для репозитория моделей и его загрузчика данных, который можно увидеть здесь. Я постараюсь улучшить его дальше, основываясь на предложениях.

Что дальше?

В настоящее время я работаю над написанием загрузчика данных для обнаружения объектов. Теперь я могу анализировать аннотации, поэтому с этого момента очень легко создавать прогнозы / метки. Поскольку изображения могут иметь разный размер, нам нужно изменить их размер, и я начинаю работать над этим, добавляя определение класса дополнения. Вот определение функции, над которым я сейчас работаю, но я уверен, что к тому времени, когда я сделаю PR, оно изменится.

Я надеюсь, что на этой неделе я объединю функции по связям с общественностью и PR для документации.

Некоторые рекомендации

Чтобы сделать вещи интересными, я думал каждую неделю делиться тем, чем пользуюсь, или вещами, которые меня развлекают.

Оцените Roam Research, это потрясающее приложение для создания заметок. Я использую его уже месяц, и он действительно лучше, чем все, что я использовал раньше.

В музыке я слушал ODESZA Как я сюда попал.

В кино я планирую смотреть 1917 год уже почти месяц.

Интересные вещи в машинном обучении. Сейчас есть YOLOv4 и Agent57, которые играют почти во все игры Atari.

Благодарственное письмо

Спасибо замечательным наставникам и участникам сообщества за то, что помогли мне с предложениями и отзывами.