Это введение в「PaddleSeg」, модель машинного обучения, которую можно использовать с ailia SDK. Вы можете легко использовать эту модель для создания приложений ИИ с помощью ailia SDK, а также многих других готовых к использованию AIlia MODELS.

Обзор

PaddleSeg – это высокоточная модель сегментации, основанная на PaddlePaddle (Baidu) и выпущенная в мае 2020 года. Ее многомасштабная система внимания обеспечивает самые современные результаты на Набор данных Городские пейзажи.





Архитектура

При сегментации часто используется многомасштабный вывод. В сеть вводятся изображения разного разрешения, а результаты усредняются или комбинируются на основе максимальных значений.

PaddleSegпредлагает многомасштабный подход в сочетании с механизмом внимания. Это позволяет сети узнать, какой масштаб изображения предпочтительнее использовать в каждом случае, и получить более качественную сегментацию.

Например, в приведенном ниже примере тонкий столб исчезает в масштабе 0,5x. При масштабе 2.0x опоры сегментируются правильно, но, наоборот, снижается точность сегментации дороги. Затем используется механизм внимания для объединения этих результатов и получения наилучшего возможного результата сегментации.

Кроме того, внимание выполняется иерархически. При явном внимании коэффициенты композиции выхода каждой сегментации получаются напрямую. Явное внимание напрямую находит коэффициенты для каждой шкалы и составляет их для вычисления конечного результата. Выполняя внимание иерархически, можно сократить количество вычисляемых коэффициентов и ускорить обучение.

Для этой модели используется магистраль HRNet_w48.

PaddleSeg достиг самых современных результатов в наборе данных Cityscapes.

Применение

Вы можете использовать PaddleSeg с ailia SDK с помощью следующей команды. Сегментация выполняется на изображении input.jpg, генерируются выходное составное изображение output.jpg и изображение маски output_mask.jpg.

$ python3 paddleseg.py --input input.jpg --savepath output.jpg


Топор Инк. разработал ailia SDK, который обеспечивает кросс-платформенный быстрый вывод на основе графического процессора.

ax Inc. предоставляет широкий спектр услуг от консалтинга и создания моделей до разработки приложений и SDK на основе ИИ. Не стесняйтесь связаться с нами для любого запроса.