Периапикальное обнаружение с помощью Yolov5

Периапикальное поражение — это инфекция или воспаление, расположенное у основания корня зуба. Это может быть вызвано невылеченным кариесом или плохо сделанной пломбой.

Однако обнаружение этих поражений не является простым и требует рентгенографических изображений различных типов. В исследовании сравниваются показатели успешности обнаружения поражений с использованием различных методов рентгенографии.

Подход заключался в использовании знаний, полученных предварительно обученной моделью из других изображений, и адаптации их к нашему набору данных с использованием трансферного обучения.

Перенос обучения

Трансферное обучение — это метод, используемый для повышения производительности модели за счет использования знаний, полученных во время обучения предыдущей модели. Он включает в себя повторное использование весов предварительно обученной модели для решения конкретной задачи с меньшим количеством обучающих данных.

Этот подход применим в нашем случае путем адаптации YOLOv5, модели, изначально обученной для обнаружения объектов (80 типов объектов), к нашей базе данных рентгенографических изображений, содержащей один класс (поражение), для получения окончательной модели.

Набор данных

База данных, находящаяся в нашем распоряжении, состоит из 172 пациентов с 336 поражениями. Рентгенографические изображения представлены в формате DICOM, а аннотации были выполнены стоматологом с использованием программного обеспечения MIPAV. В аннотации каждое поражение было обведено многоугольником.

Эта аннотация описывается файлом XML, в котором указываются координаты каждой точки, составляющей многоугольник.

<!-- MIPAV VOI file -->
<VOI>
<Unique-ID>369081143</Unique-ID>
<Curve-type>0</Curve-type>
<Color>255,255,0,0</Color>
<Thickness>1</Thickness>
<Contour>
<Slice-number>0</Slice-number>
<Pt>806.0,676.0</Pt>
<Pt>770.0,682.0</Pt>
<Pt>736.0,684.0</Pt>
<Pt>728.0,694.0</Pt>
<Pt>708.0,686.0</Pt>
<Pt>722.0,712.0</Pt>
<Pt>756.0,698.0</Pt>
<Pt>780.0,700.0</Pt>
<Pt>806.0,698.0</Pt>
<Pt>836.0,698.0</Pt>
<Pt>846.0,692.0</Pt>
<Pt>838.0,680.0</Pt>
<Pt>822.0,680.0</Pt>
<Pt>804.0,676.0</Pt>
</Contour>
<Contour>
<Slice-number>0</Slice-number>
<Pt>1688.0,354.0</Pt>
<Pt>1692.0,330.0</Pt>
<Pt>1706.0,318.0</Pt>
<Pt>1716.0,312.0</Pt>
<Pt>1730.0,308.0</Pt>
<Pt>1736.0,316.0</Pt>
<Pt>1730.0,330.0</Pt>
<Pt>1728.0,344.0</Pt>
<Pt>1728.0,360.0</Pt>
<Pt>1710.0,352.0</Pt>
<Pt>1702.0,352.0</Pt>
<Pt>1690.0,354.0</Pt>
</Contour>
</VOI>

Данные должны быть преобразованы в соответствии с данными модели, поэтому изображение должно быть в формате .jpg, а файл аннотации должен быть в формате txt, который содержит ограничивающие рамки для поражений.

0 0.299 0.602 0.053 0.031
0 0.658 0.290 0.018 0.045

Окончательный вид после конвертации

Увеличение данных

Я использовал увеличение данных из-за небольшого количества изображений, которые у нас были, мы использовали эту технику, добавляя новые изображения, которые являются просто теми же изображениями, но перевернутыми по вертикали.

Другие изображения были добавлены для пациентов, у которых не было поражений, чтобы уменьшить погрешность прогноза.

Распространение нашей базы данных

После преобразования базы данных необходимо разделить базу данных на 3 набора: обучающий, проверочный и тестовый наборы.

Учебный набор используется для обучения модели и составляет 80% нашей базы данных.
Набор проверки используется для оценки модели во время обучения и тонкой настройки гиперпараметров; эта часть составляет 10% нашей базы данных.
Тестовый набор используется для оценки модели после ее обучения и настройки, измеряя ее производительность на данных, с которыми она никогда раньше не сталкивалась. На этот сегмент приходится 10% нашей базы данных.

Обучение

Метрика, используемая для оценки, основана на IoU (пересечение над объединением), которое определяется отношением площади пересечения между прогнозируемой и фактической областями к площади объединения этих двух областей.

Кривые обучения

Обучение проходило на 100 эпохах на 380 изображениях и дало такие результаты:

И мы можем видеть это более конкретно в прогнозах набора данных проверки.

Более конкретно через метрики:

Точность – показатель того, сколько из сделанных положительных прогнозов являются правильными (истинно положительными).

Отзыв:мера того, сколько положительных случаев правильно предсказал классификатор среди всех положительных случаев в данных.

Оценка F1: оценка, сочетающая точность и полноту.

Заключение

Хотя результаты являются умеренно удовлетворительными, для достижения комплексного улучшения может потребоваться реализация следующих стратегий:

• Увеличение размера набора данных за счет получения доступа к большей базе данных.

• Тонкая настройка таких гиперпараметров, как скорость обучения и количество эпох.

• Использование большего количества ресурсов для выполнения большего количества операций для получения оптимальной модели.