Периапикальное поражение — это инфекция или воспаление, расположенное у основания корня зуба. Это может быть вызвано невылеченным кариесом или плохо сделанной пломбой.
Однако обнаружение этих поражений не является простым и требует рентгенографических изображений различных типов. В исследовании сравниваются показатели успешности обнаружения поражений с использованием различных методов рентгенографии.
Подход заключался в использовании знаний, полученных предварительно обученной моделью из других изображений, и адаптации их к нашему набору данных с использованием трансферного обучения.
Перенос обучения
Трансферное обучение — это метод, используемый для повышения производительности модели за счет использования знаний, полученных во время обучения предыдущей модели. Он включает в себя повторное использование весов предварительно обученной модели для решения конкретной задачи с меньшим количеством обучающих данных.
Этот подход применим в нашем случае путем адаптации YOLOv5, модели, изначально обученной для обнаружения объектов (80 типов объектов), к нашей базе данных рентгенографических изображений, содержащей один класс (поражение), для получения окончательной модели.
Набор данных
База данных, находящаяся в нашем распоряжении, состоит из 172 пациентов с 336 поражениями. Рентгенографические изображения представлены в формате DICOM, а аннотации были выполнены стоматологом с использованием программного обеспечения MIPAV. В аннотации каждое поражение было обведено многоугольником.
Эта аннотация описывается файлом XML, в котором указываются координаты каждой точки, составляющей многоугольник.
<!-- MIPAV VOI file --> <VOI> <Unique-ID>369081143</Unique-ID> <Curve-type>0</Curve-type> <Color>255,255,0,0</Color> <Thickness>1</Thickness> <Contour> <Slice-number>0</Slice-number> <Pt>806.0,676.0</Pt> <Pt>770.0,682.0</Pt> <Pt>736.0,684.0</Pt> <Pt>728.0,694.0</Pt> <Pt>708.0,686.0</Pt> <Pt>722.0,712.0</Pt> <Pt>756.0,698.0</Pt> <Pt>780.0,700.0</Pt> <Pt>806.0,698.0</Pt> <Pt>836.0,698.0</Pt> <Pt>846.0,692.0</Pt> <Pt>838.0,680.0</Pt> <Pt>822.0,680.0</Pt> <Pt>804.0,676.0</Pt> </Contour> <Contour> <Slice-number>0</Slice-number> <Pt>1688.0,354.0</Pt> <Pt>1692.0,330.0</Pt> <Pt>1706.0,318.0</Pt> <Pt>1716.0,312.0</Pt> <Pt>1730.0,308.0</Pt> <Pt>1736.0,316.0</Pt> <Pt>1730.0,330.0</Pt> <Pt>1728.0,344.0</Pt> <Pt>1728.0,360.0</Pt> <Pt>1710.0,352.0</Pt> <Pt>1702.0,352.0</Pt> <Pt>1690.0,354.0</Pt> </Contour> </VOI>
Данные должны быть преобразованы в соответствии с данными модели, поэтому изображение должно быть в формате .jpg, а файл аннотации должен быть в формате txt, который содержит ограничивающие рамки для поражений.
0 0.299 0.602 0.053 0.031 0 0.658 0.290 0.018 0.045
Окончательный вид после конвертации
Увеличение данных
Я использовал увеличение данных из-за небольшого количества изображений, которые у нас были, мы использовали эту технику, добавляя новые изображения, которые являются просто теми же изображениями, но перевернутыми по вертикали.
Другие изображения были добавлены для пациентов, у которых не было поражений, чтобы уменьшить погрешность прогноза.
Распространение нашей базы данных
После преобразования базы данных необходимо разделить базу данных на 3 набора: обучающий, проверочный и тестовый наборы.
- Учебный набор используется для обучения модели и составляет 80% нашей базы данных.
- Набор проверки используется для оценки модели во время обучения и тонкой настройки гиперпараметров; эта часть составляет 10% нашей базы данных.
- Тестовый набор используется для оценки модели после ее обучения и настройки, измеряя ее производительность на данных, с которыми она никогда раньше не сталкивалась. На этот сегмент приходится 10% нашей базы данных.
Обучение
Метрика, используемая для оценки, основана на IoU (пересечение над объединением), которое определяется отношением площади пересечения между прогнозируемой и фактической областями к площади объединения этих двух областей.
Кривые обучения
Обучение проходило на 100 эпохах на 380 изображениях и дало такие результаты:
И мы можем видеть это более конкретно в прогнозах набора данных проверки.
Более конкретно через метрики:
Точность – показатель того, сколько из сделанных положительных прогнозов являются правильными (истинно положительными).
Отзыв:мера того, сколько положительных случаев правильно предсказал классификатор среди всех положительных случаев в данных.
Оценка F1: оценка, сочетающая точность и полноту.
Заключение
Хотя результаты являются умеренно удовлетворительными, для достижения комплексного улучшения может потребоваться реализация следующих стратегий:
• Увеличение размера набора данных за счет получения доступа к большей базе данных.
• Тонкая настройка таких гиперпараметров, как скорость обучения и количество эпох.
• Использование большего количества ресурсов для выполнения большего количества операций для получения оптимальной модели.