По оценкам Всемирной организации здравоохранения (2019 г.), во всем мире насчитывается 2,2 миллиарда людей с нарушениями зрения, из которых по крайней мере 1 миллиард можно было бы предотвратить или до сих пор не лечили. Что касается ухода за глазами, мир сталкивается со многими проблемами, включая неравенство в охвате и качестве услуг по профилактике, лечению и реабилитации. Существует нехватка обученных офтальмологов и плохая интеграция офтальмологических услуг в основные системы здравоохранения. Моя цель — стимулировать действия по решению этих проблем в рамках моего ключевого проекта по науке о данныхIluminado.

Цель проекта Capstone

Мой проект направлен на обучение модели ансамбля глубокого обучения, которая очень доступна для семей с низким доходом и может выполнять первоначальную диагностику риска заболевания по низкой цене. Используя мою модель, офтальмологи и пациенты могут определить необходимость немедленного вмешательства на основании фотографии глазного дна сетчатки.

Источник набора данных

Существует общедоступный набор данных изображений, называемый набором данных изображений глазного дна сетчатки (RFMiD), предоставленный OphthAI, который включает 3200 изображений глазного дна, снятых с помощью трех разных камер глазного дна и аннотированных двумя старшими экспертами по сетчатке на основе принятого решения. консенсус.

Изображения были извлечены из тысяч исследований, проведенных в период с 2009 по 2020 год. Как высококачественные, так и низкокачественные изображения выбираются, чтобы сделать набор данных сложным.

Набор данных был разделен на 3 части, состоящие из обучающего набора (60% или 1920 изображений), оценочного набора (20% или 640 изображений) и тестового набора (20% или 640 изображений). В среднем заболевание Соотношение в обучающей, оценочной и тестовой выборках составляет 60 ± 7 %, 20 ± 7 % и 20 ± 5 % соответственно. Основной целью этого набора данных является борьба с широким спектром глазных заболеваний, встречающихся в повседневной клинической практике. Всего выявлено 45 категорий заболеваний/патологий. Эти метки можно найти в трех файлах CSV; а именно RFMiD_Training_Labels.CSV, RFMiD_Validation_Labels.CSV и RFMiD_Testing_Labels.CSV.

Откуда образ?

Это изображение было получено с помощью инструмента, известного как фундус-камера — специализированного микроскопа с малым увеличением, присоединенного к камере со вспышкой, для фотографирования глазного дна — слоя сетчатки в задней части глаза.
Сегодня большинство фундус-камер портативные. , поэтому пациентам достаточно смотреть прямо в объектив. Яркая вспышка указывает на то, что была сделана фотография глазного дна.

Портативные камеры выгодны, поскольку их можно носить с собой в разных местах и ​​использовать для пациентов с особыми потребностями, например, для пользователей инвалидных колясок. Кроме того, любой сотрудник, прошедший необходимое обучение, может управлять камерой, что позволяет диабетикам с недостаточным уровнем обслуживания быстро, безопасно и эффективно проходить ежегодные обследования.

(Ссылка: Системы визуализации сетчатки глазного дна)

Где ставится окончательный диагноз?

Процессу начального скрининга может помочь глубокое обучение, но окончательный диагноз ставит офтальмолог с помощью осмотра с помощью щелевой лампы.

Этот процесс также известен как биомикроскопия, которая включает в себя исследование живых клеток. Врач может провести исследование под микроскопом, чтобы определить, появляются ли какие-либо аномалии в ваших глазах.

Применение глубокого обучения к классификации изображений сетчатки

В отличие от традиционных алгоритмов машинного обучения, глубокие сверточные нейронные сети (CNN) могут автоматически извлекать и классифицировать функции из необработанных данных, используя несколько уровней обработки.

Недавно было опубликовано большое количество статей, в которых используются сверточные нейронные сети (CNN) для выявления широкого спектра глазных патологий, таких как диабетическая ретинопатия и глаукома, с исключительными результатами (AUROC > 0,9).

Показатели успеха

Оценка AUROC суммирует кривую ROC в одно число, которое описывает производительность модели для нескольких пороговых значений одновременно. Примечательно, что оценка AUROC, равная 1, является идеальной оценкой, а оценка AUROC, равная 0,5, соответствует случайному угадыванию.

Методология — Кросс-энтропия как функция потерь

Кросс-энтропия - это мера из области теории информации, основанная на энтропии и обычно вычисляющая разницу между двумя распределениями вероятностей, тогда как можно подумать, что кросс-энтропия вычисляет общую энтропию между распределениями.

Кросс-энтропия также связана с логистическими потерями, называемыми логарифмическими потерями. Хотя эти две меры получены из разных источников, при использовании в качестве функций потерь для моделей классификации обе меры рассчитывают одно и то же количество и могут использоваться взаимозаменяемо.

(Ссылка: https://machinelearningmastery.com/logistic-regression-with-maximum-likelihood-estimation/)

Что такое кросс-энтропия?

Кросс-энтропия — это мера разницы между двумя распределениями вероятностей для данной случайной величины или набора событий.

Возможно, вы помните, что информация определяет количество битов, необходимых для кодирования и передачи события. События с более низкой вероятностью содержат больше информации, события с более высокой вероятностью содержат меньше информации.

В теории информации нам нравится описывать «неожиданность» события. Событие тем более удивительно, чем менее оно вероятно, а значит, оно содержит больше информации.

  • Событие с низкой вероятностью (удивительно): дополнительная информация.
  • Событие с более высокой вероятностью (неудивительно): меньше информации.

Информация h(x) может быть рассчитана для события x с учетом вероятности события P(x) следующим образом:

  • ч (х) = -лог (Р (х))

Энтропия – это количество битов, необходимое для передачи случайно выбранного события из распределения вероятностей. Асимметричное распределение имеет низкую энтропию, тогда как распределение, в котором события имеют одинаковую вероятность, имеет большую энтропию.

Асимметричное распределение вероятностей имеет меньше «неожиданностей» и, в свою очередь, низкую энтропию, поскольку преобладают вероятные события. Сбалансированное распределение более удивительно и, в свою очередь, имеет более высокую энтропию, потому что события равновероятны.

  • Асимметричное распределение вероятностей (неудивительно): низкая энтропия.
  • Сбалансированное распределение вероятностей (удивительно): высокая энтропия.

Энтропия H(x) может быть рассчитана для случайной величины с набором x в дискретных состояниях X и их вероятностью P( х) следующим образом:

Мультиклассовая классификация — мы используем мультиклассовую кросс-энтропию — частный случай кросс-энтропии, когда целью является вектор с горячим кодированием. (Со ссылкой на Властимила Мартинека)

Как насчет бинарной кросс-энтропии?

Двоичная классификация — мы используем бинарную кросс-энтропию — особый случай кросс-энтропии, когда наша цель равна 0 или 1. Ее можно вычислить с помощью формулы кросс-энтропии, если мы преобразуем цель в единицу. -горячий вектор, такой как [0,1] или [1,0] и прогнозы соответственно.

Использование асимметричных потерь для обработки несбалансированных данных

В типичной настройке с несколькими метками набор данных может характеризоваться наличием непропорционально большого количества положительных и отрицательных меток. Этот перекос набора данных в пользу отрицательных меток влияет на процесс оптимизации и приводит к недооценке градиентов от положительных меток, что снижает точность.

И это именно та ситуация, с которой я столкнулся с моим текущим набором данных.

Асимметричная потеря, разработанная Беном-Барухом, представляет собой решение для многоклассовой классификации с сильно несбалансированным распределением.

Путем асимметричного изменения положительных и отрицательных компонентов кросс-энтропии можно уменьшить вес простых отрицательных моментов и усилить вес сложных положительных моментов.

Архитектуры для тестирования

  • Начальная версия 3
  • Открытие
  • VGG16
  • MobileNetV2
  • EfficientNetB5
  • SE-ResNeXt

Оценка модели — показатели успеха

Вот результат:

Будущая адаптация и улучшение

Приятно видеть, что мой долгожданный прототип развернут! Затем развертывание должно иметь возможность отображать тип заболевания глаз после более точного обучения модели с дополнительным вводом фотографий. В конце концов, модель будет доступна в Интернете и предлагаться по низкой цене по мере ее развития. Кроме того, результаты диагностики будут автоматически отправлены выбранному офтальмологу пациента в качестве медицинской справки и записи. К тому времени, надеюсь, пациент будет лечиться вовремя.

Специалисты по данным, давайте работать вместе, чтобы сделать мир лучше.