Краткое объяснение использования учебной программы для анализа медицинских изображений.

Общий обзор. В этом исследовании я работал с группой исследователей, чтобы применить обучение по учебной программе для повышения точности модели глубокого обучения для классификации изображений рака прямой и прямой кишки. Полную версию доклада можно найти здесь, и он будет опубликован и представлен на Зимней конференции 2021 года по приложениям компьютерного зрения (WACV).

Мотивация. Обучение по учебной программе - это элегантная идея, вдохновленная человеческим обучением, которая предлагает обучать модели глубокого обучения на примерах в указанном порядке, основанном на сложности (обычно простые примеры, а затем сложные примеры), в отличие от случайной выборки. Самое главное, чтобы успешно применять обучение по учебной программе, необходимо, чтобы существовал ряд простых и сложных примеров и чтобы был способ разделить примеры на простые или сложные.

Мы утверждаем, что классификация гистопатологических изображений является естественной задачей для изучения учебной программы, основываясь на следующих наблюдениях:

  • При выполнении многих задач классификации гистопатологических изображений существует ряд трудностей. Поскольку патологическое заболевание развивается с течением времени, определенно происходит переход от нормальной ткани к пораженной. Многие болезни классифицируются по дискретным классам, поэтому в их развитии должен быть какой-то момент, лежащий на границах двух классов, и поэтому их трудно диагностировать. Кроме того, согласие между аннотаторами по многим задачам от среднего до низкого, что говорит о том, что некоторые изображения сложно классифицировать.
  • Соглашение аннотатора на уровне изображения может использоваться, например, в качестве прокси-сервера. Наборы данных медицинских изображений обычно аннотируются несколькими обученными клиницистами, поэтому мы можем использовать степень согласия для каждого изображения как показатель сложности этого изображения. По определению, изображения с высокой степенью согласованности легко классифицировать, потому что все согласны с ними, а изображения с низким согласованием труднее классифицировать.

Набор данных. Набор данных состоит из изображений рака прямой кишки, полученных из Медицинского центра Дартмут-Хичкок. Он разделен на обучающий набор из 2175 изображений и тестовый набор из 977 изображений. Каждое из этих изображений было отмечено семью практикующими патологоанатомами как гиперпластический полип (HP) или сидячая зубчатая аденома (SSA), что допускает различные уровни согласия аннотаторов.

Предлагаемая методика изучения учебной программы. Мы предлагаем структуру учебной программы, которая использует согласие комментатора для ранжирования изображений по сложности. В частности, мы разделяем изображения на четыре дискретных уровня сложности: очень простой (соглашение 7/7 между аннотаторами), легкий (соглашение 6/7 между аннотаторами), жесткий (согласие аннотаторов 5/7) и очень жесткий (согласие аннотаторов 4/7). Затем мы обучаем нашу сеть на все более сложных изображениях в четыре этапа:

Этап 1: очень простые только изображения
Этап 2:
Очень простые + простые изображения
Этап 3:
Очень легко + легко + сложно изображения
Этап 4:
Очень легко + легко + жесткий + очень жесткий изображения

На каждом этапе добавляются изображения с предыдущих этапов, чтобы предотвратить катастрофическое забывание. См. Первый рисунок в этой статье для визуальной модели предлагаемой методологии.

Базовые показатели. Мы сравниваем предложенную схему с несколькими базовыми линиями. Первичный базовый уровень - это обычное обучение, когда все обучающие изображения маркируются большинством голосов. Мы также сравниваем с моделью, обученной с использованием антиучебной схемы, которая меняет график обучения (то есть сначала тренируется на жестких изображениях, а затем тренируется на все более простых изображениях). Кроме того, мы проанализировали четырехэтапную модель с использованием меры сложности, в которой патолог напрямую оценил сложность каждого изображения по шкале от 1 до 4. Кроме того, мы протестировали контрольную программу с той же схемой обучения, что и предложенный нами метод, за исключением изображений. на каждом этапе отбирались случайным образом.

Значение. Чтобы получить более подробную информацию о значимости улучшения, которое наш метод обучения в учебной программе привносит в эффективность моделей, мы сравниваем эффективность наших моделей с показателями патологов. Прогнозы каждой модели оформляются как аннотации дополнительного патолога и сравниваются с аннотациями реальных патологов с точки зрения Каппы Коэна, общей меры согласия между аннотаторами. Мы оцениваем каждую модель при разнице доверительных порогов. Наша модель обучения по учебной программе превосходит средний показатель патолога для нескольких пороговых значений и базовую модель для всех пороговых значений.

Последствия для поля. В большинстве предшествующих работ в области анализа медицинских изображений для определения меток используется голосование большинства или разрешение старшего комментатора, сохраняя только одну метку для каждого изображения. Вместо этого наш метод использует согласование аннотаций для изучения учебной программы, и мы считаем, что эту методологию стоит изучить для задач медицинской визуализации, учитывая высокую стоимость аннотации данных и важность точности результатов для пациентов.

Резюме. Мы представили простую, но эффективную структуру обучения по учебной программе, в которой используются легко получаемые данные о соглашении аннотаторов. Мы надеемся, что предоставили хорошо мотивированный аргумент в пользу более целенаправленного применения обучения по учебной программе для решения новых задач, таких как анализ медицинских изображений.

Дополнительная литература: