Может ли глубокое обучение помочь врачам диагностировать рак молочной железы быстрее, чем большинство современных методов?

Авторы: Эндрю Дабидин и Райан Хеджес.

Введение

Рак молочной железы является одним из самых распространенных видов рака в Соединенных Штатах, и хотя им страдают представители обоих полов, он гораздо чаще встречается у женщин. Примерно у каждой восьмой женщины в Соединенных Штатах (примерно 12%) в течение жизни развивается инвазивный рак молочной железы. Неудивительный, но важный факт, который следует отметить, заключается в том, что ранняя диагностика приводит к более высокой выживаемости в долгосрочной перспективе. Поэтому использование новых технологий в маммографических исследованиях и рутинных осмотрах имеет жизненно важное значение. На рисунке 1 показано распределение различных случаев инвазивного рака молочной железы. Глубокое обучение играет важную роль в гистологии благодаря этим новым достижениям в области технологий. В частности, в рамках глубокого обучения и для классификации изображений мы можем использовать сверточные нейронные сети (CNN) для классификации определенного изображения. CNN полезны, поскольку они разбивают изображения на матрицы и пытаются зафиксировать определенные пространственные структуры для точной классификации. Затем мы можем предоставить графическому процессору (GPU) выполнение вычислений, которые точно классифицируют изображение.

Последствия рака несут как физическое, так и эмоциональное бремя. В дополнение к этим проблемам для пациентов и их семей рак также создает значительное экономическое бремя. Часто это оказывает огромное финансовое воздействие как на пациентов, так и на их семьи. Лечение рака и выздоровление часто приводят к значительной потере времени на работе, а также к потенциальному статусу безработного к моменту окончания лечения и выздоровления. Кроме того, страховые компании часто не покрывают полную стоимость лекарств, которые входят в стоимость лечения. На рис. 2 на примере показаны различные расходы, связанные с онкологическими заболеваниями. Кульминация всех этих личных расходов может быть разрушительной. Диагностика рака на ранних стадиях и более персонализированное лечение могут привести к снижению многих из этих затрат как для пациента, так и для задействованного медицинского персонала.

В дополнение к созданию модели машинного обучения для демонстрации передовых технологий глубокого обучения в обнаружении рака, цель этого проекта также состоит в том, чтобы заглянуть «под капот» моделей с помощью карты активации классов (CAM). ) приемы визуализации. Врачи потенциально могут использовать эти новые данные, чтобы повысить точность и сроки диагностики.

Данные

В большей степени, чем создание и обучение моделей машинного обучения, потенциально самым сложным этапом этого проекта было получение помеченных данных для использования в обучении с учителем. Мы связались с многочисленными организациями здравоохранения, запросив наборы данных изображений, но нам было трудно получить ответы. К счастью, мы нашли предыдущее исследование, в котором использовались гистологические изображения, и их данные из открытых источников можно найти по следующей ссылке —

http://gleason.case.edu/webdata/jpi-dl-tutorial/IDC_regular_ps50_idx5.zip

Следующее описание, которое было найдено на веб-сайте источника данных, дает представление о конкретном типе рака молочной железы, используемом в наборе данных:

«Инвазивная протоковая карцинома (IDC) является наиболее распространенным подтипом всех видов рака молочной железы. Чтобы присвоить степень агрессивности всему образцу препарата, патологоанатомы обычно сосредотачиваются на областях, содержащих IDC. В результате одним из распространенных этапов предварительной обработки для автоматической оценки агрессивности является выделение точных областей IDC внутри всего предметного стекла».

К счастью, на этапе предварительной обработки данных было сэкономлено значительное время, поскольку более тщательно подобранный набор данных тех же изображений можно найти на Kaggle по адресу: https://www.kaggle.com/simjeg/lymphoma-subtype-classification-fl- против-кл.

Методология

Цель этого проекта — применить методы глубокого обучения, чтобы помочь сократить время обработки диагнозов рака молочной железы. Мы используем сверточную нейронную сеть для изучения изображений ткани молочной железы. После того, как наша сеть построена, мы изучаем внутреннюю работу нейронной сети, чтобы точно определить, какая часть ткани молочной железы наиболее полезна для сети при постановке диагноза. Для этого мы воспользуемся методом визуализации функций, называемым картированием активации классов (CAM). На рис. 3 показан пример данных, с которыми мы работали, используя пакет Python Matplotlib.

При построении CNN наша модель будет состоять из последовательности сверточных слоев, также называемых сверточной базой, где за каждым сверточным слоем следует слой максимального пула, который служит для понижения дискретизации каждого слоя. За сверточной базой в конечном итоге следует плотно связанный слой из 64 нейронов. Роль последовательности сверточных слоев состоит в том, чтобы изучить иерархию пространственных признаков и паттернов, которые становятся более масштабными по мере того, как сеть становится глубже, что позволяет понижающая дискретизация на каждом слое. Другими словами, первый слой исследует тривиальные углы и края, в то время как более глубокие слои сети, вероятно, фиксируют общие формы потенциальных опухолей или другие более крупные физические атрибуты ткани молочной железы. Роль плотного слоя состоит в том, чтобы затем разобраться во всех этих формах, поскольку они относятся к нашей конкретной задаче классификации. Краткое описание архитектуры, которую мы использовали, показано на рисунке 4, который отражает общую картину сверточных нейронных сетей.

Выводы

При разработке архитектуры для нашей модели мы начали с более простой архитектуры, состоящей из трех сверточных слоев, чтобы создать базовый уровень для последующего улучшения. Этот подход привел к тому, что модель сразу же переоснастила наши данные, что также в значительной степени было обусловлено небольшим размером нашего набора обучающих данных. Точность на этой модели достигала 75%. Чтобы компенсировать переоснащение, используются два метода регуляризации. Чтобы помочь компенсировать небольшой размер наших обучающих данных, что часто является проблемой при классификации изображений, мы сначала применили дополнение данных, то есть процесс создания дополнительных обучающих выборок путем случайного растяжения, переворачивания , обрезка и внесение других изменений в наши текущие данные. Кроме того, мы также ввели слой отсева в плотно связанном слое, который заставляет нейроны в плотном слое коллективно обобщать свою прогностическую способность, слегка сглаживая их индивидуальные активации.

После применения наших методов регуляризации наша модель больше не подвергалась переоснащению, что позволило нам впоследствии увеличить сложность нашей модели для повышения точности. Сложность модели можно многократно увеличивать, если повышенная сложность способствует прогностической способности модели, и мы не подгоняем наши данные. Результатом этого процесса стала окончательная архитектура модели, состоящая из пяти сверточных слоев по 64, 128, 128, 128 и 128 нейронов соответственно. Наша окончательная точность классификации достигла 79% с этой моделью. На рис. 5 показаны наши потери и точность при обучении/проверке в зависимости от количества эпох, которые мы использовали для нашей модели.

Как только наша модель была завершена и мы получили точность классификации, которая нас удовлетворила, мы перешли к этапу проекта, где мы исследовали слои сверточной нейронной сети, чтобы лучше понять, что захватывают свертки, процесс, называемый картированием активации класса. (КАМ). Этот процесс исследует активацию нейронов в каждом слое после того, как модель полностью обучена. В нашей модели мы использовали активацию softmax для вывода правильных меток классов, но это оказалось сложно использовать, поскольку функция запутывает активации классов. Поэтому мы использовали сигмовидную функцию для вычисления логитов класса для получения слоев, прежде чем применять функцию softmax. Затем мы выбрали несколько изображений случайным образом, определили градиент для этих изображений, а затем вычислили массивы значимостей. На рис. 6 показаны изображения ткани молочной железы, наложенные на активации, обнаруженные в первом сверточном слое. Мы видим, что сеть пытается сфокусироваться на синих/желтых пикселях для целей классификации.

Поскольку мы получили наши изображения с низким качеством пикселей, трудно показать четкую картину того, что именно происходит. Из приведенных выше изображений видно, что сеть фокусируется на частях тканей, покрытых цветом. Для этого мы использовали составную альфа-функцию в библиотеке PIL в Python и наложили активации поверх исходного изображения.

Наши окончательные результаты действительно интересны, даже учитывая тот факт, что наши изображения были более низкого качества. В идеале мы хотели бы передать эти изображения экспертам в данной области, чтобы узнать, как эти идеи потенциально могут быть полезны для диагностики рака в будущем. Эти идеи могут помочь врачам сосредоточиться на определенных областях ткани молочной железы в сочетании с другой информацией о пациенте.

Репозиторий GitHub

Наш код и данные, с которыми мы работали, можно найти по следующей ссылке на GitHub:

https://github.com/andrew-dabydeen/breast_cancer_analysis