Проф. Кёнхён Чо и Кшиштоф Дж. Герас решают проблему безрезультатных сканирований и ложных срабатываний в своей последней статье

Хотя глубокие сверточные нейронные сети могут выполнять распознавание объектов изображения в естественных изображениях, эта технология по-прежнему остается неприменимой для медицинской промышленности. Медицинским работникам требуются изображения с высоким разрешением, чтобы можно было увидеть мелкие детали, и возможность рассматривать человеческое тело под разными углами для постановки полного диагноза для своих пациентов.

Откройте для себя многовидовую глубокую сверточную нейронную сеть (MV-DCN), созданную профессорами Центра Кюнхеном Чо и Кшиштофом Дж. Герасом, а также исследовательской группой из Медицинской школы Нью-Йоркского университета (Стейси Вулфсон, С. Джин Ким и Линдой Мой) . В марте этого года они опубликовали свои выводы в Скрининге рака молочной железы с высоким разрешением с помощью многоэкранных глубоких сверточных нейронных сетей.

Команда объяснила, что в центре внимания были изображения для скрининга рака груди, поскольку рак груди является второй по значимости причиной смерти среди женщин в Соединенных Штатах. Более того, маммограммы, которые являются основным визуализирующим тестом для выявления рака груди, не имеют точности. От 10 до 15% женщин, прошедших скрининг, вызывают на дополнительные обследования или биопсии, большинство из которых приводят к ложноположительным результатам, вызывая беспокойство и ненужные расходы.

MV-DCN, однако, обещает улучшить процесс скрининга рака груди за счет своей инновационной архитектуры, которая может обрабатывать четыре стандартных вида или углов без ущерба для высокого разрешения. В отличие от обычно используемых архитектур DCN для естественных изображений, которые работают с изображениями 224 x 224 пикселей, MV-DCN также может использовать разрешение 2600 x 2000 пикселей.

Кроме того, MV-DCN делает прогнозы для медицинских работников, присваивая разные вероятности трем возможным исходам (неполный, нормальный и доброкачественный), а также указывает, какая часть груди должна быть исследована дополнительно, если вообще должна быть исследована. Однако при обучении MV-DCN команда также столкнулась с некоторыми препятствиями. Обучение нейронных сетей обычно зависит от миллионов аннотированных изображений. Хотя исследователи собрали самый большой набор данных такого рода в литературе, медицинские изображения гораздо сложнее получить в больших количествах, что делает их набор данных из 103000 сканированных маммограмм (собранных из Медицинской школы Нью-Йоркского университета) небольшим по сравнению с наборами данных естественные изображения.

Глубокие нейронные сети также требуют большого количества вычислений, чтобы получить от входа, который в данном случае представляет собой четыре стандартных представления в скрининговом экзамене на рак груди, к выходу, распределению вероятностей для возможных решений. С большими изображениями, такими как те, что используются в этой сети, вычислительная проблема усугубляется. Скорость обучения сетей ограничена памятью их оборудования, так как используемые изображения очень большие. В заключение исследователи обнаружили, что производительность увеличивается с увеличением обучающего набора, и исходное разрешение необходимо для достижения наилучшей производительности. В настоящее время они надеются улучшить возможности MV-DCN за счет сбора еще большего набора данных.

Найла Аль-Мамлук

Первоначально опубликовано на cds.nyu.edu 10 апреля 2017 г.