Разработка модели предварительной диагностики, которая потенциально может помочь в борьбе с пандемией.

11 марта, за четыре дня до написания этой статьи, Всемирная организация здравоохранения (W.H.O.) объявила коронавирусную болезнь 2019 (NCOV-19) пандемией, характеризующейся быстрым и глобальным распространением нового коронавируса по всему миру. Поскольку правительства стремятся закрыть границы, внедрить отслеживание контактов и повысить осведомленность о личной гигиене в попытке сдержать распространение вируса, распространение вируса, к сожалению, будет увеличиваться до тех пор, пока не будет разработана и внедрена вакцина из-за различных факторов. стандарты реализации этих политик для каждой страны.

Поскольку ожидается, что количество реальных ежедневных случаев заболевания во всем мире будет увеличиваться, одним из важных факторов, ограничивающих диагностику, является продолжительность патологических тестов на вирус, которые проводятся в лабораториях, как правило, в центрах городов, которые требуют трудоемкой точности. Это вызывает серьезные проблемы, главным образом из-за того, что людей, являющихся носителями, нельзя изолировать раньше, и, таким образом, они могут заразить большее количество людей в этот критический период неограниченного передвижения. масштабное внедрение действующей процедуры диагностики. Возможно, наиболее уязвимыми являются люди из отдаленных районов развивающихся стран, которые, как правило, не имеют плохого медицинского обслуживания и доступа к диагностике. Единственная инфекция может быть вредной для этих сообществ, а доступ к диагностике, по крайней мере, даст им шанс на борьбу с вирусом.

Новое исследование Ванга и др. др. показывает перспективность использования глубокого обучения для сканирования на COVID-19 в компьютерной томографии (КТ), и это рекомендовано в качестве практического компонента уже существующей системы диагностики. В исследовании использовалось трансферное обучение с помощью начальной сверточной нейронной сети (CNN) на 1119 компьютерных томографах. Точность внутренней и внешней проверки модели составила 89,5% и 79,3% соответственно. Основная цель - позволить модели извлечь радиологические особенности, присутствующие в COVID-19.

В то время как исследование показало потрясающую точность их модели, я решил обучить и реализовать модель с использованием другой архитектуры в надежде на повышение точности. Я решил использовать рентгенограммы грудной клетки (CXR) вместо компьютерной томографии по трем причинам:

  1. Получение рентгеновских снимков более доступно для людей, чем получение компьютерной томографии, особенно в сельских и изолированных районах. Также будет доступно больше потенциальных данных.
  2. В случае, если радиологи и медицинские работники станут недееспособными из-за сдерживания вируса (например, если они сами заболеют), A.I. системы необходимы для продолжения диагностики.
  3. Когда эта модель станет эффективной, она сможет свести к минимуму проблему ложноотрицательных результатов в существующей лабораторной диагностике путем тестирования начальных отрицательных случаев.

Основным препятствием для использования рентгеновских снимков по сравнению с компьютерной томографией в качестве источников диагностики является отсутствие деталей, которые можно визуально проверить, исходя из COVID-19. Труднее увидеть симптомы COVID-19, такие как легочные узелки, которые можно легко увидеть при компьютерной томографии. Я хочу проверить, может ли модель с достаточным количеством слоев обнаруживать объекты с более низким качеством, но с более практичными изображениями. Таким образом, моя модель является подтверждением концепции того, может ли модель Resnet CNN эффективно обнаруживать COVID-19 с использованием относительно недорогих рентгеновских снимков.

Наборы данных сканирования легких COVID-19 в настоящее время ограничены, но лучший набор данных, который я нашел, и который я использовал для этого проекта, взят из набора данных с открытым исходным кодом COVID-19. Он состоит из вырезанных изображений COVID-19 из общедоступных исследований, а также изображений легких с различными вызывающими пневмонию заболеваниями, такими как SARS, Streptococcus и Pneumocystis. Если у вас есть какие-либо надлежащие изображения сканированных изображений, которые может принять репозиторий, а также их ссылки и метаданные, пожалуйста, внесите свой вклад в создание набора данных для улучшения систем искусственного интеллекта, которые будут на него полагаться.

Я обучал свою модель только просмотру задне-передних снимков (PA) рентгеновских снимков, которые являются наиболее распространенными типами рентгеновских снимков. Я использовал трансфер-обучение на модели Resnet 50 CNN (моя потеря резко возросла после нескольких эпох на Resnet 34), и я использовал в общей сложности 339 изображений для обучения и проверки. Вся реализация была сделана с использованием fastai и Pytorch.

Данные сильно искажены из-за отсутствия доступных общедоступных данных на момент написания (35 изображений для COVID-19, 226 изображений для не-COVID-19, включая изображения нормальных и больных легких). Я решил сгруппировать все изображения, не относящиеся к COVID-19, потому что у меня были только редкие изображения для разных болезней. Я продолжил увеличивать размер рентгеновских снимков с пометкой Другое, используя рентгеновские снимки здоровых легких из этого набора данных Kaggle ¹ перед случайным разделением данных на 25%. Обучающий набор состоял из 196 изображений, проверочный набор состоял из 65 изображений, а тестовый набор состоял из 78 изображений (которые полностью состояли из дополнительного набора данных). Было проверено, что внешний набор данных не содержит повторяющихся изображений из набора данных с открытым исходным кодом. Все изображения были изменены до 512 x 512 пикселей, потому что они работали лучше, чем изображения с разрешением 1024 x 1024 пикселей по моему опыту создания другого классификатора.

Проведение первых нескольких эпох с использованием реализации fastai политики fit_one_cycle показало, что недостаточное оснащение было проблемой с самого начала. Я решил увеличить количество эпох и получить диапазон скорости обучения. В оставшейся части обучения я придерживался агрессивной стратегии обучения с большим количеством эпох, изменяя скорость обучения с помощью lrfinder от fastai, а затем продолжая тренироваться с большим количеством эпох, пока не начнется обучение. снижение потерь сопоставимо с потерями при проверке.

Наконец, после десятков итераций мне удалось снизить потери при обучении на уровне, аналогичном потерям при проверке, при сохранении высокой точности. Точность окончательной внутренней проверки модели составляет 93,8%.

Модель работала на проверочном наборе очень хорошо, как показывает приведенная выше матрица путаницы, с двумя случаями для ложноположительных и ложноотрицательных результатов. Переходя к тестовым данным, из 78 изображений 75 были правильно спрогнозированы, что является точностью внешней проверки 96,2%. Хотя мы получили три ложных срабатывания по нашим тестовым данным, прогноз модели был близок к 50% для всех этих случаев. Это говорит о том, что это сбивало с толку некоторые особенности рентгеновских снимков, но не было решающим для вывода о положительном результате на COVID-19. Но самое удивительное произошло, когда он предсказал правильные положительные случаи. Модель никогда не тренировалась на этих изображениях, но тем не менее смогла предсказать с 99% уверенностью, что легкие на изображениях являются положительными для COVID-19. ²

Это беспрецедентная точность для модели глубокого обучения при классификации сканирований COVID-19, но это всего лишь предварительный эксперимент с очевидным отсутствием рентгеновских данных, и он не был подтвержден внешними организациями здравоохранения или специалистами. В будущем я настрою модель против ложных срабатываний, хотя меня больше беспокоят ложные срабатывания, которые в настоящее время не позволяют проводить дальнейшую настройку из-за нехватки данных.

Опять же, эта модель является доказательством правильности концепции, но при дальнейшем развитии она имеет огромный потенциал для решения существующей ограниченной диагностической возможности и вероятной нехватки кадров в будущем. Это может помочь остановить распространение этой пандемии и создать новые способы предотвращения будущих.

С этой целью я делаю свой код, модель и результаты доступными для использования исследователями. Я планирую обновить модель, протестировав ее на более сбалансированном наборе данных, как только данные станут общедоступными. Я также планирую реализовать GRAD-CAM, чтобы визуально видеть, на каких функциях сконцентрирована модель. Мне бы хотелось, чтобы моя модель была проверена извне и использовалась не только в качестве домашнего проекта, особенно в это очень неотложное время .³ Не стесняйтесь обращаться ко мне, если у вас возникнут вопросы или вы можете помочь мне связаться с организацией или профессионалом, который потенциально может выгода от И УЛУЧШЕНИЕ модели.

  • ¹После обучения я понял, что большая часть обучающих и тестовых изображений принадлежит педиатрическим пациентам, что может повлиять на производительность модели при сканировании взрослых. Однако его работоспособность все еще требует подтверждения с дополнительными данными. Модель также может быть улучшена при дальнейшем обучении.
  • ² Я обнаружил, что одно из положительных изображений COVID-19 также было в обучающем наборе, а это означает, что точность этого результата недействительна. Тем не менее, для трех других изображений COVID-19 он по-прежнему давал 99% -ную вероятность.
  • ³ Недавно я протестировал эту модель на изображениях пневмонии как бактериального, так и вирусного происхождения. В настоящее время я жду дополнительных данных для дальнейшего обучения.
  • Клиника Мэйо: ложноотрицательные результаты теста на COVID-19 могут привести к ложному чувству безопасности
  • Примечание. Мне следовало повысить выборку положительных случаев, чтобы решить проблему нехватки этих изображений, и мне следовало включить больше изображений как бактериальной, так и вирусной пневмонии, чтобы сделать их более надежными. Пожалуйста, сделайте это, если вы попытаетесь улучшить модель.
  • Примечание. Поскольку изучение радиологических маркеров COVID-19 - это активная область исследований, которую еще предстоит раскрыть, я предостерегаю от интерпретации результатов, поскольку модель выявила правильные особенности, уникальные для COVID-19.