Понятно, что самые разные отрасли приспособились к использованию машинного обучения, и сектор здравоохранения не является исключением. Сектор здравоохранения всегда располагал большим объемом информации, оценочный объем данных в 2011 году составил около 150 экзабайт (1 экзабайт = 10¹⁸). Эта информация представлена ​​в самых разных формах, включая письменные медицинские записи, медицинские изображения. , результаты лабораторных анализов, семейный анамнез и генетические базы данных. Поэтому из-за большого объема данных неудивительно, что машинное обучение и искусственный интеллект находят свое место в сфере здравоохранения.

Приложения

Медицинская визуализация и диагностика

Анализ медицинских изображений был одной из первых областей, на которые было направлено внимание, когда машинное обучение впервые появилось в секторе здравоохранения. В настоящее время медицинские изображения, такие как УЗИ, компьютерная томография и магнитно-резонансная томография, оцениваются специально обученным специалистом, таким как врач, патологоанатом или рентгенолог. Эти люди используют годы обучения и опыта, чтобы последовательно оценивать эти изображения и ставить диагнозы. Хотя они, как правило, хорошо обучены, этот процесс подвержен человеческим ошибкам и может стать дорогостоящим, если консультируются несколько профессионалов.

Машинное обучение применяется к этому аспекту медицины с целью помочь медицинским работникам с точностью и скоростью диагнозов.

В 2017 году был проведен опрос из 308 статей, в которых обсуждалось применение глубокого обучения в анализе медицинских изображений. Опрос показал применение глубокого обучения на изображениях: головного мозга, глаз, грудной клетки, цифровой патологии/микроскопии, молочной железы. , сердце, живот и скелет. В каждом случае для создания математических моделей, способных ставить диагнозы, использовалось глубокое обучение. Это исследование показало, что сквозные обучающие сверточные нейронные сети (CNN) стали предпочтительным подходом для такого анализа.

Одной из основных проблем, выявленных в ходе опроса, была доступность больших размеченных наборов данных, на основе которых можно было бы подогнать модели. Как упоминалось ранее, наличие данных не является проблемой, однако процесс маркировки изображений требует консультации со специалистами, что не всегда возможно сразу.

Обработка медицинских документов и литературы на естественном языке

Процесс естественного языка (NLP) — это ветвь машинного обучения, связанная с взаимодействием между людьми и компьютерами с использованием естественного языка. Цель НЛП состоит в том, чтобы читать и понимать человеческие языки таким образом, чтобы создавать ценность.

Поскольку сектор здравоохранения занимается людьми, неудивительно, что НЛП легко применимо к этим проблемам. Два конкретных применения NPL включают: идентификацию пациентов с циррозом из электронных медицинских карт и радиологических сканирований и идентификацию подлежащих регистрации случаев рака из отчетов о патологии; первые производят модели с чувствительностью 95,7% и специфичностью 93,9%, а вторые производят модели с точностью 87,2% и точностью 84,3%.

Машинное обучение в клинической геномике

Клиническая геномика — это изучение клинических исходов с использованием геномных данных. В частности, это область исследования, в которой используется весь геном пациента для диагностики болезни или корректировки лекарств. Геном человека относится ко всему набору последовательностей нуклеиновых кислот, закодированных в виде ДНК, что, по оценкам, составляет примерно 1,5 гигабайта данных. Машинное обучение, благодаря его способности обрабатывать большие объемы данных, было адаптировано для выполнения различных этапов клинического геномного анализа, как объясняется в этой статье.

Эти шаги включают в себя: определение вариантов, аннотацию генома, классификацию вариантов и соответствие фенотип-генотип. Каждый из этих процессов будет рассмотрен ниже.

Вариант вызова

Вызов вариантов — это процесс идентификации отдельных генетических вариантов среди миллионов, населяющих каждый геном, и требует предельной точности. DeepVariant, программа вызова вариантов на основе CNN, недавно превзошла стандартные инструменты в различных задачах вызова вариантов.

Аннотация генома

Аннотация генома — это процесс определения местоположения и функции генов и кодирующих областей в геноме. Рекуррентная нейронная сеть (RNN) с долговременной кратковременной памятью (LSTM) под названием DeepAnnotator была обучена и дала F-показатель 94%, превзойдя существующие методы.

Классификация вариантов

Классификация вариантов - это процесс вывода о влиянии генетических вариантов на функциональные элементы генома. LEAP или Изучение данных для оценки патогенности — это модель машинного обучения, созданная для выполнения именно этой задачи. Модель представляет собой классификатор случайного леса, площадь которого под кривой рабочих характеристик приемника (AUROC) достигла 98%.

Картирование фенотип-генотип

Наконец, существует картирование фенотип-генотип, которое представляет собой процесс связывания наблюдаемых характеристик (фенотип) и генома (генотип), полученных в результате предыдущих анализов. Это процесс обоснования или постановки диагноза на основе полученного генетического анализа. Это самый сложный этап из-за возможных значительных генетических и физических симптоматических вариаций. DeepGestalt — это еще один алгоритм анализа изображений лица на основе CNN, используемый параллельно с PEDIA, системой интерпретации генома. Эта система смогла превзойти дисморфологов-людей в клинической диагностике синдрома Нунан, что свидетельствует о согласованности машинного обучения.

Проблемы и ограничения

Совершенно очевидно, что машинное обучение начало интегрироваться в сектор здравоохранения с невероятными результатами. Однако важно понимать, что интеграция этих элементов должна осуществляться ответственно и консервативно.

Регуляторные вопросы

Из-за характера здравоохранения и медицинских данных эти алгоритмы поднимают ряд этических проблем, связанных с источником и конфиденциальностью данных, используемых для обучения. Кроме того, эти алгоритмы вызывают большой скептицизм из-за их прозрачности, регулирующего процесса переобучения алгоритмов, а также ответственности, связанной с ошибкой прогнозирования.

Интерпретируемость ИИ

Природа «черного ящика» этих систем машинного обучения часто критикуется за то, что они генерируют результаты без каких-либо оснований. Из-за характера клинической диагностики, которая обычно представляет собой среду с высоким риском, было бы идеально, если бы такие системы обеспечивали интерпретируемую человеком интерпретацию каждого прогноза.

Предвзятость данных и машины

Существует достаточное количество подструктуры или предвзятости, связанной с факторами риска и последствиями для здоровья. Эти предубеждения могут быть результатом социально-экономического положения, культурных обычаев, неравного представительства и других не причинных факторов. Эти предубеждения могут отрицательно сказаться на производительности модели и ее обобщаемости. Поэтому важно убедиться, что модели машинного обучения в этом секторе специально оцениваются на предмет форм непричинной предвзятости.

Вывод

Понятно, что машинное обучение процветало из-за значительного объема данных, генерируемых сектором здравоохранения. Большое количество моделей машинного обучения было создано и применено к различным аспектам медицины с невероятными результатами. Эти области включают медицинскую визуализацию и диагностику с использованием НЛП, а также клиническую геномику. Эти алгоритмы в основном превзошли текущие современные методы, но подлежат тщательной проверке из-за их регулирования, интерпретируемости и возможной систематической ошибки. Наконец, хотя техническое развитие машинного обучения укоренилось в медицине, становится все более важным развивать законодательство, чтобы обеспечить полную интеграцию.