Возможные приложения искусственного интеллекта - и, в частности, машинного обучения - в здравоохранении вызвали значительный интерес в последние годы. Однако, хотя технологические разработки сделали сравнительно легким создание и внедрение нейронных сетей и других инструментов искусственного интеллекта для использования в медицине, здравоохранение остается сложной ареной, где многие из наиболее насущных проблем многогранны. Вдобавок, типы решений с высокими ставками, которые распространены в медицине, могут означать, что плохо реализованный ИИ дорого обходится человеческому благополучию.

Широкое распространение электронных медицинских карт (EHR), наряду с разработкой носимых устройств, таких как часы Apple, и ростом генетического тестирования, направленного непосредственно потребителю, привело к беспрецедентному количеству данных о пациентах, в основном доступных в цифровом формате. Однако то, что еще предстоит разработать, - это хорошо разработанный план использования этих данных для улучшения и расширения существующих медицинских услуг и исследований. Кроме того, наличие большего количества данных - это не то же самое, что наличие более качественных данных, и проблемы с качеством данных продолжают влиять как на исследования, так и на клиническую медицину. Ожидается, что количество данных, с которыми врачи будут взаимодействовать, синтезировать и на которые будут реагировать, само по себе является осложняющим фактором при оказании медицинской помощи.

Как писал Атул Гаванде в New Yorker в 2018 году, история современной медицины - это история нашей человеческой борьбы со сложностями. В то время как возбудители некоторых болезней четко определены и установлены, результаты в медицине часто являются результатом более чем одной потенциальной причины или взаимодействия ряда различных, потенциально взаимосвязанных факторов. Большая часть медицины по-прежнему глубоко полагается на корреляцию - например, связь определенного поведения с повышенным риском определенного исхода - а не на абсолютное причинно-следственное доказательство. В результате при внедрении новых технологий в медицину, особенно в диагностике, наблюдается тенденция к использованию методов, которые также полагаются на корреляцию.

Модели черного ящика плохо подходят для медицины.

В последние несколько лет особое внимание привлекли возможности использования машинного обучения в медицине, особенно для диагностических приложений. Последние технологические достижения позволили относительно легко обучать и развертывать нейронные сети, даже без понимания того, как они работают. Однако их простота реализации не означает, что нейронные сети - лучший подход или подходящий инструмент для ответа на вопросы в медицине. Исследователи и специалисты по этике подвергли сомнению использование таких моделей« черного ящика при принятии решений с высокими ставками». Примечательно, что д-р Синтия Рудин указала, что даже построение сопутствующей объяснимой модели наряду с подходом черного ящика не является адекватной заменой использованию моделей, которые по своей сути интерпретируемы.

Неинтерпретируемые модели рисков недавно продемонстрировали производительность CheXNet - глубокой нейронной сети, созданной группой исследователей из Стэнфорда. Модель была обучена на наборе рентгеновских снимков, выпущенных Национальным институтом здравоохранения в 2017 году для выявления пневмонии, и, похоже, это сработало. Однако после изучения стало ясно, что модель учитывала информацию с краев изображений, а не только из важных с медицинской точки зрения областей, на которых видны легкие пациентов. Алгоритм с большей вероятностью классифицировал изображение как показывающее пневмонию, когда он обнаружил, что изображение было получено с портативного рентгеновского аппарата - результат, который имел отношение к тенденциям в данных, используемых для обучения модели. Поскольку алгоритм просто искал закономерности, а пациенты с пневмонией в наборе данных NIH с большей вероятностью находились в больнице (и, следовательно, с большей вероятностью получили рентгеновский снимок в своей комнате с портативного аппарата), он неправильно сопоставил информацию, которая выявил источник рентгеновского излучения с вероятностью того, что легкие на рентгеновском снимке показали пневмонию.

В настоящее время такие модели, как CheXNet, повсеместно встречаются в исследовательской литературе, но обычно не используются в клинической практике. Одной из причин являются проблемы, возникающие из-за не интерпретируемых моделей, но есть и другие препятствия. Помимо проблем переносимости, когда модели, которые хорошо работают в теории, не обязательно работают хорошо в реальности, медицина и здравоохранение являются сложными областями. Одна из проблем при внедрении подходов искусственного интеллекта (и особенно машинного обучения) - это редкость четко сформулированных вопросов. Медицина часто бывает сложной, полной вариативности и нюансов, из-за которых трудно определить лучший показатель для использования.

Больше данных не обязательно лучше.

Однако даже в тех случаях, когда вопросы очень четко сформулированы, проблемы с качеством данных значительно затрудняют практичность использования вычислительных моделей. В медицинских исследованиях проблемы с данными представляют собой серьезное препятствие для значимого использования методов машинного обучения. Например, многие медицинские исследования опираются на результаты экспериментов, проведенных на культивируемых клетках. Однако до 10 или даже 20% линий клеток in vitro, по оценкам, загрязнены - часто клетками HeLa, которые возникли как образец клеток рака шейки матки, взятый без согласия Генриетты Лакс в начале 1950-х годов.

Клетки HeLa были первой задокументированной бессмертной клеточной линией, и за десятилетия, прошедшие с тех пор, как они начали использоваться в медицинских исследованиях, они настолько адаптировались к лабораторным условиям, что легко зарастают культурами при случайном внесении. Это означает, что, например, эксперименты, предназначенные для клеток поджелудочной железы или печени, могут вместо этого проводиться на клетках рака шейки матки. Хотя чрезмерный рост клеток HeLa и частота заражения клеточной линии документированы на протяжении десятилетий, лаборатории продолжают публиковать результаты, основанные на неправильно маркированных клетках.

Проблемы с данными в клинической практике еще более сложны. Хотя широкое распространение электронных медицинских записей означает, что в настоящее время существует огромное количество данных о пациентах в цифровой форме, большая часть этих данных имеет низкое качество. Хотя EHR рекламировались как конец ошибок в медицинских записях, они не столько устранили ошибки, сколько преобразовали их. Поскольку более 90% больниц и поставщиков медицинских услуг в настоящее время используют электронные медицинские карты, пациентам больше не нужно беспокоиться, по большей части, о получении неправильной дозировки или формы лекарства из-за неразборчивого почерка врача, выписавшего рецепт; но неправильный выбор из длинного раскрывающегося меню может привести к тому же результату.

Кроме того, поскольку во многих случаях электронные записи были разработаны с учетом потребностей и желаний страховщиков и больниц, а не отдельных врачей, в качестве приоритета, они хранят некоторые данные, такие как коды ICD, используемые для выставления счетов, легче, чем другие данные, например в виде сложных заметок из визита в клинику. Из-за различных практик, включая апкодирование (выбор более серьезного диагностического кода, чем это строго необходимо для увеличения дохода), коды МКБ не обязательно хорошо соответствуют симптомам пациента.

EHR также, как правило, несовместимы; существуют сотни поставщиков, которые создают и распространяют такие продукты среди больниц и отдельных поставщиков медицинских услуг, и лишь некоторые из систем разработаны таким образом, чтобы они могли взаимодействовать друг с другом. Дополнительные настройки для конкретных учреждений усугубляют проблему и означают, что при переходе от одного поставщика к другому может потребоваться распечатка и отправка по факсу записей пациента. В результате данные о пациентах часто бывают неполными, фрагментированными и разрозненными.

Системные проблемы со здоровьем создают дополнительные препятствия

В частности, в США системные аспекты оказания медицинской помощи усугубляют проблемы качества данных. Например, до принятия Закона о доступном медицинском обслуживании многие люди не могли получить медицинскую страховку и, как следствие, не могли получить доступ к медицинской помощи. Поскольку основания для исключения людей из плана медицинского страхования включают ранее существовавшие заболевания, определенные группы людей - особенно те, у кого есть текущие или предыдущие проблемы со здоровьем, а также те, у кого не было работы, которая обеспечивала медицинские льготы, - были гораздо менее вероятны. для включения в наборы медицинских данных. Поскольку в Соединенных Штатах до сих пор нет универсального здравоохранения, это постоянная проблема, несмотря на снижение ставки незастрахованного населения после принятия ACA, особенно в штатах, которые не принимали мер по расширению Medicare. Проблемы такого рода при выборке могут привести к серьезным проблемам с производительностью и точностью модели, особенно когда они применяются к популяциям, которые отличаются от данных обучения.

Еще одна проблема здравоохранения, особенно в Соединенных Штатах, - это выгорание врачей. Хотя электронные медицинские записи должны были облегчить работу врачей, в конечном итоге они создали новые виды работы. Врачи теперь обычно тратят больше времени на заполнение электронных медицинских карт - часто в нерабочее время, без оплаты - чем на приеме пациентов. Хотя выгорание является серьезной проблемой во всех областях медицины, оно особенно распространено среди врачей, которые проводят большую часть своего дня, взаимодействуя с компьютером.

Помимо вопросов методологии и данных, для внедрения ИИ в здравоохранении необходимо учитывать уникальные особенности.

Если предположить на мгновение, что все эти проблемы были решены, все еще существуют определенные проблемы, которые необходимо учитывать при внедрении ИИ в здравоохранении. Как упоминалось ранее при обсуждении CheXNet, абсолютно необходимо, чтобы модели работали так, как задумано. В частности, необходимо позаботиться о том, чтобы обучение проходило должным образом, чтобы то, что работает в теории, применялось к реальности.

Кроме того, необходимо уделить внимание определению критериев. Например, если врач-человек может правильно различать нормальный и ненормальный результат визуализации в половине случаев, неужели алгоритм просто должен превзойти человека? Если это означает, что производительность лишь немного лучше, чем случайность, достаточно ли этого, чтобы оправдать время, затраты и возможные последствия неудач, связанных с использованием ИИ?

В частности, компромиссы, существующие в ИИ (и особенно в машинном обучении), могут иметь серьезные последствия в применении к здравоохранению. Когда алгоритм делает неверный прогноз относительно вероятного удовольствия кого-то от просмотра фильма или классифицирует кого-то как склонного покупать дополнительную одежду у продавца, хотя на самом деле они этого не делают, последствия ограничены. Однако влияние неверного прогноза или классификации в сфере здравоохранения может быть очень серьезным - даже в буквальном смысле это вопрос жизни и смерти.

Тем не менее, невозможно одновременно свести к минимуму ложноотрицательные и ложноположительные результаты. В медицинском контексте это означает, что тест может быть очень чувствительным (например, правильно идентифицирующим всех с конкретным заболеванием) или очень специфическим (выявляющим только людей, у которых действительно есть данное заболевание), но не то и другое вместе. В медицине и ложноположительные, и ложноотрицательные результаты имеют последствия. Если тест (или модель) классифицирует кого-то как больного, хотя он этого не делает, он может получить лечение (с сопутствующими рисками и побочными эффектами), в котором он не нуждается. Однако, если модель не может охватить все случаи, когда у кого-то действительно есть рассматриваемое заболевание, пациенты могут не получить лечение, в котором они нуждаются. К сожалению, нет универсального ответа на вопрос, лучше ли сосредоточиться на чувствительности или специфичности; Какой из них более важен, зависит от причины обследования, эффекта от лечения, рисков отказа от него и т. д.

Наконец, отсутствие контекстных знаний, особенно о клинической практике, остается серьезным препятствием для разработки приложений ИИ в клинической практике. Хотя большая часть медицины может быть представлена ​​в виде результатов тестов, показателей долгосрочной выживаемости и других количественных данных, ценность других частей клинической практики оценить сложнее. Роль человеческого взаимодействия - например, взаимоотношений врача с пациентами - трудно измерить и учесть, однако исследования показали, что оно может повлиять на результаты лечения пациентов. Обесценивание роли межличностных связей в медицине, возможно, является симптомом более серьезной проблемы в технологической индустрии - тенденции игнорировать или обесценивать вещи, которые трудно измерить количественно.

В свете этих проблем, в каких областях здравоохранения есть хорошие возможности для использования ИИ?

Помимо всех этих трудностей, в медицине есть как минимум два варианта использования, в которых ИИ представляется многообещающим инструментом. Первый относится к сценариям с большим объемом данных - ситуациям, когда имеется большой объем информации, которую можно использовать для создания прогнозов. Это особенно многообещающе в областях, с которыми люди обычно сталкиваются, например, при точной сортировке нормальных и аномальных результатов визуализации. Частично то, что многообещающе в этом приложении ИИ, заключается в том, что оно может освободить врачей, чтобы они могли играть большую роль в интерпретации и переводе результатов, чтобы пациенты могли их лучше понять. В своей недавней книге Глубокая медицина д-р Эрик Тополь рассматривает, как такие разработки могут позволить сдвиг в обязанностях, которые в настоящее время связаны с определенными специальностями медицины. Например, большая часть работы радиологов в настоящее время связана с визуализацией; если в будущем это бремя будет переложено на алгоритм, то, возможно, роль радиологов изменится на что-то более ориентированное на пациента.

Второй вариант использования, когда ИИ продемонстрировал потенциал для улучшения здравоохранения, - это «функциональные» сценарии - области, где автоматизация или ИИ могут сократить время, которое врачи и другой медицинский персонал тратят на повторяющиеся, некритические задачи, такие как составление графиков. Были предприняты усилия по сокращению количества времени, которое врачи должны тратить на ввод медицинской информации в EHR, путем назначения им писцов, которые могут вводить записи во время встреч. Однако проблемы логистики и конфиденциальности означают, что это не самое осуществимое (и не самое экономичное) решение. Разработка эффективной обработки естественного языка, которая могла бы легко и точно транскрибировать записи из разговора врача с пациентом во время приема, не только позволила бы улучшить данные в медицинских записях, но также могла бы дать врачам шанс развиваться более глубоко и более человечно. отношения со своими пациентами и могут уменьшить выгорание врачей.

Одним из примеров использования ИИ для удовлетворения функциональных потребностей является создание Moxi, робота для доставки медицинских товаров. Moxi был создан для поддержки медперсонала, и разработка робота включала в себя обширные интервью и слежку за медсестрами во время их клинических обходов. Создатели Moxi также продумали, как сделать робота доступным и безопасным для пациентов.

Как и во многих областях, где ИИ тестируется и развивается, в здравоохранении существуют реальные проблемы, которые потенциально могут быть решены с помощью ИИ. Однако медицина уникальна тем, что принимаемые в ней решения высоки. Следовательно, использование ИИ в здравоохранении требует вдумчивого рассмотрения моделей потенциального воздействия, которые могут оказать на пациентов, врачей и других медицинских работников. Кроме того, сложный характер систем здравоохранения, особенно в США, означает, что жизненно важно, чтобы те, кто стремится разработать модели для использования в медицинских учреждениях, взаимодействовали с людьми, имеющими непосредственный опыт оказания медицинской помощи, будь то в качестве пациента, поставщика медицинских услуг, или исследователь.

Наконец, как и в других областях, возможно, наиболее многообещающим аспектом применения ИИ в здравоохранении является его способность высвобождать человеческое время и энергию для решения задач, в которых люди преуспевают, таких как построение отношений с пациентами, реагирование на новые ситуации и контекстуализация информации. . Используя технологии для поддержки врачей, медсестер и другого медицинского персонала и вовлекая их в обсуждения, ведущие к их созданию, есть потенциал для того, чтобы здравоохранение работало более эффективно и гуманно для большего числа людей.

О публикации "Сотрудничество человека и машины" и о встрече по ИИ в Беркли

Подготовить и оснастить людей для работы и жизни с машинами намного проще, когда создание этих машин требует вдумчивого учета человеческих способностей и человеческих потребностей. Учитывая наш интерес к этим вопросам, Боб Старк и Ян Моура решили создать дискуссионную группу с целью исследования и решения проблем через группу встреч по ИИ в Беркли. В этой публикации Medium кратко излагается справочная информация, которую мы освещаем на наших встречах.

Ссылки и дополнительная информация

Фергюсон, Джон Уэйн. Робот медицинской службы доставки Мокси проходит испытания в больнице Техаса. (2019) https://www.washingtontimes.com/news/2019/jan/25/medical-delivery-robot-moxi-being-tested-at-texas-/

Гаванде, Атул. (2018, 12 ноября). Почему врачи ненавидят свои компьютеры. Житель Нью-Йорка. https://www.newyorker.com/magazine/2018/11/12/why-doctors-hate-their-computers

Золото, Майкл. (1985). Заговор ячеек. Нью-Йорк: SUNY Press.

Харрис, Р. Как врачи могут быть уверены, что компьютер-самоучка ставит правильный диагноз? (2019) https://www.npr.org/sections/health-shots/2019/04/01/708085617/how-can-doctors-be-sure-a-self-taught-computer-is-making- правильный диагноз

Панч, Т., Х. Мэттис, и Л.А. Сели. Неудобная правда об искусственном интеллекте в здравоохранении. (2019) https://www.nature.com/articles/s41746-019-0155-4.pdf

Рашиди, Х.Х., Н.К. Тран, Э. Беттс, Л.П. Хауэлл, Р. Грин. Искусственный интеллект и машинное обучение в патологии: современный ландшафт контролируемых методов. (2019) https://journals.sagepub.com/doi/pdf/10.1177/2374289519873088

Рудин, К. (2018) Пожалуйста, прекратите объяснять модели черного ящика для принятия решений с высокими ставками. Https://arxiv.org/pdf/1811.10154.pdf

Shulte, F. & E. Fry. (2019). Смерть от тысячи кликов: где электронные медицинские записи ошиблись. Https://khn.org/news/death-by-a-thousand-clicks/

Тополь, Э. Высокоэффективная медицина: конвергенция человеческого и искусственного интеллекта. (2019) https://www.gwern.net/docs/ai/2019-topol.pdf

Тополь, Э. Глубокая медицина: как искусственный интеллект может снова сделать здравоохранение человеком. (2019). Нью-Йорк: Основные книги.

Wiens, J., S. Saria, M. Sendak, M. Ghassemi, V.X. Лю, Ф. Доши-Велес, К. Юнг, К. Хеллер, Д. Кале, М. Саид, П.Н. Оссорио, С. Тадани-Исрани и А. Гольденберг. Не навреди: дорожная карта по ответственному машинному обучению для здравоохранения. (2019) https://www.nature.com/articles/s41591-019-0548-6.pdf