Почему самый продвинутый искусственный интеллект в мире используется для видео с кошками, но не для того, чтобы помочь нам жить дольше и здоровее? Краткая история ИИ в медицине и факторы, которые могут помочь ему добиться успеха там, где он раньше терпел неудачу.

Представьте себя молодым аспирантом Стэнфордской лаборатории искусственного интеллекта, создающим систему для диагностики распространенных инфекционных заболеваний. После нескольких лет тяжелого труда и тяжелого труда настает день для испытания: прямое сравнение с пятью ведущими специалистами по инфекционным заболеваниям. Над первым экспертом ваша система выжимает узкую победу, выигрывая всего 4%. Он легко превосходит второго, третьего и четвертого докторов. Против пятого он выигрывает на поразительные 52%.

Вы бы поверили, что такая система уже существует? Вы бы поверили, что он существовал в 1979? Это был проект MYCIN, и, несмотря на прекрасные результаты исследований, он так и не вошел в клиническую практику. [1]

На самом деле, хотя мы окружены фантастическими приложениями современного ИИ, особенно глубокого обучения - беспилотные автомобили, Siri, AlphaGo, Google Translate, компьютерное зрение, - влияние на медицину практически отсутствует. В ведущем кардиологическом журнале Circulation термин «глубокое обучение» встречается только дважды [2]. Глубокое обучение никогда не упоминалось в Медицинском журнале Новой Англии, The Lancet, BMJ или даже в JAMA , где работа над MYCIN была опубликована 37 лет назад. Что случилось?

Усилия по использованию искусственного интеллекта в медицине преследовали три основные проблемы: проблема с ярлыком, проблема развертывания и страх вокруг регулирование. Прежде чем мы перейдем к ним, давайте кратко рассмотрим состояние медицины сегодня.

Моральные аргументы в пользу ИИ в здравоохранении

Медицина - это жизнь и смерть. При таких высоких ставках можно было бы спросить: действительно ли мы должны раскачивать лодку здесь? Почему бы просто не придерживаться существующих, проверенных алгоритмов клинического уровня?

Что ж, рассмотрим несколько примеров статус-кво:

Чтобы быть ясным, ничто из этого не означает, что медицинские исследователи делают плохую работу. Современная медицина - это чудо; просто оно распределено неравномерно. Специалисты по информатике могут здесь многое предложить. С помощью таких инструментов, как Apple's ResearchKit и Google Fit, мы можем собирать данные о состоянии здоровья в любом масштабе; с помощью глубокого обучения мы можем преобразовывать большие объемы необработанных данных в аналитические данные, которые помогают как врачам, так и пациентам предпринимать реальные действия.

Для этого мы должны решить три сложные проблемы: техническую, политэкономическую и нормативную. Хорошая новость заключается в том, что в каждой категории есть новые разработки, которые могут позволить ИИ добиться успеха там, где он раньше терпел неудачу.

Центральная проблема №1: здравоохранение как ярлык пустыни и одноразовое обучение

Современный искусственный интеллект требует данных. Чтобы сделать распознавание речи на вашем телефоне Android точным, Google обучает глубокую нейронную сеть примерно 10 000 часов аннотированной речи. В области компьютерного зрения ImageNet содержит более 1 034 908 изображений с ручными аннотациями. Эти аннотации, называемые метками, необходимы для работы таких методов, как глубокое обучение.

В медицине каждый ярлык представляет опасность для жизни человека.

Например, в нашем исследовании, проведенном совместно с UCSF Cardiology, размеченные примеры были получены от людей, посещающих больницу для процедуры, называемой кардиоверсией, - электрического разряда 400 джоулей в грудную клетку, который сбрасывает ваш сердечный ритм. Это может быть пугающим опытом. Многие из этих пациентов достаточно любезны, чтобы носить датчик сердечного ритма (например, Apple Watch) на протяжении всей процедуры в надежде улучшить жизнь следующего поколения, но мы знаем, что у нас никогда не будет миллиона участников, и это было бы бессовестно спросить.

Может ли ИИ хорошо работать в ситуациях, когда у нас может быть в 1000 раз меньше ярлыков, чем мы привыкли? В этом направлении уже есть многообещающие работы. Во-первых, именно неконтролируемое обучение вызвало интерес к глубокому обучению в 2006–2009 годах, а именно, предварительное обучение и автоэнкодеры, которые могут находить структуру в данных, которая полностью не помечена. Совсем недавно с помощью гибридных методов, таких как полууправляемое обучение последовательности, было установлено, что вы можете делать точные прогнозы с менее размеченными данными, если у вас много немаркированных данных. Самая экстремальная настройка - это однократное обучение, когда алгоритм учится распознавать новый шаблон после того, как ему присвоена только одна метка. Работа Фей-Фей Ли по однократному обучению компьютерному зрению, например, разложила статистические модели на отдельные распределения вероятностей по внешнему виду и положению; Могут ли подобные факторинги медицинских данных раньше спасать жизни? Недавние работы по Байесовскому программному обучению (Торонто, Массачусетский технологический институт, Нью-Йоркский университет) и одноразовому обобщению в глубоких генеративных моделях (DeepMind) являются многообещающими в этом отношении.

В основе многих из этих методов лежит идея о том, что большие объемы немаркированных данных могут заменять помеченные данные. Это настоящий прорыв? да. С распространением датчиков немаркированные данные теперь дешевы. Некоторые медицинские исследования уже используют это. Для Cardiogram это потребовало создания приложения Apple Watch для сбора около 8,5 миллиардов точек данных из HealthKit, а затем партнерства с проектом UCSF Health eHeart для сбора медицинских этикеток [слева, 5]. Исследователи из USC обучили нейронному внедрению данных EMR. Американская ассоциация апноэ во сне в партнерстве с IBM Watson разработала приложение ResearchKit, в которое каждый может предоставить свои данные о сне.

Центральная проблема №2: развертывание и принцип «вовнутрь»

Допустим, вы создали прорывной алгоритм. Что произойдет дальше? Опыт MYCIN показал, что результатов исследований недостаточно; вам нужен путь к развертыванию.

Исторически сложилось так, что развертывание было затруднено в таких областях, как здравоохранение, образование и правительство. Электронные медицинские записи не имеют реального эквивалента «App Store», который позволил бы отдельному врачу установить новый алгоритм [8]. Программное обеспечение EMR, как правило, устанавливается на месте, продается с многолетними циклами централизованной группе закупок в каждой больничной системе, а новые функции управляются контрольными списками, утвержденными на федеральном уровне. Чтобы внедрить новую инновацию в рамках тяжелого процесса закупок, вам нужна четкая окупаемость инвестиций. К сожалению, больницы, как правило, уделяют приоритетное внимание тому, за что они могут выставлять счета, что подводит нас к нашей укоренившейся и дирижированной платежной системе с оплатой за услуги. При оплате за услуги больница выставляет счета за каждый отдельный вид деятельности; в случае ошибочного диагноза, например, они могут провести последующие тесты и выставить счет за них. И наоборот, это означает, что лучший алгоритм может на самом деле снизить доход больниц, которые, как ожидается, примут его. Как, черт возьми, этот может летать?

Хуже того, поскольку за каждую отдельную услугу устанавливается плата, нововведения по умолчанию не оплачиваются. Говоря абстрактно, алгоритм спасения жизни, такой как MYCIN, должен быть широко принят, но когда вы намечаете конкретные финансовые стимулы, реалистичного пути к развертыванию нет.

К счастью, есть изменение, в которое мы можем верить. Во-первых, мы больше не поставляем программное обеспечение, мы развертываем его мгновенно. Во-вторых, Закон о доступном медицинском обслуживании дает стартапам возможность полностью брать на себя риск: стартапы полного цикла в сфере здравоохранения.

Во-первых, доставка. Представьте себя исследователем искусственного интеллекта, создававшим программу проверки орфографии Microsoft Word в 90-х годах. Ваш алгоритм будет ограничен любыми данными, которые вы можете собрать в лаборатории; если вы обнаружите прорыв, на поставку уйдут годы. А теперь представьте себя десятью годами позже, когда вы работаете над исправлением орфографии в Google. Вы можете построить свой алгоритм на основе миллиардов поисковых запросов, кликов, просмотров страниц, веб-страниц и ссылок. Когда он будет готов, вы можете сразу же его развернуть. Это приводит к увеличению скорости обратной связи в 100 раз. Такие системы, как поиск Google, работают лучше, чем какой-либо один алгоритм, благодаря этому быстрому циклу обратной связи.

То же самое постепенно становится возможным и в медицине. У всех в кармане есть суперкомпьютер. Если вы можете найти способ упаковать искусственный интеллект в приложение для iOS или Android, процесс развертывания перейдет от цикла продаж предприятия к обновлению магазина приложений.

Во-вторых, разделение рисков. Закон о доступном медицинском обслуживании создал альтернативы плате за услуги. Например, в пакетных платежах Medicare оплачивает фиксированную плату за операцию, и, если пациента необходимо повторно госпитализировать в течение 90 дней, первоначальный поставщик услуг финансово зависит от затрат. Это меняет стимулы: если вы изобретете новый алгоритм искусственного интеллекта, который на 10% лучше прогнозирует риск (или, что еще лучше, предотвращает его), это теперь определяет чистую прибыль для больницы. В настоящее время тестируется множество вариантов вознаграждения за вознаграждение: организации подотчетной помощи, заключение контрактов на основе риска, полное подушевое регулирование, MACRA и MIPS и многое другое.

Эти две вещи позволяют использовать внешний подход к здравоохранению: создать базу пользователей за пределами ядра системы здравоохранения (например, за пределами EMR), но взять на себя риск основные проблемы внутри системы здравоохранения, такие как повторные госпитализации. Вместе эти два фактора позволяют стартапам решать проблемы от начала до конца, почти так же, как Uber решал сквозные перевозки, а не пытался продавать программное обеспечение компаниям такси.

Проблема только отчасти: регулирование и страх

Многие предприниматели и исследователи опасаются здравоохранения, потому что оно строго регулируется. Считается, что многие режимы регулирования - это просто дорогой способ сказать «нет» новым идеям.

И такое восприятие иногда бывает правдой: сертификаты потребности, требования к капиталу, основанные на оценке риска, чрезмерно обременительная отчетность, плата за услуги: все это иногда создает серьезные препятствия для новых участников и инноваций, в значительной степени в ущерб нашему коллективному.

Но правила также могут быть вашим союзником. Возьмите HIPAA. Если авторы MYCIN хотели сделать возможным запуск своего алгоритма в вашей медицинской карте в 1978 году, на самом деле у них не было возможности сделать это. Медицинская карта принадлежала больнице, а не пациенту. HIPAA, принятая в 1996 году, изменила модель собственности: если пациент дает согласие, больница обязана отправить запись пациенту или назначенному лицу. Сегодня эти записи иногда представляют собой факсы с бумажными копиями, но такие усилия, как Blue Button, FIHR, и их рациональное использование переводят их в машиночитаемые форматы. Как говорит мой друг Райан Панчадсарам: HIPAA часто говорит, что вы можете.

Заключительные мысли

Если вы опытный специалист по искусственному интеллекту, который в настоящее время сидит в сторонке, самое время действовать. Проблемы, из-за которых ИИ не появлялся в здравоохранении последние 40 лет, теперь решаемы. И ваше влияние велико.

Современные исследования стали настолько специализированными, что наше представление о воздействии иногда бывает разрозненным. Клиницист мирового уровня может быть вознагражден за изобретение новой хирургии; Исследователь ИИ может получить признание за побитие мирового рекорда по MNIST. Когда два поля пересекаются, иногда могут возникать страх, недопонимание или культурные столкновения.

Мы не уникальны в истории. В 1944 году были заложены основы квантовой физики, включая, в значительной степени, более поздний взрыв первой атомной бомбы. После войны поколение физиков обратило внимание на биологию. В книге 1944 года Что такое жизнь? Эрвин Шредингер сослался на чувство благородного обязательства, которое не позволяло исследователям в разных областях тесно сотрудничать и «умоляло [ged] отказаться от благородство »:

В течение следующих 20 лет развивалась область молекулярной биологии. Сам Шредингер использовал квантовую механику, чтобы предсказать, что наш генетический материал имеет структуру «апериодического кристалла». Тем временем Лурия и Дельбрюк (доктор медицины и доктор физики соответственно) обнаружили генетический механизм, с помощью которого реплицируются вирусы. В следующем десятилетии Уотсон (биолог) и Крик (физик) применили рентгеновские лучи от Розалинды Франклин (химик), чтобы открыть двойную спиральную структуру ДНК. И Лурия, и Дельбрюк, и Watson & Crick выиграли Нобелевские премии за это междисциплинарное сотрудничество. (Сама Франклин скончалась к моменту присуждения последней премии.)

Если бы ИИ в медицине был в сотую часть успешнее физики в биологии, его влияние было бы астрономическим. Возвращаясь к примеру с CHADS2-Vasc, во всем мире около 21 миллиона человек принимают препараты для разжижения крови; если трети из них не нуждаются в этом, мы вызываем 266 000 дополнительных кровоизлияний в мозг [7]. И это всего лишь один балл за одно заболевание. Но мы сможем решить эти проблемы только в том случае, если будем умолять отречься от благородства, как это делали поколения ученых до нас. На карту поставлены жизни.

Примечания

[1] Интересный момент из истории можно найти в книге 1982 года Искусственный интеллект в медицине, которая давно вышла из печати. Раздраженный сам автор размышляет о том, что многие идеи 80-х годов все еще живы, но системы медицинской документации продвигались к рутинному внедрению так медленно, что авторы были бы шокированы в 1982 году, обнаружив, что многие из идей, которые мы описали, все еще актуальны. чрезвычайно сложно применить на практике, потому что данные, на которые они опираются, обычно не доступны в машиночитаемой форме . Более свежий обзор - Тридцать лет конференций по искусственному интеллекту в медицине (AIME): обзор тем исследований (2015).

[2] Машинное обучение в медицине (Circulation, 2015) - хорошее резюме, особенно последний раздел о взаимосвязи между точной медициной и уровнями представления в глубоком обучении. :

«В представлении болезни человека с помощью глубокого обучения нижние уровни могут представлять клинические измерения (такие как данные ЭКГ или белковые биомаркеры), промежуточные уровни могут представлять аберрантные пути (которые могут одновременно влиять на многие биомаркеры), а верхние слои могут представлять подклассы болезней (которые возникают из-за переменного вклада ≥1 аберрантных путей). В идеале такие подклассы не только стратифицировали бы по риску, но и фактически отражали бы доминирующий механизм (ы) заболевания. Это поднимает вопрос об основной патофизиологической основе сложного заболевания у любого конкретного человека: редко ли оно закодировано в ограниченном наборе аберрантных путей, которые могут быть восстановлены неконтролируемым процессом обучения (хотя и с правильными собранными характеристиками и достаточно большой выборкой). размер), или это диффузный, многофакторный процесс с сотнями мелких детерминант, которые сильно варьируются у разных людей? В последнем случае концепция точной медицины вряд ли принесет большую пользу. Однако в первой ситуации неконтролируемое и, возможно, глубокое обучение могло бы реально реализовать неуловимую цель реклассификации пациентов в соответствии с более однородными подгруппами, с общей патофизиологией и потенциалом общего ответа на терапию ».

[3] C-статистика также эквивалентна площади под кривой ROC. Первоисточник CHADS2-Vasc: Lip 2010.

[4] Из Стратификация риска внезапной сердечной смерти:
текущий статус и проблемы на будущее
и Стратификация риска внезапной сердечной смерти: план на будущее.

[5] Это не означает, что приложение - это всего лишь площадка для исследования: мы глубоко заботимся о том, чтобы Cardiogram оставался особенным как привлекательное, хорошо продуманное и полезное приложение. Но решение создать приложение в первую очередь было продиктовано более широкой целью. Как сказал один врач: «Если вы хотите проводить социологические исследования мирового уровня, создавайте Facebook».

[6] http://venturebeat.com/2015/12/19/5-must-dos-for-succeeding-in-health-tech/

[7] Варфарин вызывает кровоизлияние в мозг у 38 из 1000 пациентов.

[8] Возможное исключение в будущем: Illumina’s Helix. См. Статью Крисси Фарр в Fast Company о стремлении Illumina создать магазин приложений для вашего генома.