Бен Ленгерих

Какие госпитализированные пациенты чаще всего умирают? В нашей новой статье мы показываем, что пациенты с самым высоким риском смерти часто являются не самыми нездоровыми пациентами в целом, а скорее самыми нездоровыми из пациентов, которые не проявляют агрессии. лечение.

Например, креатинин сыворотки является индикатором дисфункции почек. Таким образом, мы ожидаем, что риск смертности будет увеличиваться с повышением уровня креатинина в сыворотке (внизу слева). Но когда мы проводим анализ реальных медицинских записей на основе данных, мы получаем совершенно другую картину (внизу справа). Наиболее высокому риску подвержены пациенты с уровнем креатинина в сыворотке 5 мг/дл, а пациенты с уровнем креатинина в сыворотке 7 мг/дл имеют наименьшую вероятность смерти.

Почему мы видим эту странную кривую риска? Форма кривой дает нам некоторые подсказки. Кривая риска вогнута между 3 мг/дл и 5 мг/дл с резкими изменениями направления при каждом из этих круглых чисел. Это говорит о том, что изменения в поведении врачей вызываются пороговыми значениями 3 и 5 мг/дл, а чрезвычайно низкий риск у пациентов с сильно повышенным уровнем креатинина >7 мг/дл указывает на то, что для таких пациентов существуют эффективные методы лечения.

Так почему же это происходит? Короче говоря, наблюдаемый риск представляет собой комбинацию основного риска пациентов и взаимодействия с системой вмешательства, которая имеет все причуды и предубеждения человеческих суждений и действий. Клиницисты — это люди, принимающие трудные решения на основе эвристики и пороговых значений. Как оказалось, эти эвристики и пороги влияют на качество получаемой медицинской помощи: пациенты, состояние которых чуть ниже порога для лечения, часто имеют худшие результаты. Эффекты настолько сильны, что мы улавливаем эти закономерности с помощью ретроспективного анализа данных.

Как найти эти лечебные эффекты

Итак, как мы можем узнать, изучила ли наша модель, управляемая данными, шаблоны протоколов лечения, а не шаблоны основного риска?

Это сложно, потому что эффекты обработки не являются следствием ограниченных выборок или некачественной модели. Скорее смешанные эффекты возникают из-за поведения в реальном мире, поэтому любая модель, которая точно предсказывает наблюдаемые результаты, должна резюмировать эти эффекты. Это также не проблема недостаточного количества характеристик: даже если бы мы наблюдали все характеристики лечения для всех пациентов, стандартизированное лечение без рандомизации не обеспечивает статистической идентифицируемости, позволяющей отделить влияние лечения от влияния характеристик, которые определяли решения о лечении.

К счастью, у нас есть новые интерпретируемые инструменты машинного обучения!

Изучая модель с высоким разрешением, которую можно понять и проверить, мы можем выяснить, какие паттерны кривых риска исходят из основного риска пациента, а какие — из протоколов лечения. Мы используем GAM, реализованные в Interpret.ML — они действительно хороши, потому что они представляют собой древовидные модели, поэтому расщепления точно моделируют решения о лечении, основанные на медицинских протоколах и порогах.

Проблема -> Возможность

Наличие инструмента, который позволяет нам находить эти странные шаблоны риска, на самом деле превращает смешанную проблему в возможность:

Хотя эти контрпричинные модели риска могут сбить с толку прогностические модели, они также подчеркивают возможности для улучшения медицинской практики. В нашей статье мы классифицируем эти формы кривых риска по узнаваемым шаблонам и разбираем влияние каждой из этих форм на основной протокол лечения и его возможное отклонение от оптимальных протоколов.

Последствия машинного обучения для здравоохранения

Применяя машинное обучение «стеклянного ящика» к данным здравоохранения, мы обнаруживаем, что эти шаблоны повсеместно встречаются в наборах данных здравоохранения. Стандартные наборы данных, которые использовались тысячами исследователей, полны этих «парадоксальных» эффектов лечения. Например, вот наборы данных MIMIC, высококачественные наборы данных с тысячами посещений отделений интенсивной терапии, зарегистрированных за десятилетия:

В MIMIC-4 у нас записано лечение, поэтому мы можем связать показатели смертности (верхняя строка) с решениями о лечении (нижние 2 строки). Странные закономерности в уровне смертности, по-видимому, сильно зависят от решений о лечении, а решения о лечении следуют узнаваемым клиническим руководствам и протоколам. В результате мы должны ожидать, что любая система МО, обученная на наборах данных MIMIC, будет повторять эти эффекты лечения, а прогнозирование риска МО сильно искажается решениями о лечении. Это означает, что мы не должны считать модель МО риска для здоровья значимой, даже если она дает прогноз на большом каноническом наборе данных — мы должны проверить, что она научилась резюмировать на основе данных.

Значение для медицины

Эта точка зрения также имеет значение для практикующих врачей. Мы видим, что на показатели смертности сильно влияют факторы риска, которые определяют решения о лечении. Это означает, что наши решения о лечении не идеальны — если бы решения были идеальными, у нас были бы гладкие, плоские кривые риска. Вместо этого кривые риска в реальном мире скачкообразны и часто бывают самыми высокими для пациентов, у которых нет самого высокого основного риска.

Мы должны продолжать совершенствовать наши протоколы лечения, чтобы риск для пациентов был сглажен и снижен в целом. Это сложно, потому что большинство протоколов лечения должны использовать пороги для определения категорий риска. Однако строгое соблюдение пороговых значений может нанести вред лицам, находящимся чуть ниже порогового уровня. По мере того, как мы движемся к точной медицине, мы можем использовать больше инструментов, чтобы помочь создать более целостное описание здоровья, которое может помочь в принятии решений о лечении лучше, чем любое отдельное измерение.