Вклад авторов: авторами этого блога являются Лия Ли, Рутуджа Гуатам Похаре, Айшвария Вадкар и Биаоюе Ван. Все авторы подготовили рукопись, рассмотрели и одобрили окончательный вариант для публикации.

Введение

Сепсис — это состояние, представляющее большую угрозу для жизни, особенно если оно вызвано бактериальной инфекцией. Следовательно, крайне важно обнаружить его на ранней стадии, чтобы обеспечить эффективное лечение. По определению, это серьезное и потенциально смертельное состояние, возникающее в результате чрезмерной реакции организма на инфекцию и приводящее к дисфункции органов, полиорганной недостаточности и даже смерти без своевременного выявления и лечения. Раннее выявление сепсиса и вмешательство необходимы для улучшения результатов лечения пациентов и снижения показателей смертности. В 2017 году госпитализации из-за сепсиса составили 5,8% всех госпитализаций и повлекли за собой огромные расходы в размере 38,2 миллиарда долларов.

Своевременное и эффективное лечение имеет решающее значение для лечения сепсиса из-за его высокой смертности. Поэтому исследователи разработали различные системы оценки, такие как SIRS, NEWS, qSOFA и модели машинного обучения для выявления и прогнозирования сепсиса. Однако большинство этих моделей ориентированы на отделения неотложной помощи или отделения интенсивной терапии, которые имеют больше данных и более высокую частоту сепсиса, чем обычные отделения. Пациенты, у которых сепсис развивается в условиях общей палаты, имеют худшие результаты, потому что они получают меньше мониторинга, меньше показателей жизненно важных функций и меньше лабораторных тестов. В результате разработка системы раннего предупреждения о сепсисе в палатах общего профиля может принести значительную пользу пациентам. Целью этого исследования является разработка модели машинного обучения для прогнозирования сепсиса в условиях общего отделения, сравнение ее эффективности с широко используемыми инструментами наблюдения, такими как SIRS и NEWS, и оценка модели с использованием нового подхода к моделированию испытаний. Несмотря на существующие руководства по ведению сепсиса, диагностика и лечение в общих отделениях остаются трудными, в основном из-за существующих прогностических моделей, ориентированных на пациентов ОИТ. В данной статье (Yu et al., 2022) эта проблема рассматривается путем разработки эффективной модели для выявления начала сепсиса у пациентов общего профиля. Общие палаты имеют определенные проблемы по сравнению с отделениями интенсивной терапии, такие как нечастое наблюдение за пациентами и различные группы населения с различными факторами риска сепсиса. Точная модель прогнозирования имеет жизненно важное значение, поскольку она позволяет специалистам в области здравоохранения выявлять пациентов из группы риска, проводить оперативные вмешательства и сводить к минимуму переводы в отделение интенсивной терапии.

Оригинальная значительная бумага

Пожалуйста, обратитесь к оригинальной значимой статье: Прогнозирование сепсиса для общего отделения.

Ю С.К., Гупта А., Беттхаузер К.Д., Лайонс П.Г., Лай А.М., Коллеф М.Х., Пейн ПРО и Михельсон А.П. (2022) Прогнозирование сепсиса для общего отделения. Спереди. цифра. Здоровье 4:848599. DOI: 10.3389/fdgth.2022.848599

Резюме статьи

В исследовании использовались данные пациентов из еврейской больницы Барнса / Медицинской школы Вашингтонского университета в Сент-Луисе для разработки и проверки модели. В исследование были включены пациенты, поступившие в период с 1 января 2012 г. по 1 июня 2019 г. в возрасте 18 лет и старше. Пациенты были исключены, если они были госпитализированы в психиатрическую или акушерскую службу, имели неполные данные, были закуплены культурами или получали антибиотики в течение 48 часов до времени прогнозирования, имели сепсис при поступлении, находились в отделении интенсивной терапии в течение 24 часов до времени прогнозирования, перенесли операцию в течение 72 часов до времени прогноза и имели слишком много отсутствующих данных. Это было сделано для того, чтобы сосредоточиться на пациентах, которые с наибольшей вероятностью выиграют от модели прогнозирования риска.

Исследователи этой статьи построили модель машинного обучения, которая может прогнозировать риск сепсиса у людей, находящихся в больнице. Созданная ими модель использовала алгоритмы машинного обучения с учителем под названием eXtreme Gradient Boosting (XGBoost), логистическую регрессию и рассматривала различные характеристики каждого пациента, такие как его возраст, состояние его тела («жизненные показатели»), какие лекарства он принимал. взятие, и результаты различных испытаний, которые были сделаны на них.

Встречи с пациентами были разделены на две группы: обучение (75%) и тестирование (25%), чтобы избежать путаницы между пациентами. Параметры преобразования данных были определены из обучающей выборки и использованы для обеих выборок. Исследователи использовали метод под названием «случайный поиск» с повторной перекрестной проверкой для настройки гиперпараметров модели. Лучшая комбинация использовалась для тренировки полного тренировочного набора. Важность функции оценивалась с использованием метода SHAP, который может объяснить индивидуальные прогнозы. SHAP — это проверенный подход к атрибуции кредита, основанный на коалиционной теории игр. У этого подхода есть полезные свойства, такие как аддитивность, что означает, что оценки важности признаков складываются в общий прогноз. Кроме того, он имеет возможность давать объяснения для отдельных прогнозов. Исследователи создали «облегченную» версию модели с небольшим подмножеством функций, чтобы упростить ее развертывание.

В дополнение к оптимизированной модели XGBoost исследователи обучили две другие модели: модель XGBoost с параметрами по умолчанию (XGB unopt) и модель логистической регрессии с регуляризацией l2 (LogReg). Затем они сравнили эффективность всех трех моделей, чтобы определить, какая из них наиболее эффективна для прогнозирования риска сепсиса у пациентов. Это сравнение позволило исследователям оценить сильные и слабые стороны каждой модели и выбрать лучшую для использования в своем исследовании. Используя несколько моделей и сравнивая их производительность, исследователи смогли убедиться, что их результаты надежны и точны.

Чтобы проверить, хороша ли их модель, исследователи использовали метрики, чтобы увидеть, как часто модель была верна, когда она говорила, что кто-то подвержен риску сепсиса. Это называется «площадью под кривой рабочей характеристики приемника» или сокращенно AUC. Они также рассмотрели другие показатели, например, как часто модель была верна, когда говорила, что кто-то не подвержен риску сепсиса (так называемая «специфичность»), и как часто она была верна, когда говорила, что кто-то подвержен риску сепсиса (так называемая «чувствительность»). . Исследователи обнаружили, что их модель очень хорошо определяла, кто подвергался риску сепсиса (AUC составляла более 0,90).

Исследователи считают, что их модель может помочь врачам и медсестрам выяснить, кто может заболеть сепсисом, прежде чем он произойдет. Если они смогут найти этих людей на ранней стадии, они смогут помочь им, пока они не заболели слишком сильно. Это может улучшить положение людей, находящихся в больнице. Авторы статьи стремились разработать прогностическую модель сепсиса с использованием алгоритмов машинного обучения, которую можно применять в условиях общей палаты. Используя данные электронных медицинских карт (EHR), они смогли обеспечить мониторинг и вмешательство в режиме реального времени, что привело к улучшению результатов лечения пациентов за счет выявления пациентов с риском сепсиса еще до клинического признания.

Анализ статьи

Модель XGBoost была оптимизирована и оказалась самой эффективной моделью (рис. 1) с самыми высокими общими значениями AUROC и AUPRC. Были определены пять основных характеристик модели: время от поступления до времени прогнозирования, оценка NEWS2, возраст, оценка qSOFA и максимальная частота дыхания в течение 48 часов до времени прогнозирования.

Исследователи проверили возможности модели в реальных условиях, применяя ее к пациентам каждый час в течение всего их пребывания в больнице. Пациенты, у которых модель предсказывала наличие сепсиса, считались «предупрежденными». Затем они проверили, у скольких из этих предупрежденных пациентов были вмешательства или исходы, связанные с сепсисом.

В ходе исследования были изучены данные 17 441 пациента, и было обнаружено, что из 3 532 пациентов, у которых был отмечен возможный сепсис, у 388 он действительно был. Это означает, что тест для выявления сепсиса был правильным в 11% случаев. Из 557 пациентов, у которых действительно был сепсис, 388 были отмечены как потенциально имеющие его, что означает, что тест выявил 69,7% случаев. Тест смог правильно определить случаи без сепсиса в 81,4% случаев. В течение 48 часов после постановки диагноза почти 30% пациентов подвергались какому-либо медицинскому вмешательству, связанному с сепсисом, например, им давали лекарства или переводили в отделение интенсивной терапии.

Результаты исследования показывают, что алгоритм машинного обучения может эффективно прогнозировать сепсис у госпитализированных пациентов, используя данные ЭМК. В исследовании подчеркивается потенциал непрерывного прогнозирования риска на протяжении всего контакта с пациентом для улучшения выявления и лечения сепсиса. Однако ограничения исследования включают использование набора данных из одного центра и отсутствие внешней проверки. Необходимы дальнейшие исследования для оценки обобщаемости и эффективности алгоритма в других медицинских учреждениях.

Последствия и приложения

Среди всех четырех моделей, созданных и обученных в этом проекте, XGB opt, XGB lite, XGB unopt и LogReg, оптимизированная модель XGBoost, использующая все функции, получает наивысшую оценку AUROC и AUPRC. Это означает, что XGB opt — это подчеркнутый подход к машинному обучению, обеспечивающий наилучшие характеристики диагностики сепсиса. Таким образом, он может применяться в больницах в качестве дополнительной поддержки принятия клинических решений при диагностике случаев сепсиса, которые не были зафиксированы во время основной клинической оценки, и для привлечения клинического внимания к пациентам, вовлеченным в эти случаи.

Заключение

Задача прогнозирования, упомянутая в этом исследовании, является сложной из-за разреженности данных и низкой распространенности. Тем не менее, оптимизированная модель XGBoost по-прежнему превосходит другие, в то время как метод SHAP, используемый во время анализа важности признаков, определяет время от госпитализации до времени прогнозирования как наиболее важный признак для прогнозирования сепсиса. Алгоритмы машинного обучения могут значительно эффективнее и действеннее влиять на прогнозирование сепсиса заблаговременно, чем традиционные методы.

Основные выводы

  1. Для предварительной обработки числовых функций стандартизация часто рассматривается как один из наиболее важных методов, обеспечивающих удобство использования и доступность данных. И данные временных рядов должны обрабатываться разумно. Например, в этом исследовании при обобщении данных использовался диапазон временных окон ретроспективного анализа от 3 до 96 часов.
  2. Выбор модели и выбор показателей оценки в этом исследовании дает нам некоторые подсказки относительно реализации нашего окончательного проекта, хотя в нашем для прогнозирования сепсиса используется другой набор данных. Например, для использования значений AUROC и AUPRC для оценки модели, особенно в методе использования параллельного сравнения на линейных графиках.
  3. Настройка дополнительных материалов — это разумный способ помочь аудитории понять и визуализировать доступность данных, методы предварительной обработки данных, сравнительные таблицы и т. д., не заполняя основной отчет. Чтобы предоставить результаты моделирования, результаты настройки, результаты важности функций и т. д., блок-схемы и таблицы числовых сравнений просты и эффективны.
  4. По сравнению с традиционными способами алгоритмы машинного обучения могут снизить уровень смертности пациентов, используя клинические записи и медицинские записи для выявления симптомов сепсиса на несколько часов раньше, если таковые имеются. Алгоритмы машинного обучения способны изучать прогностические закономерности в данных EHR и, возможно, для других различных типов данных.

Возможные дальнейшие улучшения

  1. Дальнейшие улучшения в псевдопроспективном исследовании считаются потенциально полезными для исследования. Например, исследователи могут расширить исследование предупреждений, чтобы иметь дело с повторяющимися и т. д.
  2. Добавление дополнительных обучающих данных и обеспечение качества данных для обучения моделей может существенно повлиять на результаты моделирования. Например, если пациент с сепсисом прибывает в больницу и получает немедленную помощь, время прогнозирования сепсиса намного короче, чем у другого пациента, который приходит и ждет 2 часа для проведения первого клинического теста. Это может повлиять на фактическое время, необходимое для прогнозирования сепсиса.
  3. Для расширения этого исследования можно было бы использовать больше моделей и показателей. Например, использовать ансамблевую модель, которая объединяет обученные модели с хорошей производительностью, и сравнить ее производительность с параллельными одиночными моделями.
  4. Сокращения в разделе дополнительных материалов можно было бы лучше организовать с помощью таблиц с двумя столбцами вместо текстовых предложений, потому что в этом исследовании ожидается, что аудитория будет нуждаться в поиске технических формулировок и определений, пытаясь понять данные, модель и эти результаты.

Рекомендации