Келси Батлер —

Меня зовут Келси Батлер, и в марте этого года я присоединилась к Colubri Lab в Медицинской школе UMass Chan. Наша лаборатория использует вычислительные подходы для создания новых инструментов для биомедицинских исследований и обучения STEM. Поскольку новая лаборатория начала работу прямо в разгар пандемии COVID, наши первые встречи просто состояли из нас двоих в почти пустом исследовательском здании:

Один из моих проектов является продолжением давнего сотрудничества между моим личным помощником, доктором Андресом Колубри, лабораторией Сабети в Институте Броуда Массачусетского технологического института и Гарварда, а также специализированной учебной больницей Ирруа (ISTH) в штате Эдо, Нигерия. Еще в 2016 году Андрес вместе со своими коллегами из Broad и ISTH создал мобильное приложение CommCare, которое позволяет медицинским работникам ITSH собирать подробные клинические данные о пациентах с лихорадкой Ласса. Лихорадка Ласса — вирусная геморрагическая лихорадка, эндемичная для Западной Африки, которая впервые была идентифицирована как эмерджентное заболевание только в 1969 году. Интересующимся рекомендую ознакомиться с увлекательной (и страшной) историей медсестер и врачей, которые рисковали свои жизни, чтобы спасти пациентов, больных этой загадочной и смертельной болезнью.

До появления этого приложения медицинские записи хранились на бумаге и кропотливо переносились в электронные таблицы для анализа данных. Благодаря внедрению ведения цифровых записей в приложение мы собрали крупнейший на сегодняшний день набор клинических данных о лихорадке Ласса, состоящий из почти 1000 пациентов, прошедших лечение в ISTH за последние четыре года.

Этот набор данных является важным источником информации, которая может помочь нам узнать больше об этом забытом новом заболевании и, мы надеемся, построить точные вычислительные модели тяжести заболевания и прогноза, которые могут помочь в лечении пациентов в будущем.

Мы начали с анализа демографической информации, клинических симптомов, основных показателей жизнедеятельности, лабораторных результатов и лечебных вмешательств для пациентов в наборе данных. Из 841 пациента, включенного в исследование, в анализ были включены 714 пациентов с известным исходом (умершие или выжившие). Средний возраст составлял 33 года, и 42,9% (294/684) были женщинами. Общий уровень летальности составил 17,8% (127/714), что свидетельствует о том, что даже при специализированном профессиональном уходе (в ISTH имеется одно из первых специализированных отделений лихорадки Ласса в Нигерии) лихорадка Ласса является смертельно опасным заболеванием. Наш анализ подтвердил, что кровотечение и тяжелые симптомы со стороны центральной нервной системы (ЦНС) чаще встречались у умерших пациентов, что подтверждает результаты более ранних исследований Оба являются значимыми предикторами смертности с отношением шансов 21,95 (95% ДИ: 10,5–45,8) для тяжелых заболеваний ЦНС. симптомов и 10,28 (95% ДИ: 5,07–20,86) для кровотечения. Кровотечение представляет собой совокупную переменную и может варьироваться по степени тяжести, хотя пациенты с этим симптомом, как правило, находятся на более поздней стадии заболевания. Проявления лихорадки Ласса сильно различаются , от легкой до очень тяжелой болезни Выяснение того, что объясняет разницу между легкими и серьезными проявлениями болезни, является одной из самых больших проблем в Исследовании лихорадки Ласса!

После завершения описательного анализа набора данных мы проанализировали закономерности отсутствующих данных, чтобы сообщить о выборе переменных. В наборах клинических данных часто бывает много пропусков, и это особенно верно для данных, собранных в клинических условиях с ограниченными ресурсами. Нашей целью было создание клинически полезных моделей, учитывающих эту ограниченную доступность данных. Рассмотрим закономерности отсутствия значений аспартатаминотрансферазы (АСТ) и калия, маркеров органной недостаточности и обезвоживания соответственно. Эти переменные редко сообщаются вместе, но обе являются важными предикторами смертности. Мы обнаружили, что более 90% пациентов не имеют лабораторных результатов ТЧА в течение первых двух дней после госпитализации, в то время как у 80% нет доступных уровней калия, и только у небольшого количества пациентов есть оба.

Мы пришли к выводу, что эти лабораторные тесты упорядочены по отдельным клиническим сценариям, и обучили для каждого из них отдельную модель. Модель 1 подходит для пациентов, которым назначены лабораторные исследования при подозрении на обезвоживание, а Модель 2 подходит для пациентов с подозрением на органную недостаточность. Модель 1 использует возраст, тяжелые симптомы со стороны ЦНС, кровотечения, креатинин и АСТ в качестве предикторов. Он имеет AUC 0,95 (95% ДИ 0,86-1), чувствительность 90% (63-100%) и специфичность 87% (52-100%). Модель 2 использует возраст, тяжелые симптомы со стороны ЦНС, кровотечения, креатинин и калий в качестве предикторов. Он имеет AUC 0,86 (95% ДИ 0,73–0,99), чувствительность 96% (67–100%) и специфичность 65% (6–91%).

Обратите внимание, что в модели 2 специфичность составляет 65% и имеет широкий диапазон неопределенности. Это указывает на то, что модель может давать ложноположительные результаты, что в данном случае означало бы прогнозирование смертности для пациентов, которые в конечном итоге выживут. Порог вероятности можно регулировать в зависимости от клинической ситуации, и здесь мы установили его на 30%, чтобы максимизировать способность моделей идентифицировать случаи с наибольшим риском.

Одним из самых сложных аспектов работы с этим набором данных является работа с отсутствующими данными. Ниже приведены распределения АСТ (отсутствует 92%) и калия (отсутствует 83%). Калий содержит 145 значений и имеет правое асимметричное распределение. Эта переменная потенциально может быть кандидатом на вменение, но высокий процент отсутствующих данных делает ее серой зоной. AST, с другой стороны, не подходит для вменения, потому что 67 значений не имеют предсказуемого распределения. Несмотря на большое количество недостающих данных, мы должны помнить, что на сегодняшний день это самый большой набор данных, описывающий пациентов с лихорадкой Ласса, и мы хотим извлечь как можно больше информации, чтобы улучшить клинические результаты и улучшить наше понимание клинических проявлений болезни. Отсутствующие данные также способствуют большой неопределенности в наших расчетах, как показано выше.

Работа с отсутствующими данными — это лишь один из аспектов работы со сложными наборами клинических данных, и это навык, который я буду продолжать развивать по мере получения степени. Мне повезло, что я работаю в программе и лаборатории, где меня окружают исследователи, которые построили свою карьеру на извлечении значимой информации из больших, громоздких наборов данных и представлении ее в сжатой, эффектной форме. Если вам интересно узнать больше об этом проекте, я представлю результаты на Ежегодном собрании Американского общества тропической медицины и гигиены через несколько недель!

И в заключение я хотел бы отметить, что лаборатория разрослась с тех пор, как я присоединился к ней, взгляните на страницу команды, чтобы узнать больше о ее нынешних членах. Поскольку мы на 100% являемся вычислительной лабораторией, мы приняли гибридную модель, в которой мы выполняем большую часть работы удаленно/из дома и еженедельно встречаемся на месте для личного общения и обсуждения. Мы также время от времени собираемся на экскурсии, например, в Музей Fruitlands ниже :-)