Интеграция технологий и здравоохранения продолжает революционизировать то, как мы отслеживаем и улучшаем благополучие людей. Недавняя пандемия дала редкий и тревожный взгляд на ограничения наших систем здравоохранения и стимулировала решения, направленные на устранение этих ограничений, часто за счет использования решений на основе ИИ и машинного обучения для автоматизации процессов и раскрытия возможностей прогнозирования.

Наша команда специалистов по обработке и анализу данных недавно завершила проект, ключевые аспекты которого показывают, как развивается здравоохранение с использованием ИИ, в частности, аналитика биосенсоров, и который столкнул нас лицом к лицу с особым набором проблем, типичных для поле. Вот как мы их решили — и что проект говорит нам о месте науки о данных в будущем здравоохранения.

Сенсоры — это новый черный цвет

Носимые устройства — по сути, биосенсоры, которые можно прикреплять к человеческому телу без существенного ограничения его подвижности — стали мощными инструментами в области аналитики здравоохранения. Эти устройства оснащены различными датчиками, способными регистрировать, часто в режиме реального времени, ряд измерений, таких как температура, цвет, уровень pH, биоимпеданс, частота сердечных сокращений и уровень кислорода в крови. Более совершенные датчики могут собирать еще более сложные данные, включая измерения биоимпеданса для анализа состава тела или мониторинга pH. Эта технология предлагает беспрецедентный уровень понимания наших физиологических и биологических процессов и обещает повысить эффективность и результативность работы, которая по-прежнему требует внимания и вмешательства человеческого персонала.

Однако количество и характер данных, генерируемых носимыми устройствами, ставит перед учеными и исследователями уникальные проблемы. По мере того, как носимые устройства становятся все более изощренными, потенциал для анализа данных в области здравоохранения огромен, но системы, построенные на основе носимых устройств, часто требуют новых решений для эффективного использования и анализа огромного количества данных, которые они генерируют.

Покажи, где будет больно

Проект, который мы рассматриваем в этой статье, был мотивирован необходимостью более эффективного использования данных биосенсоров в диагностических целях. Не вдаваясь в подробности, целью было прогнозирование формирования послеоперационного осложнения. Используя доступные в настоящее время инструменты и методы, требуется примерно неделя, чтобы обнаружить и начать лечение этого патологического изменения.

В зависимости от того, насколько можно улучшить время обнаружения патологических изменений, поставщики медицинских услуг могут сэкономить значительные ресурсы — как человеческие, так и материальные — которые в настоящее время выделяются на мониторинг и лечение пациентов. Результатом будут лучшие результаты для здоровья благодаря более своевременному лечению, а также в целом более оптимальному распределению внимания специалистов. Кроме того, ожидается, что решения на основе датчиков в целом будут дешевле по сравнению с традиционными технологиями визуализации и другими альтернативными методами диагностики.

По завершении проекта наша команда смогла сократить время обнаружения заболевания с текущей стандартной недели до 2–3 дней. В дополнение к демонстрации того, что подход на основе ИИ может обеспечить достаточно точные результаты за относительно короткое время, проект подтвердил коммерческую жизнеспособность подхода на основе датчиков с точки зрения стоимости оборудования. С точки зрения науки о данных это потребовало максимального использования очень скудных данных в особом стечении обстоятельств.

Необходимые и неизбежные ограничения

В начале проекта не было определенных физиологических маркеров или характеристик, на которые мы могли бы положиться в качестве пороговых значений для четкого определения изменений, к которым мы стремились. Это потребовало создания реальных случаев изменения и создания условий, подходящих для исследований корпоративного уровня в рамках ограничений пилотного проекта.

Эта ранняя фаза разработки включала ограниченное количество тестовых образцов, каждый с несколькими датчиками, прикрепленными вдоль области, которая отображала экземпляр послеоперационного изменения, которое было обнаружено в некоторых случаях, и отсутствие изменений в других. Каждый датчик действовал как независимая точка измерения множества биологических признаков. Полученная система работает на том основании, что аномалии в показаниях датчиков могут быть обнаружены раньше, чем патологическое изменение станет заметным для врача.

Сочетание этих практических потребностей и относительно ограниченного масштаба проекта оставило нас с очень скудными обучающими данными, с которыми также часто было трудно работать из-за того, что значения пропадали в результате множества общих практических причин, которые просто стали более важными факторами. при работе с меньшей выборкой. Вдобавок ко всему, первая фаза проекта также была «неконтролируемой», то есть наша команда получала только необработанные данные без меток, добавляя еще один уровень сложности, заключающийся в том, чтобы выяснить, какие данные поступают от датчика, контактирующего с патологическим изменением. Это должно было смоделировать возможный сценарий испытаний на людях, в котором наличие патологических изменений даже не было бы гарантировано.

Превратите немного в долгий путь

Наша команда решила решить двойную проблему скудных, часто неполных данных и отсутствия меток, используя модели низкой сложности, подходящие для скудных данных, и сначала попытавшись отфильтровать функции, которые действительно были бы важны для выявления патологического изменения. на ранней стадии. Цель этого этапа состояла в том, чтобы выбрать, какие датчики содержат наиболее полезную информацию для прогнозирования осложнений во время заживления. Из-за небольшого количества данных в нашем распоряжении было важно отбросить нерелевантные функции, поскольку они могли легко привести к переоснащению модели. Переобученная модель прекрасно научилась бы разделять патологические изменения в нашей ограниченной системе тестирования, но это также оставило бы ее с некачественными возможностями обобщения для образцов, отличных от наших тестовых случаев, например. во время последующих клинических испытаний.

Замена случайных отсутствующих значений в данных датчика — например. температура — было необходимо для повышения надежности конечного решения. После прослушивания ряда возможных исправлений, включая усреднение данных за последующие дни на основе временных рядов и получение данных от датчиков, соседних с тем, от которого отсутствовали данные, и усреднение отсутствующих значений из тех, мы обнаружили, что интерполяция временных рядов почти всегда произвел наиболее пригодные для замены данные. На протяжении всего этого процесса нам очень пригодился доступ к биологу, который провел проверку правильности наших оценок недостающих значений, проверил соответствующие методологии и помог определить наиболее важные функции прогностической модели, особенно на неконтролируемой фазе проекта, которая пройти долгий путь к оптимизации возможной аналитической системы на основе биосенсоров.

В дополнение к сосредоточению внимания на модальностях датчиков (температура, биоимпеданс и т. д.), которые фактически измеряют релевантную информацию в отношении целевой переменной, проект также был направлен на оптимизацию возможной аналитической системы биосенсоров путем определения датчиков, которые действительно необходимо будет сделать. его в готовое оборудование. Этот процесс шел рука об руку с построением модели: мы создали модели для каждого датчика и посмотрели, насколько хорошо они работают сами по себе, что помогло прийти к более зрелой модели, в которой использовался краткий список более эффективных датчиков.

Путь вперед

Разработка решений машинного обучения для обнаружения редких патологических изменений сталкивается с уникальными проблемами: получение данных для обучения обходится примерно так же дорого, как и в реальности, а для мониторинга часто требуются редко используемые методы датчиков. И уже очевидно, что для создания более сложных моделей потребуется дополнительное тестирование — масштабированные архитектуры сбора данных, использующие почасовую загрузку данных, а не ежедневную, уже представляют собой важный шаг вперед в методологии.

Однако, несмотря на эти проблемы, мы надеемся, что приведенные выше разделы показали, что следующий шаг в развитии аналитических систем здравоохранения на основе искусственного интеллекта и датчиков вполне достижим. Решения по науке о данных, которые необходимы для этих систем, могут быть несколько необычными, и тесное сотрудничество с экспертами в предметной области будет иметь решающее значение, но наши текущие знания и набор инструментов кажутся достаточными для их эффективного решения.
И если вы хотите узнать больше о работа по науке о данных, которая направлена ​​​​на перспективные решения для здравоохранения, дотянитесь — мы хотели бы поговорить.

Об авторах

Балинт Ковач, специалист по данным в Starschema, имеет опыт разработки программного обеспечения. Он работал над разнообразными проектами в различных ролях, в том числе в качестве научного сотрудника и ассистента лектора в ведущем венгерском университете, разработчика глубокого обучения в крупной многонациональной компании и, в настоящее время, в качестве консультанта по обработке данных. Ему нравится погружаться в пользовательские данные, чтобы выявить скрытые идеи и использовать их для создания эффективных прототипов. Свяжитесь с Балинтом в LinkedIn.

Зомбор Хааз — специалист по данным в Starschema со степенью магистра финансовой математики. Он начал свою карьеру в банковской сфере в качестве специалиста по кредитным рискам, а затем переключился на консультации по науке о данных. В своей работе он использует свои аналитические способности и навыки моделирования, чтобы извлекать неочевидную информацию из необработанных данных и использовать полученные знания по-новому. Свяжитесь с Зсомбором в LinkedIn.

ОБРАЩАЙТЕСЬ К STARSCHEMA ЗДЕСЬ:



ЧИТАЙТЕ БОЛЬШЕ ИСТОРИЙ ОТ STARSCHEMA: