Этот пост является второй частью нашей серии Будущее здравоохранения уже здесь: полное руководство Арионкодера по ИИ в медицине. Найдите первую часть здесь и следите за новостями и практическими советами от экспертов Arionkoder по использованию возможностей искусственного интеллекта в здравоохранении.

В первой статье нашей серии мы проанализировали влияние ИИ на отрасль здравоохранения и то, как эта технология может быть адаптирована для улучшения жизни пациентов и изменения ситуации.

Разработка решений проблем в этой области сложна из-за уникальных сложностей работы с медицинскими данными. Такие факторы, как размер и размерность данных, конфиденциальность и безопасность, качество, интеграция, аннотации и интерпретация, делают медицину уникальной и требовательной областью применения. Кроме того, проекты в области здравоохранения требуют высокого уровня междисциплинарности, поскольку клиницисты и специалисты по машинному обучению должны взаимодействовать друг с другом, чтобы определить фактические потребности и наиболее эффективный и правильный способ их выполнения. И последнее, но не менее важное: тот факт, что жизнь и здоровье пациентов поставлены на карту, требует надежного инженерного процесса, который в конечном итоге должен гарантировать точное, безопасное и надежное решение.

Мы в Arionkoder твердо верим, что лучший способ добиться этого — начать с правой ноги. И, по нашему опыту, первый фундаментальный шаг для достижения этой цели — это определение точных и исчерпывающих требований с самого начала. Но, опять же, особенности этой области требуют гораздо более сложного процесса, чем тот, который применяется при стандартной разработке программного обеспечения.

Как правило, мы пытаемся отобразить проблему, с которой сталкиваются наши клиенты в сфере здравоохранения, в двумерном пространстве, в котором одно представляет собой характер данных, а другое — характер проблемы. Оба измерения переплетаются друг с другом, и этот процесс сопоставления не прост. Тип и формат данных, которые будут использоваться, а также их размер и доступность отфильтровывают, какие решения ИИ можно применять. С другой стороны, природа проблемы также требует конкретных моделей: если цель состоит в том, чтобы определить наличие/отсутствие или степень определенного состояния, то проблема рассматривается как классификация или как ранжирование задачи; но если цель состоит в том, чтобы предсказать непрерывное значение, такое как количество лекарства, которое следует ввести пациенту, то нам необходимо применить регрессионные модели.

Чтобы сократить разрыв в общении с нашими клиентами и максимально упростить сбор требований, мы обычно предлагаем им серию обучающих семинаров, на которых мы углубляемся в основы ИИ и особенности этих двух аспектов, о которых мы упоминали ранее. Давайте начнем сегодня с анализа измерения данных.

Параметры данных

Клинические базы данных являются мультимодальными, то есть они заполнены данными, полученными из нескольких источников и устройств и сохраненными в разных форматах. Первый вопрос, который мы задаем нашим клиентам, — какие данные будут применяться для выполнения требуемой задачи. Как только мы поймем, как они получены и каковы их основные характеристики, мы перейдем к более сложным деталям, таким как способ их хранения, его доступность и размерность, а также наиболее экономичный способ извлечения, анализа и оценки его полезности для обучения алгоритмов машинного обучения.

В зависимости от требований наших клиентов входные данные могут быть следующих типов:

Медицинские изображения. Медицина произвела революцию благодаря множеству доступных в настоящее время устройств для получения изображений. Рентгеновские снимки, компьютерная томография, МРТ, ОКТ, ультразвуковые изображения и т. д. ежедневно используются клиницистами и радиологами для постановки диагноза, планирования лечения и наблюдения за заболеваниями. В зависимости от режима визуализацииэти данные могут быть двухмерными или трехмерными и иногда включают измерение времени для захвата движения, например Cine MRI. Автоматическая обработка этих данных — это область машинного обучения, известная как Компьютерное зрение, и сама по себе сложная задача из-за сложности и размерности изображений. Общие применения ИИ в медицинской визуализации включают, среди прочего, обнаружение и классификацию аномалий, помощь рентгенологам в диагностике и количественную оценку характеристик органов или поражений.

Геномные данные. Эти данные относятся к генетической информации человека, включая последовательности ДНК, вариации и мутации. Клиницисты и исследователи используют эту информацию, чтобы понять основные генетические причины заболеваний и разработать персонализированные стратегии лечения. Получение таких образцов обычно обходится дорого, а их обработка затруднена из-за их большой размерности и низкой доступности образцов. ИИ применяется к геномным данным, чтобы помочь в решении таких задач, как определение новых мишеней для лекарств, прогнозирование реакции пациентов на лечение и обнаружение генетических вариаций, связанных с заболеваниями. Он также часто используется для анализа крупномасштабных наборов геномных данных для определить шаблоны и ассоциации, которые было бы трудно обнаружить вручную, т.е. для приложений прецизионной медицины. Мы уже помогаем одной компании создать решение для точной медицины и онкологии! Обо всем этом можно прочитать здесь.

Биомедицинские сигналы. К ним относятся электрические, химические или механические сигналы, производимые организмом и измеряемые с помощью клинических инструментов, таких как электрокардиограммы (ЭКГ), электроэнцефалограммы (ЭЭГ) и электромиограммы (ЭМГ)-, носимые устройства, например. фитнес-трекеры или датчики интенсивной терапии. Эти сигналы содержат ценную информацию о физиологическом состоянии пациентов и используются для мониторинга, диагностики и лечения широкого спектра заболеваний. К этим данным применяются модели машинного обучения, которые используют их временное измерение и нелинейность, чтобы извлекать значимые функции, классифицировать закономерности и делать прогнозы. Несколько примеров — обнаружение и диагностика сердечных заболеваний, таких как аритмии, по ЭКГ. или выявление судорог у больных эпилепсией по ЭЭГ.

Клинический текст. Электронные записи обычно включают описательную информацию, подготовленную клиницистами в виде медицинских заметок или выписки. Эти данные содержат ценную информацию об истории болезни, диагнозе, лечении и результатах, но они неструктурированы, многомерны и, как правило, полны медицинского жаргона. Модели машинного обучения для обработки естественного языка (NLP), например, для распознавания именованных сущностей, анализа настроений и тематического моделирования, часто применяются для извлечения ценной информации из такого рода текстов, например для прогнозирования вероятности повторной госпитализации или для выявления пациентов с высоким риском развития определенных заболеваний.

Наконец, одним важным фактором в измерении данных является тот факт, что некоторые приложения требуют анализа и обработки мультимодальных данных и объединения их внутренней информации. Представьте себе проблему компьютерного зрения, такую ​​как обнаружение заболеваний с помощью МРТ, в которой все доступные сканы не помечены явно как больные или не больные, а предоставляются вместе с медицинскими записями, сделанными рентгенологом. Применяя методы НЛП к этим неструктурированным текстам, мы можем предсказать, исходит ли соответствующая МРТ от больного пациента или нет, а затем использовать эти метки для обучения классификатора глубокой нейронной сети, который решил исходную проблему.

Чтобы эффективно извлекать ценную информацию из этих различных типов данных, необходимо понимать их характеристики и наилучший способ их обработки. Наша команда в Arionkoder имеет большой опыт работы с различными типами медицинских данных, и мы можем помочь вам определить лучшие источники данных, извлечь и предварительно обработать их, а также применить современные алгоритмы машинного обучения для извлечения информации и прогнозирования. .

Следите за нашими будущими статьями, посвященными измерению проблем и тому, как мы объединили данные и проблемы в Arionkoder, чтобы создать наилучшие из возможных инструментов ИИ.

Первоначально опубликовано на https://blog.arionkoder.com 13 января 2023 г.