Эта статья изначально была опубликована в блоге Encord, который вы можете прочитать здесь.

Эрик Ландау

Этот пост о надежде — надежде, которую машинное обучение и компьютерное зрение могут дать врачам, лечащим больных раком.

‍Поскольку рак убивает примерно 10 миллионов человек ежегодно, я ожидаю, что большинство читателей знали кого-то, кто умер от этой болезни или перенес ее. После десятилетий исследований и клинических испытаний он остается основной причиной смерти в мире. Это также чрезвычайно тяжелое заболевание, многие испытывают ужасную боль.

Что касается лечения, то около 60 процентов пациентов проходят курс химиотерапии в той или иной форме. Химиотерапия может и спасает жизни, но сопровождается выпадением волос, усталостью и рвотой (что показывают фильмы), а также отечностью конечностей, кровоподтеками и периферической невропатией (чего нет). Есть мрачное выражение, которое резюмирует опыт химиотерапии: Убей рак до того, как химиотерапия убьет тебя.

Новые методы лечения, такие как иммунотерапия, могут кардинально изменить прогноз рака, но большинство врачей скажут вам, что лучшая новость, которую может услышать больной раком, — это четыре коротких слова: Мы поймали это на ранней стадии.

Я не понаслышке знаю силу этих слов. Они рано поймали рак моего отца. При постановке диагноза на поздней стадии его шансы на пятилетнее выживание были бы менее 30 процентов. Пойманный рано, этот показатель подскочил до более чем 90 процентов.

Когда врачи выявляют рак на ранней стадии, показатели выживаемости резко возрастают: на более поздних стадиях рак дает метастазы, распространяясь по всему телу, что затрудняет эффективное лечение.

Когда дело доходит до рака, унция профилактики стоит фунта лечения — и вот тут-то и появляется надежда.‍

Использование машинного обучения и компьютерного зрения для предотвращения поздней диагностики рака

Машинное обучение и технологии искусственного интеллекта быстро развиваются и приносят с собой огромные надежды на раннее обнаружение и диагностику рака.

Врачи уже используют медицинские изображения и искусственный интеллект для обнаружения аномалий роста тканей. После обучения на больших наборах данных модели компьютерного зрения могут выполнять задачи по обнаружению и категоризации объектов, чтобы помочь врачам выявлять аномалии в полипах и тканях и определять, являются ли опухоли злокачественными или доброкачественными.

Однако, поскольку компьютерное зрение дает клиницистам дополнительную пару глаз, эти модели могут уловить тонкие признаки аномалий, даже если врачи не ищут рак. Это может наделить врачей огромными диагностическими возможностями, даже за пределами их специализации.

Например, если врач общей практики сканирует пациента на наличие камней в желчном пузыре, она также может передать результаты сканирования модели компьютерного зрения, которая запускает алгоритм для обнаружения аномалий в окружающих областях тела. Если модель замечала что-то ненормальное, терапевт мог предупредить пациента, и пациент мог обратиться к специалисту, даже если у него еще не было никаких внешних симптомов опухоли. Такая упреждающая и профилактическая помощь имеет большое значение для раннего выявления рака. Для многих видов рака, особенно для тех, где не проводится регулярный скрининг, внешние симптомы, такие как потеря веса, боль и утомляемость, часто коррелируют с прогрессированием заболевания, а это означает, что к тому времени, когда у пациента есть причина обратиться к специалисту , может быть уже слишком поздно для эффективного лечения.

Поскольку компьютерное зрение может позволить врачам любой специальности сканировать ранние признаки рака, эти модели также могут демократизировать здравоохранение для жителей сельских районов и развивающихся стран. Лучшие в мире врачи-онкологи помогают курировать, обучать и проверять эти алгоритмы, поэтому модели применяют свой опыт при просмотре данных пациентов. С помощью этой технологии больницы в любом месте могут предоставить пациентам опыт лучшего в своем классе онколога. В то время как в мире есть ограниченное количество высококвалифицированных онкологов, эти алгоритмы бесконечно масштабируемы, а это означает, что опыт этих врачей больше не будет зарезервирован для пациентов, получающих помощь в ведущих больницах и научно-исследовательских институтах мира.‍

Создание инструментов медицинской визуализации и диагностики будущего

Компании по всему миру работают над созданием этих диагностических инструментов, и для этого им необходимо обучить свои модели компьютерного зрения в соответствии с самыми высокими стандартами.

При построении модели компьютерного зрения для медицинской диагностики наиболее важным фактором является обеспечение очень высокого качества наземной истины. Обучающие данные, используемые для обучения модели, должны соответствовать тому же стандарту, что и врач. Аннотации должны быть точными и информативными, а распределение данных должно быть хорошо сбалансированным, чтобы алгоритм научился находить целевой результат на примерах, представляющих различные сценарии реального мира. Например, наличие демографического разнообразия в наборе данных чрезвычайно важно. Алгоритм, обученный только на данных студентов определенного этнического происхождения, не будет отражать баланс реального мира, поэтому модель не сможет делать точные прогнозы при работе с данными, собранными от людей разной демографической группы.

Создание этих моделей также требует тесного сотрудничества между врачами и инженерами по машинному обучению, а также между несколькими врачами. Это сотрудничество помогает гарантировать, что модель разрабатывается для ответов на соответствующие вопросы для реального сценария, с которым сталкивается конечный пользователь, и что она учится делать прогнозы, практикуясь на высококачественных обучающих данных.

Без опыта специалистов по данным и клиницистов на этапах проектирования и обучения полученная модель не будет очень эффективной. Разработка алгоритмов клинического уровня требует участия обеих групп заинтересованных сторон. Инженеры по машинному обучению должны тесно сотрудничать с врачами, потому что врачи являются конечными пользователями. Консультируясь с ними, инженеры получают доступ к полному набору тонких вопросов, на которые необходимо ответить, чтобы продукт достиг максимальной эффективности в реальных условиях использования.

Однако врачи также должны иметь возможность тесно сотрудничать друг с другом, чтобы проводить тщательный анализ рабочего процесса. Обзор рабочего процесса состоит из двух частей: обзор достоверности и обзор модели. Для проверки достоверности врачи должны проверить точность машинных аннотаций, на которых будет обучаться модель. Для обзора модели врачи проверяют выходные данные модели, чтобы измерить ее производительность и убедиться, что она делает точные прогнозы. Наличие нескольких врачей с разным опытом и уровнями знаний, выполняющих обзоры рабочих процессов и проверяющих выходные данные модели несколькими способами, помогает обеспечить точность ее прогнозов. Часто регулирующие органы, такие как FDA, требуют, чтобы в командах, создающих медицинские модели, было по крайней мере три врача, выполняющих проверку рабочего процесса.

Инженеры по машинному обучению могут быть удивлены, узнав, как часто врачи не соглашаются друг с другом при постановке диагноза; однако это расхождение во мнениях — еще одна причина, по которой инженерам важно консультироваться с несколькими врачами. Если вы работаете только с одним врачом при обучении своей модели, алгоритм подходит только к мнению этого врача. Чтобы добиться наивысшего качества модели, инженерам необходимо учесть несколько уровней обзора и несколько мнений и провести арбитраж по всем им для достижения наилучшего результата. Врачам, в свою очередь, нужны инструменты, предназначенные для них и их рабочих процессов, инструменты, которые позволяют им создавать точные аннотации.

Чтобы облегчить процесс обзора и помочь врачам аннотировать более эффективно, Encord разработала наш инструмент аннотирования DICOM — первый комплексный инструмент аннотирования с собственными возможностями 3D-аннотирования, предназначенный для медицинского ИИ. Он создан для работы с несколькими методами медицинской визуализации, включая КТ, рентген и МРТ. Наш инструмент DICOM сочетает в себе подход к обучению и запуску автоматизированных моделей с контролем человека для просмотра и уточнения меток. Когда дело доходит до проверки достоверности данных, этот инструмент повышает эффективность, снижает затраты и повышает точность, что делает его незаменимым для врачей, которым не хватает времени, и для больниц, заботящихся о затратах.

При создании нашего инструмента для аннотирования 3D-изображений DICOM мы консультировались с врачами из Королевского колледжа, академическими учеными из Стэнфорда и экспертами по машинному обучению в радиологических компаниях с искусственным интеллектом, создающих эти типы моделей медицинского зрения. В результате мы знали, что наша платформа должна иметь гибкий интерфейс, обеспечивающий совместную работу между клиническими группами и группами специалистов по обработке и анализу данных. Он должен был иметь возможность поддерживать несколько обзоров, способствовать достижению консенсуса между различными мнениями и проводить оценку качества, чтобы проверить истинность алгоритма автоматической маркировки данных.

Мы разработали наш Инструмент аннотации DICOM, чтобы дополнить и заменить ручной процесс маркировки, который делает разработку ИИ дорогой, трудоемкой и сложной в масштабировании. В настоящее время большая часть разработки ИИ опирается на аутсорсинг данных людям, занимающимся маркировкой, включая клиницистов. Человеческая ошибка, возникающая во время этого процесса, приводит к тому, что врачам приходится тратить время на просмотр и исправление этикеток. С помощью инструмента аннотирования изображений DICOM мы надеемся сэкономить драгоценное время врачей, предоставив им нужные инструменты и уменьшив их нагрузку на маркировку вручную.

Это восходящий подход, но создание нашего инструмента аннотирования изображений DICOM — это наш способ внести свой вклад в раннее выявление и профилактику рака. Организации, использующие этот инструмент, могут увеличить скорость, с которой модели компьютерного зрения могут быть запущены в производство и стать жизнеспособными для использования в медицинской среде.

Будущее искусственного интеллекта и медицины

Коммерческое внедрение медицинского ИИ совершит революцию в здравоохранении, которую мы пока не можем себе представить.

С помощью этой технологии мы можем ускорить медицинские исследования в 100 раз. Подумайте о том, как проводились медицинские исследования в предшествующую эпоху? Врачи и исследователи должны были делать заметки в физической электронной таблице и выполнять анализ с помощью логарифмических линеек. Каждый шаг отнимал огромное количество времени. Компьютеры, хотя и не предназначенные для непосредственного использования в медицинских исследованиях, изменили способ проведения исследований благодаря своей мощности и универсальности.

Компьютерное зрение и машинное обучение сделают то же самое.

Биологические исследования и технологии будут развиваться в тандеме, и, работая вместе, инженеры по машинному обучению и клиницисты смогут предлагать людям профилактическую помощь, а не заставлять их ждать, пока не возникнет что-то вопиющее, требующее лечения.

Профилактика болезни быстрее, дешевле и безопаснее, чем лечение болезни. У нас пока нет инструментов искусственного интеллекта для масштабной реализации этого видения, но с ростом ИИ, ориентированного на данные и достижениями в аннотации данных, машинном обучении и компьютерном зрении мы добьемся этого.

Используя возможности медицинского ИИ, мы можем трансформировать наши медицинские системы, сосредоточив внимание не на «уходе за больными», а на «здравоохранении». При этом мы можем уберечь людей как от смертельных последствий «слишком позднего» диагноза рака, так и от человеческих страданий, сопровождающих современные методы лечения.

‍Как я уже сказал, это история надежды. И это только начинается.

Команды машинного обучения и обработки данных любого размера используют приложения Encord для совместной работы, функции автоматизации и API-интерфейсы для создания моделей, аннотирования, управления и оценки своих наборов данных. Загляните к нам здесь.