Построчное объяснение применения машинного обучения в медицине

Эта статья, опубликованная в Nature Communications в мае 2021 года, содержит много биологического жаргона, из-за которого ее трудно читать среднему специалисту по машинному обучению. Вот разбивка всех предложений аннотации, которая, надеюсь, дает достаточно справочной информации и контекста, чтобы полностью понять общую идею.

Построчное аннотация

Устойчивость к ионизирующему излучению, первая линия терапии многих видов рака, является серьезной клинической проблемой.

  • Для многих людей, у которых диагностирован рак, одним из первых предложенных методов лечения является ионизирующее излучение, также часто называемое лучевой терапией. Это лечение работает, посылая волны частиц высокой энергии (представьте, как от рентгеновского аппарата) к раковым областям, чтобы повредить гены раковых клеток и предотвратить их рост и деление.
  • Однако это лечение не работает для всех онкологических больных (около одной пятой), и рекомендовать это лечение людям, для которых оно не работает, вредно для их здоровья, а также тратит драгоценное время. пациента и ресурсов больниц.

Персонализированное прогнозирование радиочувствительности опухоли в настоящее время клинически не реализуется из-за недостаточной точности существующих классификаторов машинного обучения.

  • Хотя ученые работают над разработкой моделей машинного обучения, которые могли бы предсказать, стоит ли лучевая терапия для каждого конкретного пациента / опухоли, текущие модели недостаточно хороши для использования в реальных условиях больницы. Текущие модели машинного обучения используют такие вещи, как гистология опухоли (изображения образцов ткани), степень опухоли (насколько серьезно распространился рак) и геномную информацию (ДНК конкретного пациента), но ни одна из них не объединяет их с метаболомными данными (концентрациями малых молекул в площадь).

Несмотря на признанную роль метаболизма опухоли в радиационном ответе, данные метаболомики редко собираются в крупных многопрофильных инициативах, таких как Атлас генома рака (TCGA), и, следовательно, не включаются в разработку алгоритмов.

  • Геномика - это изучение ДНК и генетической информации внутри клетки, транскриптомика - это изучение РНК и различий в экспрессии мРНК, протеомика - это изучение активности белков, а метаболомика - это изучение малых молекул (например, субстратов или продуктов). метаболизма). Типы и концентрации малых молекул зависят как от генетики, так и от клеточной среды (например, среды опухоли).
  • Атлас генома рака (TCGA) - это огромная база данных для использования исследователями, состоящая из геномных, эпигеномных, транскриптомных и протеомных данных множества различных образцов рака (и их сравнительных образцов нормальной ткани). Это чрезвычайно полезно для исследования рака. К сожалению, у него не так много метаболомных данных, особенно для отдельных образцов.

В этом исследовании мы избегаем недостатка персонализированной метаболомической информации, охарактеризовав 915 опухолей пациентов с TCGA с помощью моделей анализа баланса метаболического потока в масштабе генома, созданных на основе наборов транскриптомных и геномных данных.

  • В этом исследовании авторы смогли рассчитать концентрации малых молекул (метаболитов) для отдельных пациентов / образцов, объединив транскриптомные и геномные данные отдельных образцов (из TCGA) с метаболической информацией о людях в целом. Они сделали это с помощью математического подхода под названием Анализ баланса потока.

Метаболические биомаркеры, позволяющие дифференцировать радиочувствительные и резистентные опухоли, предсказываются и экспериментально проверяются, что позволяет интегрировать метаболические характеристики с другими наборами данных multi-omics в ансамблевые классификаторы машинного обучения для радиационного ответа.

  • После того, как авторы вычислили концентрации различных малых молекул (метаболомных биомаркеров) для всех своих 915 образцов, они определили, какие из них сильно присутствовали или отсутствовали в образцах опухолей, которые хорошо поддались лучевой терапии (лучевой- чувствительны) по сравнению с образцами опухолей, которые были устойчивы к лучевой терапии (радиационно-стойкие).
  • Они также подтвердили обоснованность результатов анализа баланса потоков, проанализировав четыре образца и измерив фактические концентрации малых молекул для сравнения с их расчетными концентрациями.
  • Затем они обучили пару разных моделей классификаторов машинного обучения отдельно. В одном из них входными данными были рассчитанные концентрации малых молекул (метаболомная информация) всех образцов для классификатора машинного обучения. В других случаях вводилась клиническая, геномная или транскриптомная информация. Для всех из них выходными данными была вероятность классификации образца как чувствительного к радиотерапии или устойчивого к радиотерапии на основе входных данных. Наконец, они объединили выходные данные для разных индивидуальных классификаторов, чтобы получить общий прогноз радиационной реакции (это ансамблевое обучение).

Эти многокомпонентные классификаторы демонстрируют повышенную точность классификации, идентифицируют клинические подгруппы пациентов и демонстрируют полезность персонализированных метаболических биомаркеров на основе крови для определения радиационной чувствительности.

  • Описанная выше стратегия классификатора (объединение результатов клинических, метаболомных, геномных и транскриптомных классификаторов) дала лучшие на данный момент результаты (AUROC = 0,904) для прогнозирования того, будут ли отдельные пациенты хорошо реагировать на лучевую терапию или нет . AUROC относится к кривой «Площадь под рабочей характеристикой приемника», которая является мерой для моделей классификации, где 1 означает высшую оценку.
  • Авторы также пошли дальше и смогли определить, откуда были получены результаты для каждого пациента. Например, для некоторых пациентов клиническая информация вносила наибольший вклад в окончательный прогноз ответа на лучевую терапию, тогда как для других пациентов важна была метаболомная информация. Выявив эти подгруппы пациентов, авторы показали, что радиационная реакция может быть легко предсказана для некоторых пациентов, если у них есть определенные клинические особенности (например, определенные типы рака, степень рака и т. Д.), Но другим может потребоваться больше тестов.

Интеграция машинного обучения с метаболическим моделированием в масштабе генома представляет собой значительный методологический прогресс для выявления прогностических биомаркеров метаболитов и прогнозирования радиочувствительности для отдельных пациентов.

  • Было показано, что новый метод расчета метаболомных данных (концентраций малых молекул) с анализом баланса потока очень хорош для определения того, какие небольшие молекулы связаны с тем, будет ли пациент хорошо реагировать на лучевую терапию или нет, и помог создать модели машин, пытающиеся Решите эту проблему точнее в целом.

Вам также может понравиться: