Искусственный интеллект | Генетическое тестирование

Потенциальные преимущества выявления вариантов с неопределенной значимостью в генетическом тестировании

Как эффективное использование данных может привести к более достоверной интерпретации генетических вариантов?

Написано Сарой Клемм, специалистом по клинической геномике в Invitae®

Вариант неопределенной значимости (VUS) представляет собой генетический вариант с неизвестным сопутствующим риском заболевания. Цель определения того, является ли VUS болезнетворным, состоит в том, чтобы помочь устранить неопределенность, связанную с результатами генетического тестирования пациентов.

Когда пациенты проходят генетическое тестирование, они ищут ответы на вопросы о своем здоровье и здоровье своих семей. Когда результат содержит VUS, это не помогает дать четкие ответы на их вопросы.

В предыдущем сообщении в блоге мы определили, что означает классификация вариантов VUS, и попытки, которые мы можем предпринять, чтобы попытаться решить эту классификацию. Читайте дальше, чтобы узнать, как эти усилия по разрешению VUS могут дать более информативные результаты для отдельных лиц.

Как лучшее использование данных может привести к более достоверной интерпретации генетических вариантов?

Поскольку данных о редких генетических вариантах может быть недостаточно, мы хотим извлечь из имеющейся информации как можно больше смысла. Один из способов улучшить использование доступных данных — использовать клиническую информацию от людей с наблюдаемым вариантом. Эта информация может быть очень ценной при рассмотрении вопроса о том, связан ли конкретный вариант с генетическим заболеванием.

Конкретные клинические и медицинские признаки могут указывать на определенные генетические состояния. Итак, когда мы наблюдаем вариант в гене, связанный с определенным состоянием у человека с этими конкретными чертами, мы можем учитывать эту информацию при оценке того, является ли вариант патогенным или причиной этого состояния.

Когда наши партнеры в сфере здравоохранения заказывают генетическое тестирование и предоставляют подробную клиническую информацию вместе с заказом на тест, мы можем объединить эти данные с нашей системой интерпретации вариантов и инструментами для лучшей классификации вариантов. Эта ценная информация может включать клинические записи, семейный анамнез, результаты визуализирующих исследований, а также результаты биохимических и других соответствующих лабораторных исследований.

Давайте рассмотрим конкретный вариант, чтобы продемонстрировать это.

Пример реальных клинических данных: ген SGSH

Известно, что ген SGSH связан с мукополисахаридозом III типа (MPS III), также называемым синдромом Санфилиппо. МПС III — редкое метаболическое заболевание, поражающее центральную нервную систему. Прогрессирующее неврологическое ухудшение, нарушения слуха, рецидивирующие ушные инфекции, диарея и эпилепсия характеризуют МПС III.¹⁻⁻⁴

Клинические признаки MPS III могут пересекаться с другими потенциальными генетическими состояниями. Однако у людей с МПС III из-за патогенных вариантов гена SGSH есть специфические биохимические данные о значительно сниженной активности фермента сульфамидазы (также известной как гепаран-N-сульфатаза). Когда у человека низкая активность сульфамидазы, это сильно указывает на МПС III.

При интерпретации варианта SGSH c.823G›A (p.Gly275Arg) у нас изначально была следующая информация:

  • Этот вариант отсутствует в популяционных базах данных.
  • Многочисленные алгоритмы прогнозирующего моделирования предполагают, что этот вариант может нарушить функцию белка.

Только с этой информацией мы бы классифицировали этот вариант как VUS. Однако литературное сообщение о человеке с диагнозом MPS III было гомозиготным по этому варианту, что означает, что они унаследовали по одной копии от каждого родителя. В этой публикации исследователи отметили, что у человека были характерные признаки низкой активности сульфамидазы.⁶

Дополнительная информация из литературного отчета позволяет нам применить больше доказательств и интерпретировать вариант как вероятно патогенный. Эта информация означает, что люди, протестированные в нашей лаборатории с этим вариантом, могут быть идентифицированы как носители или потенциально пораженные MPS III, в зависимости от наличия или отсутствия дополнительных вариантов в этом гене.¹⁻⁻⁵

Этот пример показывает, как информация о клинических и медицинских особенностях человека может помочь разрешить интерпретацию VUS для генетических состояний. Хотя в этом примере клиническая информация взята из литературного отчета, мы используем предоставленную клиническую информацию для людей, которых мы тестируем в нашей лаборатории. Подробная клиническая информация помогает нам лучше понять обнаруженные варианты, поэтому предоставление как можно большего количества клинической информации с запросом на тест имеет решающее значение для классификации вариантов.

Лучшее использование данных о населении

Еще один способ, с помощью которого Invitae максимально использует доступную информацию, заключается в улучшении того, как мы используем данные о населении. Частота аллелей измеряет, насколько распространен конкретный генетический вариант в популяции (обычно в целом здоровой). Эта частота может быть очень ценной при рассмотрении связи конкретного варианта с конкретным генетическим состоянием.

Естественно думать, что если генетическое заболевание встречается редко при определенной частоте аллеля, конкретный вариант слишком распространен, чтобы быть связанным с этим состоянием. Однако определить, что является «слишком распространенным» для этого состояния, может быть непросто. Это связано с тем, что все генетические состояния не одинаковы, и качества этих состояний могут играть роль в том, насколько распространенным может быть причинный вариант в общей популяции. Эти качества могут включать:

  • тяжесть клинических признаков, связанных с состоянием
  • возраст появления этих признаков
  • характер наследования состояния

Это лишь некоторые факторы, которые могут помочь определить пороговые значения, когда вариант может быть более распространенным, чем ожидается, что он является причиной состояния. Возможность количественной оценки и расчета этих влияний и выявления связанных закономерностей в больших наборах данных о частоте населения может быть затруднена вручную.

По этой причине Invitae использовала идеи наших клинических экспертов для разработки инструментов на основе машинного обучения (ML), которые превращают их в значимые данные для интерпретации вариантов.

Модель частоты популяции на основе машинного обучения Invitae™ — это инструмент на основе машинного обучения, который обеспечивает пороговые значения частоты популяции для конкретных генов, которые помогают уменьшить варианты неопределенной значимости по сравнению с традиционными методами интерпретации вариантов на основе популяции. По состоянию на 2022 год эта технология позволила разрешить почти 15 000 уникальных VUS, которые теперь классифицируются как доброкачественные.

По оценкам, использование этой модели на основе машинного обучения уменьшит количество VUS на 2,5% по сравнению с другими существующими моделями.⁷ Это сокращение означает, что больше пациентов и их семей получат более точные результаты генетического тестирования, чтобы принимать более обоснованные решения в отношении здоровья.

Реальный сценарий модели машинного обучения на основе популяции в классификации вариантов

Модель частоты популяции Invitae, основанная на машинном обучении, дала многообещающие результаты в переклассификации VUS. Давайте рассмотрим реальный пример того, как эта модель работала, чтобы прояснить конкретный вариант SOS1.

Ген SOS1 связан с аутосомно-доминантными расстройствами спектра Нунана (NSD)⁸ и наследственным фиброматозом десен⁹.

Что такое расстройства спектра Нунан?

NSD, также известные как RASopathies, представляют собой группу состояний, которые имеют общий набор симптомов, включая¹⁰⁻⁻¹²:

  • невысокий рост
  • отличительные черты лица
  • изменения кожи и волос
  • разная степень задержки развития
  • сердечно-сосудистые аномалии, такие как пороки сердца и гипертрофическая кардиомиопатия

Эти симптомы могут варьироваться от человека к человеку, даже в пределах одной семьи. В некоторых случаях у людей могут быть только легкие клинические признаки.

Что такое наследственный фиброматоз десен?

Наследственный фиброматоз десен представляет собой медленно прогрессирующее фиброзное разрастание десен, которое может покрывать зубы. Это состояние может вызвать хроническую инфекцию, пародонтит, неправильное прорезывание зубов и неправильный прикус.⁹

Люди наследуют связанные с SOS1 расстройства спектра Нунана или наследственный фиброматоз десен по аутосомно-доминантному типу. При аутосомно-доминантных состояниях достаточно только одной копии гена с причинным вариантом, чтобы вызвать заболевание. Представители всех полов с одинаковой вероятностью наследуют, передают или проявляют симптомы. Причинный вариант может передаваться от родителей к ребенку или возникать случайно.

Как Invitae разрешила вариант классификации с неопределенной значимостью для варианта SOS1

Использование нашей модели машинного обучения частоты популяции полезно для таких генов, как SOS1, связанных с несколькими различными генетическими состояниями с широким спектром клинических симптомов. Это связано с тем, что ученым-клиницистам сложно вручную выявить закономерности в больших наборах данных о населении. Модели машинного обучения могут обнаруживать закономерности в этих больших наборах данных, которые наши ученые могут использовать для интерпретации вариантов.

При интерпретации варианта SOS1 c.3946C›G (p.His1316Asp) у нас изначально была следующая информация:

  • Этот вариант наблюдался в базе данных gnomAD 34 раза с глобальной частотой аллеля 0,012%.¹³
  • Этот вариант не соответствует порогу доброкачественных или патогенных популяционных доказательств с использованием стандартных отраслевых порогов частоты аллелей.
  • Платформа функционального моделирования Invitae на основе машинного обучения предполагает, что этот вариант вряд ли нарушит функцию белка (> 95% отрицательного прогностического значения).

Используя всю приведенную выше информацию, мы бы классифицировали вариант как ВУС. Однако с добавлением данных популяционного моделирования, которые учитывают больше популяционных признаков, чем только частоту аллелей, мы можем понизить этот вариант до вероятно доброкачественного. Эта реклассификация варианта SOS1 c.3946C›G (p.His1316Asp) на вероятно доброкачественный предоставила более 15 пациентам обновленный отчет, что уменьшило неопределенность и внесло больше ясности¹⁴.

Влияние реклассификации вариантов неопределенной значимости

По мере того, как собирается больше генетических данных и ученые разрабатывают новые инструменты для использования ценности этой информации, реклассификация VUS не за горами. В Invitae мы стремимся объединить человеческие элементы и элементы машинного обучения, которые помогают тщательно изучить геном человека, но мы не можем сделать это в одиночку.

Медицинские работники могут играть неотъемлемую роль в процессе генетического тестирования, работая рука об руку с лабораторией тестирования. При заказе генетического теста включение исчерпывающих клинических данных о пациенте может иметь важное значение в процессе интерпретации вариантов. Чем больше клинических данных можно включить и изучить, тем лучше мы сможем интерпретировать обнаруженные варианты и предоставить отчет о генетическом тестировании самого высокого качества.

Эта информация из данных о пациентах в сочетании с моделированием частоты популяции и другими инструментами машинного обучения, использующими большие наборы данных, может улучшить процесс интерпретации вариантов и результаты генетического тестирования. Это дает клиницистам и пациентам больше ясности в отношении результатов генетического тестирования, что помогает принимать решения о лечении.

Переклассификация этих ВУЗИ влияет не только на пациента перед вами. Эта информация может помочь членам семьи понять свой статус носителя и риск рецидива, а также дает возможность выявить других членов семьи, подверженных риску.

Помогите своим пациентам и их семьям принимать более обоснованные решения в отношении здоровья с помощью комплексных панелей генетического тестирования Invitae для конкретных состояний.

Ссылки:

  1. Ruijter GJG, и др.. Мол Генет Метаб. 2008;93(2):104–11.
  2. Гребичек М, и др. Am J Hum Genet. 2006;79(5):807–19.
  3. Фелдхаммер М., и др.. Хум Мутат. 2009;30(6):918–25.
  4. Бурман Д., и др. J Наследовать метаб Dis. 2014;37(3):431–437.
  5. Андраде Ф., и др.. Педиатр Междунар. 2015;57(3):331–38.
  6. Héron B. Am J Med Genet A. 2011; 155А(1):58–68.
  7. Приглашаем. Моделирование частоты населения. 2022.
  8. Синдром Нунана 4 (идентификатор концепции: C1853120) — MedGen — NCBI. Национальный центр биотехнологической информации. По состоянию на 16 февраля 2023 г. https://www.ncbi.nlm.nih.gov/medgen/339908
  9. Харт Т.С., и др.. Am J Hum Genet. 2002;70(4):943–54.
  10. Романа Лепри Ф., и др.. BMC Med Genet. 2014;15:14.
  11. Гелб Б.Д., и др.. Программа Педиатр Кардиол. 2015;39(1):13–9.
  12. Аоки Ю. J Hum Genet. 2016;61(1):33–9.
  13. Однонуклеотидный вариант: 2–39213021-G-C(GRCh37). браузер гномАД. По состоянию на 14 марта 2023 г. https://gnomad.broadinstitute.org/variant/2-39213021-G-C
  14. Приглашает внутренние данные в файл.