Биохимия сворачивания белков

Подобно бумажному оригами, сворачивание белков — утомительное занятие для клетки.

Каждая клетка выполняет сложный процесс (см. фильмы ниже) выведения трехмерной (третичной) структуры белка из его аминокислотной (первичной) последовательности.

Средний шаг — расшифровка вторичной структуры белка — включает в себя создание альфа-спиралей и бета-листов, удерживаемых вместе водородными связями. Также известно, что многосубъединичные комплексы образуют четвертичные структуры, одним из наиболее ярких примеров которых является гемоглобин.

Проблема в том, насколько нам известно, наша ДНК не дает никаких сведений о трехмерной форме или топологии любого белка.

ДНК и ее аналог рибонуклеиновой кислоты мРНК только говорят нам: переводят ATG в метионин в пределах окна, известного как открытая рамка считывания.

Лауреат Нобелевской премии по химии Кристиан Анфинсен постулировал, что третичная структура белка неотъемлемо встроена в его аминокислотную последовательность, факт, теперь известный как догма Анфинсена или термодинамическая гипотеза.

(Примечательно, что белки, вызывающие болезни Альцгеймера, Паркинсона или губчатую энцефалопатию крупного рогатого скота — коровье бешенство, — не обязательно следуют этой гипотезе. Точно так же внутренне неупорядоченные белки, поскольку их зрелые, активные формы никогда не содержат спиралей или слоев.)

Позже Сайрус Левинталь разработал мысленный эксперимент — парадокс Левинталя, — в котором он заявил, что каждой полипептидной цепи, прежде чем она будет должным образом свернута (т. е. в развернутом или денатурированном состоянии), потребуется время, намного превышающее возраст нашего космоса. найти его правильное, окончательное подтверждение (т. е. родное состояние). Чтобы уточнить его рассуждения, можно задать вопрос: как полипептид узнает, какие состояния неверны? Кроме того, некоторым белкам требуются шапероны, чтобы должным образом достичь своего нативного состояния, что также не закодировано напрямую в последовательности ДНК целевого белка. Со временем стало очевидно, что существует глобальный энергетический минимум, когда белок полностью свернут и функционирует, явление, которое может или не может быть независимым от аминокислотной последовательности.

Знай свою структуру. В чем клиническое преимущество расшифровки форм белков?

Прогнозирование структуры белка является ключевым во многих областях биомедицины:

  1. понимание основных клеточных функций,
  2. определение этиологии заболевания,
  3. Дизайн белка de novo для терапевтических целей (например, дизайн антител),
  4. и содействие разработке лекарственных средств (например, создание низкомолекулярных ингибиторов для воздействия на болезнетворные агенты).

Как мы выяснили структуры белков до сих пор?

На сегодняшний день разработано несколько экспериментальных методов для определения трехмерной структуры белков: рентгеновская кристаллография, ядерный магнитный резонанс (ЯМР) и криогенная электронная микроскопия (крио-ЭМ). приходить на ум. Гибридные методы, включающие масс-спектрометрию и рентгеноструктурный анализ, дополняют этот список (Ежегодный обзор биофизики и биомолекулярной структуры, 2001; Frontiers in Physiology, 2017).

Некоторые белки трудно кристаллизуются, особенно рецепторы внутри клеточного фосфолипидного двойного слоя. Поскольку они естественным образом находятся в гидрофобной среде, они содержат гидрофобные участки в своей структуре и, вероятно, неправильно сворачиваются и агрегируют (процесс, очень похожий на то, что происходит при нейродегенеративных расстройствах) в растворе, используемом для предсказания структуры белка. (Другие причины можно найти здесь: Current Opinion in Structural Biology, 2008 г.)

Моделирование гомологии

Часто для предсказания неизвестных белковых структур использовался метод моделирования гомологии. Во-первых, производится множественное выравнивание последовательностей (MSA) между двумя аминокислотными последовательностями. Один — назовем его шаблоном — представляет собой аминокислотную последовательность, чья нативная трехмерная структура уже определена и доступна под рукой. Другой представляет собой известную последовательность белка, трехмерная структура которого еще не определена. Приведем пример, сравнив две последовательности — человеческую (Homo sapiens) и мышиную (Mus musculus) версию регулятора трансмембранной проводимости при муковисцидозе (CFTR ), белок хлоридных каналов, функция которого нарушена при муковисцидозе.

Во-вторых, каждая аминокислота «смоделирована» на матрице. Чтобы проиллюстрировать, если сегмент в шаблоне образует альфа-спираль (или бета-лист), то неизвестная последовательность, вероятно, тоже образует ее. Выходные данные включают ряд прогнозов с определенной оценкой, указывающей качество подгонки. Тем не менее, этот метод далек от идеала, и необходимы новые способы определения белковых структур.

Бесшаблонный («de novo») фолдинг белка с помощью машинного обучения/искусственного интеллекта

Чтобы преодолеть текущую нехватку всех белковых структур, три года назад DeepMind Technologies — дочерняя компания Google (Alphabet Inc., GOOG) — разработала AlphaFold.

Это алгоритм сворачивания белка, используемый для точного определения нативной структуры любого данного белка на основе его первичной аминокислотной последовательности.

Опубликованные в журнале Proteins (октябрь 2019 г.) новейшие результаты, полученные с помощью AlphaFold, теперь доступны. Ранее в статье Cell Systems описывалось ядро ​​алгоритма (препринт в свободном доступе доступен на bioRxiv; а вот Nature< пресс-релиз /em>).

Фактически, DeepMind приняла участие и выиграла самый последний конкурс по предсказанию структуры белка — Critical Assessment of белковая структура предсказания (CASP). В целях этой двухгодичной инициативы Protein Data Bank (PDB) не публикует некоторые из самых последних белковых структур и, таким образом, просит участников предсказать их трехмерную структуру исключительно на основе аминокислотных последовательностей. Затем предсказанные структуры напрямую сравнивают с экспериментальными биологическими данными, полученными с помощью рентгеновской кристаллографии или других методов.

Первым шагом в алгоритме является создание MSA между двумя аминокислотными последовательностями — одной неизвестной и другой (другими) уже известной. Ключевым аспектом является то, что алгоритм идентифицирует аминокислоты, которые расположены в тандеме (т. е. они, скорее всего, кажутся близкими друг к другу в 3D), а не одна за другой в цепочке. Используя аминокислотные последовательности, найденные в базе данных белков (PDB), AlphaFold узнал координаты тысяч белков, что позволило ему предсказать трехмерную структуру практически любого нового белка.

Одним из преимуществ AlphaFold является то, что для него не требуется уже существующий шаблон, а требуется только аминокислотная последовательность неизвестного белкового объекта (см. видео здесь) — отсюда и название de novo .

В конечном итоге нейронная сеть делает предположение о том, каковы (1) расстояния, (2) точки соприкосновения и (3) двугранные углы между всеми аминокислотами рассматриваемого белка. Как показано на изображении ниже, два угла phi (φ) и psi (ψ) строго определяют возможные конфигурации между аминокислотами.

Некоторые аминокислотные подтверждения не допускаются — то есть они не могут встречаться в белке естественным образом, согласно сюжету Рамачандрана (см. здесь для дальнейшего объяснения).

После MSA второй шаг алгоритма — градиентный спуск — включает в себя генерацию схемы складывания на основе небольших постепенных улучшений. Этот шаг оптимизации чем-то напоминает упомянутый ранее поиск минимума энергии.

Что отличает новый метод, используемый в AlphaFold, так это то, что:

  1. его предсказание является точным, даже если оно не содержит шаблонов (т. е. больше нет необходимости сравнивать с уже существующей трехмерной гомологичной структурой, также известной как de novo или «свободное моделирование») ,
  2. и он сочетает в себе как MSA, так и этапы складывания (ранее ученые использовали либо один, либо другой, но никогда оба).

Заключительные слова

AlphaFold предлагает предсказание структуры белка без шаблонов, шаг вперед к надежному выяснению неизвестных структур белка для биомедицинских и сельскохозяйственных целей.

Если вы хотите узнать больше, следующее видео лучше всего объясняет фолдинг белка, а также алгоритм AlphaFold.