Мысли и теория, приложения, ограничения и будущее

Спин-офф AlphaFold 2 через три месяца после официального выпуска

Краткое изложение наиболее важных работ, связанных с AlphaFold 2 на сегодняшний день.

За три месяца, прошедшие с момента выпуска статьи и кода AlphaFold 2, появилось много новых статей и препринтов, в которых анализируется его потенциал и ограничения, они используются для создания новых открытий и используются для разработки новых структурные базы данных, которые пытаются восполнить пробел в знаниях в экспериментальных структурных данных.

На начало октября 2021 года статья Nature 2021 об AlphaFold 2 имеет более 200 цитирований (проверенные статьи + непроверенные препринты). Из этих работ проще всего ссылаться на нее в ситуациях, когда другие более широкие цитаты подойдут гораздо лучше. В этом рассказе я проделал работу по обобщению статей и препринтов, которые я считаю наиболее актуальными в отношении областей, непосредственно связанных с AlphaFold, с упором на его оценки, его непосредственное применение и его использование для создания новых структурных баз данных.

Показатель

Введение

Перво-наперво: исходные оценки AlphaFold 2 в CASP14

  • Потребность в новых способах проведения оценок

Расширение охвата баз данных структуры белков моделями AlphaFold 2 и RoseTTAFold

  • Покрытие «всех» структур во вселенной белков
  • База данных моделей белковых комплексов
  • Прогнозирование белковых комплексов с помощью AlphaFold-Multimer

Оценка прогнозов AlphaFold 2 на основе того, какими они были, а какие не предназначены для прогнозирования

  • Экспериментальные структурные биологи объединили усилия, чтобы оценить полезность AlphaFold в своих областях исследований
  • Прогнозирование белково-пептидных комплексов
  • Прогнозирование складчатых структур - это не то же самое, что прогнозирование путей складывания

Из специального выпуска Журнала молекулярной биологии

Обзор других оценок и потенциальных приложений

Дальнейшие примечания и чтения

Введение

В конце прошлого года Deepmind попала в новости, когда Критическая оценка предсказания структуры показала, что их программа AlphaFold 2 намного превзошла всех остальных участников. Затем, в июле 2021 года, всего 3 месяца назад, Deepmind и AlphaFold 2 снова попали в новости, когда был выпущен их код. Как я уже писал в этой истории, Deepmind выпустила адаптацию программы для работы в виде записной книжки Google Colab. Еще одним шоком стало то, что независимые исследователи выпустили целый набор записных книжек Colab, соединенных со специальной программой поиска последовательностей, MMSeqs2, тем самым сделав всю мощь этой технологии, которая сильно зависит от выравнивания последовательностей белков, доступной в широком масштабе и на нулевом уровне. Стоимость.

Широкий доступ к AlphaFold 2 в его различных формах настолько оперативно, что позволил исследователям всего мира экспериментировать с ним. Внезапно многие ученые стали проверять его пределы и применимость к реальным проблемам в области структурной биологии. Твиты со всех уголков мира показали, как модели AlphaFold 2 помогли им легче решать структуры на основе экспериментальных данных, в некоторых случаях даже исправляя ошибки, которые люди вносили при решении структур «вручную». Иногда они также проявляли несоответствия и проблемы в предсказаниях.

Другие группы посвятили время проверке, может ли AlphaFold 2 с учетом качества своих прогнозов предсказывать и другие характеристики белков. Их объяснение состояло в том, что, несмотря на то, что он был специально обучен предсказанию белковых структур, если бы он действительно изучил полную биофизику белка (спойлер: это не так!), То он, вероятно, смог бы предсказать их динамику, взаимодействия, пути сворачивания, и т.д. И что удивительно, некоторые из этих тестов действительно показали, что AlphaFold 2 может добиться определенного прогресса в предсказании некоторых из этих функций.

Тем не менее другие группы, и сама Deepmind, применяли AlphaFold 2 и другие программы, иногда даже интегрируя их, для разработки новых структурных баз данных на основе своих прогнозов, пытаясь сначала охватить отдельные белковые структуры всех протеомов, а затем смоделировать мультибелковые комплексы в целом.

Вот нетехническое резюме работ, которые я нашел наиболее актуальными и интересными среди всех «побочных продуктов» AlphaFold 2 за последние 3 месяца.

Перво-наперво: исходные оценки AlphaFold 2 в CASP14

Прежде чем я начну, я вернусь немного назад, чтобы выделить статью, которая очень важна, но в значительной степени игнорировалась в средствах массовой информации: исходная оценка CASP14, которая определила AlphaFold 2, является лучшей программой моделирования для жестких мишеней (то есть белков, которые не имеют гомологов в банк данных о белках, поэтому моделировать их было нелегко) по состоянию на 2020/2021 год:



В этой статье описывается официальный анализ CASP14, проведенный назначенными экспертами (группа Гришина из HHMI в США, давно связанная с CASP) по всем моделям, предсказанным всеми участниками CASP14, с учетом, в частности, проблемы прогнозирования структур для сложных целей - т.е. белковые структуры сложно смоделировать с помощью классических методов, таких как моделирование гомологии. Используя метрики, очень похожие на те, что использовались в предыдущих выпусках CASP, оценщики обнаружили, что лучшая группа (да, AlphaFold 2) намного превзошла остальную часть сообщества прогнозистов. Но не по всем сложным целям! Для двух целей другие группы предикторов работали лучше (тем не менее, AlphaFold 2 правильно понимал глобальную топологию). Эксперты обнаружили, что AlphaFold 2 обеспечивает высокоточные модели для большинства целей, включая некоторые довольно большие белки (более крупные белки обычно сложнее смоделировать). Более того, некоторые из его прогнозов были выдающимися, достигая точности, сопоставимой с экспериментальными неопределенностями в положениях атомов, во многих случаях даже для боковых цепей аминокислот (которые обычно даже не оцениваются в этом треке CASP). Как и в случае с остальными предикторами, AlphaFold 2 все еще было трудно моделировать гибкие области и олигомерные сборки (тем не менее, он добился прогресса и помог улучшить их прогнозы - см. Следующие разделы).

В отдельном документе тот же набор оценщиков показал, что цели, доступные для CASP14, не были особенно простыми; на самом деле, они были одними из самых сложных:



Потребность в новых способах проведения оценок

Высокая точность прогнозов AlphaFold вызвала вопрос, который мы уже задавали в CASP13. К тому времени, когда в игру вошла первая версия AlphaFold (победившая, но незначительная и не предполагающая революцию, как это сделала AlphaFold 2), мы пришли к выводу, что по мере того, как были достигнуты новые вехи в предсказании третичной структуры белков, необходимо было найти новые направления. разработан для будущих CASP:



В частности, мы предложили отказаться от разделения целей на домены, переосмыслить метрики сложности, оценить не только скелеты, но и боковые цепи аминокислот, а также оценить оценки качества остатков и, возможно, остатков-остатков. Соответственно, для CASP14, учитывая успех AlphaFold 2 (а также других методов), оценщики провели отдельный анализ и обсуждение новых задач для оценки:



Один из таких дальнейших анализов повлек за собой оценку взаимодействий, предсказанных между различными доменами, составляющими белковые мишени:



При оценке моделей для целевых целевых белков (в отличие от оценок только доменов, что является основным типом оценки, обычно выполняемой) с помощью дополнительных баллов, которые измеряют качество взаимодействий между трехмерными единицами, и с учетом 10 конкретных целей, наивысший - ранжированным предсказателем снова стал AlphaFold 2. Фактически, он предсказал высокоточные модели для 8 из 10 полных белков, причем оценки по 3 из них были намного выше, чем у моделей всех других групп.

Еще одним важным моментом в статьях CASP14 является открытие моделей AlphaFold 2, полезных для метода, используемого для определения структуры белков на основе рентгеновских лучей, называемого «молекулярная замена», в котором модель используется в качестве основы для определения структуры из экспериментального X -дифракционные данные. Хотя, строго говоря, это уже было возможно для некоторых целей в предыдущих выпусках CASP, высокое качество моделей AlphaFold 2 позволило сделать это для большего количества целей. Фактически, для некоторых мишеней экспериментальные данные были доступны, но не были «поэтапными» (этап определения экспериментальной структуры, который облегчается использованием моделей посредством «молекулярной замены»); в некоторых из этих случаев модели, предоставленные AlphaFold, были полезны для решения фазовой проблемы и полного определения экспериментальной структуры (тогда все модели можно было сравнивать):



Расширение охвата баз данных структуры белков с помощью AlphaFold 2 и RoseTTAFold

Покрытие «всех» структур белковой вселенной

Я уже обсуждал эту статью в предыдущей статье на TDS: Европейский институт биоинформатики сотрудничал с Deepmind с целью разработки наиболее полной базы данных структур белков, открытой для всего сообщества бесплатно. Цель EBI-Deepmind - охватить всю вселенную белков, то есть смоделировать структуры для всех белков из всех когда-либо секвенированных геномов. На момент написания этой статьи база данных содержит модели для полных протеомов 21 вида, в том числе людей и видов, имеющих отношение к биотехнологии и / или используемых в качестве модельных организмов для исследований. Таким образом, помимо протеома человека, база данных охватывает протеомы нескольких патогенных организмов, пекарские дрожжи, рис и глубоко изученные модели, такие как Arabidopsis thaliana (модельное растение) и Caenorhabditis elegance (модельный червь) .

Модели всех белков у этих 21 организма доступны для бесплатного скачивания по адресу https://alphafold.ebi.ac.uk/download. Веб-сайт EBI также позволяет пользователям искать последовательности белков по последовательностям всех белков с моделями; благодаря этому пользователи могут найти модели белков, очень близких к интересующему их объекту, а затем использовать эту модель в качестве суррогата или для моделирования гомологии своего собственного белка.

Я не буду вдаваться в подробности здесь, потому что я рассмотрел усилия Deepmind-EBI в специальном разделе следующей статьи, выделив важные моменты, такие как ограничения моделей в этой базе данных, среди прочего:



Но я добавлю сюда этот препринт, представляющий тщательный анализ, который показывает, что из текущего базового уровня структурного покрытия 47% для складываемых областей белка (с учетом экспериментально полученных и основанных на шаблонах моделей гомологии) модели, доступные в настоящее время в базе данных EBI-AlphaFold, приносят покрытие до 75%. В частности, 50% протеома человека покрыто экспериментальными структурными данными или высококачественными структурными моделями, что еще более впечатляет, учитывая, что около 20% протеома - это просто длинные неупорядоченные сегменты или полностью неупорядоченные белки.



База данных моделей белковых комплексов

База данных EBI-Deepmind продолжает расти, и это здорово для сообщества экспериментальных и вычислительных биологов, но она сосредоточена только на структурах отдельных белков в мономерных формах. Однако оценки CASP показали, что AlphaFold 2, по-видимому, улучшился по сравнению с уровнем техники того времени в предсказании структур комплексов между белками (дальнейшие работы были направлены на это, см. Следующий раздел). Фактически, к такому выводу пришла не только оценка CASP, но и конкурс CAPRI, специально посвященный оценке и отслеживанию современного состояния моделирования белок-белковых комплексов:



В новой работе, которая только что вышла в виде препринта, использовались AlphaFold 2 и RoseTTAFold (метод моделирования белков по точности приближающийся к AlphaFold 2, который был опубликован в Science одновременно с AlphaFold 2) предсказывать структуру не отдельных белков, а их комплексов. В частности, работа представляет собой серию систематически идентифицированных, вероятно, точных моделей основных комплексов эукариотических белков протеома Saccharomyces cerevisiae (дрожжи). RoseTTAFold и AlphaFold служили для сканирования нескольких парных выравниваний последовательностей для 8,3 миллиона пар дрожжевых белков для обнаружения взаимодействующих пар, фильтрации случаев, для которых должны быть достигнуты точные прогнозы, а затем для построения трехмерных моделей их сборок. Результатом работы стал большой новый набор данных предсказанных белковых комплексов, содержащих от двух до пяти белковых компонентов каждый, которые охватывают почти все ключевые процессы в эукариотических клетках. Более сотни смоделированных белковых ансамблей ранее не были идентифицированы, и было известно, что более 600, вероятно, образуют комплексы, но их структуры не были охарактеризованы.

Этот препринт обязательно станет заметной статьей в журнале первого уровня с влиянием, аналогичным сотрудничеству Deepmind-EBI по моделированию всех отдельных белков. Вы можете прочитать это сейчас здесь (к сожалению, полный список смоделированных комплексов еще не опубликован):



В родственном препринте, фактически разделяющем имена некоторых авторов с препринтом выше, использовалась аналогичная комбинация AlphaFold 2 и RoseTTAFold для моделирования комплексов митохондриальных белков человека:



Прогнозирование белковых комплексов с помощью AlphaFold-Multimer

Как раз когда я собирался отправить эту статью, новый препринт Deepmind приземлился на bioRxiv. Этот препринт представляет новую модель AlphaFold, специально обученную для мультимерных входных данных известной стехиометрии («AlphaFold-Multimer»). Разработчики сообщают, что это значительно повышает точность прогнозируемых мультимерных интерфейсов по сравнению с обычным AlphaFold, только адаптированным для нескольких белков, как до сих пор делало все сообщество. Новая программа обеспечивает среднюю и высокую точность на сложных наборах данных эталонных тестов даже для случаев, когда отсутствуют доступные шаблоны:



Оценка прогнозов AlphaFold 2 на основе того, какими они были, а какие не предназначены для прогнозирования

Строго говоря, AlphaFold 2 был разработан для предсказания структуры белка, то есть относительного положения в пространстве всех атомов, составляющих белок. Но белковые структуры - это гораздо больше, чем просто трехмерные атомные позиции. Как мы видели выше, они могут взаимодействовать друг с другом, образуя комплексы, они также могут принимать множественные конформации, они могут даже не иметь определенной структуры и быть неупорядоченными или иметь складчатые домены с неупорядоченными сегментами между ними. Даже хорошо сложенный белок может иметь несколько гибких петель.

Экспериментальные структурные биологи объединили усилия, чтобы оценить полезность AlphaFold в своих областях исследований.

В этом замечательном препринте, выпущенном буквально на прошлой неделе, собраны оценки, проведенные экспертами в отношении потенциала AlphaFold для прогнозирования некоторых свойств белков, помимо самих структур:



В работе оценивалось использование прогнозов AlphaFold 2 при изучении характерных структурных элементов белков в качестве инструмента для оценки воздействия мутаций, для прогнозирования функций и сайтов связывания малых молекул (что важно, потому что большинство лекарств на самом деле являются небольшими молекулами, которые связываются к белкам), моделирование взаимодействий (относящееся к разделу выше, а также к разделу ниже) и моделирование экспериментальных структурных данных. Несколько моментов из этого препринта:

  • По сравнению с тем, какие фракции протеомов могут быть смоделированы простой гомологией между последовательностями белков, авторы обнаружили, что моделирование с помощью AlphaFold 2 значительно увеличивает охват достоверных моделей, хотя это варьируется от протеома к протеому. Интересно, что они сообщают, что в некоторых случаях модели AlphaFold идентифицируют структурные особенности, которые редко встречаются в PDB. Я сам был свидетелем этого на некоторых примерах моей собственной работы с применением AlphaFold 2.
  • Прогнозирование белкового расстройства и белковых комплексов превосходит самые современные инструменты. Да, AlphaFold 2 не был разработан для прогнозирования нарушения, но один из его показателей самоконтроля, который измеряет, насколько надежен прогноз для каждой аминокислоты, оказался отличным прогнозом нарушения белка.
  • Как многие и ожидали, и даже оценка CASP14 показала для пары целей, эта работа документирует больше случаев, когда модели AlphaFold 2 могут использоваться для облегчения экспериментального определения структуры.
  • И для многих белков авторы показывают, что модели AlphaFold 2 имеют такое высокое качество, что они служат для различных приложений, а также для экспериментально определенных структур, если критически рассматривать показатели достоверности.

В большинстве случаев роль показателей достоверности так же важна, как и сами модели. И, как считают авторы, из представленных оценок ясно, что успехи, достигнутые AlphaFold, окажут преобразующее влияние на структурную биологию и более широкие исследования в области наук о жизни. Ничего нового, потому что мы уже наблюдаем эту трансформацию в исследованиях.

Прогнозирование белково-пептидных комплексов

Приведенные выше препринты показывают, что AlphaFold 2 действительно работает для моделирования комплексов между белками. Этот препринт здесь оценивает более конкретный вопрос, может ли он также моделировать комплексы между хорошо сложенными, «обычными» белками и короткими, в значительной степени неупорядоченными пептидами. Для этого авторы взяли записи из базы данных комплексов белок-пептид PepBDB, получили их аминокислотные последовательности и запустили AlphaFold 2 без шаблонов (что очень важно, поскольку все эталонные структуры доступны в PDB).

Работа показала, что в целом AlphaFold 2 довольно хорошо предсказывает связанные структуры, более чем в половине случаев с хорошей точностью, а значительная часть из них действительно очень точна. Однако есть одна оговорка, которую я здесь обнаружил: хотя авторы отказались от использования шаблонов для этого, AlphaFold 2, как известно, «знает» банк данных о белках «наизусть». Это означает, что если вы скармливаете ему последовательность, структура которой уже доступна в PDB, он может очень точно восстановить ее даже без использования информации о шаблоне. Фактически, некоторые неофициальные отчеты и сама статья Deepmind показывают, что при большом количестве последовательностей во входных сопоставлениях информация о шаблоне становится менее важной и во многих случаях может игнорироваться без ущерба для качества прогнозирования.



Важные группы, занимающиеся разработкой методов стыковки пар белков, также используют AlphaFold для поддержки своих собственных методов. Вот этот препринт, например, объединяет собственный метод авторов ClusPro для повторной стыковки моделей AlphaFold белок-белковых комплексов, а затем использует AlphaFold для уточнения моделей:



В этой другой работе изучается, как настроить выравнивание входных последовательностей и идентификацию модели, чтобы улучшить предсказания AlphaFold 2 для комплексов белок-белок:



В этом другом препринте также исследовалось использование AlphaFold для моделирования комплексов белок-пептид:



Прогнозирование складчатых структур - это не то же самое, что прогнозирование путей складывания.

Когда вышел AlphaFold 2, многие говорили, что он «решил проблему сворачивания белка». Для нас, ученых, работающих с белками, это явно не так. Одно дело - структура, которую достигают белки, когда они свернуты, и другое дело - механизм, с помощью которого белки достигают своей свернутой структуры. Вспомните, что белки принимают свою трехмерную структуру, сворачиваясь на себя (иногда и на другие белки) из расширенного гибкого состояния.

В этом препринте сравниваются пути, генерируемые современными методами предсказания структуры белков, включая AlphaFold 2, с экспериментальными данными о реальных путях сворачивания. Сравнение сложно, потому что данные сворачивания редко показывают положение атомов во времени; скорее, большинство данных касается того, как долго аминокислоты белка остаются открытыми для растворителя, когда белок сворачивается (аминокислоты защищаются от растворителя, когда белок сворачивается, потому что они образуют контакты и погружаются в белок). Однако данные дополняются моделированием на основе физики того, как белки складываются, ограниченные известными структурами. Короче говоря, эта работа обнаруживает, по крайней мере для меня неудивительно, что современные методы прогнозирования структуры белка не обеспечивают правильных путей сворачивания, даже если их окончательно свернутые структуры очень точны:



Из специального выпуска журнала "Молекулярная биология".

Статьи, приглашенные для специального выпуска известного Journal of Molecular Biology, развивают и обсуждают влияние основных достижений, обещанных AlphaFold 2, и связанных с ним технологий, основанных на искусственном интеллекте, применяемых в биологии, а также о том, как ученые могут создавать на них. Ученые из разных областей биологии обсуждают различные вопросы, достигая консенсуса, что AlphaFold повлияет (я бы сказал, что уже влияет) на то, как будут проводиться исследования в области наук о жизни. Модели белковых структур всегда были полезны, когда были уверены, поэтому повышение достоверности моделей в такой степени, как AlphaFold, не может иметь ничего, кроме воздействия.

Многие статьи в этом выпуске вообще не об AlphaFold, но содержат интересные взгляды на то, как ведущие исследователи в области структурной биоинформатики, дизайна белков, динамики белков, сворачивания белков и биофизики белков в целом думают о революции, которую эти методы и машинное обучение в целом приводят к:



Я комментирую здесь только статьи, которые мне интересны и больше связаны с машинным обучением, но я рекомендую вам перейти по ссылке выше, чтобы узнать больше.

В своей статье специалист по белковым наукам Алан Фершт дает личный взгляд на то, как машинное обучение повлияло на область его исследований, в широком смысле - на биофизику белков. Особенно интересно читать его точку зрения, когда он начинал свою работу, когда компьютеры были роскошью, а таких вещей, как Protein Data Bank, вообще не существовало. Кроме того, он очень хорошо знает историю биофизики белков и структурной биологии, начав свою статью в 1968 году, когда началось моделирование трехмерных структур белка на основе использования известной структуры в качестве шаблона (моделирование гомологии). В то время информатика быстро развивалась, и область машинного обучения начинала развиваться, даже не предполагая, что через полвека компьютеры смогут предсказывать белковые структуры без шаблонов, а скорее стремясь к более простым задачам, таким как игра в игры. против людей. И примерно в то же время была поставлена ​​проблема путей сворачивания белков, которая сегодня практически не решена (как показано в одном из препринтов выше, даже когда методы машинного обучения могут правильно предсказывать свернутые структуры, они не могут объяснить, как белки сворачиваются в такие структуры). Фактически, основная тема, вокруг которой вращается статья Фершта, - будут ли компьютерные программы когда-либо способны предсказывать пути сворачивания белков и помогать прояснять, какие принципы управляют укладыванием белков.

В другой статье группы Дилла более подробно рассматривается проблема сворачивания белков, как это было установлено первыми экспериментальными структурами глобулярных белков и как ранние биофизики подошли к ее изучению, сначала с помощью теорий полимеров для моделирования переходов между неупорядоченными и упорядоченные конструкции, а затем переходим к теориям обрушения и складывания воронок. Обзор не касается машинного обучения для определения структуры, но он является обязательным для любого новичка в биофизике белков, поскольку в нем также обсуждается природа неупорядоченных состояний белков, почему складывание происходит быстро и направленно, мультипротеиновые ассоциации, нативные и фибриллярные. агрегаты, сборка белка и разделение p -газы (вероятно, самая модная тема в биофизике белка сегодня) среди других тем - все с интересной теоретической и исторической точки зрения.

В связи со статьей, прокомментированной выше, другие статьи этого номера посвящены именно проблемам нарушения и агрегации белков, одна из них конкретно касается того, как методы машинного обучения могут помочь выявить взаимосвязи между последовательностью белков, структурой, динамикой и функция для неупорядоченных белков. Среди прочего, в статье рассматриваются методы вывода свойств белка непосредственно из последовательностей, таких как мотивы взаимодействия, функции и нарушения; кроме того, в нем также рассматривается, как машинное обучение может помочь предсказать белок-белковые взаимодействия (многие из которых представлены выше в этой статье), параметризовать силовые поля для молекулярного моделирования, интерпретировать экспериментальные данные и т. д.

В двух интересных статьях этого выпуска обсуждается (мембранный) дизайн белков (здесь и здесь), который сегодня в значительной степени опирается на экспериментальную работу и компьютерное проектирование, но не использует методы машинного обучения, но ожидается, что эта область будет затронутые ими, особенно генеративными сетями - с некоторыми представленными примерами.

Другая интересная статья затрагивает очень важную проблему, с которой могут помочь методы прогнозирования белков, особенно сейчас, когда они становятся все более точными: прогнозирование функциональных эффектов генетической изменчивости. В своей статье Диван и др. Обсуждают предсказания AlphaFold и роль структур в предсказании генетических вариаций фенотипов. В высшей степени полезности можно предсказать, какие мутации (генетические вариации) вызывают заболевание (фенотип), почему они это делают и как мы можем компенсировать эти эффекты. Одним из важных моментов в статье является то, что структур, предсказанных или экспериментальных, для белка, в котором падает генетическая изменчивость, обычно недостаточно, чтобы понять, как эта вариация связана с наблюдаемым фенотипом. Для полного предсказания фенотипа на основе генотипа нам необходимо понимать структуру, динамику, пути сворачивания, комплексы, взаимодействия с другими молекулами и, возможно, другие аспекты, о которых мы не подозреваем.

Обзор других оценок и потенциальных приложений

  • Этот препринт показывает, что ни одно из прогнозов или параметров AlphaFold не может использоваться в качестве прокси для изменения стабильности белка при мутации. Хотя это было ожидаемо, его стоило изучить: https://www.biorxiv.org/content/10.1101/2021.09.19.460937v1
  • В работе в этом другом препринте был разработан подход к дизайну белков из фиксированных позвоночников, основанный на прогностической силе AlphaFold. Для нескольких дизайнов авторы продемонстрировали, что структуры, предсказанные AlphaFold, соответствуют желаемым основам, предполагая, что AlphaFold и аналогичные методы могут облегчить разработку нового ряда новых и точных методологий дизайна белков, т. Е. где программа используется для прогнозирования аминокислотных последовательностей, которые приобретут желаемую складку: https://www.biorxiv.org/content/10.1101/2021.08.24.457549v1
  • В этом препринте оценивается, насколько хорошо AlphaFold 2 может предсказать специфические мембранные белки, что является важным моментом, поскольку программа не содержала никаких наборов правил, специфичных для этого типа белков. Их открытие заключалось в том, что предсказания были выдающимися: https://www.biorxiv.org/content/10.1101/2021.08.21.457196v1 Однако важно учитывать, что в CASP14 уже были некоторые мишени мембранного белка.

Дальнейшие примечания и материалы для чтения

(Новые статьи, относящиеся к моим предыдущим статьям, выделены жирным шрифтом)

Пример использования AlphaFold в очень конкретном приложении для моделирования определенных белков яичной оболочки: https://onlinelibrary.wiley.com/doi/full/10.1002/mrd.23538

Пример использования AlphaFold, дополненного ad hoc выравниванием для модельных белков паразитов Trypanosoma и Leishmania: https://www.biorxiv.org/ content / 10.1101 / 2021.09.02.458674v1

Оригинальный документ AlphaFold 2, если вы его не видели: https://www.nature.com/articles/s41586-021-03819-2

И оригинальная статья EBI-Deepmind, представляющая базу данных моделей для 21 протеома: https://www.nature.com/articles/s41586-021-03828-1

Новый документ Deepmind, объясняющий, как именно они использовали AlphaFold 2 во время CASP14: https://onlinelibrary.wiley.com/doi/10.1002/prot.26257. Обратите внимание, что команда участвовала как группа людей, поскольку они проводились вмешательства по инициативе экспертов. Основываясь на том, что они узнали в процессе, они могли бы доработать окончательную полностью автоматизированную программу, которую все мы знаем сегодня.

RoseTTAFold, по-видимому, почти так же хорош, как AlphaFold 2, хотя еще не тестировался ни в одном CASP: https://www.science.org/doi/full/10.1126/science.abj8754

Выпуск EMBL / EBI о моделировании белковой вселенной: https://www.embl.org/news/science/alphafold-potential-impacts/

Основной препринт о ColabFold, который позволяет вам легко использовать AlphaFold 2 и RoseTTAFold: https://www.biorxiv.org/content/10.1101/2021.08.15.456425v1.abstract

Я увлекаюсь природой, наукой, технологиями, программированием и сделай сам. Биотехнолог и химик в мокрой лаборатории и в компьютерах. Я пишу обо всем, что входит в круг моих интересов, в том числе и коммуникативную науку. Посмотрите мои списки, чтобы узнать больше. Станьте средним участником, чтобы получить доступ ко всем рассказам, написанным мной и другими авторами, и подпишитесь, чтобы получать мои новые истории по электронной почте (оригинальные партнерские ссылки платформы).