Настройка Autodock Vina

«Существует острая необходимость в открытом и быстром обмене нашими методами, моделями и результатами для проверки результатов, обеспечения воспроизводимости, значимости тестирования, устранения тупиков и ускорения открытия. Обмен данными для приложений COVID-19 поможет объединить ученых всего мирового сообщества биомолекулярных симуляторов, а также улучшить связь и коммуникацию между симуляцией, экспериментальными и клиническими данными и исследователями ».

Письмо сообщества относительно обмена данными биомолекулярного моделирования COVID-19 [1].

То, что я представляю ниже, является первым из по крайней мере двух постов, посвященных технике под названием виртуальный скрининг, используемой в вычислительной молекулярной биохимии. Вообще говоря, он состоит из проведения массового исследования взаимодействия между белком и набором лекарственных препаратов-кандидатов. Проблема прогнозирования взаимодействия между такой системой очень сложна, и единственного способа ее решения не существует. Первый шаг в виртуальном скрининге - это вычислительная техника, называемая стыковка, в которой молекула (возможно, лекарство, но не обязательно) многократно приводится в контакт с рецепторным белком, и выбираются конфигурации с наилучшей энергией. с помощью, например, генетического алгоритма. В целом, к результатам этого метода следует относиться с осторожностью и сравнивать с результатами лабораторных исследований. Когда это делается таким образом, можно получить хорошее представление о взаимодействиях в этих системах, что улучшает интерпретацию результатов. Этот пост будет посвящен этому первому шагу. В другой раз я рассмотрю, как это можно сделать массово, а затем применить алгоритм машинного обучения классификации, вдохновленный недавней работой Кадиоглу О, Саид М., Йоханнес Гретен Х и Эфферт Т. где они проводят исследования, чтобы найти лекарства-кандидаты для атаки вируса SARS-CoV2 [2].

AutoDock Vina [3] - популярное программное обеспечение для стыковки молекул, используемое для прогнозирования того, как молекулы размещаются в белках. Здесь в несколько шагов я покажу вам, как установить в Google Colaboratory или Colab. Вы можете ввести каждый фрагмент кода или перейти по ссылке GitHub внизу. Кроме того, вы можете погрузиться в сайт Autodock для получения дополнительной информации и загрузок [4]. Если вы нетерпеливы, прокрутите вниз, чтобы увидеть молекулы, и откройте Блокнот Colab, чтобы увидеть, как он работает и взаимодействует с виджетами.

  1. Загрузите и установите vina

Чтобы установить vina в блокнот Colab , сначала нужно ! Wget загрузить ссылку:

после загрузки и распаковки файла создается каталог autodock_vina_1_1_2_linux_x86. Исполняемый файл vina находится в подкаталоге bin:

мы можем создать псевдоним для программы vina для более беспроблемного использования. Это полезно, если мы хотим сменить каталог и вызвать оттуда vina:

теперь мы можем вызывать vina как команду linux (здесь вы можете использовать ! vina или % vina) из любого каталога в ячейке Notebook. Например, мы можем попробовать помощь (посмотрите варианты):

Этот вывод, помимо основного использования vina, также означает, что программа работает нормально. Как видно на изображении выше, vina принимает в качестве Input в основном два типа файлов: рецептор и лиганд. Лиганд - это химическое соединение, которое образует так называемый комплекс, связываясь с участком целевого белка (рецептора). В этом руководстве мы будем работать с стыковкой белка и лиганда, приведенной в руководстве по программе. Следующая необходимая информация - это пространство поиска, которое определяется как прямоугольник с центром в center_x, center_y, center_z и стороны size_x, size_y, size_z, измеренные в Ангстремах. В этом блоке лиганд будет исследоваться, изменяя свое положение, ориентацию и, возможно, изменяя другие степени свободы. Таким образом, желательно иметь предыдущую информацию об активном сайте, где может происходить связывание, чтобы определить бокс соответствующим образом, или иначе, мы можем сделать слепую стыковку, когда бокс имеет размер всего рецептора, но с более высокими вычислительными затратами. Позже я представлю небольшой инструмент для сборки такой коробки от Colab.

2. Загрузите учебник и файлы pdbqt

Белки обычно представлены в формате файла Банк данных белков (pdb), который, помимо прочего, содержит трехмерную структуру атомных позиций. Здесь мы возьмем необходимые файлы из учебника vina по адресу http://vina.scripps.edu/tutorial.html,

Мы должны распаковать с помощью unzip, чтобы получить файлы pdb лиганда и защиты, а также файл «ligand_experiment.pdb», который является файлом «истинных» координат, полученным экспериментальным путем, и vina прогноз должен максимально походить на эту структуру, чтобы считаться приемлемым,

Файлы белков и лигандов должны быть предварительно обработаны с помощью autodock tools, графического интерфейса, который позволяет манипулировать структурами и записывать файлы pdbqt, но здесь я получу заранее подготовленные файлы из https: // bcrf .biochem.wisc.edu / все-уроки / учебные материалы-молекулярная графика / 66-2 /

мы будем работать в каталоге vina_tutorial, поэтому нам нужно переместить туда эти файлы, переименовав их в «protein.pdbqt» и «ligand.pdbqt» следующим образом:

и мы меняем каталог на vina_tutorial, где и будем работать над остальной частью упражнения:

3. Файл конфигурации

Когда мы увидели справку от vina на рис. 2, мы заметили параметр Файл конфигурации, где все параметры могут быть помещены в сценарий. Мы можем использовать команду cat для записи этого файла:

Я хочу выделить несколько моментов в этом файле. В строках 3 и 4 рецептор и лиганд четко указаны в именах соответствующих файлов pdbqt. В строке 6 структуры out для лиганда в лучших конфигурациях сохраняются в файле «all.pdbqt». Наконец, в строках с 8 по 14 определяются центр и размер окна исследования, чтобы охватить область поиска. Обычно бокс определяется с помощью графического интерфейса инструментов autodock, но его можно создать, например, с помощью других популярных программ просмотра. Далее я покажу, как можно просматривать молекулы в браузере, а также создавать поле для выполнения процесса стыковки.

4. Установите Py3Dmol для визуализации браузера

Я думаю, что Py3Dmol - один из лучших вариантов визуализации молекул в браузере для Jupyter или Colab Notebooks. Чтобы использовать его, мы можем установить с помощью pip и импортировать :

Ниже приведены некоторые функции, которые я написал для просмотра молекул, создания блока и создания виджета для интерактивного изменения настроек блока:

Функция visbox2 добавляет рамку к объекту py3Dmol с центром в bxi, byi, bzi и размером bxf, byf, bzf. На рис. 3 мы можем увидеть, как построить коробку. Для лучшей визуализации показаны два изображения. На левом рисунке показан экран по умолчанию для py3dmol (плоскость x-y лежит на экране), а на правом рисунке показан тот же экран, но повернутый на 90 градусов по вертикали (плоскость z-y лежит на экране). В этом случае, чтобы показать, как манипулировать коробкой, лиганд рядом с белком заключен в коробку.

Когда вы будете довольны настройками окна, значения должны использоваться в файле конфигурации для center_x, center_y, center_z и size_x, size_y и size_z.

5. Запустите vina

Теперь, когда у нас есть файлы белков и лигандов и поле установлено, мы просто вызываем vina, чтобы прочитать файл «c onf.txt». Требуется несколько минут, чтобы использовать 2 ЦП на виртуальной машине (жаль, что это программное обеспечение не работает на ГП):

6. Преобразование файлов pdbqt в pdb

Наконец, файлы pdbqt можно преобразовать в стандартный формат pdb с помощью программного обеспечения openbabel:

И вот обе молекулы, белок и лиганд в одной из выходных конфигураций в файле «all.pdbqt», где мы можем видеть, что лиганд должным образом размещен в «полости» белка.

7. Заключение. Colab - это инструмент, который позволяет упорядоченному процессу молекулярной стыковки. Несмотря на то, что вычислительные мощности не самые адекватные, его можно преобразовать в Jupyter Notebook и запустить локально или на другой платформе облачного сервиса. Также полезна возможность визуализации непосредственно в браузере, и ее можно доработать для определения химических взаимодействий, таких как водородные связи. Мы увидим, как это работает, когда применяется машинное обучение.

8. Ссылка на блокнот. Https://github.com/napoles-uach/covid19mx/blob/master/VINA_autodock_vis.ipynb

9. Благодарность: я хочу поблагодарить доктора философии Хайме Адаме Гальегоса (@donadame) за его любезный обзор.

10. Ссылки.

[1] Ромми Э. Амаро, Адриан Дж. Малхолланд, Дж. Chem. Инф. Модель. 2020 https://doi.org/10.1021/acs.jcim.0c00319

[2] Кадиоглу О, Саид М., Йоханнес Гретен Х. и Эфферт Т. Идентификация новых соединений против трех мишеней коронавируса SARS CoV-2 путем комбинированного виртуального скрининга и контролируемого машинного обучения. [Поданный]. Bull World Health Organ. Электронный паб: 21 марта 2020 г. doi: http://dx.doi.org/10.2471/BLT.20.255943

[3 ] О. Тротт, А. Дж. Олсон, AutoDock Vina: повышение скорости и точности стыковки с новой функцией оценки, эффективной оптимизацией и многопоточностью, Journal of Computational Chemistry 31 (2010) 455–461.

[4] http://vina.scripps.edu/index.html