Открытие лекарств — это, пожалуй, самый захватывающий потенциальный вариант использования искусственного интеллекта (ИИ). Хотя многие опасаются неизбежного вторжения ИИ в нашу жизнь, существует множество способов, которыми ИИ улучшит наш мир для людей, а не сотрет нас с лица земли. Одним из способов является помощь в создании новых методов лечения болезней. Более 43 компаний работают над открытием новых лекарств с помощью ИИ уже несколько лет.

Самостоятельное (без искусственного интеллекта) открытие лекарств — это трудоемкий процесс, который может занять более 10 лет и до 2,5 миллиардов долларов, чтобы вывести новое лекарство на рынок. Это может быть утомительным процессом тестирования тысяч соединений, зная, что вероятность того, что любое из них станет прибыльным лекарством, невелика. Но что, если бы мы могли сосредоточиться на небольшом списке соединений, которые с гораздо большей вероятностью будут успешными?

ИИ может помочь именно в этом. Мы можем создавать модели, которые предсказывают потенциал соединения, и запускать эту модель на миллионах соединений, чтобы найти наиболее многообещающие варианты для тестирования в лабораторных условиях. Но с оценкой 10⁶⁰ соединений у нас все еще есть много соединений для оценки. (Чтобы лучше осмыслить это число, поймите, что 1 миллион — это всего лишь 10⁶.)

Итак, с чего мы начнем? Одним из методов является «виртуальный скрининг». Это предсказывает перепрофилирование существующих лекарств. Как это работает?

  1. Создайте базу данных соединений с их известными свойствами, такими как окислительно-восстановительный потенциал, растворимость, токсичность, двухмерная или трехмерная структура соединения и т. д. Затем пометьте их для заболевания, при котором они эффективны.
  2. Создайте модель, чтобы принять эти значения в качестве характеристик и предсказать, против каких болезней они эффективны.
  3. Запустите все соединения в базе данных, чтобы увидеть, есть ли предсказанная эффективность каких-либо из них при заболеваниях, отличных от тех, для которых они уже одобрены.

Это было полезно в некоторых случаях, и лекарство легче получить одобрение FDA, если оно в настоящее время используется не по прямому назначению, поскольку токсичность уже считается терпимой. Однако помните это число 10⁶⁰? Как найти новые полезные соединения?

Что ж, мы могли бы пометить новые соединения и прогнать их через модель. Это требует очень много времени, и мы, вероятно, захотим выбрать соединения, похожие на существующие успешные соединения (например, антибиотики), чтобы повысить вероятность успеха. Может иметь смысл, что подобное соединение будет работать хорошо, но как насчет других соединений? Там могут быть очень разные соединения, которые никогда раньше не тестировались и могли бы значительно улучшить лечение.

Итак, как нам это решить? Что ж, некоторые ученые начали мыслить по-настоящему нестандартно. Они вывернули весь процесс наизнанку. Вместо того, чтобы принимать соединения в качестве входных данных, а свойства — в качестве предсказанных результатов, они решили напрямую предсказывать сами соединения. Это называется Генеративный ИИ.

Вы, наверное, уже видели Генеративный ИИ. В течение многих лет мы использовали его для создания историй, стихов, электронных писем и т. д. (Автозаполнение в вашем любимом почтовом приложении или текстовом процессоре является обычным явлением.) В последнее время вы, вероятно, видели, как он генерирует изображения или даже короткие видеоролики. На изображении ниже мы видим текстовую подсказку «Пара роботов, обедающая на Эйфелевой башне на заднем плане». и впечатляющее сгенерированное изображение.

При создании соединений решение больше похоже на Генеративный ИИ НЛП. Мы начинаем с нашего собственного языка, синтаксиса молекулярного моделирования SMILES (Simplified Molecular Input Line Entry System). Если мы будем относиться к SMILES как к языку, в котором составные части являются предложениями, а затем маркировать его, как мы это делаем в стандартных моделях преобразования, мы можем предсказать молекулы, которые составят новое «предложение», имеющее то же значение. Итак, насколько хорошо это сработало? Ну, это не так. НО проблема заключалась в том, что метод SMILE не вкладывал в себя весь смысл компонентов соединения.

Подумайте об этом таким образом, рассмотрите следующие два предложения:

  1. Джон сидел на берегу реки.
  2. Банк был открыт, поэтому Джон сел внутри.

В каждом предложении слово «банк» имеет совершенно разное значение. Как вы, возможно, знаете, в современных моделях НЛП эти два слова будут иметь разные вложения, а предложения будут иметь разные векторы внимания. Это решало проблему различения разных значений одного и того же слова. Возвращаясь к нашим соединениям, ученые также обнаружили, что в некоторых случаях два почти идентичных соединения могут быть закодированы в совершенно разные строки с помощью SMILES. Это означало, что мы никогда не смогли бы предсказать, что эти 2 соединения могут обеспечить аналогичное лечение.

Так как же нам это сделать в контексте молекулярных связей и их трехмерных свойств? Ученые, участвовавшие в одном проекте, решили создать новую версию SMILES, которая рассматривала бы другой словарь. Например, общие молекулярные структуры (общие в составе соединений) могут быть объединены в 1 токен (слово) в словаре. Это обеспечило лучшие результаты при прогнозировании следующего «слова». Затем команда смогла надежно предсказать аналогичные соединения и, следовательно, (потенциально) аналогичные или лучшие методы лечения.

Сообщество ИИ все еще находится на ранних стадиях создания нашего ИИ-помощника в поиске лекарств. Мы уже видели несколько захватывающих результатов. (См. историю Halicin.) Но ключом к успеху является творчество. Не существует единого способа создать этот ИИ, и изобретательность будет иметь решающее значение для достижения большего прогресса.

Если вы хотите узнать больше о том, что я пишу, подписывайтесь на меня в LinkedIn или Medium.