Краткий обзор ключевых инноваций, которые позволили ИИ закрепиться в фундаментальных фармацевтических исследованиях.

Искусственный интеллект (ИИ) продолжает революционизировать многие аспекты отраслей науки о жизни. Приложения ИИ включают автоматическое обнаружение рака в медицинских изображениях, прогнозирование структуры белков на основе аминокислотных последовательностей и извлечение ключевых слов из медицинских заметок. В частности, за последние несколько лет значительно увеличилось количество приложений ИИ для разработки лекарств. После нескольких лет постепенного прогресса недавние достижения в области прогнозирования структуры и функций белков открыли шлюзы для прогнозирования структуры с помощью ИИ для открытия лекарств, что привело к быстрым улучшениям и инновациям в этой области. В ближайшем будущем искусственный интеллект станет неотъемлемой частью рабочего процесса по поиску лекарств. В этом сообщении блога мы рассмотрим общий обзор основ и истории глубокого обучения и обсудим, почему эти методы стали жизнеспособными для открытия лекарств после многих лет небольшого прогресса.

Основополагающие концепции, обеспечивающие недавний взрыв нейронных сетей, существуют уже несколько десятилетий. Глубокие нейронные сети состоят из искусственных нейронов: вычислительных единиц, в общих чертах основанных на нейронах. Они поглощают данные и выборочно генерируют искусственные потенциалы действия. В моделях 1950-х годов использовались десятки нейронов для изучения простых паттернов. По мере увеличения вычислительной мощности в сети добавлялись дополнительные нейроны, повышая производительность. Нейроны добавлялись горизонтально: каждый нейрон получал входные данные от самих входных данных (см. рис. 1).

Эта горизонтальная группировка (или слой) стала фундаментальной для ИИ. В 1980-х годах в нейронные сети были добавлены дополнительные горизонтальные слои, где выходные данные предыдущего слоя становятся входными данными следующего слоя (см. рис. 2). Эта «глубокая» многоуровневая структура для нейронных сетей дала название области глубокого обучения и позволила сетям получать функции более высокого уровня из входных данных, позволяя глубоким нейронным сетям аппроксимировать более широкий диапазон шаблонов.

Несмотря на то, что идеи, лежащие в основе глубокого обучения, существовали с 1980-х годов (и их основы с 1950-х годов), эти алгоритмы не оказывали сильного влияния на реальный мир до 2010-х годов, когда отраслевое финансирование и внедрение выросли в геометрической прогрессии. В области открытия лекарств мы все еще находимся в зачаточном состоянии приложений глубокого обучения, и AlphaFold2 в 2020 году представляет собой первый революционный прогресс в области глубокого обучения для открытия лекарств. Задержка в развитии глубокого обучения до его коммерческой жизнеспособности при открытии лекарств может быть объяснена несколькими факторами: доступностью данных, затратами на хранение, затратами на вычисления и улучшениями архитектуры.

По мере оцифровки биологических и химических рабочих процессов каждый день создаются огромные объемы данных: структуры белков, химические взаимодействия, последовательности геномов и т. д. Рост объема жизнеспособных данных привел к тому, что ИИ научился изучать широкий спектр биохимических паттернов. Даже при наличии больших объемов данных обучение глубоких нейронных сетей было бы невозможно без экономичного метода хранения данных. Глубокие нейронные сети теперь могут получать доступ к терабайтам обучающих данных по ценам, приемлемым для коммерческих приложений.

Алгоритмы глубокого обучения теперь используют огромное количество слоев с сотнями миллиардов параметров. Количество параллельных вычислений, необходимых для оптимизации этих параметров, огромно и было бы совершенно невыполнимо на центральном процессоре (ЦП). С появлением программирования CUDA, а также снижением стоимости и повышением производительности графических процессоров (GPU) теперь стало возможным обучать модели, распределенные по тысячам GPU, с параллельным выполнением миллионов вычислений. Усовершенствования вычислительной мощности позволили совершить новый прорыв в ключевых архитектурах глубокого обучения, которые стали основной частью недавних достижений в открытии лекарств.

Все эти факторы объединились, чтобы породить волну приложений ИИ для разработки лекарств. AlphaFold2 в 2020 году представлял собой огромный скачок в предсказании структуры белка, опережая конкурентов на дрожжах в CASP14 и достигая точности, сравнимой с экспериментальными методами. MaSIF, также выпущенный в 2020 году, мог использовать геометрические методы глубокого обучения для прогнозирования горячих точек белок-белкового взаимодействия на поверхности белка. Графовые нейронные сети и модели-трансформеры также добились больших успехов в ретросинтезе, когда химические реакции, необходимые для производства молекулы, происходят из самой молекулы.

Эти новые приложения — всего лишь пример огромных возможностей, открываемых появлением ИИ в разработке лекарств. Поскольку затраты на вычисления и хранение продолжают снижаться, вычислительная мощность графического процессора увеличивается, а данные становятся все более доступными, мы будем и дальше видеть, как новые архитектуры ИИ революционизируют открытие лекарств, от предсказания структуры до идентификации взаимодействия лекарство-белок. Поскольку ИИ быстро продвигается в области разработки лекарств, исследователям крайне важно ознакомиться с доступными моделями и понять концепции, лежащие в основе этих инноваций. Со временем недавно разработанные алгоритмы станут такими же незаменимыми инструментами, как микроскоп для лабораторного ученого в ближайшие годы.