Краткое введение в продовольственную безопасность, селекцию растений, идентификацию целей и какое отношение все это имеет к графовому машинному обучению.

вступление

Меня зовут Дом — я сооснователь и технический директор компании Биографика. Мы являемся платформой TechBio на ранней стадии, целью которой является ускорение продуктивного и устойчивого сельского хозяйства, черпая вдохновение из волн инноваций, которые произвели революцию в области открытия лекарств за последние несколько лет. Платформа, которую мы создаем, находится на пересечении чрезвычайно интересных областей исследований, включая графовое машинное обучение, НЛП, генеративный ИИ, генную инженерию и будущее продуктов питания.

В этой серии блогов я хочу поделиться нашей миссией, техническими проблемами, которые мы решаем, почему они важны и почему мы думаем, что это может иметь невероятно большое влияние на мир. В этой первой статье я надеюсь ответить на некоторые вопросы «почему» Biographica. Я объясню, почему:

  • Продовольственная безопасность — огромная проблема, с которой мы столкнемся в ближайшие десятилетия
  • Чтобы решить эту проблему, необходимо улучшить селекцию растений.
  • Генная инженерия и CRISPR представляют собой многообещающее решение
  • Какое все это имеет отношение к graph-ML

У нас проблема с продовольственной безопасностью

По данным ООН, к 2050 году нам нужно производить на 60% больше еды в год, чем сейчас, чтобы накормить население в ~9,5 млрд человек. Как часто отмечает мой соучредитель Сеси Прайс, это означает, что в следующие 50 лет будет производиться больше еды, чем за предыдущие 10 000 лет. Хотя также подсчитано, что почти треть продуктов питания, производимых каждый год, теряется или выбрасывается, даже если мы достигнем 100-процентной эффективности использования продуктов питания, мы все равно не достигнем этого. Чтобы сделать эту задачу более сложной, ООН «также оценивает, что к 2050 году засухи могут затронуть до 75% земного шара. С учетом того, что сильная засуха, по оценкам, снизит урожайность где-то на 30–90%, это рисует сложную картину для ближайшие десятилетия! И это еще не все — перед нами стоит множество других проблем, в том числе вредная практика внесения удобрений, эрозия почвы и еда, буквально менее питательная, чем в прошлом. Короче говоря, нам нужно улучшить сельское хозяйство. Один из наших лучших способов добиться этого — улучшить урожай.

Одно только растениеводство нас не спасет

Улучшение урожая не ново. На самом деле это, возможно, одно из древнейших явлений цивилизации, поскольку концепция выращивания лучших растений лежит в основе сельскохозяйственной революции; предшествующий даже письму и математике. На протяжении тысячелетий улучшение урожая достигалось исключительно с помощью традиционной селекции растений — в двух словах, глядя на то, какие растения хорошо растут в течение одного года, и скрещивая эти растения вместе. На самом деле, выведение одной разновидности дикой горчицы (Brassica oleracea) на протяжении тысячелетий привело к появлению современной капусты, брокколи, цветной капусты и капусты:

По сей день селекция является «стандартным» методом получения новых сортов семян. В общих чертах процесс можно разделить на три основных этапа:

  1. создание новой генетической вариации
  2. выбор растений-кандидатов на основе определенных достоинств
  3. испытание, размножение и выпуск улучшенных сортов сельскохозяйственных культур

Разведение в его традиционном понимании сталкивается с недостатками на всех трех этапах, о которых мы расскажем в следующих статьях. Однако по своей сути у разведения есть две проблемы. Во-первых, это медленно. Даже при использовании современных методов селекции, таких как скоростная селекция (т. е. оптимизация шага 3), может потребоваться десятилетие, чтобы вывести новый сорт сельскохозяйственной культуры. Учитывая скорость изменений, с которыми сталкивается наше население и окружающая среда, этот временной масштаб просто невозможен. Во-вторых, и это, возможно, более важно, селекция обычно оптимизирует линию растений в соответствии с генетическим разнообразием, которое существует в текущей популяции.

Но сорта диких растений имеют генетическое разнообразие, Дом!

Помимо скорости, успех селекции в конечном счете определяется шагами 1 и 2 — нашей способностью создавать необходимую нам генетическую вариацию и нашей способностью выбирать растения на основе этой вариации. Если бы селекционной программе мирового класса была предоставлена ​​популяция генетически идентичных растений для разведения, они ничего не смогли бы сделать с этой популяцией. Поскольку ДНК кодирует белки, а экспрессия белков в конечном итоге определяет признаки высокого уровня, в популяции клонов нечего оптимизировать.

Из-за этого селекционеры десятилетиями были заинтересованы в том, чтобы ввести правильную генетическую вариацию в свои популяции растений. Дикие сорта растений гораздо более генетически разнообразны, чем элитные линии, которые обычно используются семеноводческими компаниями и часто рекламируются как основной источник генетического разнообразия. Однако, как сказано в недавнем исследовании:

выгода, полученная от использования [диких сортов] в селекции, представляет собой потенциальную розу между шипами вредной генетической изменчивости, которая связана с интересующим признаком

Проще говоря, хотя у дикого сорта может быть некоторая комбинация генов, которые делают его устойчивым к засухе, весьма вероятно, что он также имеет целый ряд других вариантов генов, которые наносят ущерб другим признакам, таким как урожайность. Это явление известно как перетаскивание связи, и оно является основным препятствием для доступа к дикому разнообразию.

Мутагенез — молоток, когда нужен пинцет

Так как же внести разнообразие в популяцию растений, чтобы оптимизировать их? Ответом на многие годы в селекции растений был мутагенез. Буквально, введение новых мутаций в ДНК растения — обычно с помощью химического или УФ-излучения. Затем облученные растения можно либо селекционировать на основе их характеристик, либо мы можем секвенировать их ДНК и идентифицировать семена, которые имеют мутации в интересующих генах. Согласно отчету 2007 года, за предыдущие два десятилетия было выпущено в продажу более 2500 сортов растений, охватывающих 175 видов.

Радиация очень эффективна при введении мутаций. Однако при этом возникает проблема, заключающаяся в том, что мы не можем контролировать, какие фрагменты ДНК мутируют. Даже если будет введена полезная мутация, весьма вероятно, что будет и целая куча других мутаций. В конечном итоге это означает, что мутационная селекция может страдать от того же сопротивления сцеплению, что и с дикими образцами.

Генетическое редактирование позволяет ввести точное разнообразие

Все вышеизложенное прекрасно подводит нас к тому, почему люди так взволнованы потенциалом CRISPR в развитии сельскохозяйственных культур. Возможность редактировать точные фрагменты ДНК дает очень тонкий контроль над тем, какие вариации мы вносим в ДНК растений, и, следовательно, теоретически контроль над любыми признаками растения за более короткие периоды времени и с меньшим количеством побочных эффектов. как потеря урожая.

Неудивительно, что в ближайшее десятилетие ожидается значительный рост рынка генно-отредактированных культур. Только за последние два месяца на рынке произошло три знаковых события:

  1. В марте правительство Великобритании отменило регулирование культур с отредактированными генами, чтобы юридически считать их той же группой, что и культуры, полученные путем мутационной селекции.
  2. Британская биотехнологическая компания Tropic Biosciences получила лицензию на свой генно-отредактированный нетемнеющий банан как первую культуру с отредактированным геномом, получившую лицензию на Филиппинах.
  3. Американская компания PairWise food дебютировала свой генетически отредактированный бренд Conscious Greens в ресторанах США.

Итак, почему Биографика?

Таким образом, CRISPR и другие методы редактирования генов открывают большие перспективы для ускорения развития продуктивного и устойчивого сельского хозяйства. Однако есть одна главная загвоздка. Чтобы использовать CRISPR в качестве метода внесения целевых изменений в наши культуры, мы должны знать, на что ориентироваться. Это процесс, называемый открытием генов, и он является основным узким местом в жизненном цикле исследований и разработок в области развития культур с отредактированными генами. Недавнее исследование показало, что современные методы обнаружения генов могут иметь вероятность успеха всего лишь в 5%:

В настоящее время в этой области имеется чрезвычайно точный инструмент редактирования и крайне неточные методы принятия решения о том, что редактировать. В процессе поиска клиентов мы обнаружили, что до 95% времени НИОКР тратится на ручной поиск литературы. Вдобавок к этому проблемы разреженности данных мешают наукам о растениях — менее 1% растительных белков было экспериментально охарактеризовано на молекулярном уровне. Традиционные экспериментальные методы не позволяют на самом деле определить приоритеты генов и изменений, представляющих интерес для данного признака. Подробнее обо всем этом в будущих сообщениях в блоге.

Таким образом, улучшение обнаружения генов — это деятельность с высокой долей заемных средств. Увеличение показателя успеха даже до 1/3 привело бы к экономии буквально 10 миллионов фунтов стерлингов в процессе развития сельскохозяйственных культур. Кроме того, более низкие затраты, естественно, привели бы к развитию большего разнообразия культур и признаков. Это миссия Биографики. Мы хотим быть первым поставщиком высококачественных генных мишеней для сельскохозяйственной отрасли в больших масштабах.

В будущих постах я расскажу, как мы собираемся достичь этого с помощью графического машинного обучения, итеративной лабораторной проверки, НЛП и некоторых интересных новых подходов к редактированию генов.