В Produvia мы производим интеллектуальное программное обеспечение. Мы также пишем письма об искусственном интеллекте (ИИ) основателям, руководителям и лицам, принимающим решения из всех отраслей. Эти письма призваны вдохновлять и мотивировать компании, государственные учреждения и страны на темы ИИ, машинного обучения и технологий глубокого обучения.

Мы считаем, что технологии искусственного интеллекта коренным образом изменят то, как стартапы и компании в области геномики, биотехнологии и наук о жизни превращают данные в практические идеи.

Прежде чем говорить об искусственном интеллекте, важно сначала разобраться в индустрии геномики.

Геномная промышленность

Мировая отрасль геномики оценивается в 16,4 миллиарда долларов по состоянию на 2018 год и, как ожидается, к 2025 году достигнет 41,2 миллиарда долларов. Индустрия геномики состоит из геномных продуктов и услуг. Ожидается, что геномные продукты будут доминировать на рынке из-за периодического использования инструментов и реагентов для исследований в области геномики и растущего числа исследовательских программ, проводимых государственными и частными организациями. Услуги по геномике включают секвенирование следующего поколения, базовую геномику, перевод биомаркеров и многое другое. [1]

Согласно AngelList, существует более 160 геномных; 4228+ биотехнологий; 9 893+ наук о жизни; и 4 893 827+ стартапов по всему миру [2-5]. Другими словами, геномные стартапы составляют около 4 процентов биотехнологической отрасли, 2 процента биотехнологической отрасли и 3/1000 процентов всех стартапов.

Сегодня индустрия геномики переживает бум благодаря растущему объему данных. Согласно прогнозам, данные по геномике в ближайшие 10 лет будут равны и превзойдут другие дисциплины, требующие обработки больших объемов данных, включая социальные сети и онлайн-видео. [6]

Искусственный интеллект в геномике

В Produvia мы прогнозируем, что геномные стартапы, сочетающие глубокое обучение, компьютерное зрение и технологии обработки естественного языка, обеспечат конкурентное преимущество на рынке.

Глубокое обучение, подраздел искусственного интеллекта, сочетается с методами компьютерного зрения для анализа растущего количества данных изображений геномики. В компьютерном зрении к превосходным алгоритмам глубокого обучения относятся сверточные нейронные сети и рекуррентные нейронные сети. Эти модели машинного обучения решают задачи компьютерного зрения, такие как классификация изображений, семантическая сегментация и поиск изображений.

Глубокое обучение также сочетается с методами обработки естественного языка для анализа растущего количества текста, связанного с геномикой, который можно найти в общедоступных исследовательских работах. Глубокие нейронные сети решают такие задачи, как распознавание именованных сущностей, извлечение отношений и поиск информации. Технологии глубокого обучения идеально подходят для решения задач обработки естественного языка, поскольку они обеспечивают высочайшую производительность и преодолевают проблемы, связанные с проектированием функций.

В Produvia мы осознаем сложность применения искусственного интеллекта в области геномики. В результате мы написали эту статью в качестве руководства для всех заинтересованных сторон, включая пациентов, участников исследования, общественность, поставщиков, исследователей, группы защиты, плательщиков и политиков.

Как искусственный интеллект и геномика спасут планету

В 2015 году Организация Объединенных Наций (ООН) поставила семнадцать глобальных целей, также известных как цели в области устойчивого развития (ЦУР). ЦУР были приняты всеми государствами-членами ООН как универсальный призыв к действию положить конец бедности, защитить планету и обеспечить мир и процветание всем людям к 2030 году [6].

Из семнадцати ЦУР команда Produvia определила пять целей, которые можно решить с помощью технологий геномики и искусственного интеллекта.

Цель искусственного интеллекта №1: искоренение бедности

Можем ли мы действительно положить конец бедности? Можем ли мы вырастить средний класс? На эти вопросы действительно сложно ответить. Спутниковые изображения были объединены с машинным обучением для прогнозирования бедности [7]. Бедность связана с болезнями, хроническими заболеваниями, детским ожирением, повышенным уровнем свинца в крови, академическими достижениями и метилированием ДНК [8–12]. Как машинное обучение может помочь в устранении этих геномных причин или корреляций? Если мы сможем предсказать болезнь или метилирование ДНК в генах, мы сможем принять превентивные меры в борьбе с бедностью.

Цель искусственного интеллекта № 2: искоренение голода

Как человечество может покончить с голодом? Сможем ли мы обеспечить стабильное снабжение продуктами питания? Можем ли мы положить конец скрытому голоду, также известному как дефицит питательных микроэлементов? Определенные гормоны, регулирующие чувство голода и насыщения [13]. Голод можно обнаружить у плачущих младенцев с помощью глубокого обучения [14]. Анализ того, как люди едят или их модели потребления, может выявить скрытый голод или пробелы в дефиците питательных микроэлементов. Могут ли люди улучшить питание и продвигать устойчивое сельское хозяйство? Чтобы ответить на эти вопросы, примите во внимание, что селекция растений и другие сельскохозяйственные технологии значительно улучшаются с помощью машинного обучения. Повышение урожайности сократит разрыв между урожайностью и голодом. Генетическое улучшение культурных сортов и улучшение агрономической практики - один из способов повышения урожайности сельскохозяйственных культур [15]. Если мы сделаем сельское хозяйство более продуктивным, мы сможем уменьшить голод в мире.

Цель ИИ № 3: хорошее здоровье и благополучие

Можем ли мы жить более здоровой жизнью? Можем ли мы способствовать благополучию всего человечества? Благодаря глубокому обучению теперь возможно более точное выявление СПИДа, туберкулеза, малярии и забытых тропических болезней. Представьте себе возможность создавать персонализированные геномные профили каждого человека на Земле. Это позволит нам прогнозировать вспышку заболеваний, зная, в чем заключается уязвимость. Человечество имеет возможность редактировать репродукцию человека. С помощью редактирования генов мы можем создать следующее поколение людей, невосприимчивых к новейшим болезням и типичным состояниям здоровья. Сочетание редактирования генов с машинным обучением позволит человечеству создавать индивидуальные генетические и геномные профили людей. Если мы сможем лучше понять, как процесс старения влияет на здоровье и долголетие, мы сможем создать более здоровые общества. Сегодня мы можем использовать глубокое обучение для обнаружения изменений биомаркеров (то есть физиологических переменных, составных индексов), используя данные лонгитюдных исследований.

Цель искусственного интеллекта №4: жизнь под водой

Можем ли мы сохранить жизнь в океане? Может ли человечество рационально использовать океаны, моря и морские ресурсы? Геномика и машинное обучение могут решить множество проблем, чтобы обеспечить продолжение жизни под водой. Например, мы можем классифицировать кислотность океана, чтобы сократить сокращающиеся запасы рыбы. Мы можем применять природоохранную геномику с технологиями глубокого обучения для прогнозирования биоразнообразия живых организмов. Можем ли мы улучшить нашу аквакультуру? За последние несколько десятилетий достижения сельскохозяйственной биотехнологии изменили способ анализа исследований. Сегодня использование геномных данных анализируется с помощью различных вычислительных инструментов, включая машинное обучение или глубокое обучение.

Цель ИИ №5: жизнь на суше

Можем ли мы защитить нашу экосистему? Можем ли мы восстановить и продвигать устойчивое использование наземных экосистем, устойчивое управление лесами, борьбу с опустыниванием? Наконец, может ли человечество остановить и обратить вспять деградацию земель и остановить утрату биоразнообразия? Понимание сложных экосистем и того, как окружающая среда влияет на гены, стало возможным благодаря технологиям машинного обучения. Глубокое обучение может соответствовать метаболическому моделированию в масштабе генома [16]. Технологии машинного обучения продемонстрировали способность анализировать большие и сложные биологические данные. Более того, массовый и быстрый прогресс в методологиях генерации биологических данных и машинного обучения многообещающе для дальнейшего понимания геномики и биологических данных. Теперь можно классифицировать роли микробов в экосистемах с помощью глубокого обучения [17]. Геномные инструменты, такие как популяционная геномика, мета-омика и редактирование генома, также могут восстанавливать экосистемы и биоразнообразие. Метаомика может улучшить оценку и мониторинг результатов восстановления. Редактирование генов может генерировать новые генотипы для восстановления сложной окружающей среды. Использование машинного обучения для анализа данных популяционной геномики, мета-омики и редактирования генома поможет компаниям в разработке решений для улучшения жизни на Земле.

Исследования искусственного интеллекта в геномике

Исследования в области искусственного интеллекта приводят к технологическим прорывам во всех отраслях промышленности, включая геномику. Чтение научных статей требует времени, а технический язык нелегко понять. В Produvia, напротив, мы всегда в курсе последних научных исследований, так что вам не придется. Ниже мы выделяем 20 примеров использования ИИ и машинного обучения для геномики [18–26]:

Геномика

Геномика - это междисциплинарная область биологии, в которой основное внимание уделяется структуре, функциям, эволюции, картированию и редактированию геномов. Вот пять приложений искусственного интеллекта и машинного обучения для геномики:

  1. Извлечение геномных и эпигеномных вариантов, имеющих клиническую ценность
  2. Определить гены
  3. Предсказать геномные ассоциации
  4. Прогнозировать функции белка
  5. Предсказать последовательность и специфичность ДНК и РНК-связывающих белков.

Нормативная геномика

Регуляторная геномика - это изучение участков или особенностей генома и того, как они регулируют гены. В Produvia мы перечисляем пять приложений искусственного интеллекта и машинного обучения для регуляторной геномики:

  1. Классифицируйте экспрессию генов
  2. Прогнозировать экспрессию генов по генотипу
  3. Прогнозировать промоторы и энхансеры
  4. Прогнозирование сращивания
  5. Прогнозировать факторы транскрипции и РНК-связывающие белки

Функциональная геномика

Функциональная геномика - это область молекулярной биологии, которая пытается описать функции и взаимодействия генов. Вот пять приложений ИИ для функциональной геномики:

  1. Классифицируйте мутации и функциональную активность
  2. Классифицируйте субклеточную локализацию
  3. Прогнозировать промоторы и энхансеры
  4. Прогнозирование сращивания
  5. Прогнозировать факторы транскрипции и РНК-связывающие белки

Структурная геномика

Структурная геномика - это область геномики, которая включает характеристику структур генома. В Produvia мы перечисляем пять приложений искусственного интеллекта и машинного обучения для структурной геномики:

  1. Классифицируйте третичные структуры белков
  2. Классифицируйте структуры белков
  3. Предсказать карты контактов
  4. Прогнозировать физические свойства
  5. Прогнозировать вторичные структуры белков

Идеи искусственного интеллекта для геномики

Вы интересуетесь искусственным интеллектом и машинным обучением, но не знаете, с чего начать. В Produvia мы придумали несколько идей по применению технологий искусственного интеллекта в геномике. Вот тридцать пять идей ИИ для геномики:

  1. Аннотируйте гены на основе структуры и хромосом
  2. Классифицируйте рак по профилям экспрессии генов
  3. Классифицируйте гены
  4. Классифицируйте геномные профили
  5. Классифицируйте типы мутаций
  6. Дизайн целенаправленной терапии
  7. Обнаружение участков дезоксирибонуклеиновой кислоты, которые позволяют прогнозировать экспрессию генов
  8. Определите взаимосвязь между генотипами и фенотипом
  9. Откройте для себя препараты для геномной медицины
  10. Различают рак и аденому
  11. Оценить распространенность меток хроматина
  12. Извлечь шаблоны транскриптомов
  13. Определите биомаркеры болезни
  14. Определите энхансеры
  15. Выявление попарных ассоциаций переменных между типами геномных данных
  16. Определить позиционированные нуклеосомы
  17. Выявить потенциально ценные биомаркеры болезней
  18. Определите промоутеров
  19. Определите подтип опухоли рака груди
  20. Определить сайты связывания факторов транскрипции
  21. Определите сайты начала транскрипции, сайты сплайсинга, экзоны
  22. Интерпретировать регуляторный контроль в отдельных клетках
  23. Типовые регулирующие элементы
  24. Разделите и пометьте геном с помощью аннотации состояния хроматина
  25. Прогнозирование меток хроматина на основе последовательностей дезоксирибонуклеиновой кислоты
  26. Предсказать фенотип заболевания или прогноз
  27. Прогнозировать функцию гена
  28. Прогнозировать генетические взаимодействия
  29. Прогнозирование белковых основ на основе белковых последовательностей
  30. Прогнозировать регулирующие функции и отношения
  31. Предсказать последовательность, специфичность энхансерных и цис-регуляторных областей
  32. Предсказать специфичность белков, связывающих дезоксирибонуклеиновую кислоту и рибонуклеиновую кислоту.
  33. Предсказать активность сплайсинга отдельных экзонов
  34. Прогнозировать вредоносность вариантов
  35. Количественно оценить влияние однонуклеотидных вариантов на доступность хроматина

Проблемы и возможности в геномике

Использование технологий искусственного интеллекта для решения задач геномики создает множество проблем. Эти отраслевые проблемы также открывают возможности для поставщиков технологий искусственного интеллекта, таких как Produvia, для решения рыночных проблем и создания решений на основе искусственного интеллекта. Ниже мы перечисляем три возможности геномики:

  1. Создание достоверных меток или наборов данных геномики может быть дорогостоящим
  2. Необходимо обратить внимание на законы «Право на объяснение».
  3. Требуются лонгитюдные исследования.

Как компании, работающие с ИИ, могут преодолеть эти проблемы? В Produvia мы верим, что отраслевое сотрудничество преодолеет Вызов №1, алгоритмическая прозрачность преодолеет Вызов №2, а долгосрочные исследовательские проекты преодолеют Вызов №3.

Будущее ярче благодаря искусственному интеллекту и геномике

Сочетание технологий искусственного интеллекта и геномики может положить конец бедности, положить конец голоду, защитить, восстановить и поддержать водные и наземные экосистемы.

Заинтересованы в разработке специального программного обеспечения для искусственного интеллекта и машинного обучения? Посетите сайт Produvia, чтобы начать проект AI с нашей командой.

Хотите стать партнером Produvia, партнера Google по решениям для искусственного интеллекта и машинного обучения? Посетите веб-страницу Produvia Partnerships, чтобы сотрудничать с нашей командой.

использованная литература

  1. Исследования, З. (2019). К 2025 году мировой рынок геномики достигнет 41,2 миллиарда долларов: исследование Zion Market Research. Комната новостей GlobeNewswire. Получено 1 сентября 2019 г. с сайта https://www.globenewswire.com/news-release/2019/04/10/1801776/0/en/Global-Genomics-Market-Will-Reach-USD-41-2-Billion. -К 2025-Zion-Market-Research.html
  2. Геномика Стартапы. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/genomics-2.
  3. Биотехнологические стартапы. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/biotechnology.
  4. Стартапы в области наук о жизни. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/life-sciences.
  5. Все стартапы Стартапы. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/all-markets.
  6. dpicampaigns. (2018). О целях устойчивого развития - Устойчивое развитие Организации Объединенных Наций. Получено 26 октября 2019 г. с веб-сайта ООН по устойчивому развитию: https://www.un.org/sustainabledevelopment/sustainable-development-goals/
  7. Джин Н., Берк М., Се М., Дэвис В. М., Лобелл Д. Б. и Эрмон С. (2016). Сочетание спутниковых снимков и машинного обучения для прогнозирования бедности. Наука, 353 (6301), 790–794. Https://doi.org/10.1126/science.aaf7894
  8. Глобальные различия в геномике после персонализированных медицинских услуг: Международный журнал медицинской инженерии и информатики: Том 1, № 4. (2009). Получено 27 октября 2019 г. с веб-сайта Международного журнала медицинской инженерии и информатики: https://www.inderscienceonline.com/doi/abs/10.1504/IJMEI.2009.026812
  9. Ньюачек, П. В. (1994). Бедность и детские хронические болезни. Архив педиатрии и подростковой медицины, 148 (11), 1143. https://doi.org/10.1001/archpedi.1994.02170110029005
  10. Чокши, Д. А. (2018). Доход, бедность и неравенство в отношении здоровья. JAMA, 319 (13), 1312. https://doi.org/10.1001/jama.2018.2521
  11. Векслер, Б. Э., Имал, Ахмет Эсат, Питтман, Б., и Белл, М. Д. (2019). Дефицит исполнительной функции опосредует влияние бедности на академическую успеваемость: важная цель для мероприятий по улучшению нейрокогнитивного развития у детей из групп риска. Получено 27 октября 2019 г. с веб-сайта Ssrn.com: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3369774
  12. Бедность оставляет след в наших генах. (2019). Получено 26 октября 2019 г. с веб-сайта Northwestern.edu: https://news.northwestern.edu/stories/2019/04/poverty-leaves-a-mark-on-our-genes/
  13. Месмар, Б., и Стейнле, Н. (2020). Геномика пищевого поведения и регуляции аппетита. Принципы нутригенетики и нутригеномики, 159–165. Https://doi.org/10.1016/b978-0-12-804572-5.00020-3
  14. Барахас-Монтьель, С. Э., и Рейес-Гарсия, К. А. (2019). Определение боли и голода у младенцев с помощью ансамблей классификаторов. Международная конференция по вычислительному интеллекту для моделирования, управления и автоматизации и Международная конференция по интеллектуальным агентам, веб-технологиям и интернет-торговле (CIMCA-IAWTIC’06). Https://doi.org/10.1109/cimca.2005.1631561
  15. Боррил, П., Харрингтон, С. А., и Уауи, К. (2018). Применение последних достижений в области геномики и феномены для обнаружения признаков полиплоидной пшеницы. Журнал растений. Https://doi.org/10.1111/tpj.14150
  16. Зампиери, Г., Виджаякумар, С., Янеске, Э., и Ангионе, К. (2019). Машинное и глубокое обучение соответствуют метаболическому моделированию в масштабе генома. PLOS Computational Biology, 15 (7), e1007084. Https://doi.org/10.1371/journal.pcbi.1007084
  17. Хэндли, К. М. (2019). Определение роли микробов в функции экосистемы: переосмысление микробных пищевых цепей и преодоление барьеров царства. MSystems, 4 (3). Https://doi.org/10.1128/msystems.00153-19
  18. Акдемир, Д. (2013). Матрицы локально эпистатических геномных отношений для геномной ассоциации, прогнозирования и отбора. arXiv.org. Получено 18 сентября 2019 г. с сайта https://arxiv.org/abs/1302.3463.
  19. Ходли, Э. (2011). Объяснение совместных и индивидуальных вариаций (JIVE) для комплексного анализа нескольких типов данных. ArXiv E-Prints, arXiv: 1102.4110. Получено с https://ui.adsabs.harvard.edu/abs/2011arXiv1102.4110L/abstract.
  20. ‌ Авторы Википедии. (2019, 23 октября). Цели устойчивого развития. Получено 26 октября 2019 г. с веб-сайта Википедии: https://en.wikipedia.org/wiki/Sustainable_Development_Goals
  21. ‌Глубокое обучение анализу медицинских изображений. (2019). @AnnualReviews. Получено 7 октября 2019 г. с сайта https://www.annualreviews.org/doi/10.1146/annurev-bioeng-071516-044442.
  22. ‌SDGs.:. Платформа знаний об устойчивом развитии. (2015). Получено 26 октября 2019 г. с веб-сайта Un.org: https://sustainabledevelopment.un.org/topics/sustainabledevelopmentgoals.
  23. ‌Глубокое изучение геномики. (2018). Nature Genetics, 51 (1), 1–1. DOI: 10,1038 / s41588–018–0328–0
  24. ‌Сюн, М., и Ма, Л. (2013). Эффективный достаточный метод уменьшения размеров для выявления генетических вариантов клинической значимости. arXiv.org. Получено 18 сентября 2019 г. с сайта https://arxiv.org/abs/1301.3528.
  25. ‌Квак, Г. Х.-Дж., и Хуэй, П. (2019). DeepHealth: глубокое обучение для информатики здоровья. Получено 28 октября 2019 г. с веб-сайта arXiv.org: https://arxiv.org/abs/1909.00384.
  26. ‌Диналанкара, В., Браво, Х. (2013). Классификация аномалий с помощью машины антипрофильных опорных векторов. arXiv.org. Получено 18 сентября 2019 г. с сайта https://arxiv.org/abs/1301.3514.

Этот пост впервые появился в блоге Produvia 28 октября 2019 года.