В Produvia мы производим интеллектуальное программное обеспечение. Мы также пишем письма об искусственном интеллекте (ИИ) основателям, руководителям и лицам, принимающим решения из всех отраслей. Эти письма призваны вдохновлять и мотивировать компании, государственные учреждения и страны на темы ИИ, машинного обучения и технологий глубокого обучения.
Мы считаем, что технологии искусственного интеллекта коренным образом изменят то, как стартапы и компании в области геномики, биотехнологии и наук о жизни превращают данные в практические идеи.
Прежде чем говорить об искусственном интеллекте, важно сначала разобраться в индустрии геномики.
Геномная промышленность
Мировая отрасль геномики оценивается в 16,4 миллиарда долларов по состоянию на 2018 год и, как ожидается, к 2025 году достигнет 41,2 миллиарда долларов. Индустрия геномики состоит из геномных продуктов и услуг. Ожидается, что геномные продукты будут доминировать на рынке из-за периодического использования инструментов и реагентов для исследований в области геномики и растущего числа исследовательских программ, проводимых государственными и частными организациями. Услуги по геномике включают секвенирование следующего поколения, базовую геномику, перевод биомаркеров и многое другое. [1]
Согласно AngelList, существует более 160 геномных; 4228+ биотехнологий; 9 893+ наук о жизни; и 4 893 827+ стартапов по всему миру [2-5]. Другими словами, геномные стартапы составляют около 4 процентов биотехнологической отрасли, 2 процента биотехнологической отрасли и 3/1000 процентов всех стартапов.
Сегодня индустрия геномики переживает бум благодаря растущему объему данных. Согласно прогнозам, данные по геномике в ближайшие 10 лет будут равны и превзойдут другие дисциплины, требующие обработки больших объемов данных, включая социальные сети и онлайн-видео. [6]
Искусственный интеллект в геномике
В Produvia мы прогнозируем, что геномные стартапы, сочетающие глубокое обучение, компьютерное зрение и технологии обработки естественного языка, обеспечат конкурентное преимущество на рынке.
Глубокое обучение, подраздел искусственного интеллекта, сочетается с методами компьютерного зрения для анализа растущего количества данных изображений геномики. В компьютерном зрении к превосходным алгоритмам глубокого обучения относятся сверточные нейронные сети и рекуррентные нейронные сети. Эти модели машинного обучения решают задачи компьютерного зрения, такие как классификация изображений, семантическая сегментация и поиск изображений.
Глубокое обучение также сочетается с методами обработки естественного языка для анализа растущего количества текста, связанного с геномикой, который можно найти в общедоступных исследовательских работах. Глубокие нейронные сети решают такие задачи, как распознавание именованных сущностей, извлечение отношений и поиск информации. Технологии глубокого обучения идеально подходят для решения задач обработки естественного языка, поскольку они обеспечивают высочайшую производительность и преодолевают проблемы, связанные с проектированием функций.
В Produvia мы осознаем сложность применения искусственного интеллекта в области геномики. В результате мы написали эту статью в качестве руководства для всех заинтересованных сторон, включая пациентов, участников исследования, общественность, поставщиков, исследователей, группы защиты, плательщиков и политиков.
Как искусственный интеллект и геномика спасут планету
В 2015 году Организация Объединенных Наций (ООН) поставила семнадцать глобальных целей, также известных как цели в области устойчивого развития (ЦУР). ЦУР были приняты всеми государствами-членами ООН как универсальный призыв к действию положить конец бедности, защитить планету и обеспечить мир и процветание всем людям к 2030 году [6].
Из семнадцати ЦУР команда Produvia определила пять целей, которые можно решить с помощью технологий геномики и искусственного интеллекта.
Цель искусственного интеллекта №1: искоренение бедности
Можем ли мы действительно положить конец бедности? Можем ли мы вырастить средний класс? На эти вопросы действительно сложно ответить. Спутниковые изображения были объединены с машинным обучением для прогнозирования бедности [7]. Бедность связана с болезнями, хроническими заболеваниями, детским ожирением, повышенным уровнем свинца в крови, академическими достижениями и метилированием ДНК [8–12]. Как машинное обучение может помочь в устранении этих геномных причин или корреляций? Если мы сможем предсказать болезнь или метилирование ДНК в генах, мы сможем принять превентивные меры в борьбе с бедностью.
Цель искусственного интеллекта № 2: искоренение голода
Как человечество может покончить с голодом? Сможем ли мы обеспечить стабильное снабжение продуктами питания? Можем ли мы положить конец скрытому голоду, также известному как дефицит питательных микроэлементов? Определенные гормоны, регулирующие чувство голода и насыщения [13]. Голод можно обнаружить у плачущих младенцев с помощью глубокого обучения [14]. Анализ того, как люди едят или их модели потребления, может выявить скрытый голод или пробелы в дефиците питательных микроэлементов. Могут ли люди улучшить питание и продвигать устойчивое сельское хозяйство? Чтобы ответить на эти вопросы, примите во внимание, что селекция растений и другие сельскохозяйственные технологии значительно улучшаются с помощью машинного обучения. Повышение урожайности сократит разрыв между урожайностью и голодом. Генетическое улучшение культурных сортов и улучшение агрономической практики - один из способов повышения урожайности сельскохозяйственных культур [15]. Если мы сделаем сельское хозяйство более продуктивным, мы сможем уменьшить голод в мире.
Цель ИИ № 3: хорошее здоровье и благополучие
Можем ли мы жить более здоровой жизнью? Можем ли мы способствовать благополучию всего человечества? Благодаря глубокому обучению теперь возможно более точное выявление СПИДа, туберкулеза, малярии и забытых тропических болезней. Представьте себе возможность создавать персонализированные геномные профили каждого человека на Земле. Это позволит нам прогнозировать вспышку заболеваний, зная, в чем заключается уязвимость. Человечество имеет возможность редактировать репродукцию человека. С помощью редактирования генов мы можем создать следующее поколение людей, невосприимчивых к новейшим болезням и типичным состояниям здоровья. Сочетание редактирования генов с машинным обучением позволит человечеству создавать индивидуальные генетические и геномные профили людей. Если мы сможем лучше понять, как процесс старения влияет на здоровье и долголетие, мы сможем создать более здоровые общества. Сегодня мы можем использовать глубокое обучение для обнаружения изменений биомаркеров (то есть физиологических переменных, составных индексов), используя данные лонгитюдных исследований.
Цель искусственного интеллекта №4: жизнь под водой
Можем ли мы сохранить жизнь в океане? Может ли человечество рационально использовать океаны, моря и морские ресурсы? Геномика и машинное обучение могут решить множество проблем, чтобы обеспечить продолжение жизни под водой. Например, мы можем классифицировать кислотность океана, чтобы сократить сокращающиеся запасы рыбы. Мы можем применять природоохранную геномику с технологиями глубокого обучения для прогнозирования биоразнообразия живых организмов. Можем ли мы улучшить нашу аквакультуру? За последние несколько десятилетий достижения сельскохозяйственной биотехнологии изменили способ анализа исследований. Сегодня использование геномных данных анализируется с помощью различных вычислительных инструментов, включая машинное обучение или глубокое обучение.
Цель ИИ №5: жизнь на суше
Можем ли мы защитить нашу экосистему? Можем ли мы восстановить и продвигать устойчивое использование наземных экосистем, устойчивое управление лесами, борьбу с опустыниванием? Наконец, может ли человечество остановить и обратить вспять деградацию земель и остановить утрату биоразнообразия? Понимание сложных экосистем и того, как окружающая среда влияет на гены, стало возможным благодаря технологиям машинного обучения. Глубокое обучение может соответствовать метаболическому моделированию в масштабе генома [16]. Технологии машинного обучения продемонстрировали способность анализировать большие и сложные биологические данные. Более того, массовый и быстрый прогресс в методологиях генерации биологических данных и машинного обучения многообещающе для дальнейшего понимания геномики и биологических данных. Теперь можно классифицировать роли микробов в экосистемах с помощью глубокого обучения [17]. Геномные инструменты, такие как популяционная геномика, мета-омика и редактирование генома, также могут восстанавливать экосистемы и биоразнообразие. Метаомика может улучшить оценку и мониторинг результатов восстановления. Редактирование генов может генерировать новые генотипы для восстановления сложной окружающей среды. Использование машинного обучения для анализа данных популяционной геномики, мета-омики и редактирования генома поможет компаниям в разработке решений для улучшения жизни на Земле.
Исследования искусственного интеллекта в геномике
Исследования в области искусственного интеллекта приводят к технологическим прорывам во всех отраслях промышленности, включая геномику. Чтение научных статей требует времени, а технический язык нелегко понять. В Produvia, напротив, мы всегда в курсе последних научных исследований, так что вам не придется. Ниже мы выделяем 20 примеров использования ИИ и машинного обучения для геномики [18–26]:
Геномика
Геномика - это междисциплинарная область биологии, в которой основное внимание уделяется структуре, функциям, эволюции, картированию и редактированию геномов. Вот пять приложений искусственного интеллекта и машинного обучения для геномики:
- Извлечение геномных и эпигеномных вариантов, имеющих клиническую ценность
- Определить гены
- Предсказать геномные ассоциации
- Прогнозировать функции белка
- Предсказать последовательность и специфичность ДНК и РНК-связывающих белков.
Нормативная геномика
Регуляторная геномика - это изучение участков или особенностей генома и того, как они регулируют гены. В Produvia мы перечисляем пять приложений искусственного интеллекта и машинного обучения для регуляторной геномики:
- Классифицируйте экспрессию генов
- Прогнозировать экспрессию генов по генотипу
- Прогнозировать промоторы и энхансеры
- Прогнозирование сращивания
- Прогнозировать факторы транскрипции и РНК-связывающие белки
Функциональная геномика
Функциональная геномика - это область молекулярной биологии, которая пытается описать функции и взаимодействия генов. Вот пять приложений ИИ для функциональной геномики:
- Классифицируйте мутации и функциональную активность
- Классифицируйте субклеточную локализацию
- Прогнозировать промоторы и энхансеры
- Прогнозирование сращивания
- Прогнозировать факторы транскрипции и РНК-связывающие белки
Структурная геномика
Структурная геномика - это область геномики, которая включает характеристику структур генома. В Produvia мы перечисляем пять приложений искусственного интеллекта и машинного обучения для структурной геномики:
- Классифицируйте третичные структуры белков
- Классифицируйте структуры белков
- Предсказать карты контактов
- Прогнозировать физические свойства
- Прогнозировать вторичные структуры белков
Идеи искусственного интеллекта для геномики
Вы интересуетесь искусственным интеллектом и машинным обучением, но не знаете, с чего начать. В Produvia мы придумали несколько идей по применению технологий искусственного интеллекта в геномике. Вот тридцать пять идей ИИ для геномики:
- Аннотируйте гены на основе структуры и хромосом
- Классифицируйте рак по профилям экспрессии генов
- Классифицируйте гены
- Классифицируйте геномные профили
- Классифицируйте типы мутаций
- Дизайн целенаправленной терапии
- Обнаружение участков дезоксирибонуклеиновой кислоты, которые позволяют прогнозировать экспрессию генов
- Определите взаимосвязь между генотипами и фенотипом
- Откройте для себя препараты для геномной медицины
- Различают рак и аденому
- Оценить распространенность меток хроматина
- Извлечь шаблоны транскриптомов
- Определите биомаркеры болезни
- Определите энхансеры
- Выявление попарных ассоциаций переменных между типами геномных данных
- Определить позиционированные нуклеосомы
- Выявить потенциально ценные биомаркеры болезней
- Определите промоутеров
- Определите подтип опухоли рака груди
- Определить сайты связывания факторов транскрипции
- Определите сайты начала транскрипции, сайты сплайсинга, экзоны
- Интерпретировать регуляторный контроль в отдельных клетках
- Типовые регулирующие элементы
- Разделите и пометьте геном с помощью аннотации состояния хроматина
- Прогнозирование меток хроматина на основе последовательностей дезоксирибонуклеиновой кислоты
- Предсказать фенотип заболевания или прогноз
- Прогнозировать функцию гена
- Прогнозировать генетические взаимодействия
- Прогнозирование белковых основ на основе белковых последовательностей
- Прогнозировать регулирующие функции и отношения
- Предсказать последовательность, специфичность энхансерных и цис-регуляторных областей
- Предсказать специфичность белков, связывающих дезоксирибонуклеиновую кислоту и рибонуклеиновую кислоту.
- Предсказать активность сплайсинга отдельных экзонов
- Прогнозировать вредоносность вариантов
- Количественно оценить влияние однонуклеотидных вариантов на доступность хроматина
Проблемы и возможности в геномике
Использование технологий искусственного интеллекта для решения задач геномики создает множество проблем. Эти отраслевые проблемы также открывают возможности для поставщиков технологий искусственного интеллекта, таких как Produvia, для решения рыночных проблем и создания решений на основе искусственного интеллекта. Ниже мы перечисляем три возможности геномики:
- Создание достоверных меток или наборов данных геномики может быть дорогостоящим
- Необходимо обратить внимание на законы «Право на объяснение».
- Требуются лонгитюдные исследования.
Как компании, работающие с ИИ, могут преодолеть эти проблемы? В Produvia мы верим, что отраслевое сотрудничество преодолеет Вызов №1, алгоритмическая прозрачность преодолеет Вызов №2, а долгосрочные исследовательские проекты преодолеют Вызов №3.
Будущее ярче благодаря искусственному интеллекту и геномике
Сочетание технологий искусственного интеллекта и геномики может положить конец бедности, положить конец голоду, защитить, восстановить и поддержать водные и наземные экосистемы.
Заинтересованы в разработке специального программного обеспечения для искусственного интеллекта и машинного обучения? Посетите сайт Produvia, чтобы начать проект AI с нашей командой.
Хотите стать партнером Produvia, партнера Google по решениям для искусственного интеллекта и машинного обучения? Посетите веб-страницу Produvia Partnerships, чтобы сотрудничать с нашей командой.
использованная литература
- Исследования, З. (2019). К 2025 году мировой рынок геномики достигнет 41,2 миллиарда долларов: исследование Zion Market Research. Комната новостей GlobeNewswire. Получено 1 сентября 2019 г. с сайта https://www.globenewswire.com/news-release/2019/04/10/1801776/0/en/Global-Genomics-Market-Will-Reach-USD-41-2-Billion. -К 2025-Zion-Market-Research.html
- Геномика Стартапы. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/genomics-2.
- Биотехнологические стартапы. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/biotechnology.
- Стартапы в области наук о жизни. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/life-sciences.
- Все стартапы Стартапы. (2019, 26 октября). Получено 26 октября 2019 г. с веб-сайта AngelList: https://angel.co/all-markets.
- dpicampaigns. (2018). О целях устойчивого развития - Устойчивое развитие Организации Объединенных Наций. Получено 26 октября 2019 г. с веб-сайта ООН по устойчивому развитию: https://www.un.org/sustainabledevelopment/sustainable-development-goals/
- Джин Н., Берк М., Се М., Дэвис В. М., Лобелл Д. Б. и Эрмон С. (2016). Сочетание спутниковых снимков и машинного обучения для прогнозирования бедности. Наука, 353 (6301), 790–794. Https://doi.org/10.1126/science.aaf7894
- Глобальные различия в геномике после персонализированных медицинских услуг: Международный журнал медицинской инженерии и информатики: Том 1, № 4. (2009). Получено 27 октября 2019 г. с веб-сайта Международного журнала медицинской инженерии и информатики: https://www.inderscienceonline.com/doi/abs/10.1504/IJMEI.2009.026812
- Ньюачек, П. В. (1994). Бедность и детские хронические болезни. Архив педиатрии и подростковой медицины, 148 (11), 1143. https://doi.org/10.1001/archpedi.1994.02170110029005
- Чокши, Д. А. (2018). Доход, бедность и неравенство в отношении здоровья. JAMA, 319 (13), 1312. https://doi.org/10.1001/jama.2018.2521
- Векслер, Б. Э., Имал, Ахмет Эсат, Питтман, Б., и Белл, М. Д. (2019). Дефицит исполнительной функции опосредует влияние бедности на академическую успеваемость: важная цель для мероприятий по улучшению нейрокогнитивного развития у детей из групп риска. Получено 27 октября 2019 г. с веб-сайта Ssrn.com: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3369774
- Бедность оставляет след в наших генах. (2019). Получено 26 октября 2019 г. с веб-сайта Northwestern.edu: https://news.northwestern.edu/stories/2019/04/poverty-leaves-a-mark-on-our-genes/
- Месмар, Б., и Стейнле, Н. (2020). Геномика пищевого поведения и регуляции аппетита. Принципы нутригенетики и нутригеномики, 159–165. Https://doi.org/10.1016/b978-0-12-804572-5.00020-3
- Барахас-Монтьель, С. Э., и Рейес-Гарсия, К. А. (2019). Определение боли и голода у младенцев с помощью ансамблей классификаторов. Международная конференция по вычислительному интеллекту для моделирования, управления и автоматизации и Международная конференция по интеллектуальным агентам, веб-технологиям и интернет-торговле (CIMCA-IAWTIC’06). Https://doi.org/10.1109/cimca.2005.1631561
- Боррил, П., Харрингтон, С. А., и Уауи, К. (2018). Применение последних достижений в области геномики и феномены для обнаружения признаков полиплоидной пшеницы. Журнал растений. Https://doi.org/10.1111/tpj.14150
- Зампиери, Г., Виджаякумар, С., Янеске, Э., и Ангионе, К. (2019). Машинное и глубокое обучение соответствуют метаболическому моделированию в масштабе генома. PLOS Computational Biology, 15 (7), e1007084. Https://doi.org/10.1371/journal.pcbi.1007084
- Хэндли, К. М. (2019). Определение роли микробов в функции экосистемы: переосмысление микробных пищевых цепей и преодоление барьеров царства. MSystems, 4 (3). Https://doi.org/10.1128/msystems.00153-19
- Акдемир, Д. (2013). Матрицы локально эпистатических геномных отношений для геномной ассоциации, прогнозирования и отбора. arXiv.org. Получено 18 сентября 2019 г. с сайта https://arxiv.org/abs/1302.3463.
- Ходли, Э. (2011). Объяснение совместных и индивидуальных вариаций (JIVE) для комплексного анализа нескольких типов данных. ArXiv E-Prints, arXiv: 1102.4110. Получено с https://ui.adsabs.harvard.edu/abs/2011arXiv1102.4110L/abstract.
- Авторы Википедии. (2019, 23 октября). Цели устойчивого развития. Получено 26 октября 2019 г. с веб-сайта Википедии: https://en.wikipedia.org/wiki/Sustainable_Development_Goals
- Глубокое обучение анализу медицинских изображений. (2019). @AnnualReviews. Получено 7 октября 2019 г. с сайта https://www.annualreviews.org/doi/10.1146/annurev-bioeng-071516-044442.
- SDGs.:. Платформа знаний об устойчивом развитии. (2015). Получено 26 октября 2019 г. с веб-сайта Un.org: https://sustainabledevelopment.un.org/topics/sustainabledevelopmentgoals.
- Глубокое изучение геномики. (2018). Nature Genetics, 51 (1), 1–1. DOI: 10,1038 / s41588–018–0328–0
- Сюн, М., и Ма, Л. (2013). Эффективный достаточный метод уменьшения размеров для выявления генетических вариантов клинической значимости. arXiv.org. Получено 18 сентября 2019 г. с сайта https://arxiv.org/abs/1301.3528.
- Квак, Г. Х.-Дж., и Хуэй, П. (2019). DeepHealth: глубокое обучение для информатики здоровья. Получено 28 октября 2019 г. с веб-сайта arXiv.org: https://arxiv.org/abs/1909.00384.
- Диналанкара, В., Браво, Х. (2013). Классификация аномалий с помощью машины антипрофильных опорных векторов. arXiv.org. Получено 18 сентября 2019 г. с сайта https://arxiv.org/abs/1301.3514.
Этот пост впервые появился в блоге Produvia 28 октября 2019 года.