Что мы знаем о машинном обучении и искусственном интеллекте?

Искусственный интеллект — это разновидность интеллекта, основанного на алгоритмах, демонстрируемая машинами. Здесь алгоритм учится и извлекает полезную информацию из предоставленных данных без учета каких-либо эмоциональных и сознательных предубеждений.

Франсуа Шолле, исследователь искусственного интеллекта в Google и создатель библиотеки программного обеспечения для машинного обучения Keras, сказал, что интеллект связан со способностью системы адаптироваться и импровизировать в новой среде, обобщать свои знания и применять их к незнакомым сценариям.

Интеллект — это эффективность, с которой вы приобретаете новые навыки в задачах, к которым раньше не готовились, — сказал он.
«Интеллект — это не сам навык, это не то, что вы можете сделать, зависит от того, насколько хорошо и эффективно вы можете изучать новые вещи.

Сферы применения искусственного интеллекта безграничны. Технология может применяться во многих различных секторах и отраслях. ИИ тестируется и используется в сфере здравоохранения для дозирования лекарств и различных методов лечения пациентов, а также для хирургических процедур в операционной.
Другими примерами машин с искусственным интеллектом являются компьютеры, играющие в шахматы, и беспилотные автомобили. Каждая из этих машин должна взвешивать последствия любого действия, которое они предпринимают, поскольку каждое действие влияет на конечный результат. Искусственный интеллект также находит применение в финансовой сфере, где он используется для обнаружения и пометки деятельности в банковской и финансовой сферах.

С другой стороны, машинное обучение — это приложение искусственного интеллекта (ИИ), которое предоставляет системам возможность учиться и улучшать свой опыт без явного автоматического программирования.

Машинное обучение можно сравнить с мозгом младенца. Если он видит собаку в первый раз, он не уверен, что это на самом деле. Его родители говорят ему, что данные, которые он воспринимает, классифицируются как «собака». Это указание, данное родителем, хранится в мозгу ребенка. Каждый раз, когда он сталкивается с животным, он сравнивает его с данными, хранящимися в его мозгу. Он сравнивает, является ли животное, которое он видит, собакой или нет. Теперь, если он сталкивается с новой породой собак, он не понимает, собака ли это. Его родители снова говорят ему, что это «Собака» породы по кличке «Лабрадор-ретривер». В мозгу ребенка хранится еще одна особенность: «Как выглядит порода лабрадор-ретривер?» Этот процесс соблюдается всю жизнь из-за постоянного потока данных повсюду. Алгоритмы машинного обучения реализуют аналогичный процесс.

Некоторые методы машинного обучения

Алгоритмы машинного обучения часто делятся на контролируемые и неконтролируемые.
Алгоритмы машинного обучения с учителем могут применять то, что было изучено в прошлом, к новым данным, используя помеченные примеры для прогнозирования будущих событий.
Напротив, алгоритмы машинного обучения без учителя используются, когда информация, используемая для обучения, не классифицируется и не помечается.

Алгоритмы полуконтролируемого машинного обучения находятся где-то между контролируемым и неконтролируемым обучением. Для обучения они используют как размеченные, так и неразмеченные данные — обычно небольшое количество размеченных данных и большое количество неразмеченных данных.

Алгоритмы машинного обучения с подкреплением – это метод обучения, который взаимодействует с окружающей средой, производя действия и обнаруживая ошибки или вознаграждения.

КАКОВА СВЯЗЬ МЕЖДУ ДВУМЯ ОБЛАСТЯМИ?

Два домена имеют разный набор временных шкал. Одна существует с нами на протяжении веков, а другая является одной из «Новейших наук». Астрономия претерпела значительные изменения с течением времени и продолжает развиваться. Первоначальные стратегии включали математические модели для предсказания звездных циклов и других астрономических объектов и их наблюдения.

Эти стратегии со временем стали бесполезными, производя сложные функции и требуя больше времени для решения. Это произошло за счет прироста данных, полученных с обновлением технологий. Этот прогресс в технологии вскоре стал проблемой для исследователей. Как бы странно это ни звучало, но это, безусловно, правда. Более совершенные технологии давали больше данных и, следовательно, больше анализа. Например, большее поле зрения (FOV) телескопов и более высокое разрешение детекторов убедительно указывают на то, что сегодняшние телескопы собирают гораздо больше данных, чем технологии предыдущего поколения; и это говорит о том, что астрономам приходится иметь дело с такими объемами данных, которых они никогда раньше не видели. Сегодня эта проблема решается с помощью машинного обучения и искусственного интеллекта. Машинное обучение может обрабатывать данные намного быстрее, чем другие методы, без наших инструкций о том, как это сделать. Это чрезвычайно важно, поскольку машинное обучение может понять то, что мы даже не знаем, как делать, и распознать неожиданные закономерности. Например, он может различать разные типы галактик еще до того, как мы узнаем об их существовании. Это подводит нас к мысли, что машинное обучение также менее предвзято, чем люди, и, следовательно, более надежны в своем анализе.

НЕКОТОРЫЕ ОСНОВНЫЕ ИНТЕГРАЦИИ

Проект «Галактический зоопарк»

В 2007 году Кевину Шавински, астрофизику из Оксфордского университета, за 7 лет пришлось классифицировать 900 000 изображений, полученных в ходе Слоановского цифрового обзора неба. Он должен был смотреть на каждое изображение и классифицировать его морфологически. Задача, однако, казалась относительно простой, но время классификации при расчете оказывалось гигантским, если человек работал над процессом 24x7. Исследователи нашли решение для решения этой проблемы. Так родился «Галактический зоопарк» — гражданский научный проект, в котором приняли участие почти 150 000 добровольцев, чтобы классифицировать галактики в соответствии с их морфологией. Этот процесс был завершен всего за 2 года и имел явный успех. Но вот загвоздка: если 150 тысячам человек понадобилось 2 года, чтобы классифицировать 900 тысяч изображений только с одного телескопа, то сколько времени потребуется на обработку и анализ полученных с в тысячи раз более мощных телескопов.

Например, телескоп Хаббл, работающий с 1990 года, собирает около 20 ГБ данных в неделю. Ожидается, что Большой синоптический обзорный телескоп (LSST), запланированный на 2021 год, будет собирать более 30 терабайт данных каждую ночь. Но это ничто по сравнению с самым амбициозным астрономическим проектом — Square Kilometre Array (SKA). SKA — это межправительственный радиотелескоп, который будет построен в Австралии и Южной Африке, и его завершение планируется примерно в 2024 году. Ожидается, что его 2000 радиотарелок и 2 миллиона низкочастотных антенн будут производить более 1 эксабайта в день. Это больше, чем весь интернет за целый год, произведенный всего за один день!
СКА со временем будет использовать тысячи тарелок и до миллиона низкочастотных антенн, чтобы астрономы могли следить за небо с беспрецедентной детализацией и исследовать все небо намного быстрее, чем любая существующая в настоящее время система. Этот огромный подход позволит производить беспрецедентные наблюдения, в значительной степени превосходящие качество разрешения изображений космического телескопа Хаббла. Эти данные не могут быть обработаны с использованием обычного человеческого вмешательства и анализа, и для их обработки необходимо использовать более продвинутый подход. Здесь вступают в действие алгоритмы машинного обучения и глубокого обучения.

Гравитационное линзирование

Поскольку свет, излучаемый далекими галактиками, проходит через массивные объекты во Вселенной, гравитационное притяжение этих объектов может искажать или искривлять свет. Это называется гравитационным линзированием.

Обычная материя — не единственный источник гравитации; существует неизвестная материя, на долю которой приходится примерно 85 % материи вселенной и около 27 % ее общей массово-энергетической плотности около 2,241×10−27 кг/м3. Его присутствие подразумевается в различных астрофизических наблюдениях, включая гравитационные эффекты, которые не могут быть объяснены общепринятыми теориями гравитации, если только не присутствует больше материи, чем можно увидеть.
Чтобы доказать подлинность темной материи, можно использовать такие методы, как гравитационное линзирование, как это было сделано в 2017 году исследовательской группой из Стэнфордского университета, которая продемонстрировала эффективность алгоритмов машинного обучения, используя нейронную сеть для изучения изображений сильного гравитационного поля. линзирование.

Раньше этот тип анализа был утомительным и включал в себя сравнение слишком большого количества математических уравнений и стимуляций с реальными изображениями линзы.

Морфеус

Morpheus — это компьютерная программа, которая может анализировать данные астрономических изображений попиксельно, чтобы идентифицировать все галактики и звезды в огромных наборах данных астрономических обзоров.

Брант Робертсон, профессор астрономии и астрофизики, который возглавляет Исследовательскую группу по вычислительной астрофизике в Калифорнийском университете в Санта-Круз, вместе с Райаном Хаузеном, аспирантом компьютерных наук в Инженерной школе Калифорнийского университета в Баскине, разработали и протестировали Morpheus в промежуток в два года.
Есть некоторые вещи, которые мы, люди, просто не можем делать, поэтому нам нужно найти способы использовать компьютеры для обработки огромного количества данных, которые будут поступать в течение следующих нескольких лет в результате крупных астрономических исследований. проекты, сказал Робертсон.

Морфология галактик может рассказать много информации о том, как они образовались и об их эволюции, а также о ее характеристиках. Крупномасштабные исследования, такие как Legacy Survey of Space and Time (LSST), которые будут проводиться в Обсерватории Веры Рубин, строящейся в настоящее время в Чили, будут генерировать огромные данные изображений. Поэтому исследователи во всем мире были вовлечены в разработку способов использования этих данных. Каждую ночь LSST будет делать более 800 панорамных снимков с помощью камеры с разрешением 3,2 миллиарда пикселей, дважды в неделю записывая все видимое небо.

«Представьте, что вы пришли к астрономам и попросили их классифицировать миллиарды объектов — как они могли это сделать? Теперь мы сможем автоматически классифицировать эти объекты и использовать эту информацию для изучения эволюции галактик», сказал Робертсон.

Было много попыток, когда исследователи использовали технологию глубокого обучения, которая обычно включала адаптацию существующих алгоритмов распознавания изображений, которые использовались для анализа и классификации наборов астрономических данных или изображений. Ученые также использовали инструменты глубокого обучения для обработки зашумленных астрономических изображений, чтобы получить более четкие изображения, которые можно интерпретировать более точно.

Конфликт NASA, AWS и CME

НАСА разработало образцовый метод борьбы с солнечными бурями и корональным выбросом массы с использованием решений AWS Машинное обучение — для содействия неконтролируемому обучению и обнаружению аномалий — с помощью Amazon Web Services. Но прежде чем углубляться в то, как работает решение, созданное с помощью AWS, давайте разберемся с CME.

Корональные выбросы массы (КВМ) — это массивные выбросы плазмы и магнитных полей из короны Солнца. Они могут выбрасывать миллиарды тонн коронального материала и нести встроенное магнитное поле (замороженное в потоке), более мощное, чем напряженность фонового межпланетного магнитного поля (ММП) солнечного ветра.

Возникнет вопрос, почему мы не можем предсказать шторм и разработать контрмеры для борьбы с такими аномалиями. Ответом на это является отсутствие исторических данных для обучения наших моделей. Это спорадическое космологическое событие, происходящее примерно раз в 50 лет. Следовательно, общий алгоритм обучения с учителем оказывается крайне неэффективным при решении сценария и обеспечении необходимых встречных шагов. Более того, данные, собранные многочисленными спутниками, слишком велики, чтобы их можно было сопоставить обычными методами. Поэтому НАСА объединилось с AWS и интегрировало их алгоритмы машинного обучения, чтобы мгновенно работать с гигантскими наборами данных, и это очень удобно. Обнаружение аномалий НАСА основано на одновременных наблюдениях за движущими силами солнечного ветра и откликами в магнитных полях вокруг Земли. Эти геологические супербури можно смоделировать как аномальные выбросы среди обычных солнечных бурь.
Примечание. Конфликт NASA-AWS и CME упоминался в другом моем блоге: Соединение ASTRONOMY-AWS. Прочтите его, чтобы получить больше информации по теме.

Центр передового опыта в области искусственного интеллекта имени Годдарда НАСА

Центр передового опыта в области искусственного интеллекта Центра космических полетов имени Годдарда НАСА (AI CoE) — это новая совместная зонтичная организация для нескольких партнеров НАСА по искусственному интеллекту и машинному обучению (МО).

AI CoE реализует несколько проектов в своей области в рамках более широкого сообщества AI, например — Применение Random Forest для количественной оценки глубины озера в арктических озерах, которое фокусируется на полевых измерениях глубины воды в озерах Арктики. North Slope of Alaska для создания модели Random Forest (RFA), которую можно применять к данным дистанционного зондирования от Landsat для создания карт глубин для озер по всему North Slope of Alaska.

Есть много других проектов, которые предпринял AI CoE:
1: Идентификация объектов в субметровых коммерческих данных очень высокого разрешения с использованием сверточных нейронных сетей,
2: MERRA/Max: Использование потенциала климата Результаты моделирования в исследованиях изменения экосистемы,
3: машинное обучение различий между тропосферными гидроксильными радикалами в химико-климатических моделях и т. д.

ВЫВОД

В целом, возможность просеивать большие объемы данных и выполнять сложный анализ очень быстро и полностью автоматизированным образом может изменить астрофизику так, как это необходимо для будущих обзоров неба. И они будут заглядывать глубже во Вселенную — и производить больше данных, чем когда-либо прежде.

ИСПОЛЬЗОВАННАЯ ЛИТЕРАТУРА

https://365datascience.com/trending/machine-learning-astronomy/
https://www.skatelescope.org/the-ska-project/
https://www .zdnet.com/article/what-is-ai-everything-you-need-to-know-about-artificial-intelligence/
https://www.science.org.au/curious/space -time/gravitational-lensing#:~:text=Как%20%20свет%20излучаемый%20by,Это%20является%20называемым%20гравитационным%20линзированием.
https://news.ucsc.edu/2020/ 05/morpheus.html