Пол Джонсон

Не проходит и месяца, как еще одно разрушительное землетрясение где-нибудь в мире не напоминает нам, как мы все остаемся во власти крупных сейсмических событий, которые происходят без предупреждения. Но новая область геофизики, основанная на машинном обучении, раскрывает новые идеи о скользящих разломах Земли, которые часто вызывают эти катастрофические землетрясения.

Машинное обучение, которое часто называют искусственным интеллектом, захватило воображение публики своими обещаниями полностью автономных автомобилей и приближающейся «сингулярностью», когда машины будут думать лучше людей. Однако нынешнее состояние дел показывает мало признаков истинного интеллекта, таких как способность абстрагировать принципы, лежащие в основе данного явления. При распознавании изображений системы ИИ учатся на механическом запоминании идентифицировать объекты, и поэтому их часто обманывают. По этим причинам машинное обучение остается более подходящим термином для этой отрасли вычислительной науки.

Многие из недавних разработок в области машинного обучения, получившие широкое распространение, основаны на подходе, называемом глубокими нейронными сетями. Тем не менее, более простая и прозрачная форма машинного обучения, называемая деревьями решений, открывает новые впечатляющие научные открытия. В случае с нашим исследованием землетрясений в Лос-Аламосской национальной лаборатории процесс машинного обучения с участием деревьев решений выявил ранее неожиданные физические принципы, которые глубокая нейронная сеть могла бы скрыть, а люди, изучающие наборы данных, вероятно, никогда бы не заметили. К нашему удивлению — и радости — этот подход привел к прорыву в изучении механики землетрясений, что, безусловно, продвинет нас в поисках священного Грааля наук о Земле: прогнозирования землетрясений.

Машинное обучение — это не магия. Однако он дает беспрецедентную способность просеивать огромные потоки информации. Глубокие нейронные сети доказали свою способность решать сложные задачи, такие как распознавание лиц, но они также ограничены своей природой черного ящика. Нейронные сети могут дать правильный ответ, но вы не будете знать, как они туда попали. Они выполняют вычисления с данными, которые ученый не может изучить извне — если вы хотите, чтобы Siri нашла название песни, вам все равно, как машина найдет его. Если вы хотите понять какой-то физический процесс, вам, конечно, не все равно. Вы не можете построить теорию, основанную на цифровом разреженном воздухе.

В используемом нами подходе машинного обучения деревья решений устанавливают набор вопросов о статистических аспектах информации, содержащейся в акустическом сигнале землетрясения. На основе одного решения программа машинного обучения переходит к другому решению и так далее — диаграмма процесса в конечном итоге выглядит как дерево, отсюда и название. И такая программа машинного обучения не является непрозрачной. Подобно хорошим школьникам-математикам, деревья решений «показывают свою работу» на каждом этапе пути. Это позволяет нам исследовать каждое решение в целом лесу решений, чтобы понять, почему и как оно было принято.

В науках о Земле и за ее пределами машинное обучение меняет характер научных исследований, поскольку обработка больших данных продолжает свое прерывистое шествие по дисциплинам. Традиционно наука переходит от формулирования гипотезы к проведению эксперимента, анализу данных, уточнению гипотезы и повторному экспериментированию. Несмотря на ошеломляющую эффективность, этот метод уязвим для предвзятости — предвзятая или просто ошибочная гипотеза поставит под угрозу результаты и выводы исследовательского проекта.

В работе нашей команды мы минимизируем нашу предвзятую предвзятость, позволяя машине просеивать массивные наборы сейсмических данных в поисках связей между данными и некоторыми важными статистическими аспектами сдвигающих геологических разломов, такими как трение или смещение разломов. Во время этой процедуры программа машинного обучения строит сама себя. Затем мы проверяем эти соединения, сопоставляя их с данными, которые программа никогда не видела.

Мы начали с анализа акустических сигналов от лабораторной машины для землетрясений в Университете штата Пенсильвания. Между искусственными землетрясениями машинное обучение обнаружило непрерывный сигнал, который ранее считался бесполезным шумом и годами игнорировался всеми, включая меня. Примечательно, что независимо от того, когда сигнал считывается, он позволяет нам диагностировать состояние разлома и показывает время, оставшееся до проскальзывания разлома в наших лабораторных экспериментах по землетрясению.

После того, как мы обнаружили контрольный сигнал в лаборатории, мы использовали тот же метод машинного обучения для изучения реальных сейсмических данных о событиях «медленного проскальзывания» в зонах крупных землетрясений в Северной Америке, Южной Америке и Новой Зеландии. Медленное скольжение, которое может быть незаметно для человека, представляет собой постепенное смещение земли, прилегающей к запертой зоне разлома. По мере того, как в закрытой зоне нарастает давление, трение в конечном итоге приводит к мегаземлетрясению.

Мы обнаружили, что эти геологически активные области постоянно передают один и тот же сигнал через цикл с медленным проскальзыванием. Сигнал точно диагностирует в любой момент времени движение неисправности в этой области и то, как скоро она может проскочить. Эта информация может позволить нам определить, как и когда медленное скольжение приводит к мегаземлетрясению.

В будущем мы надеемся продемонстрировать, что базовая физика, лежащая в основе этого явления, применима к любому разрушению материала, будь то лавина или разрушение стальной балки на мосту. Все они могут издавать характерный звуковой сигнал, показывающий их текущее состояние и то, как скоро они выйдут из строя.

Машинное обучение не может волшебным образом ответить на все научные вопросы, но оно дает нам чрезвычайно мощное и гибкое дополнение к нашему набору инструментов. У нас было мало шансов обнаружить этот разоблачающий акустический сигнал без машинного обучения. Он открыл революционный способ «слышать» землю и открыл новый закон природы. Это может позволить геофизикам предпринять значительные шаги в направлении прогнозирования землетрясений.

Подобные прорывы произойдут и в других областях науки. Мы все еще пробираемся на ощупь через ранние этапы науки, основанной на машинном обучении. Мы с трудом можем себе представить, куда это приведет нас в ближайшие несколько лет, но это, безусловно, нас удивит.

Автор работает с командой, в которую входят Бертран Руэ-Ледук, Клаудия Халберт и Ян МакБрарти в Лос-Аламосе. Соавтор Крис Марон управляет машиной для землетрясений в штате Пенсильвания. Последние работы команды по машинному обучению и поведению землетрясений можно найти здесь.

Пол Джонсон — геофизик из Лос-Аламосской национальной лаборатории, где он применяет машинное обучение и статистические методы для изучения основных физических принципов, лежащих в основе землетрясений и других сейсмических явлений.

Эта история впервые появилась в журнале Scientific American.