GSoC 2018: Начиная с ЦЕРН - Часть I

Google Summer Of Code 2018, стажер в ЦЕРН.

Привет народ! Я Харшит, студентка второго курса ECE из LNMIIT, Джайпур, Индия. В этом году я был выбран в Google Summer Of Code 2018 в рамках организации CERN. Я второй раз буду работать по этой программе (GSoC) от Google.

Что касается моего проекта, меня выбрали в команду TMVA для разработки модуля глубокого обучения для CERN. Этот модуль должен быть интегрирован в Toolkit for Multivariate Analysis (TMVA), который представляет собой многоцелевой инструментарий машинного обучения, интегрированный в структуру научного программного обеспечения ROOT (довольно известный проект CERN) и используется во многих приложениях физики элементарных частиц, таких как классификация. , отслеживание частиц, анализ данных и т. д.

Моя основная работа - это проектирование рекуррентных нейронных сетей, дальнейшее повторение первоначальной работы Саурава Шекхара (одного из моих наставников) и проектирование сетей LSTM. Они также должны быть реализованы с поддержкой архитектуры GPU, для чего я буду использовать CUDA, платформу параллельных вычислений и модель API, созданную Nvidia. Архитектура ЦП основана на библиотеке BLAS, которая оптимизирована для более быстрого умножения матриц. В этом году в команду Deep Learning выбраны трое студентов (включая меня). Мы все собирались работать на CNN, но позже на встрече работа была распределена. Сиддхартха будет работать над вариационными автоэнкодерами, Манос будет работать над CNN, а я буду работать над сетями RNN и LSTM.

Рекуррентная нейронная сеть - это нейронная сеть, обрабатывающая данные временных рядов, которые мы называем последовательными данными. Он принимает в качестве входных данных как новый вход на текущем временном шаге, так и выход (или скрытый слой) сети на предыдущем временном шаге. Самым популярным типом RNN, вероятно, является LSTM, у которого есть «состояние ячейки» на каждом временном шаге, которое изменяется с новым вводом. Например: Большой адронный коллайдер (LHC) от CERN, который является крупнейшим и самым мощным ускорителем частиц в мире, состоит из сверхпроводящих магнитов LHC, соединенных с электронной системой мониторинга, которая записывает и анализирует временные ряды напряжения, отражающие их характеристики. Здесь сети RNN и LSTM могут быть полезны для легкого мониторинга производительности магнитов.

В моем следующем рассказе я более подробно расскажу о сетях RNN и LSTM с небольшим акцентом на то, как я буду разрабатывать класс BasicLSTMLayer в TMVA.