Ускоренный курс последовательного прогнозирования данных с использованием RNN и LSTM

Изучите навыки работы с данными и узнайте, как применить их в конкурентной финансовой отрасли, чтобы пополнить свой портфель практическим опытом.

Статистические данные, машинное обучение и навыки глубокого обучения стали востребованными в финансовой сфере за последнее десятилетие ⁠ - с момента глобального финансового кризиса 2008 года. Фирмы активно ищут сотрудников с высокими математическими и вычислительными способностями для моделирования рыночных рисков, прогнозирования финансовых рисков. цены на активы, и, следовательно, уменьшить их подверженность экономическому спаду. Некоторые хорошо известные приложения науки о данных в финансовой отрасли включают обнаружение мошенничества, управление рисками, прогнозирование цен и алгоритмическую торговлю.

Два инструмента, которые являются обязательными для этих приложений науки о данных, - это рекуррентные нейронные сети (RNN) и модели долгосрочной краткосрочной памяти (LSTM), которые используются для прогнозирования последовательных данных. Финансовая отрасль переживает серьезную революцию с появлением глубокого обучения и искусственного интеллекта ⁠ - конкуренция ужесточается, а компании пытаются получить большую прибыль, и отрасль переходит на использование новейших технологий в области ИИ для прогнозирования цен на активы и управления риск своих инвестиционных портфелей.

Один из способов опробовать RNN и LSTM и добавить их в свое резюме - принять участие в последнем конкурсе искусственного интеллекта bitgrit. Соревнования bitgrit отлично подходят для оттачивания ваших навыков в предсказании данных, и в этом соревновании три лучших победителя будут награждены денежными призами на общую сумму 10 000 долларов. Конкурс привлекает данные с валютного рынка, предоставляя участникам данные экономических индексов и новости, которые являются основными кандидатами для практики использования RNN и LSTM. Для получения дополнительной информации вы можете зарегистрироваться и ознакомиться с конкурсом форекс здесь.

Рекуррентные нейронные сети (RNN)

В нейронной сети информация проходит через разные уровни, каждый из которых содержит узлы, которые обрабатывают данные по-разному. Эта информация в конечном итоге достигает последнего уровня, чтобы создать окончательное выходное значение. Количество слоев в нейронной сети может варьировать конечный результат, и нет эвристики относительно того, каким должно быть оптимальное количество слоев. Эти сети довольно адаптивны и, как правило, обучаются и работают лучше, чем большинство алгоритмов машинного обучения.

Рекуррентные нейронные сети - это особый тип нейронной сети, в которой выходные данные уровня многократно возвращаются на входной уровень, чтобы учиться на прошлых данных. По сути, нейронная сеть пытается изучить данные, следующие за последовательностью. Три лучших примера для этого:

Распознавание текста в речь
Предсказание следующего слова в предложении
Прогнозирование временных рядов

По сути, RNN отлично подходят для обработки естественного языка и задач временных рядов.

Прогноз цен на валюту, естественно, следует временному измерению. Финансовые временные ряды показывают нам модели в прошлом, которые могут помочь нам предсказать будущее состояние, точно так же, как последнее соревнование по искусственному интеллекту bitgrit просит своих участников спрогнозировать обменный курс на месяц в будущем. Вместо машинного обучения специалисты по обработке данных использовали эконометрику и анализ временных рядов для прогнозирования цен на финансовые продукты. Хотя эти методы оказались полезными, современные вычислительные мощности и способность собирать большие объемы данных позволили использовать методы глубокого обучения для прогнозирования цен.

Функция RNN

Выход RNN в момент времени t как функция состояния скрытого слоя (h) в момент времени t с учетом весов и смещений (theta)

h в момент времени t равен функции h в предыдущий раз, вход в момент времени t (x) с заданным тета

Существует множество обозначений того, как математически представить вышесказанное, так что будьте внимательны, чтобы не запутаться.

Рекуррентные нейронные сети запоминают, что произошло в прошлом, что влияет на то, что они предсказывают на будущее. RNN запускаются в цикле при достижении скрытого уровня, пока не узнают основную взаимосвязь данных.

На что обращать внимание в РНС

Часть RNN, которая может расстроить даже самого опытного специалиста по данным, - это проблема исчезающего / взрывающегося градиента. Проще говоря, RNN сталкивается с этой проблемой при наличии длинной последовательности ввода-вывода. Несмотря на то, что они мощные и точные, рекуррентные нейронные сети имеют проблему определения взаимосвязи между входами в последовательности, разделенными большим пространством. В приложениях временных рядов RNN могут испытывать трудности с моделированием взаимосвязи двух моментов времени, которые находятся далеко друг от друга.

Это явление связано с цепным правилом алгоритма обратного распространения ошибки. Если все частные производные при вычислении обратного распространения не близки к 1, их произведение будет либо очень маленьким (т.е. исчезающим), когда частные производные меньше 1, либо очень большими (т.е. взрывающимися), когда частные производные больше 1.

Чтобы объяснить это явление, стали популярны модели долговременной краткосрочной памяти.

Модели долгосрочной краткосрочной памяти (LSTM)

В отличие от RNN, LSTM могут запоминать более длительные периоды времени. Они являются одним из многих вариантов RNN, но LSTM привлекли основное внимание.

LSTM позволяют нейронной сети выборочно запоминать и забывать информацию и вводят шлюзы, которые регулируют поток информации (а именно, добавление и удаление информации).

Приведенные ниже ресурсы помогут вам более подробно реализовать и понять RNN и LSTM.

Кроме того, как RNN, так и LSTM являются дорогостоящими в вычислительном отношении и требуют большей мощности, чем имеет стандартный пользователь. Следующие платформы могут помочь в анализе:

Финансовая отрасль является одним из пионеров в области статистики, машинного обучения и глубокого обучения. Искусственный интеллект откроет перед фирмами новые возможности для увеличения прибыльности и улучшения пользовательского опыта. В сфере ИИ RNN и LSTM де-факто являются алгоритмами для использования глубокого обучения для прогнозирования цен на активы. Таким образом, они являются важными навыками для любого специалиста по данным, желающего работать в сфере конкурентного финансирования.

Конкурс искусственного интеллекта на форексе от bitgrit завершился 31 декабря, но вы можете посмотреть другие их конкурсы здесь.