Цель этого проекта по науке о данных — исследовать мир финансовых рынков и прогнозирования. Используя глубокое обучение, мы стремимся прогнозировать цены акций IBM в будущем. Как одна из ведущих мировых технологических корпораций, движение цен на акции IBM может предоставить ценную информацию и потенциально прибыльные инвестиционные стратегии.
Чтобы решить эту проблему, мы используем сети с долговременной кратковременной памятью (LSTM), особый тип рекуррентной нейронной сети (RNN), который хорошо работает с данными временных рядов, такими как цены на акции. Сети LSTM могут со временем изучать закономерности и предсказывать будущее на основе этой информации.
PyTorch, одна из самых универсальных и мощных библиотек машинного обучения с открытым исходным кодом, будет использоваться для создания и обучения нашей модели LSTM. Для эффективного моделирования и прогнозирования цен на акции IBM гибкость и скорость PyTorch делают его отличным инструментом для этого проекта.
Этот проект охватывает все: от предварительной обработки данных, построения моделей и обучения до прогнозирования и визуализации. Вы получите прочную основу для прогнозирования цен на акции с использованием моделей LSTM, независимо от того, являетесь ли вы опытным специалистом по данным, финансистом или кем-то, кто заинтересован в применении машинного обучения к реальным проблемам.
Настройки и библиотеки
import numpy as np import random import pandas as pd from pylab import mpl, plt plt.style.use('seaborn') mpl.rcParams['font.family'] = 'serif' %matplotlib inline from pandas import datetime import math, time import itertools import datetime from operator import itemgetter from sklearn.metrics import mean_squared_error from sklearn.preprocessing import MinMaxScaler from math import sqrt import torch import torch.nn as nn from torch.autograd import Variable import os for dirname, _, filenames in os.walk('/kaggle/input'): for i, filename in enumerate(filenames): if i<5: print(os.path.join(dirname,filename))
В этом коде импортируется несколько библиотек и настраивается необходимая среда для анализа и визуализации данных.
Во-первых, он импортирует: numpy, random, pandas, mpl (из модуля pylab) и plt (из модуля pylab). Обычно эти библиотеки используются для численных вычислений…