Цель этого проекта по науке о данных — исследовать мир финансовых рынков и прогнозирования. Используя глубокое обучение, мы стремимся прогнозировать цены акций IBM в будущем. Как одна из ведущих мировых технологических корпораций, движение цен на акции IBM может предоставить ценную информацию и потенциально прибыльные инвестиционные стратегии.

Чтобы решить эту проблему, мы используем сети с долговременной кратковременной памятью (LSTM), особый тип рекуррентной нейронной сети (RNN), который хорошо работает с данными временных рядов, такими как цены на акции. Сети LSTM могут со временем изучать закономерности и предсказывать будущее на основе этой информации.

PyTorch, одна из самых универсальных и мощных библиотек машинного обучения с открытым исходным кодом, будет использоваться для создания и обучения нашей модели LSTM. Для эффективного моделирования и прогнозирования цен на акции IBM гибкость и скорость PyTorch делают его отличным инструментом для этого проекта.

Этот проект охватывает все: от предварительной обработки данных, построения моделей и обучения до прогнозирования и визуализации. Вы получите прочную основу для прогнозирования цен на акции с использованием моделей LSTM, независимо от того, являетесь ли вы опытным специалистом по данным, финансистом или кем-то, кто заинтересован в применении машинного обучения к реальным проблемам.

Настройки и библиотеки

import numpy as np
import random
import pandas as pd 
from pylab import mpl, plt
plt.style.use('seaborn')
mpl.rcParams['font.family'] = 'serif'
%matplotlib inline

from pandas import datetime
import math, time
import itertools
import datetime
from operator import itemgetter
from sklearn.metrics import mean_squared_error
from sklearn.preprocessing import MinMaxScaler
from math import sqrt
import torch
import torch.nn as nn
from torch.autograd import Variable


import os
for dirname, _, filenames in os.walk('/kaggle/input'):
    for i, filename in enumerate(filenames):
        if i<5:
            print(os.path.join(dirname,filename))

В этом коде импортируется несколько библиотек и настраивается необходимая среда для анализа и визуализации данных.

Во-первых, он импортирует: numpy, random, pandas, mpl (из модуля pylab) и plt (из модуля pylab). Обычно эти библиотеки используются для численных вычислений…