Может ли кто-нибудь объяснить мне, в чем смысл этих двух строк кода отсюда: https://github.com/Newmu/Theano-Tutorials/blob/master/4_modern_net.py
acc = theano.shared(p.get_value() * 0.)
acc_new = rho * acc + (1 - rho) * g ** 2
Это ошибка? Почему мы создаем экземпляр acc до нуля, а затем умножаем его на rho в следующей строке? Похоже, что таким образом он ничего не добьется и останется нулем. Будет ли разница, если мы заменим «ро * акк» просто «акк»?
Полная функция приведена ниже:
def RMSprop(cost, params, lr=0.001, rho=0.9, epsilon=1e-6):
grads = T.grad(cost=cost, wrt=params)
updates = []
for p, g in zip(params, grads):
acc = theano.shared(p.get_value() * 0.)
acc_new = rho * acc + (1 - rho) * g ** 2
gradient_scaling = T.sqrt(acc_new + epsilon)
g = g / gradient_scaling
updates.append((acc, acc_new))
updates.append((p, p - lr * g))
return updates