Я разрабатываю код оптимизации для сложной задачи эксплуатации пласта. Часть этого требует, чтобы я вычислил целевую функцию для большого количества потенциальных решений. Я тестирую оптимизатор на функции Розенброка и пытаюсь улучшить его скорость. Когда я профилировал код, я заметил, что вычисление целевой функции в цикле for было одним из узких мест кода, поэтому я разработал способ делать это параллельно для нескольких наборов переменных решения. У меня есть два калькулятора целевых функций: FO для одного набора переменных решения и P_FO для нескольких наборов переменных решения. Вычисление целевой функции — одна из самых медленных частей моего кода, поэтому я хотел бы еще больше ускорить процесс, используя @jit. Я протестировал обе функции с помощью @jit и обнаружил, что функция P_FO с @jit работает медленнее, чем без нее. Код ниже:
import time
import numpy as np
from numba import jit
def FO(X):
#Rosenbrock function
ObjV=0
for i in range(65-1):
F=100*((X[i+1]-X[i]**2)+(X[i]-1)**2)
ObjV+=F
return ObjV
t0=time.time()
X=10+np.zeros(65)
for i in range(5000):
FO(X)
t1 = time.time()
total = t1-t0
print("time FO="+str(total))
@jit
def FO(X):
#Rosenbrock function
ObjV=0
for i in range(65-1):
F=100*((X[i+1]-X[i]**2)+(X[i]-1)**2)
ObjV+=F
return ObjV
t0=time.time()
X=10+np.zeros(65)
for i in range(5000):
FO(X)
t1 = time.time()
total = t1-t0
print("time FO with @jit="+str(total))
def P_FO(X):
ObjV=np.zeros(X.shape[0])
for i in range(X.shape[1]-1):
F=100*((X[:,i+1]-X[:,i]**2)+(X[:,i]-1)**2)
ObjV+=F
return ObjV
t0=time.time()
X=10+np.zeros((65, 5000))
P_FO(X)
t1 = time.time()
total = t1-t0
print("time P_FO="+str(total))
@jit
def P_FO(X):
ObjV=np.zeros(X.shape[0])
for i in range(X.shape[1]-1):
F=100*((X[:,i+1]-X[:,i]**2)+(X[:,i]-1)**2)
ObjV+=F
return ObjV
t0=time.time()
X=10+np.zeros((65, 5000))
P_FO(X)
t1 = time.time()
total = t1-t0
print("time P_FO with @jit="+str(total))
Результаты были:
time FO=0.523999929428
time FO with @jit=0.0720000267029
time P_FO=0.0380001068115
time P_FO with @jit=0.229000091553
Может ли кто-нибудь указать мне причину, по которой @jit замедляет параллельную целевую функцию P_FO? Это из-за использования np.zeros или, возможно, array.shape()?