Реализация mvtnorm :: pmvnorm в rcpp медленнее, чем исходная функция R

Я пытаюсь заставить Rcpp-версию pmvnorm работать по крайней мере так же быстро, как mvtnorm :: pmvnorm в R.

Я нашел https://github.com/zhanxw/libMvtnorm и создал скелетный пакет Rcpp с соответствующие исходные файлы. Я добавил следующие функции, которые используют Armadillo (поскольку я использую его в другом коде, который я писал).

//[[Rcpp::export]]
arma::vec triangl(const arma::mat& X){
  arma::mat LL = arma::trimatl(X, -1);  // omit the main diagonal
  return LL.elem(arma::find(LL != 0));
}

//[[Rcpp::export]]
double pmvnorm_cpp(arma::vec& bound, arma::vec& lowtrivec){
  double error;
  int n = bound.n_elem;
  double* boundptr = bound.memptr();
  double* lowtrivecptr = lowtrivec.memptr();
  double result = pmvnorm_P(n, boundptr, lowtrivecptr, &error);
  return result;
}

Это воспроизводимый пример из R после сборки пакета:

set.seed(1)
covar <- rWishart(1, 10, diag(5))[,,1]
sds <- diag(covar) ^-.5
corrmat <- diag(sds) %*% covar %*% diag(sds)
triang <- triangl(corrmat)

bounds <- c(0.5, 0.9, 1, 4, -1)

rbenchmark::benchmark(pmvnorm_cpp(bounds, triang),
                      mvtnorm::pmvnorm(upper=bounds, corr = corrmat),
                      replications=1000)

Это показывает, что pmvnorm_cpp намного медленнее, чем mvtnorm :: pmvnorm. а результат другой.

> pmvnorm_cpp(bounds, triang)
[1] 0.04300643
> mvtnorm::pmvnorm(upper=bounds, corr = corrmat)
[1] 0.04895361

что меня озадачивает, потому что я думал, что базовый код fortran был таким же. Есть ли в моем коде что-то, что заставляет все работать медленно? Или мне попробовать напрямую перенести код mvtnorm :: pmvnorm? У меня буквально нет опыта работы с фортраном.

Предложения приветствуются, извините за мою некомпетентность в противном случае.

РЕДАКТИРОВАТЬ: чтобы быстро сравнить с альтернативой, это:

//[[Rcpp::export]]
NumericVector pmvnorm_cpp(NumericVector bound, NumericMatrix cormat){
  Environment stats("package:mvtnorm"); 
  Function f = stats["pmvnorm"];

  NumericVector lower(bound.length(), R_NegInf);
  NumericVector mean(bound.length());
  NumericVector res = f(lower, bound, mean, cormat);
  return res;
}

имеет практически ту же производительность, что и вызов R (следующее на 40-мерном mvnormal):

> rbenchmark::benchmark(pmvnorm_cpp(bounds, corrmat),
+                       mvtnorm::pmvnorm(upper=bounds, corr = corrmat),
+                       replications=100)
                                              test replications elapsed relative user.self sys.self
2 mvtnorm::pmvnorm(upper = bounds, corr = corrmat)          100   16.86    1.032     16.60     0.00
1                     pmvnorm_cpp(bounds, corrmat)          100   16.34    1.000     16.26     0.01

поэтому мне кажется, что в предыдущем коде что-то происходит. Либо с тем, как я справляюсь с делами с Армадилло, либо с тем, как другие вещи связаны. Я предполагаю, что должен быть прирост производительности по сравнению с этой последней реализацией.


person mkln    schedule 11.07.2018    source источник
comment
Каков результат тестов? Почему вы ожидаете, что это будет быстрее? Вы выполняете тот же код, но с дополнительным уровнем абстракции, предоставляемым Rcpp.   -  person Ralf Stubner    schedule 11.07.2018
comment
эталонный тест зависит от размера и становится все хуже. он идет от 3-4 до 10 раз медленнее. Я не ожидал, что он будет быстрее, но примерно так же.   -  person mkln    schedule 11.07.2018
comment
Ой, это ужасное относительное время. Какие абсолютные числа?   -  person Ralf Stubner    schedule 11.07.2018
comment
Я запустил приведенный выше пример на своем ноутбуке, и он стал в 13 раз медленнее. Я обновляю вопрос, добавляя дополнительный взгляд на проблему   -  person mkln    schedule 11.07.2018


Ответы (1)


Вместо того, чтобы пытаться использовать для этого дополнительную библиотеку, я бы попытался использовать C API, экспортированный mvtnorm, c.f. https://github.com/cran/mvtnorm/blob/master/inst/NEWS#L44-L48. При этом я обнаружил три причины, по которым результаты различаются. Один из них также отвечает за разницу в производительности:

  1. mvtnorm использует RNG, хотя он был удален из библиотеки, которую вы используете, c.f. https://github.com/zhanxw/libMvtnorm/blob/master/libMvtnorm/randomF77.c.

  2. Ваша triangl функция неверна. Он возвращает нижнюю треугольную матрицу в порядке столбцов. Однако базовый код fortran ожидает этого в строковом порядке, ср. https://github.com/cran/mvtnorm/blob/master/src/mvt.f#L36-L39 и https://github.com/zhanxw/libMvtnorm/blob/master/libMvtnorm/mvtnorm.cpp#L60

  3. libMvtnorm использует 1e-6 вместо 1e-3 в качестве относительной точности, ср. https://github.com/zhanxw/libMvtnorm/blob/master/libMvtnorm/mvtnorm.cpp#L65. Это также отвечает за разницу в производительности.

Мы можем проверить это, используя следующий код:

// [[Rcpp::depends(RcppArmadillo)]]
#include <RcppArmadillo.h>
// [[Rcpp::depends(mvtnorm)]]
#include <mvtnormAPI.h>

//[[Rcpp::export]]
arma::vec triangl(const arma::mat& X){
  int n = X.n_cols;
  arma::vec res(n * (n-1) / 2);
  for (int i = 0; i < n; ++i) {
    for (int j = 0; j < i; ++j) {
      res(j + i * (i-1) / 2) = X(i, j);
    }
  }
  return res;
}

// [[Rcpp::export]]
double pmvnorm_cpp(arma::vec& bound,
           arma::vec& lowertrivec,
           double abseps = 1e-3){

  int n = bound.n_elem;
  int nu = 0;
  int maxpts = 25000;     // default in mvtnorm: 25000
  double releps = 0;      // default in mvtnorm: 0
  int rnd = 1;            // Get/PutRNGstate

  double* bound_ = bound.memptr();
  double* correlationMatrix = lowertrivec.memptr();
  double* lower = new double[n];
  int* infin = new int[n];
  double* delta = new double[n];

  for (int i = 0; i < n; ++i) {
    infin[i] = 0; // (-inf, bound]
    lower[i] = 0.0;
    delta[i] = 0.0;
  }

  // return values
  double error;
  double value;
  int inform;

  mvtnorm_C_mvtdst(&n, &nu, lower, bound_,
           infin, correlationMatrix, delta,
           &maxpts, &abseps, &releps,
           &error, &value, &inform, &rnd);
  delete[] (lower);
  delete[] (infin);
  delete[] (delta);

  return value;
}

/*** R
set.seed(1)
covar <- rWishart(1, 10, diag(5))[,,1]
sds <- diag(covar) ^-.5
corrmat <- diag(sds) %*% covar %*% diag(sds)
triang <- triangl(corrmat)
bounds <- c(0.5, 0.9, 1, 4, -1)
set.seed(1)
system.time(cat(mvtnorm::pmvnorm(upper=bounds, corr = corrmat), "\n"))
set.seed(1)
system.time(cat(pmvnorm_cpp(bounds, triang, 1e-6), "\n"))
set.seed(1)
system.time(cat(pmvnorm_cpp(bounds, triang, 0.001), "\n"))
 */

Полученные результаты:

> system.time(cat(mvtnorm::pmvnorm(upper=bounds, corr = corrmat), "\n"))
0.04896221 
   user  system elapsed 
  0.000   0.003   0.003 

> system.time(cat(pmvnorm_cpp(bounds, triang, 1e-6), "\n"))
0.04895756 
   user  system elapsed 
  0.035   0.000   0.035 

> system.time(cat(pmvnorm_cpp(bounds, triang, 0.001), "\n"))
0.04896221 
   user  system elapsed 
  0.004   0.000   0.004 

При одинаковом ГСЧ (и состоянии ГСЧ), правильной нижней треугольной корреляционной матрице и той же относительной точности результаты идентичны, а производительность сопоставима. При более высокой точности страдает производительность.

Все это для отдельного файла, использующего Rcpp::sourceCpp. Чтобы использовать это в пакете, вам нужно добавить LinkingTo: mvtnorm в ваш DESCRIPTION файл.

person Ralf Stubner    schedule 11.07.2018