ccf с использованием объекта ts или объекта xts обеспечивает разные задержки

Я использую R 3.1.3, и у меня есть 2 временных ряда, которые я хотел бы сравнить, используя ccf, чтобы увидеть, при какой задержке наблюдается максимальная корреляция. Временные ряды находятся в 15-минутном интервале.

Я пробовал это двумя разными способами:

  • определение временного ряда как объекта ts
  • определение временного ряда как xts объекта

После этого я вычисляю взаимную корреляцию с помощью команды ccf. Графика ACF одинакова в обоих случаях, но у меня есть задержки между (-31, 31), когда я использую объект ts, но задержки идут между (-27900, 27900), когда я использую объект xts. Я проверил в справке, и по умолчанию максимальная задержка составляет 10*log10(N/m), что в этом случае будет: 10*log10(2688/2) = 31.28.

Поэтому кажется, что первый вариант отображает правильные лаги. Однако я бы предпочел использовать xts, поскольку у меня есть еще 8 серий для сравнения, и все они находятся в одном и том же data.frame. Кроме того, мне интересно узнать, почему это происходит!

Здесь вы можете увидеть код:

# Generate data - Example:
set.seed(123)
x <- rnorm(2880,0,3)
y <- rnorm(2880,0,3)
# 1 month of data
dt <- seq(as.POSIXct('2014-01-01 00:00:00'), by='15 min', length.out=(60*24*30/15))

x <- data.frame (dt,x)
y <- data.frame(dt,y)
summary(x)
summary(y)
str(x)
str(y)

xy <- merge (x, y, by="dt", all=TRUE)
summary(xy)

# Time series objects (univariate):
x_ts <- ts(x)
y_ts <- ts(y)

# Using xts (multivariate):
library(xts)
xy_ts <- xts(xy[,-1], order.by = xy$dt)
summary(xy_ts)
str(xy_ts)
class(xy_ts)

xy_ts_x <- xy_ts[,1]
xy_ts_y <- xy_ts[,2]
summary(xy_ts_y)

# Cross-correlation fucntion from the univariate series:
ccf1 <- ccf(x_ts[,2], y_ts[,2])

# Cross-correlation fucntion from the multivariate series:
ccf2 <- ccf(drop(xy_ts_x), drop(xy_ts_y)) # drop extra dimensions in xts

Как видите, ось X на обоих графиках различна. Я прочитал много сообщений о ccf, xts и т. д., но я не мог найти, почему это происходит.


person goyiki    schedule 15.01.2016    source источник


Ответы (1)


Функции acf и ccf внутренне преобразуют свой первый аргумент в объект ts. Как я уже говорил в других местах, xts в настоящее время не очень хорошо обрабатывает преобразование в/из ts.

Обходной путь для этой конкретной проблемы — вручную установить для атрибута frequency значение 1 после создания объекта xts:

xy_ts <- xts(xy[,-1], order.by = xy$dt)
attr(xy_ts, "frequency") <- 1

xy_ts_x <- xy_ts[,1]
xy_ts_y <- xy_ts[,2]

ccf2 <- ccf(drop(xy_ts_x), drop(xy_ts_y))
person Joshua Ulrich    schedule 16.01.2016
comment
Я думал разделить задержки между 900, так как из результатов я понимаю, что задержки даны в секундах (вместо периодов), но ваш обходной путь намного лучше. В очередной раз благодарим за помощь! :) - person goyiki; 17.01.2016