R - корреляционная матрица Corrplot() имеет вопросительные знаки в сетке. Как понять матрицу?

Я пытаюсь создать корреляционную матрицу переменных из набора данных прогнозирования фильмов IMDB из kaggle. Когда я пытаюсь построить матрицу корреляции, я получаю следующие вопросительные знаки в матрице.

Корреляционная матрица

Все переменные числовые. Как я понимаю вопросительные знаки?

numeric_col <- sapply(df, is.numeric)
movie_numeric <- df[, numeric_col]
Correlation <- cor(movie_numeric)
corrplot(Correlation)

person user1884763    schedule 07.03.2019    source источник
comment
Из ?corrplot: 'na.label — метка, которая будет использоваться для рендеринга ячеек NA. По умолчанию ?.' См. также вводную документацию.   -  person neilfws    schedule 07.03.2019


Ответы (1)


Как сказал @neilfws в своем комментарии, значения NA представлены вопросительными знаками.

Вы можете попытаться избежать значений NA, используя только попарно полные наблюдения при вычислении матрицы корреляции:

Correlation <- cor(movie_numeric, use="pairwise.complete.obs")
person Karolis Koncevičius    schedule 12.05.2019