Категориальная числовая переменная в непрерывной форме для задачи регрессии

У меня есть набор данных, в котором все столбцы являются числовыми. Некоторые из столбцов имеют категории в числовой форме с уровнями> = 2. Нужно ли мне преобразовывать этот категориальный числовой столбец в фактор для регрессионного анализа или нет? Пожалуйста, предложите лучший подход в R.


person Sameer Kumar Pandey    schedule 07.03.2019    source источник


Ответы (1)


Да, это так. Вы можете доказать это себе ...

x <- rep(1:5, 20)
y <- rnorm(100)

# not converting to factors
m1 <- lm (y ~ x)

# converting to factors
m2 <- lm(y ~ as.factor(x) )

summary(m1) # one fitted coefficent
summary(m2) # five fitted coefficients

person user3357177    schedule 08.03.2019