преобразовать оператор sas if-else в R

У меня есть код SAS, аналогичный приведенной ниже логике. Я хотел бы преобразовать его в сценарий R, используя метод if-else или ifelse. Вот пример кода SAS:

if cat1=1 then do;
 if cat2 eq 'U' then do;
  if var1 =. then var1 = var3;
 end;
 else if cat2='A' then do;
  if var1 =. then var1=var2;
 end;
 end;
else do;
 if cat2 eq 'U' then do;
  if cat3 = 'NC' then do;
   if var1 =. then do;
    if var2 ge 4.0 then var1 =1.15;
   else if var2 le 4.0 then var1 = 10.0;
   else var1 = 6.1;
end;
end;
end;
end;

Вот преобразованный код R-скрипта. Однако последний шаг (df4) перезаписывает все предыдущие шаги. Есть ли лучший способ преобразовать эту логику в оператор R if-else.

df <- data.frame(cat1 = c(rep(1,3), rep(0,4)), 
             cat2 = c(rep('U',2), rep('A',3), 'U', 'U'), 
             cat3 = c(rep('NC',2), rep('RF',2), 'NC', 'NC', 'NC'),
             var1 = c(rep(NA,5),.14, NA), 
             var2 = c(rep(NA,2), 4.5, 2.3, 8.5, 3.4, 2.4), 
             var3 = c(rep(2.6, 2), 3.9, NA, 4.2, .012, NA))

df2 <- transform(df,
             var1 = ifelse(is.na(var1) & cat1 ==1 & cat2  == 'U', var3, var1) 
             )
df3 <- transform(df2, 
             var1 = ifelse(is.na(var1) & cat1 ==1 & cat2 == 'A', var2, var1)
             )
df4 <- transform(df3,
             var1 = ifelse(is.na(var1) & cat2 == 'U' & cat3 == 'NC' & var2 >= 4.0, 1.15,
                           ifelse(var2 <= 4.0, 10.0, 6.1))
             )

Пожалуйста помоги?


person R. Kal    schedule 21.10.2015    source источник
comment
Может возникнуть логическая проблема с последним условием, поскольку все var1 с cat2==U больше не будут отсутствовать после первых двух шагов, поэтому ничего не будет заменено.   -  person IRTFM    schedule 21.10.2015


Ответы (1)


Обычно я стараюсь делать «целевые назначения», то есть задания только в те места, которые соответствуют текущим критериям. Таким образом, я могу избежать проблем с перезаписью, когда я изменяю весь вектор с вложенными ifelse, которые я не отладил должным образом:

df$var1[ with(df, is.na(var1) & cat1 ==1 & cat2 == 'U' )] <- df$var3
df$var1[ with(df,(is.na(var1) & cat1 ==1 & cat2 == 'A') ] <- df$var2
df$var1[ with(df, is.na(var1) & cat2 == 'U' & cat3 == 'NC') ] <-
    with( df[ with(df, is.na(var1) & cat2 == 'U' & cat3 == 'NC') , ],
           ifelse( var2 >= 4.0, 1.15,
                           ifelse(var2 <= 4.0, 10.0, 6.1))
         )

Я не уверен, что правильно понял логику. Я только что скопировал ваши условные выражения R в выделение.

df

  cat1 cat2 cat3  var1 var2  var3
1    1    U   NC  2.60   NA 2.600
2    1    U   NC  2.60   NA 2.600
3    1    A   RF    NA  4.5 3.900
4    0    A   RF    NA  2.3    NA
5    0    A   NC    NA  8.5 4.200
6    0    U   NC  0.14  3.4 0.012
7    0    U   NC 10.00  2.4    NA
person IRTFM    schedule 21.10.2015