Результаты кривой выживания Каплана Мейера различаются между R и SAS?

Я повторно использую кривые выживания Каплана-Мейера на основе ранее опубликованных данных, используя точный набор данных, использованный в публикации (Charpentier et al., 2008 - Инбридинговая депрессия у кольчатых лемуров (Lemur catta): генетическое разнообразие предсказывает паразитизм, иммунокомпетентность). , и выживаемость). В этой публикации были построены кривые в SAS версии 9 с использованием LIFETEST для анализа возраста смерти, структурированного генетической гетерозиготностью и полом животного (n = 64). Она сообщает, что значение хи-квадрат составляет 6,31, а значение p - 0,012; однако, когда я провожу кривые в R, я получаю значение хи-квадрат 0,9 и значение p 0,821. Кто-нибудь может это объяснить ??

Используемый код R: возраст - время смерти, смертность - код цензуры, пол - гендерный слой, а ho2 - фактор, разделяющий две сравниваемые группы.

> survdiff(Surv(age, mort1)~ho2+sex,data=mariekmsurv1)
Call:
survdiff(formula = Surv(age, mort1) ~ ho2 + sex, data = mariekmsurv1)

              N Observed Expected (O-E)^2/E (O-E)^2/V
ho2=1, sex=F 18        3     3.23    0.0166    0.0215
ho2=1, sex=M 12        3     2.35    0.1776    0.2140
ho2=2, sex=F 17        5     3.92    0.3004    0.4189
ho2=2, sex=M 17        4     5.50    0.4088    0.6621

Chisq= 0.9  on 3 degrees of freedom, p= 0.821 


> str(mariekmsurv1)
'data.frame':   64 obs. of  6 variables:
 $ id   : Factor w/ 65 levels "","aeschylus",..: 14 31 33 30 47 57 51 39 36 3 ...
 $ sex  : Factor w/ 3 levels "","F","M": 3 2 3 2 2 2 2 2 2 2 ...
 $ mort1: int  0 0 0 0 0 0 0 0 0 0 ...
 $ age  : num  0.12 0.192 0.2 0.23 1.024 ...
 $ sex.1: Factor w/ 3 levels "","F","M": 3 2 3 2 2 2 2 2 2 2 ...
 $ ho2  : int  1 1 1 2 1 1 1 1 1 2 ...
- attr(*, "na.action")=Class 'omit'  Named int [1:141] 65 66 67 68 69 70 71 72 73 74 ...
  .. ..- attr(*, "names")= chr [1:141] "65" "66" "67" "68" ...
    

person user3491003    schedule 02.04.2014    source источник
comment
можете ли вы поместить данные в воспроизводимую форму?   -  person Ben Bolker    schedule 03.04.2014
comment
Есть ли в пабе код SAS для запуска PROC LIFETEST?   -  person Joe    schedule 03.04.2014
comment
Когда вы говорите, что хи-квадрат, вы имеете в виду логранговый тест хи-квадрат (Мантель-Хензеля)? Было ли указано в документе, использовался ли этот тест, а не Пето-Пето и т. Д.? По умолчанию как в SAS, так и в R (survdiff с rho=0) используется ранг журнала.   -  person Alex A.    schedule 04.04.2014
comment
Этот вопрос кажется не по теме, потому что он касается статистических методов, а не кодирования. Принадлежит CrossValidated.com   -  person IRTFM    schedule 10.05.2014
comment
Обратите внимание, что метод обработки связей по умолчанию для кривых выживаемости - это Бреслоу в SAS и Эфрон в R.   -  person Alex A.    schedule 18.11.2014


Ответы (2)


Некоторые идеи:

Попробуйте запустить его в SAS - посмотрите, получите ли вы те же результаты, что и автор. Возможно, они отправили вам не тот набор данных, который использовали.

Посмотрите значения по умолчанию для соответствующего SAS PROC и сравните со значениями по умолчанию для используемой вами функции R.

person rcorty    schedule 10.05.2014
comment
Лучше поместить это как комментарий. - person IRTFM; 11.05.2014

Учитывая ОГРОМНУЮ разницу между значениями хи-квадрат (6,81 и 0,9) и P (0,012 и 0,821) между процедурой SAS и процедурой R для анализа выживаемости; Я подозреваю, что вы использовали неправильные переменные в любой из процедур.

Процедурная разница / (разница в обработке данных между SAS и R может вызвать очень небольшие различия).

Это не программная ошибка, скорее всего, это человеческая ошибка.

person Mandar    schedule 15.07.2019