SAS. Как сделать две ROC-кривые (двух групп сравнения) НА ОДНОМ графике?

Набор данных SAS (9.4) (d) включает 3 переменные: Y, маркер (= 0 и 1) и группу (= 1 и 2). Как сделать две ROC-кривые НА ОДНОМ участке? Я много смотрел в Интернете, но, к сожалению, не понял объяснения. Буду очень признателен за помощь! Итак, как поместить сюда групповую переменную? (P.S. А еще получите AUC с доверительными интервалами.)

одовая графика включена;

логистические данные процесса = d графиков = графиков ЭФФЕКТА = ROC;

маркер модели (событие = '1') = Y;

запустить;

ods графика выключена;

P.S. Сейчас добавлю образец.

Y - это вес человека

группа (= 1 и 2), где 1 - мужчина, 2 - женщина

маркер (= 0 и 1), где 1 означает, что вес является избыточным, а 0 означает, что вес нормальный.

Мне нужно получить две ROC-кривые (для мужчин и женщин) на одном участке для сравнения их.

sas roc

Beginner 28.03.2016 источник

comment

Для меня это пока не имеет смысла. Ваша зависимая переменная - Marker, где 1 означает избыточный вес, а 0 - нормальный. Ваша прогнозирующая переменная Y - это вес. Итак, вы хотите узнать, является ли вес (Y) хорошим предиктором избыточного веса (Маркер)? И посмотрите, одинаковы ли кривые ROC для мужчин и женщин? - Quentin 29.03.2016

comment

У вас одинаковое количество мужчин и женщин? - Quentin 29.03.2016

comment

И посмотрите, одинаковы ли кривые ROC для мужчин и женщин? ДА! У вас одинаковое количество мужчин и женщин? НЕТ! - Beginner 30.03.2016

comment

Думаю, я не совсем понимаю, но я попытаюсь попытаться ответить по-другому, сегодня вечером или завтра вечером. Похоже, вы хотите наложить две кривые ROC из независимых образцов (мужчин и женщин). В этой заметке поддержки есть многообещающий подход: support.sas.com/kb/45/ 339.html - Quentin 30.03.2016

Ответы (2)

arrow_upward
0
arrow_downward

У вас есть две независимые выборки (мужчины и женщины), и вы хотите сравнить кривые ROC, рассчитанные для каждой выборки. Насколько я понимаю, из http://support.sas.com/kb/45/339.html, SAS не может сравнивать кривые ROC из независимых образцов за один шаг PROC. Работу надо делать самому.

Процесс такой:

Запустите PROC LOGISTIC, чтобы вычислить статистику ROC (чувствительность / специфичность в каждой точке отсечения) и AUC со стандартными ошибками для каждого образца.
Постройте график статистики ROC, наложив две кривые.
Вычислите статистику теста и p-значение из AUC.

Ниже моя попытка привести пример. Я не обещаю, что это правильно, но это моя реализация моего понимания информации в примечании поддержки. Пожалуйста, прочтите примечание службы поддержки.

Образец данных. Я все еще не понимаю ваших данных, поэтому я сделал некоторые из них, которые я понимаю. Данные для 5 женщин и 6 мужчин. У каждого человека есть балл по диагностическому тесту и статус болезни (1/0).

data have;
  input Sex $1. Test Disease;
  cards;
F 10 0
F 20 0
F 30 1
F 40 0
F 50 1
M 10 0 
M 20 1
M 30 0
M 40 1
M 50 1
M 60 1
;
run;

Запустите PROC logistic и выведите статистику. Я использовал оператор BY вместо того, чтобы запускать отдельные шаги PROC для мужчин и женщин.

ods output ROCassociation=AUCs(where=(ROCmodel="Test"));
proc logistic data=have plots(only)=roc;
  model Disease(event='1') = Test
    /outroc=RocStats(where=(_source_="Test"))
  ;
  roc 'Test' Test;
  by Sex;
run;
ods output close;

Используйте SGPLOT для построения наложенных кривых ROC. Я использую 9.3, поэтому нужно использовать оператор графики ODS для создания квадратного графика. В 9.4 в SGPLOT появилась опция aspect = 1. Это прямолинейный сюжет, напоминающий мне, как я люблю SGPLOT и GTL. Не думаю, что когда-нибудь вернусь к GPLOT.

ods graphics / height=480px width=480px;
proc sgplot data=RocStats;
  xaxis values=(0 to 1 by 0.25) grid offsetmin=.05 offsetmax=.05; 
  yaxis values=(0 to 1 by 0.25) grid offsetmin=.05 offsetmax=.05;
  lineparm x=0 y=0 slope=1 / transparency=.7;
  series x=_1mspec_ y=_sensit_ / group=Sex;
run;

Вычислите тестовую статистику. В записке поддержки говорится, что это тест на большой выборке. Статистика теста соответствует распределению хи-квадрат с 1 степенью свободы.

data AUCtest(keep=AreaMale StdErrMale AreaFemale StdErrFemale ChiSq Prob);
  set AUCs (keep=Sex Area StdErr
            where=(Sex='M')
            rename=(Area=AreaMale StdErr=StdErrMale)
            )
  ;
  set AUCs (keep=Sex Area StdErr 
            where=(Sex='F')
            rename=(Area=AreaFemale StdErr=StdErrFemale)
            )
  ;
  ChiSq=(AreaMale-AreaFemale)**2/(StdErrMale**2 + StdErrFemale**2);
  Prob=1-probChi(ChiSq,1);
  format Prob pvalue6.;
run;

Опять же, не принимайте все это как истину. Используйте на свой страх и риск, я тоже на стадии обучения.

Quentin 30.03.2016

comment

Все отлично работает! Квентин, ты очень щедрый! Большое спасибо!!! (Я считаю, что SAS излишне усложняет решение простого вопроса о medstat.) P.S. К сожалению, моей репутации недостаточно, чтобы оценить ваш ответ. - Beginner; 30.03.2016

comment

Рад, что помог. Даже если у вас недостаточно репутации для голосования, я думаю, вы все равно можете принять ответ, щелкнув галочку рядом с ним (что принесет нам обоим некоторую репутацию :). Согласитесь, решение SAS поместить вычисления ROC в PROC LOGISTIC, а не в отдельный выделенный PROC ROC определенно вызывает ограничения. - Quentin; 30.03.2016

arrow_upward
0
arrow_downward

См. Заявления ROC и ROCCONTRAST. Хороший пример в документах SAS < / а>.

Вы не предоставили образцы данных, но я считаю, что вам нужно что-то вроде:

proc logistic data=d plots=EFFECT plots=ROC /nofit; 
  model marker (event='1') = Y  Group;
  roc 'Y' Y;
  roc 'Group' Group;
  roccontrast reference('Group') / estimate e;     
run;

Quentin 28.03.2016

comment

Это не совсем то, что мне нужно. Извините за нечеткое объяснение. Теперь, пожалуйста, посмотрите P.S. выше. - Beginner; 30.03.2016

comment

Согласны, это не то, что вам нужно, потому что у вас есть два независимых образца. Вышеупомянутое будет работать, если у вас есть одна выборка и вы хотите сравнить два предиктора. Добавлю ответ. - Quentin; 30.03.2016

Вопросы по теме

Сбой междоменного HTTP-запроса в AngularJS
не могу создать каталог с помощью mkdir
Почему в моем запросе не работает функция Neo4j None?
несколько растровых изображений против рисунков - влияние на производительность и память
удаление элемента в конкретном связанном списке
MongoDB: последняя запись для каждой категории по метке времени
Невероятно, но порядок просмотра раскадровки не соблюдается для представлений контейнера, исправить?
Django REST Как правильно хешировать пароль
Передача NSString между классами
Ошибка Ajax: код ответа 200
Приложение WinRT зависает при вызове BitmapDecoder.CreateAsync(stream)
Ошибка в поле выбора OpenERP версии 7
установить паруса вручную на сервер ubuntu
подстановочный знак classpath в @PropertySource
Получить и удержать вызов в twilio
Столбец автозаполнения на основе данных другого столбца
Фильтрация в пандах: исключение строк, содержащих часть строки [дубликаты]
Получить значения заголовков в ASP.NET MVC
Почему опечатка в объявлении функции Haskell приводит к тому, что GHCi выдает ошибки вокруг ранее скомпилированного кода?
как перепривязать сетку данных Silverlight