Регресс при деп. переменная - это пропорция в Stata

Я делаю анализ в Stata факторов, определяющих уровень безработицы в переписных районах. В некоторой предыдущей литературе по моей теме использовалась прямая регрессия OLS, и я начал с этого типа анализа, но после моего собственного дальнейшего прочтения мне кажется, что обобщенная линейная модель лучше. Это в особенности потому, что я заинтересован в представлении прогнозируемых значений уровней безработицы на переписных участках на основе моей регрессии, и я хотел бы, чтобы они были надлежащим образом ограничены (от 0% до 100% включительно). Мои уровни безработицы включают нули для некоторых участков переписи, поэтому мне нужно это принять во внимание.

Мои вопросы:

  1. эквивалентен ли fracreg logit Статы программе glm с логит-связью и биномиальным семейством? (Я читал об использовании версии glm в нескольких местах, включая здесь, но обратите внимание, что fracreg - это новая команда, которая, похоже, служит той же цели). Могу ли я указать эквивалент опции robust при использовании fracreg logit?

  2. при использовании fracreg, на каком основании я должен решить использовать дробную пробитную (fracreg probit) или дробную логит (fracreg logit) регрессию?

  3. простой (вероятно, неосведомленный) вопрос интерпретации: я вижу, что fracreg и glm регрессии, упомянутые выше, не сообщают о величине R-квадрата. Могу ли я рассчитать эквивалентную меру для этих регрессий? Мои значения R-квадрата OLS были достаточно высокими, и это было для меня источником уверенности, поэтому я хотел бы посмотреть, как эти модели сравниваются (хотя я знаю, что R-квадрат - это еще не все!).

  4. при использовании этих моделей существуют ли какие-либо дополнительные ограничения или предположения (например, дополнительные предположения, выходящие за рамки СИНИХ OLS), которые я должен иметь в виду? С моей регрессией OLS я взял натуральный логарифм уровней безработицы (что делает мои остатки более нормальными, более высоким R-квадратом и удобной интерпретацией). Могу ли я сделать то же самое с fracreg или glm регрессиями выше?

Прошло некоторое время с тех пор, как я официально изучал ограниченные зависимые переменные, поэтому, пожалуйста, извините за мое незнание по этим вопросам.

Я разместил этот вопрос на сайте Statalist здесь.


person O. Kendrick    schedule 02.05.2016    source источник
comment
Я голосую за то, чтобы закрыть этот вопрос как не по теме, потому что здесь нет проблем с программированием. Это о том, какую команду использовать для каких статистических целей и различные статистические вопросы. На мой взгляд, статистик прав. Перекрестная проверка не особенно подходит, потому что здесь многое зависит от программного обеспечения.   -  person Nick Cox    schedule 02.05.2016


Ответы (1)


Это не относится к Stata, но ознакомьтесь с "Оценка максимального правдоподобия моделей" Паолино 2001 г. с бета-распределенными зависимыми переменными; "как минимум выделит освещенный обзор того, почему OLS предлагает предвзятые оценки.

Привет, продолжение: кто-то действительно создал решение Stata, посмотрите "Бакли, Джек. 2003." Оценка моделей с бета-распределенными зависимыми переменными: репликация и расширение исследования Паолино ". Политический анализ. 11 (2): 204-205 ».

person Skimwhistle    schedule 02.05.2016
comment
Спасибо! Для меня это была очень полезная ссылка на такого рода оценку в целом. Что касается mlbeta Джека Бакли, кажется, что человек может использовать официальные команды Stata для той же цели: stata.com/statalist/archive/2007-08/msg00577.html - person O. Kendrick; 03.05.2016
comment
-betareg- был добавлен в Stata 14. - person Nick Cox; 03.05.2016