Я пытаюсь предсказать статистически значимые переменные из списка двоичных переменных. У меня есть концептуальные сомнения в двух упомянутых ниже подходах к поиску соответствующих переменных.
Зависимая переменная: рост человека.
Независимые переменные:
- Пол (мужской или женский)
- Financial_Status (ниже черты бедности или нет)
- College_Graduate(Да или Нет)
Подход 1. Подгонка линейной регрессии, принимая их как зависимые/независимые переменные и находя статистически значимые переменные.
Подход 2. Выполнение отдельного статистического теста для каждой зависимой переменной (t-тест или какой-либо другой соответствующий тест) для вычисления статистически значимых переменных.
Являются ли оба этих подхода похожими и дадут ли они аналогичные результаты? Если нет, то какая именно разница?