1. Регрессия байесовского непараметрического квантильного процесса и оценка предельных квантильных эффектов (arXiv)

Автор: Стивен Г. Сюй, Брайан Дж. Райх

Аннотация: Гибкая оценка множественных условных квантилей представляет интерес для многочисленных приложений, таких как изучение влияния факторов, связанных с беременностью, на низкий и высокий вес при рождении. Мы предлагаем байесовский непараметрический метод для одновременной оценки непересекающихся нелинейных кривых квантилей. Мы расширяем условную функцию распределения отклика в базисных функциях I-сплайна, где ковариатно-зависимые коэффициенты моделируются с помощью нейронных сетей. Используя силу аппроксимации сплайнов и нейронных сетей, наша модель может аппроксимировать любую непрерывную функцию квантилей. По сравнению с существующими моделями наша модель оценивает все, а не конечное подмножество квантилей, хорошо масштабируется до высоких размерностей и учитывает неопределенность оценки. Хотя модель является произвольно гибкой, интерпретируемые предельные квантильные эффекты оцениваются с использованием кумулятивных графиков локальных эффектов и переменных показателей важности. Имитационное исследование показывает, что наша модель может лучше восстанавливать квантили распределения ответов, когда данных мало, и представлен анализ данных о массе тела при рождении.

2.Быстрые алгоритмы для процесса квантильной регрессии (arXiv)

Автор:Виктор Черножуков, Иван Фернандес-Валь, Блез Мелли

Вывод:Широкое использование методов квантильной регрессии в решающей степени зависит от наличия быстрых алгоритмов. Несмотря на многочисленные улучшения алгоритма, время вычислений по-прежнему существенно, потому что исследователи часто оценивают многие квантильные регрессии и используют бутстрап для вывода. Мы предлагаем два новых быстрых алгоритма для оценки последовательности квантильных регрессий по многим квантильным индексам. Первый алгоритм применяет идею предварительной обработки Portnoy and Koenker (1997), но использует предварительно оцененную квантильную регрессию для угадывания знака остатков. Этот шаг позволяет уменьшить эффективный размер выборки. Второй алгоритм начинает с ранее оцененной квантильной регрессии с аналогичным квантильным индексом и обновляет ее, используя одну итерацию Ньютона-Рафсона. Первый алгоритм точен, а второй лишь асимптотически эквивалентен традиционной оценке квантильной регрессии. Мы также применяем идею предварительной обработки к начальной загрузке, используя выборочные оценки, чтобы угадать знак остатков в выборке начальной загрузки. Моделирование показывает, что наши новые алгоритмы обеспечивают очень значительное улучшение времени вычислений без значительных (если вообще) затрат на качество оценок. Например, мы делим на 100 время, необходимое для оценки 99 квантильных регрессий с 20 регрессорами и 50 000 наблюдений.

3. Распределенный вывод для процессов квантильной регрессии (arXiv)

Автор :Станислав Волгушев, Ши-Кан Чао, Гуан Чэн

Аннотация. Повышение доступности массивных наборов данных дает уникальную возможность обнаружить тонкие закономерности в их распределении, но также создает огромные вычислительные проблемы. Чтобы полностью использовать информацию, содержащуюся в больших данных, мы предлагаем двухэтапную процедуру: (i) оценить условные квантильные функции на разных уровнях в параллельной вычислительной среде; (ii) построить процесс условной квантильной регрессии посредством прогнозирования на основе этих оценочных кривых квантилей. Наша общая структура квантильной регрессии охватывает как линейные модели с фиксированной или растущей размерностью, так и модели аппроксимации рядов. Мы доказываем, что предлагаемая процедура не жертвует точностью статистического вывода при условии правильного выбора количества распределенных вычислительных единиц и уровней квантилей. В частности, точная верхняя граница для первого и точная нижняя граница для второго выводятся для получения минимальных вычислительных затрат со статистической точки зрения. В качестве важного приложения рассматривается статистический вывод об условных функциях распределения. Кроме того, мы предлагаем эффективные с вычислительной точки зрения подходы к проведению логического вывода в условиях распределенной оценки, описанных выше. Эти подходы напрямую используют доступность оценок из подвыборок и могут быть выполнены практически без дополнительных вычислительных затрат. Моделирование подтверждает нашу теорию статистического вывода

4. Почти корневое приближение для процессов квантилей регрессии (arXiv)

Автор :Стивен Портной

Аннотация. Традиционно оценка точности вывода на основе квантилей регрессии основывалась на представлении Бахадура. Это дает ошибку порядка n−1/4 в нормальных аппроксимациях и предполагает, что вывод, основанный на квантилях регрессии, может быть не таким надежным, как вывод, основанный на других (более плавных) подходах, ошибки которых обычно имеют порядок n−1/2 ( или лучше в особых симметричных случаях). К счастью, обширные симуляции и эмпирические приложения показывают, что вывод для квантилей регрессии имеет меньшую частоту ошибок, чем другие процедуры. На самом деле «венгерская» конструкция Комлоша, Майора и Туснади [З. Варш. Верв. Gebiete 32 (1975) 111–131, Z. Wahrsch. Верв. Gebiete 34 (1976) 33–58] предлагает альтернативное расширение для одновыборочного квантильного процесса с частотой ошибок, близкой к корню n (в частности, с точностью до множителя logn). Такое расширение разработано здесь, чтобы обеспечить теоретическую основу для более точных приближений для вывода в моделях квантилей регрессии. Одним конкретным приложением, представляющим независимый интерес, является результат, устанавливающий, что для условного вывода частота ошибок для вероятностей охвата с использованием Холла и Шизера [J. Р. Стат. соц. сер. Б Стат. Методол. 50 (1988) 381–391] метод оценки разреженности соответствует их частоте одной выборки.