Я провел небольшое исследование и пришел к вам с несколькими книгами, которые, как я обнаружил, могут быть полезны для понимания причинно-следственной связи.

Первой вводной книгой будет: «Введение в статистическое обучение». Это дополнение к МООК из Стэнфорда, которое предлагает его на своей платформе «лагунита» вместе с бесплатным сертификатом:

Введение в статистическое обучение

Бесплатная книга в формате PDF

Статистическое обучение МООК на тему лагунита»

Обзор Террана М на goodreads.com:

Адекватная подготовка к пониманию Принципов и практики моделирования структурными уравнениями будет базовым подходом к многомерной регрессии, такой как Гельман и Хилл. Введение в статистическое обучение также будет достаточным. Если вы хотите понять подтверждающий факторный анализ, вы, вероятно, уже должны знать кое-что о факторном анализе; Мне понравился Горсуч.

Анализ данных с использованием регрессии и многоуровневых/иерархических моделей

от Эндрю Гельман, Дженнифер Хилл

Посмотреть на goodreads.com

Отзыв Мига на goodreads.com

Полезная книга по многоуровневому моделированию, но далеко не моя любимая книга по статистике. Во-первых, следует пройти все разделы, посвященные распределениям вероятностей и линейной регрессии, так как в другом месте по той же теме (и с кодами R) есть намного лучше, например Введение в статистическое обучение: с приложениями в R.

Принципы и практика моделирования структурными уравнениями, четвертое издание

Обзор Террана М на goodreads.com:

Это правильная первая книга по причинно-следственным выводам. Он охватывает моделирование структурными уравнениями (SEM), подтверждающий факторный анализ (CFA) и структурированное причинно-следственное моделирование Перла (SCM).

Хотя в этой книге утверждается, что она охватывает различные программные пакеты, ее рассмотрение поверхностно, а примеры кода (онлайн) в основном не комментируются; не ожидайте, что вы научитесь пользоваться программным обеспечением из этой книги. Прочтите эту книгу, чтобы ознакомиться с принципами, а затем прочтите руководство по программному обеспечению для любого инструмента, который вы собираетесь использовать.

По иронии судьбы, эта книга, чье название претендует на то, чтобы говорить только о СЭМ, на самом деле охватывает большую часть современного причинного вывода, в то время как книга Перла с громким названием «Причинность» охватывает только его узкую работу. Это определенно тот, который вы хотите.

Краткое введение в использование причинно-следственных графиков для выбора элементов управления см. в главе 17 книги Статистическое моделирование — свежий подход. Эта глава доступна бесплатно у автора на http://www.mosaic-web.org/go/Statisti...

Чтобы узнать больше о построении графиков причинно-следственных связей на основе данных, см. серию статей Коломбо и Маатуиса из ETH Zurich. Вот пара бумажек:

https://projecteuclid.org/euclid.aos/...
https://projecteuclid.org/euclid.aos/...

Эти статьи также есть на ArXiv, и есть еще от тех же авторов. Кроме того, они написали пакет R:

https://cran.r-project.org/web/packag...

Элементы статистического обучения: интеллектуальный анализ данных, вывод и прогнозирование

https://web.stanford.edu/~hastie/ElemStatLearn/

Задача понимания огромных объемов данных в различных областях, таких как медицина, биология, финансы и маркетинг, привела к разработке новых инструментов в области статистики и породила новые области, такие как интеллектуальный анализ данных, машинное обучение и биоинформатика. . Многие из этих инструментов имеют общую основу, но часто выражаются с помощью разной терминологии. Эта книга описывает важные идеи в этих областях в общей концептуальной основе. Хотя подход является статистическим, акцент делается на концепциях, а не на математике. Приведено множество примеров с широким использованием цветной графики. Это должно быть ценным ресурсом для статистиков и всех, кто интересуется интеллектуальным анализом данных в науке или промышленности. Охват книги широк, от обучения с учителем (прогнозирование) до обучения без учителя. Многие темы включают нейронные сети, машины опорных векторов, деревья классификации и бустинг — первое всестороннее рассмотрение этой темы в любой книге. Тревор Хасти, Роберт Тибширани и Джером Фридман — профессора статистики Стэнфордского университета. Они являются известными исследователями в этой области: Хасти и Тибширани разработали обобщенные аддитивные модели и написали популярную книгу с таким названием. Хасти написал большую часть программного обеспечения для статистического моделирования в S-PLUS и изобрел основные кривые и поверхности. Тибширани предложил Lasso и является соавтором очень успешной книги An Introduction to the Bootstrap. Фридман является соавтором многих инструментов интеллектуального анализа данных, включая CART, MARS и проекционное преследование.

Обзор Террана М на goodreads.com:

Это отличная вторая или третья книга по статистическому моделированию после того, как вы прочитали что-нибудь с примерами кода и сделали несколько реальных проектов. Он математически глубже и полнее, чем Введение в статистическое обучение: приложения в R, и делает больше, чтобы связать воедино, как и почему работают алгоритмы. Он не содержит примеров кода и, соответственно, более требователен к математической подготовке читателя. Даже если вы никогда не читали его полностью, его стоит иметь в качестве справочника, а PDF-файл даже доступен бесплатно у автора: https://web.stanford.edu/~hastie/ElemStatLearn/