Причинно-следственная связь и корреляция.

Мы слышали об этих двух словах больше, чем можем сосчитать за всю свою жизнь. Корреляция стала общепризнанным братом этих двух вещей, который выставлялся напоказ уже много лет.

Причинность, с другой стороны, пережила много трудных времен. Причинная связь - это ключ, открывающий дверь эксперимента, объяснение тайны. Но корреляция - это более простой вывод, который просто констатирует, что существует класс ключей, которые потенциально могут открыть эту дверь. Но не более того.

Мы можем обратиться к истории, чтобы понять, как мы справлялись с этими проблемами.

Идея о том, что курение вызывает рак легких, яростно боролась на протяжении многих лет. Конечно, скептики высказали свое мнение по поводу смешивающих переменных - что, возможно, существует ген, связанный с раком легких, который, как оказалось, тоже есть у курильщиков. И этот обмен необоснованными переменными, которые могли бы объяснить взаимосвязь между курением и раком легких, просто демонстрирует, насколько молод наш язык для описания причины и следствия.

Это также демонстрирует, насколько легко спутать корреляцию с причинно-следственной связью. Как невозможно доверять любым утверждениям, сделанным в результате корреляционных исследований.

Но мы по-прежнему прибегаем к корреляции - надежному значению r и ближайшему родственнику r-квадрату - чтобы получить представление о том, как одна переменная может влиять на другую. Но мы бы согрешили, если бы сказали, что x вызвало y.

Ваши скептически настроенные друзья и коллеги спросят:

Как ты мог быть так уверен?

Существует множество исследований, в которых были обнаружены другие переменные, которые также вызывают y. Как вы это примирите?

Должен быть выход.

Это то, что я узнал, читая Книгу причин Джудеи Перл и обсуждая эти темы со сверстниками, которые не смотрят на меня с ума, когда я поднимаю подобные вещи.

Итак, вот что нам нужно сделать, чтобы начать поиск причинно-следственной связи:

Прежде всего, нам нужно освободиться от уроков по статистике 101, которые мы дорожим нашим сердцем на протяжении десятилетий, которые мы учились в школе. Мы не должны бояться слова "причинная связь" - когда это в самой нашей природе - принимать решения, основанные на причинных факторах.

Вот почему ваша мама посоветовала вам выполнять эти общепринятые в вашей культуре распорядки, которые помогут избавиться от простуды. Потому что это каким-то образом сработало, и эти знания передавались из поколения в поколение.

Это может быть плохой пример (так как вы все еще можете быть больны после выполнения этих ритуалов), но вы уловили мой уклон.

Во-вторых, мы должны быть осторожны с корреляциями, которые мы вычисляем с помощью алгоритмов машинного обучения. Многие люди подтвердили, что данные могут иметь врожденную предвзятость, особенно при определении вещей, которые влияют на реальную жизнь.

Сразу приходит на ум определение, виновен ли кто-то в правонарушении и какое лечение порекомендовать больному пациенту. Очень заманчиво, когда данные говорят за нас, но позвольте себе отдать должное. Мы тоже можем найти смысл в шуме данных.

В-третьих, нам нужно начать разработку способов уловить истинную суть проблемы. Недостаточно бросить кучу переменных в горшок, запустить алгоритм, сообщающий нам, что важно, и воспользоваться преимуществами прогнозов.

В книге особое внимание уделяется построению причинно-следственных диаграмм, чтобы действительно понять взаимосвязь между переменными. Мы можем углубиться в это в другой статье, но общая идея заключается в следующем:

  1. Изложите свою гипотезу в виде - X вызывает Y
  2. Перечислите все переменные, которые, по вашему мнению, имеют отношение к проблеме.
  3. Нарисуйте стрелки, показывающие, как эти переменные взаимосвязаны.

Как только вы получите общее представление, вы сможете использовать эту концепцию для решения целого ряда проблем. Это будет похоже на детскую игру, но это дает огромные преимущества в улучшении вашего понимания того, что вы пытаетесь решить.

Давайте вместе работать над пониманием основных законов, которые определяют проблемы, которые мы пытаемся решить сегодня. Здравоохранение. Социальная справедливость. Образование. Несправедливость. Всем им нужен язык причинности, чтобы раздвинуть границы того, что мы знаем сегодня.

Спасибо за прочтение.