О статистике распространено заблуждение, что корреляция ведёт к каузации. Например, если больше высоких людей владеют котами, то вы можете подумать, что чем вы выше, тем больше шанс, что вы заведёте кота. Но простое знание корреляции между высотой и котами не говорит нам ничего о том, в какую сторону направлена причинная связь. Может быть, всё наоборот: коты заставляют расти людей высокими. А может быть, реальная причина — нечто совсем иное. Например, если люди с котами живут на двух разных островах: райском покрытом зеленью, где достаточно еды, чтобы расти высокими и кормить домашних животных, и пустынном, на котором мало возможностей вырасти высоким и завести кота.
Данные примеры полезны тем, что они показывают, что корреляция между двумя событиями необязательно говорит нам, что одно является причиной другого. Отсюда распространённое выражение: корреляция на означает каузацию. И оно правильное. Но эта часто повторяемая мантра ведёт к ещё одному заблуждению, согласно которому вы не можете вывести никакой причинно-следственной связи из статистики. А вы можете.
Довольно логично думать, что если между двумя вещами есть корреляция, скорее всего, у этого есть какая-то причина, даже если сама корреляция не может напрямую указать на неё. Иногда вы можете вывести причинность из дополнительной информации. Например, знания, что одно событие произошло до другого. Но вы можете вывести причинность напрямую из корреляции. Для этого вам всего лишь нужно несколько корреляций и кое-что под названием причинные сети.
В случае нашего примера с котами, высотой и островом, мы знаем, что рост и кошатничество коррелирует. Но мы не знаем причины этой корреляции. Если мы ничего больше не знаем, тогда существует девятнадцать, да, девятнадцать причинно-следственных связей, способных описать эту ситуацию. Двадцать, если всё это просто случайность.
![]() |
[Иллюстрация: все возможные причинно-следственные связи] |
Как кажется, пока, корреляция совсем не ведёт к каузации, но возможно, мы знаем ещё две вещи. Во-первых, предположим, что люди рождённые на определённом острове, остаются на нём, так что их рост не влияет на то, на каком острове они живут. Поэтому мы можем вычеркнуть связи, в которых остров зависит от роста. Во-вторых, предположим, что на островах самих по себе нет никакой связи между ростом и кошатничеством. Исходя из этого, мы можем отбросить все варианты, в которых коты напрямую влияют на рост. Это оставляет всего два возможных варианта.
Либо острова являются причиной и высоты, и кошатничества. Возможно, как предположили ранее, один из островов — покрытый зеленью рай и для людей и для котов. Либо владение котом — причинное объяснение островов, а острова являются причиной роста. Возможно, распространённость котов превратила остров в рай, что повлияло на рост будущих хозяев.
Итак, начиная с девятнадцати возможных причинно-следственных связей, мы использовали корреляции, чтоб сократить их количество до двух. Неплохо. Если бы мы знали что-то о времени, когда коты и люди прибыли на остров, возможно, мы бы смогли сократить количество вариантов до одного. Конечно, это всего лишь простой пример. Но для любой группы вещей вы можете использовать различные корреляции между ними или их отсутствие, чтобы избавиться от некоторых возможных причинно-следственных связей. Именно так корреляция может означать каузацию.
Есть только одна проблема. Некоторые эксперименты в квантовой механике выдают корреляции, которые исключают все возможные причинно-следственные связи. Нам придётся поговорить об этих деталях в другом видео, но вот как по-настоящему должно звучать это выражение: «корреляция не обязательно означает каузацию, но она может её означать, если вы проанализируете её каузальными моделями, но не в случае квантовой механики».
Это видео было выбрано для перевода по итогам голосования на сайте patreon.com. Если и вы хотите получить возможность выбрать следующий ролик, а также поддержать канал, переходите по ссылке на экране или в описании. Спасибо за просмотр. Видео выходит при поддержке паблика XKCD.
[Это текст перевода следующего оригинального ролика:]
[Correlation CAN Imply Causation! | Statistics Misconceptions]
Комментарии
Отправить комментарий