в чем разница? — Соцсети на vc.ru
Я люблю данные, и мне нравится их изучать. Поэтому специально для digital-агентства «Интериум» я перевел статью emplifi. io о различии между корреляцией и причинно-следственной связью. Анализируя, например, данные из соцсетей, и, спутав корреляцию и причинно-следственную связь в действиях пользователей или развитии трендов, можно прийти не к тем выводам. Давайте разберёмся, а в конце небольшой пример из нашей практики.
3488 просмотров
Существует немало статей, в которых содержатся дикие, часто насмешливые выводы, полученные в результате двух сильно коррелирующих наборов данных. Например, Harvard Business Review однажды рассмотрел примеры, показывающие «возможность» того, что:
Тратя больше денег на просмотр спортивных матчей, вы снижаете вероятность употребления кукурузного сиропа с высоким содержанием фруктозы.
Чем больше продано iPhone, тем больше людей погибнет, упав с лестницы.
Это крайние примеры. Корреляция не обязательно подразумевает причинно-следственную связь, и эти примеры показывают опасность непонимания разницы между корреляцией и причинно-следственной связью в реальном мире. В этих случаях требуется дополнительная проверка, прежде чем корреляцию можно будет квалифицировать как причинно-следственную связь.
В чем разница между корреляцией и причинностью?
Начнем с основ. Каково определение причинно-следственной связи по сравнению с корреляцией?
Что такое корреляция?
Австралийское бюро статистики дает отличное определение корреляции:
«[Это] статистическая мера (выраженная в виде числа), которая описывает размер и направление взаимосвязи между двумя или более переменными».
Другими словами, изменение одной переменной обычно отражается положительным или отрицательным изменением другой.
Какие существуют типы корреляций?
Положительная корреляция: переменные A и B движутся в одном направлении.
Например, по мере увеличения переменной A растет и B.Отрицательная корреляция: переменные A и B движутся в противоположных направлениях. Например, когда переменная A увеличивается, B уменьшается.
- Нет корреляции: нет очевидной связи между переменными A и B.
Положительная корреляция, отрицательная и её отсутствие
Сила линейной связи между двумя переменными, также называемая коэффициентом корреляции, может варьироваться от -1 (отрицательная корреляция) до 1 (положительная корреляция). Чем ближе коэффициент корреляции к -1 или 1, тем сильнее связь. А коэффициент, равный 0, указывает на отсутствие корреляции между двумя переменными.
Однако корреляция не обязательно означает, что переменные обязательно связаны. Это подводит нас к причинно-следственной связи…
Что такое причинно-следственная связь?
Австралийское статистическое бюро определяет причинно-следственную связь следующим образом:
«…одно событие является результатом возникновения другого события, т. е. существует причинно-следственная связь между двумя событиями. Это также называется причиной и следствием».
Другими словами, действительно ли одна переменная влияет на другую?
Примеры причинно-следственной связи и корреляции
Есть такой развлекательный ресурс Spurious Correlations, который делится примерами, демонстрирующими тесную взаимосвязь между переменными, которые не вызваны одна другой. По крайней мере, этих взаимосвязей быть не должно.
Показательный пример: употребление маргарина влияет на количество разводов в американском штате Мэн?
Диаграмма, показывающая сильную корреляцию между уровнем разводов в штате Мэн и потреблением маргарина. Источник: tylervigen.com
Продолжая примеры с едой, может ли сыр быть секретным топливом, которое питает инженеров-строителей в их исследованиях?
Диаграмма, показывающая сильную корреляцию между потреблением сыра моцарелла и количеством присужденных докторских степеней в области гражданского строительства. Источник: tylervigen.com
Обе диаграммы показывают сильную корреляцию между зависимыми и независимыми переменными. Однако это, вероятно, классические случаи, когда «корреляция не подразумевает причинно-следственной связи». Если, конечно, маргарин действительно не является щекотливой темой для пар в штате Мэн или появились новаторские эффекты употребления большого количества сыра.
Почему важно знать разницу между корреляцией и причинно-следственной связью?
Приведенные выше примеры корреляции и причинно-следственной связи показывают, что правильное понимание разницы имеет решающее значение.
Авинаш Кошик, евангелист цифрового маркетинга в Google, в 2016 году писал о том, что непонимание разницы может быть очень проблематичным. Кошик обратил внимание на статью The Economist, в которой утверждалось, что употребление большего количества мороженого может повысить баллы учащихся по шкале чтения PISA.
«Для нормальных людей (не аналитиков) эти график и статья выглядят правдоподобно. В конце концов, это уважаемый сайт и уважаемая команда. О, и посмотрите, есть красная линия, что-то похожее на правдоподобное распределение и R-квадрат!»
Авинаш Кошик
Но Кошик хочет, чтобы мы больше думали об имеющихся данных и не принимали вещи за чистую монету.
Он указывает, что нет ничего, что могло бы обосновать причинность того и другого, несмотря на разумную корреляцию. Может показаться, что существует связь, связывающая IQ с потреблением мороженого. Тем не менее, данные не раскрывают ничего, кроме этой очевидной корреляции.
Смелые заявления
В нашей повседневной жизни мы сегодня имеем доступ к большему количеству данных, чем когда-либо прежде. Решения, мнения и даже бизнес-стратегии могут зависеть от нашей способности различать их.
Кошик использует приведенный выше пример, чтобы напомнить людям о необходимости более скептически относиться к утверждениям, которые делают смелые выводы на основе коррелирующих данных. Он призывает читателей смотреть глубже и избегать простых решений.
«Наша работа состоит в том, чтобы быть скептичными, копать и понимать, тыкать и подталкивать, и отвергать возмутительно неправильное, а если оно не является возмутительно неправильным, то выяснить, насколько оно может быть правильным, чтобы вы могли дать обоснованную рекомендацию»
Авинаш Кошик
Причинно-следственная связь и корреляция также являются темой, которую Майкл Молнар исследует в статье Forbes. Молнар предупреждает, что:
«Путаница корреляции с причинно-следственной связью не является скрытой проблемой, но она становится все более проблематичной по мере увеличения объема данных и повышения мощности компьютеров… она затрагивает суть того, что мы знаем — или думаем, что знаем — о том, как устроен мир».
Майкл Молнар
Может быть трудно установить причинно-следственную связь между двумя переменными. Часто необходимы рандомизированные контролируемые опыты и другие статистические тесты, чтобы проверить, действительно ли одна переменная влияет на другую.
Более того, хотя корреляции могут быть полезными показателями, они имеют ограничения. Как мы увидели в приведенных выше примерах корреляции и причинно-следственной связи, это обычно связано с измерением линейной зависимости.Правильная корреляция и причинно-следственная связь
В сегодняшнем мире, управляемом данными, важно более скептически относиться к конкретным выводам, прежде чем делать смелые заявления, предлагает Кошик. Как мы можем это сделать? Дальнейшее исследование и, по возможности, дополнительное тестирование.
Внешние факторы (называемые «вмешивающимися факторами» или «скрытыми переменными») иногда могут влиять на одну или две переменные в изучаемой нами корреляции. Например, некоторые исследования обнаружили связь между потреблением кофе и риском развития рака легких. Однако было обнаружено, что «курение» может быть потенциальной искажающей переменной в результатах, как показывает один метаанализ этих результатов. Как уже упоминалось, как и в случае с другими ключевыми выводами, дальнейшие исследования могут помочь прояснить контекст, лежащий в основе корреляций.
Проверка на причинно-следственную связь является сложной задачей. Тем не менее, тут может помочь экспериментальный дизайн. Здесь исследователь может проверить гипотезу таким образом, что он может контролировать одну переменную (независимую переменную) и измерять ее влияние на другую переменную (зависимую переменную). Самое главное, это может помочь им контролировать возможные помехи, чтобы избежать потенциальной систематической ошибки в их результатах.
У нас в «Интериум» был случай, когда мы собрали статистику по отзывам на филиалы одной организации на Яндекс.Картах. Обнаружилась сильная корреляция между рейтингом по 5-балльной шкале и количеством отзывов: чем их больше, тем хуже рейтинг у филиала. Любопытно, но лучше перепроверить связь иными способами. После обсуждения ситуации с клиентом, подробного изучения текстов отзывов и принятия во внимание специфики отрасли (это была социальная сфера), стало понятно, что причинно-следственная связь всё же есть. Это не та сфера, где люди будут часто рассказывать о позитивном опыте, зато с большой вероятность пойдут в интернет жаловаться.
Для некоторых это единственный доступный механизм воздействия.Подытоживая можно сказать, что при работе с социальным сетями и данными из них, наткнувшись на любопытную корреляцию в поведении пользователей или распространении инфоповода, всегда стоит остановиться на минуточку и подумать, а есть ли тут связь? И стоит ли принимать решение о, например, активации коммуникации в этом ключе и привлечении именно этой ЦА, или все же взаимосвязь была иллюзией?
Причинно-следственные связи для малышей — Дошкольник «ONLINE»
Приветствуем вас, уважаемые родители!
В мире нет ничего случайного, в нем каждое событие связано причинно-следственной связью. Все мы знакомы с понятием причинно-следственных связей: опустил руку в горячее – обжегся, наступил на грабли – они ударили вас по лбу. С причинно-следственными связями мы сталкиваемся на каждом шагу.
Причинно-следственная связь – связь между явлениями, при котором одно явление, которое является причиной, при наличии определенных условий порождает другое явление – следствие.
Ребенок 5—7 лет владеет достаточным объемом представлений об окружающем мире и может оперировать имеющейся у него информацией, довольно легко устанавливать прямые и обратные связи между объектами и явлениями, которые ему хорошо знакомы.
В старшем дошкольном возрасте дети уже достаточно хорошо умеют анализировать, сравнивать, обобщать, классифицировать объекты и явления, т.е. сформированы основы для освоения действия установления причинно-следственных связей и зависимостей уже на более высоком уровне, нежели на предыдущих возрастных этапах дошкольного детства.
Предлагаем вам игры, направленные на развитие причинно-следственных связей у ребенка 5-7 лет.
Игра «Почему это произошло?»
Предложите ребенку назвать как можно больше причин для следующих ситуаций:
• На улице стояло много людей.
• Дети стояли, открыв рот от изумления.
• Вода в чашке стала мутной.
• Внезапно в комнате погас свет.
• Пение птиц внезапно прекратилось.
• Мама открыла дверь в комнату и ахнула.
Постарайтесь придумать как обычные, так и самые невероятные объяснения ситуаций. Например: мама могла удивиться, увидев подарок на столе или разбитую чашку, а может быть Карлсона, сидящего на подоконнике.
Игра «Что может произойти, если…»
• Если положить лед на ладонь, то … .
• Если у медведя вырастут крылья, то … .
• Если полететь высоко-высоко, то … .
• Если съесть много мороженого, то … .
• Если летом пойдет снег, то … .
Подключите фантазию: если выбросить кусочек хлеба, то его могут скушать птички, он может упасть на голову кому-то, его отнесет ветром в волшебную страну и хлебный кусочек превратится в съедобный домик.
Игра «Что тяжелее?»
В этой игре нужно будет разобраться, какие предметы тяжелее других, а какие легче.
Взрослым-то хорошо, для них понятно, что книжка весит больше, чем карандаш, а стол тяжелее стула. Перейдите по данной ссылке и играйте вместе с ребенком:
http://igraem. pro/igry-dlya-malyshej/chto-tyazhelee/
Игра «Найди связь»
Предложите ребенку найти связь между двумя предложениями, на первый взгляд не имеющих ничего общего. Объясните, как все происходило.
Например:
Шишка упала с елки. — Автобус не пришел вовремя.
Белка сидела на дереве и упустила шишку. В это время под деревом сидел зайчик, на которого упала шишка. С перепугу трусишка бросился бежать, выскочил на дорогу. Дети, сидящие в автобусе, выбежали посмотреть на зайца и разбрелись. Водитель их долго ждал и поэтому автобус не пришел на станцию вовремя.
Это варианты предложений, которые можно предложить ребенку:
- Котенок подошел к блюдечку. — Мальчик не выучил уроки.
- Утром отключили воду. – Папа опоздал на работу.
- Дворник чистил весь день дорожки от снега. — Мама опоздала на работу.
- Все прохожие промокли. — Наконец-то вылезли первые первоцветы из земли.
- Мама купила вкусный арбуз. — Папа, наконец-то поменял колесо на машине.
- Многие ученики заболели. — Окна покрыты инеем.
- Мама устроила дома праздник. — Мальчик получил хорошую оценку.
Игра «Что сначала, что потом?»
Важный момент при развитии ребенка, его подготовки к школе, научиться определять последовательность событий. Для тренировки подойдет дидактическая игра «Что сначала, что потом?». Карточки нужно распечатать, разрезать на квадратики и предложить ребенку определить, что сначала, а что потом. Не торопите ребенка, пусть хорошо подумает, включит логику, объяснит свою точку зрения, а потом у него будет получаться все быстрее и легче. Для деток 6-7 лет можно предложить по расставленным в логическом порядке картинкам составить небольшой рассказ в качестве развития речи.
(Кликните на картинку, чтобы увеличить ее в размерах)
Играйте в эти замечательные игры и развивайте воображение ваших детей!
Материал подготовлен Исламовой Р. А. (специалист МАУ ИМЦ «Альтернатива»)
Что такое историческая причинность? — Синоним
ОКЕАН МАЛАНДРА
25 ИЮНЯ 2018
КЛАСС
«Все, что становится или изменяется, — сказал Платон, — должно делать это благодаря какой-то причине, ибо ничто не может возникнуть без причины». Историческая причинность — это попытка проследить текущие и исторические события до их первопричин. Например, философ Бертран Рассел проследил причину индустриализации через европейское Возрождение, падение Константинополя, вторжение турок и, наконец, социальный распад в Средней Азии. Историческая причинность пытается найти объяснение изменениям и часто также используется для предсказания событий путем прогнозирования влияния текущих событий на будущие ситуации. Представления об исторической причинно-следственной связи со временем сильно изменились, но этот предмет всегда был в центре нашего понимания нашего мира.
Исследуйте эту статью
- Древние идеи исторической причинно -следственной связи
- Историческая причинность в средневековье
- Историческая причинность в эпоху разума
- Историческая причинно
Древние представления об исторической причинности часто связывались с метафизическими и мифологическими представлениями о том, как устроен мир. Древние греки, например, верили, что судьба и предначертание вызывают такие события, как приход вождя к власти и исход войн. Несколько греческих философов, в том числе Платон и Аристотель, пытались сформулировать более систематические идеи причинности. Аристотель разработал исследование причин событий, состоящее из четырех частей, которое включало прослеживание их до исходной идеи в чьей-то голове.
2 Историческая причинность в Средние века
В христианской Европе многие мыслители пытались примирить прежние идеи философов о причинности с мировоззрением, согласно которому все вещи в конечном счете происходят от Бога. Для Фомы Аквинского не только все вещи имели внутреннюю причину, созданную Богом, но все вещи были просто исполнением Божьего плана.
3 Историческая причинность в эпоху разума
С открытием законов физики и механических представлений о природе реальности европейские представления об исторической причинности коренным образом изменились. Ньютон явно нападает на причинность как на первичную силу, заявляя, что «любое движение, которое происходит в соответствии с первым законом движения, является беспричинным событием». Другие мыслители пересмотрели исторические события в новом свете, отметив, что изменение определенных переменных могло привести к другим историческим результатам. «Нос Клеопатры» Паскаля — один из самых известных примеров этого: он утверждал, что если бы нос египетской царицы был хоть немного короче, Марк Антоний не нашел бы ее достаточно красивой, чтобы бросить свою римскую жену, и мир бы быть другим местом.
4 Историческая причинность в Новое время
Со времен научной революции идеи об исторической причинности, как правило, следовали за идеями Паскаля, что даже самое незначительное событие может драматическим образом сформировать великую схему вещей. Это проявляется в передовых идеях, таких как «теория хаоса», согласно которой даже взмах крыльев бабочки может влиять на обстоятельства на другом конце мира — известный как «эффект бабочки». В современных книгах-бестселлерах, таких как книга Джареда Даймонда «Коллапс: как общества решают потерпеть неудачу или преуспеть», последние открытия археологии и естественных наук используются для того, чтобы проследить историческую причинно-следственную связь того, что, возможно, является самым важным вопросом на земле: выживание человеческих цивилизаций. .
ссылки
- 1 Edge: Почему история человечества развивалась по-разному на разных континентах в течение последних 13 000 лет? Джаред Даймонд
- 2 UCSC: Хаос, Клио и научные иллюзии понимания
Об авторе
Оушен Маландра, проживающая в Сан-Франциско, писатель-путешественник, автор и режиссер-документалист. Он ведет крупный веб-сайт о путешествиях в Сан-Франциско, широко публикуется как в онлайн-изданиях, так и в печатных изданиях, а также участвовал в написании нескольких путеводителей по Южной Америке.
Статьи по теме
Корреляция и причинно-следственная связь | Австралийское бюро статистики
Две или более переменных считаются связанными в статистическом контексте, если их значения изменяются таким образом, что по мере увеличения или уменьшения значения одной переменной изменяется и значение другой переменной (хотя она может находиться в противоположное направление).
Например, для двух переменных «отработанное время» и «заработанный доход» существует связь между ними, если увеличение количества отработанных часов связано с увеличением полученного дохода. Если мы рассмотрим две переменные «цена» и «покупательная способность», то по мере того, как цена товара увеличивается, способность человека покупать эти товары уменьшается (при условии постоянного дохода).
Корреляция — это статистическая мера (выраженная в виде числа), которая описывает размер и направление взаимосвязи между двумя или более переменными. Однако корреляция между переменными не означает автоматически, что изменение одной переменной является причиной изменения значений другой переменной.
Причинность указывает, что одно событие является результатом возникновения другого события; то есть существует причинно-следственная связь между двумя событиями. Это также называют причиной и следствием.
Теоретически разницу между двумя типами взаимосвязей легко определить — действие или явление может вызывать другое (например, курение вызывает увеличение риска развития рака легких) или оно может коррелировать с другим (например, курение коррелирует при алкоголизме, но не вызывает алкоголизма). На практике, однако, по-прежнему трудно четко установить причину и следствие по сравнению с установлением корреляции.
Для двух переменных статистическая корреляция измеряется с помощью коэффициента корреляции, представленного символом (r), который представляет собой одно число, описывающее степень взаимосвязи между двумя переменными.
Числовое значение коэффициента находится в диапазоне от +1,0 до –1,0, что указывает на силу и направление взаимосвязи.
Если коэффициент корреляции имеет отрицательное значение (ниже 0), это указывает на отрицательную связь между переменными. Это означает, что переменные движутся в противоположных направлениях (т. е. когда одна увеличивается, другая уменьшается, или когда одна уменьшается, другая увеличивается).
Если коэффициент корреляции имеет положительное значение (выше 0), это указывает на положительную связь между переменными, что означает, что обе переменные движутся в тандеме, т. е. при уменьшении одной переменной уменьшается и другая, или при увеличении одной переменной увеличивается и другая.
Если коэффициент корреляции равен 0, это указывает на отсутствие взаимосвязи между переменными (одна переменная может оставаться постоянной, в то время как другая увеличивается или уменьшается).
Хотя коэффициент корреляции является полезной мерой, он имеет свои ограничения: Коэффициенты корреляции обычно связаны с измерением линейной зависимости.
Например, если сравнить количество отработанных часов и доход, полученный торговцем, который взимает почасовую оплату за свою работу, существует линейная (или прямолинейная) зависимость, поскольку с каждым дополнительным отработанным часом доход будет увеличиваться на постоянную величину.
Если, однако, продавец взимает плату на основе первоначальной платы за вызов и почасовой оплаты, которая прогрессивно уменьшается по мере увеличения продолжительности работы, связь между отработанным временем и доходом будет нелинейной, где коэффициент корреляции может быть ближе до 0.
Требуется осторожность при интерпретации значения ‘r’. Можно найти корреляции между многими переменными, однако связи могут быть обусловлены другими факторами и не иметь ничего общего с двумя рассматриваемыми переменными.
Например, продажи мороженого и продажи солнцезащитного крема могут увеличиваться и уменьшаться в течение года систематическим образом, но это будет взаимосвязь, которая будет обусловлена влиянием сезона (т. е. более жаркая погода приводит к увеличению числа людей). использование солнцезащитного крема, а также употребление мороженого), а не из-за какой-либо прямой связи между продажами солнцезащитного крема и мороженого.Коэффициент корреляции не должен использоваться, чтобы сказать что-либо о причинно-следственной связи. Изучив значение «r», мы можем заключить, что две переменные связаны, но это значение «r» не говорит нам, была ли одна переменная причиной изменения другой.
Причинно-следственная связь — это область статистики, которая обычно неправильно понимается и неправильно используется людьми, ошибочно полагая, что, поскольку данные показывают корреляцию, обязательно существует основная причинно-следственная связь.
Использование контролируемого исследования является наиболее эффективным способом установления причинно-следственной связи между переменными. В контролируемом исследовании выборка или популяция делится на две части, при этом обе группы сопоставимы почти во всех отношениях. Затем две группы получают разное лечение, и оцениваются результаты каждой группы.
Например, в медицинских исследованиях одна группа может получать плацебо, а другая группа получает новый тип лекарства. Если две группы имеют заметно разные результаты, разный опыт может вызвать разные результаты.