1. Понятие о причинно-следственных связях. Логика: конспект лекций
1. Понятие о причинно-следственных связях
Перед тем как рассматривать непосредственно методы установления причинно-следственных связей, необходимо уяснить себе понятие причины и следствия.
Причиной называют такое явление, процесс или предмет, который уже в силу своего существования вызывает определенные изменения окружающего мира. Причина характеризуется тем, что всегда предшествует результату. Она лежит как бы в основе последствия. Так, ни одно следствие невозможно представить себе без причины, ведь последняя является своего рода отправной точкой. Приведем пример: «Ударила молния — лес загорелся». Очевидно, что здесь причиной является молния, если именно она спровоцировала пожар. Без такой причины следствия быть не могло. Конечно, можно говорить о том, что пожар мог начаться в результате поджога, однако в таком случае причиной стал бы поджог.
Следствие — это то, что влечет за собой причина; оно всегда вторично и зависимо, определяемо ей.
Работник правоохранительных органов, выезжая на место происшествия, первым делом определяет причины этого происшествия. Если поступил сигнал об убийстве, необходимо проверить, является ли происшедшее на самом деле преступлением.
То есть определяется причина смерти. При этом отсеиваются версии о самоубийстве, несчастном случае, смерти от болезни и т. д. После этого (если установлено, что убийство имело место) определяется уже причина совершения преступления — корысть, месть и т.
д.Спасатели, приезжая на место вызова, вначале определяют причину несчастного случая, для того чтобы разработать наиболее эффективную тактику спасения. Если речь идет о падении с высоты, автомобильной катастрофе или другом травматичном событии, появляется необходимость в особом порядке транспортировки. Так, например, шейный, грудной и поясничный отделы позвоночника должны быть зафиксированы на случай, если имеются повреждения позвоночного столба. Виды оказываемой первой помощи также зависят от того, какое именно событие привело к возникновению опасных ситуаций, получению травм. Очевидно, что спасатели определяют причины произошедших событий для наиболее эффективной организации помощи гражданам.
На первый взгляд может показаться, что определение причины не важно, не имеет большого значения, однако приведенные выше примеры говорят об обратном. Установление причины необходимо, так как в противном случае оперативный работник милиции искал бы несуществующего преступника, расследуя стечение обстоятельств, похожее на преступление (стоит ли говорить, что установление причины — большая часть оперативной работы), а пожарные и спасатели не справлялись с работой.
Таким образом, причиной называется такая объективная связь между двумя явлениями, когда одно из них вызывает другое — следствие.
Раскрытие причинной связи между явлениями представляет собой сложный многогранный процесс, включающий разнообразные логические средства и способы познания. В логике разработано несколько методов установления причинной связи между явлениями. Из этих методов чаще всего используются четыре: метод сходства, метод различия, метод сопутствующих изменений и метод остатков. Нередко в научном исследовании применяются сочетания этих методов, но для уяснения сути вопроса следует рассмотреть их отдельно{12}.
Данный текст является ознакомительным фрагментом.
Продолжение на ЛитРесПричинно-следственные связи в историческом сочинении — Историческое сочинение — Решебник заданий ЕГЭ — Все статьи
Для начала, еще раз прочитаем требования по критерию К3.
По данному критерию необходимо:
«правильно указать две причинно-следственные связи, характеризующие причины возникновения событий/явлений/процессов, происходивших в данный период».
Итак, необходимо указать две ПСС, и не какие-нибудь, а именно те, которые характеризуют причины (!) возникновения событий данного периода.
Что именно понимается под причинно-следственной связью?
ПСС — связь между историческими событиями (процессами, явлениями), при которой одно событие (процесс, явление), называемое причиной, при наличии определенных исторических условий порождает другое событие (процесс, явление), называемое следствием.
Таким образом, эксперты ЕГЭ хотят увидеть в сочинении то, как выпускник умеет показывать СВЯЗЬ между двумя историческими событиями. Связь между событием-причиной и событием-следствием.
При этом, событие-следствие должно находиться именно в рамках того периода, по которому пишется сочинение. Событие-следствие не должно находиться за верхней границей или нижней границей периода, оно должно относиться именно к данному (!) периоду.
К событию (явлению, процессу), которое произошло в рамках заданного периода, необходимо подобрать те события (явления, процессы) из прошлого, которые послужили его причиной.
Какие требования к событию-причине?
1) Событие-причина может находиться как в рамках периода, так и за нижней границей. За верхнюю границу периода невозможно выйти: ведь причины могут находиться только в прошлом, но не в будущем.
Пример «в рамках периода» :
Непродуманная налоговая политика приближенных царя Алексея Михайловича стала одной из причин Соляного бунта.
Пример «за нижней границей»:
Издание указа Петра I о престолонаследии было одной из причин начала эпохи дворцовых переворотов.
2) При указании ПСС могут быть названы не только причины
Предпосылка – это условие, повлиявшее на начало данного события.
Например:
Влияние идей эпохи Просвещения не было прямой причиной восстания декабристов на Сенатской площади, но явилось его предпосылкой.
Далее – выдержки из сочинений и комментарии по их оцениванию (К3)
Период: 945 – 972 гг.
В отрывке из сочинения есть следующие ПСС:
1) Крещение Ольги (это причина) и укрепление связей между Русью и Византией (это следствие).
2) Приближение России к византийским границам (это причина) и начало русско-византийской войны (это следствие).
«Будучи мудрой и дальновидной правительницей, Ольга решает принять религию Византийской империи – христианство. В 957 году происходит крещение Ольги в Константинополе. Ее крестным отцом стал византийский император. Такой шаг способствовал укреплению международный связей Руси и Византии: как политических, так и экономических.
В эти же годы происходит молниеносная война с Болгарией, закончившаяся победой русского князя. В результате войны Русь получила новые земли, однако присутствие воинственного Святослава у границ Византии не устраивало византийского императора. В связи с этим в 970 году начала русско-византийская война».
Период: сентябрь 1689 г. – декабрь 1725 г.
В отрывке из сочинения есть следующие ПСС:
1) Северная война (это причина) и введение рекрутской повинности (это следствие).
2) Условия работы строителей Санкт-Петербурга (это причина) и высокая смертность рабочих (это следствие).
Во время войны власть нуждалась в деньгах и служивых людях. Вопрос со служивыми людьми был решен всеобщей рекрутской повинностью, что обеспечило войну войском и увеличило его в несколько раз».
Период: октябрь 1894 г. – июль 1914 г.
В отрывке из сочинения есть следующие ПСС:
1) Проникновение Россию в Маньчжурию (это причина) и начало русско-японской войны (это следствие).
2) Аренда Порт-Артура (это причина) и начало русско-японской войны ( это следствие).
3) Поражение России в русско-японской войне (это причина) и потеря Россией Южной части Сахалина (это следствие).
«В 1904-1905 гг. была русско-японская война. Причинами этой войны послужило то, что железная дорога России шла через Китай, и то, что наша страна арендовала Порт-Артур для создания там флота. Японии это всё не понравилось. Мы проиграли эту войну. Началось строительство железной дороги на нашей территории, мы потеряли южную часть Сахалина».
Период: октябрь 1964 г. – март 1985 г.
В отрывке из сочинения есть следующие ПСС:
1) Косыгинская реформа (это причина.) и увеличение материальной заинтересованности работников и др. (это следствие).
2) Внешняя политика, проводимая А.А. Громыко (это причина) и начало курса на мирное сосуществование (
«Разработать проект реформы и воплотить его в жизнь было поручено А. Косыгину <…> Следствием реформы стало увеличение материальной заинтересованности работников, увеличение экономических показателей, строительство новых заводов. Однако затем произошло снижение показателей, и реформа была свернута.
Что касается внешней политики, то данный период характеризуется так называемой «разрядкой» в международных отношениях. Важнейшей фигурой в проведении внешней политики СССР был министр иностранных дел Громыко <…> Последствием его внешней политики можно назвать начало курса на мирное сосуществование с капиталистическими странами».
Период: октябрь 1964 г. – март 1985 г.
В отрывке из сочинения есть следующая ПСС:
1) Ввод советский войск в Афганистан (это причина) и бойкот Олимпийских игр 1980 г. западными странами (это следствие)
«В 1980 г. в СССР проводились Летние Олимпийские игры. Многие западные страны на Игры не приехали. Они забойкотировали их из-за ввода советских войск в Афганистан в 1979 г.».
Общий вывод
Чтобы получить два балла по К3, необходимо как минимум два раза указать в тексте, что «определенное событие (явление, процесс) данного периода произошло, потому что … ».
При этом здесь необязательно называть каких-либо исторических деятелей, перечислять их конкретные действия и т.д.
У вас может быть несколько отдельных связок в сочинении:
- «Событие №1 + личность + конкретные действия» — для К-1 и К-2
- «Событие №2 + личность + конкретные действия» — для К-1 и К-2
- «Событие №3 + его причины/предпосылки» — для К-3
- «Событие №4 + его причины/предпосылки» — для К-3
Обратите внимание, что можно писать не только о событиях, но и об исторических явлениях и процессах.
Например, в примерах выше говорится о таком процессе как «укрепление связей между Русью и Византией» и о таком явлении как «высокая смертность рабочих при строительстве Санкт-Петербурга» .
Скачать методические рекомендации для экспертов — ссылка
___
Подпишитесь и следите за выходом новых публикаций в моем сообществе Вконтакте «История ЕГЭ и кот Степан» vk.com/historystepa .
Причина и следствие | Экономика для школьников
Все примеры этой задачи построены так: описаны некоторые статистические наблюдения, из которых затем делается вывод. В решении, которое приводится ниже, для каждого из примеров приведено альтернативное объяснение имеющихся статистических наблюдений, которое противоречит сделанному выводу; существование такого объяснения доказывает, что вывод был получен некорректно. Мы не знаем, какое из альтернативных объяснений верно (возможно, и никакое), зато теперь мы знаем, что описанных наблюдений недостаточно, чтобы утверждать, что верным является именно тот вывод, который был сделан в условии.Разделение примеров на группы достаточно условное. То общее между примерами группы, что описано ниже в пунктах б), относится не столько к логическим ошибкам, сколько к способу получения альтернативных объяснений.
I
а)
1) Возможно, число несчастных случаев никак не зависит от объёма потребления мороженого при прочих равных условиях, а положительная корреляция между этими двумя переменными объясняется тем, что обе они увеличиваются при росте числа посетителей пляжа.
Справка. Говорят, что наблюдается положительная корреляция между переменными $x$ и $y$, если в фактических наблюдениях вида $(x_{i},y_{i})$ большим значениям одной переменной соответствуют большие значения другой переменной. Иными словами, в тех случаях, когда одна переменная принимала относительно большие значения, вторая переменная тоже принимала относительно большие значения; когда первая принимала относительно маленькие, вторая тоже принимала относительно маленькие.
Отрицательная корреляция — когда большим значениям одной переменной соответствуют меньшие значения другой переменной.
Отличие причинно-следственной связи от корреляции заключается в наличии предпосылки «при прочих равных условиях». Так, фраза «переменная $x$ влияет на переменную $y$» означает, что если изменить $x$, оставив неизменным всё остальное (кроме $y$), то $y$ изменится.
2) Как нетрудно догадаться, бесплатные обеды предоставляются школьникам из семей с низкими доходами. Значит, если доход семьи по какой-то причине положительно коррелирует с оценками ребёнка, то средние оценки в группах тех, кто получает бесплатные обеды, могут быть ниже, чем в группах тех, кто не получает бесплатных обедов, даже если обеды при прочих равных условиях никак не влияют на оценки. Причиной положительной корреляции между доходом семьи и оценками ребёнка, например, могут быть способности, передающиеся по наследству: способности родителей приводят к их высоким заработкам, а полученные по наследству способности их детей приводят к их высоким оценкам.
б) Вывод о наличии причинно-следственной связи сделан лишь на основе корреляции. Это корреляция, скорее всего, объясняется изменением неучтённой переменной.
II
а)
1) Фейерверк начинается вне зависимости от того, выходят жители дома №48 на крышу или нет; напротив, это жители выходили на крышу потому, что ожидали фейерверк.
2) Страховая компания стала требовать более высокую плату потому, что получила информацию о возросшей вероятности смерти страхователя в ближайшем будущем; для того, чтобы вывод компании был верен, достаточно положительной корреляции между риском смерти и наличием телохранителя. Корреляция между риском смерти и наличием телохранителя может быть положительной, даже если зависимость риска смерти от наличия телохранителя (при прочих равных условиях) отрицательная. Страхователь нанял телохранителя потому, что существует угроза его жизни, однако он ошибочно интерпретировал вывод страховой компании так, как будто бы наоборот, наличие телохранителя повышает эту угрозу.
б) Из-за непонимания различия между корреляцией и причинно-следственной связью перепутана причина и следствие.
III
а)
1) Сравнение времени, за которое человек нашёл работу, между двумя группами — теми, кто посещал курсы, и теми, кто не посещал их, — не является корректным основанием для вывода о причинной зависимости этого времени от факта посещения курсов, т.к. отбор в эти группы происходил не случайно и поэтому факт посещения курсов может быть скоррелирован с некоторым неучтённым фактором, который влияет на время нахождения работы. Например, таким фактором может быть целеустремлённость человека, желание поскорее найти работу. Целеустремлённый человек, с одной стороны, запишется на курсы (предполагая, что курсы помогут), с другой стороны, будет активнее искать вакансии, более ответственно готовиться к собеседованиям и т.п. — по сравнению с теми, кто не записался на курсы. Он найдёт работу быстрее, чем те, кто не записался на курсы, даже если курсы на самом деле никак не помогают найти работу.
2) Среди инвесторов, присутствующих на рынке не меньше года, средняя доходность вложений клиентов компании А выше, чем средняя доходность вложений клиентов компании Б. Но срок пребывания на рынке сам зависит от доходности: клиент, который быстро разорился, уходит с рынка, не успев пробыть на нём год. То есть отбор в группы сравнения сам зависит от изучаемой переменной — доходности, что делает данное сравнение некорректным для вывода о том, где ожидаемая доходность выше. Возможно такое, что большинство клиентов компании А разоряются, но те, кто не разорился, имеют очень высокую доходность (например, компания А вкладывает деньги клиентов в очень рискованные, но потенциально очень прибыльные проекты). Потенциальный клиент компании А заранее не знает, попадёт он в число разорившихся или в число разбогатевших, и его скорее интересует средняя доходность по всем клиентам компании А, а не только по тем, кто продержался на рынке больше года. Средняя доходность по всем клиентам компании А вполне может оказаться меньше, чем средняя доходность по всем клиентам компании Б (например, компания Б вкладывает деньги клиентов в активы, приносящие стабильный, хоть и невысокий доход).
б) Отбор в группы сравнения сам зависит от переменной, влияние на которую исследуется с помощью этого сравнения.
IV
а)
1) В условии дана статистика, сравнивающая фильм с его сиквелом, а вывод из этого делается о сравнении сиквела с новым фильмом, что некорректно. Вполне возможно, что ожидаемый успех у сиквела ровно такой же, как и у нового фильма. То, что сиквелы данной кинокомпании хуже своих предшественников, может иметь следующее объяснение: сиквелы снимают только на те фильмы, которые имели большой успех, так что не удивительно, что этот успех не удаётся повторить со следующей же попытки. Кинокомпания всегда старается снять как можно более хороший фильм, но фактический успех зависит не только от стараний, но и от случайных факторов, которые она не в состоянии предугадать или проконтролировать. Вновь снятый фильм (как сиквел, так и не сиквел) скорее будет иметь «средний» успех, чем большой успех, что и объясняет описанную в условии закономерность.
2) Родители хвалят ребёнка за высокие оценки, а ругают за низкие. Оценки (особенно за контрольные) зависят от случайных факторов, которые ребёнок не может контролировать, так что при одинаковом уровне стараний ребёнок может получать разные оценки. Средний балл растёт, если вновь полученная оценка выше среднего балла, и падает, если ниже. Рассмотрим пример. Ребёнок получает только тройки, четвёрки и пятёрки. Пусть по итогам $n$ оценок средний балл равен 4,0. Если $n+1$-я оценка — 5, то средний балл станет выше 4. И если затем $n+2$-я оценка будет 4 или 3 (что, судя по среднему баллу, более вероятно, чем то, что она будет 5), то средний балл упадёт. Таким образом, стоит ожидать, что следующая оценка после получения пятёрки понизит средний балл. Аналогичным образом можно убедиться в том, что после получения тройки средний балл, скорее всего, вырастет. Эта закономерность будет иметь место, даже если похвала и порицание со стороны родителей никак не влияют на оценки.
б) Возврат к среднему значению после случайного отклонения ошибочно используется в качестве доказательства некоторой причинно-следственной связи.
Понимание причинно-следственных связей — Сочинение
Понимание причинно-следственных связей
Понимание последовательности событий и явлений, которые изучают школьники, осуществляется через понимание самих событий и явлений, усмотрение в них закономерностей, раскрытие причинно-следственных связей. Если суть самих событий и явлений учащиеся чаще всего понимают, то в установлении причинно-следственных связей они испытывают трудности. Например, младшие школьники путают причину какого-либо факта с совпадением по времени, у многих учеников младших классов отсутствует понимание обязательности причинно-следствепной связи. Учащимся легче установить связь от причины к следствию, чем от следствия к причине. Это объясняется тем, что при умозаключении от причины к следствию устанавливается прямая связь, а при умозаключении от случившегося следствия к вызвавшей причине такая связь дана опосредованно, так как случившийся факт может быть следствием различных причин, которые необходимо анализировать, чтобы определить верную. Таким образом, школьнику гораздо легче ответить на вопрос «Что произойдет, если растение не поливать?», чем на вопрос «Почему это растение засохло?».
Для понимания причинно-следственных связей необходимо добиваться, чтобы учащиеся не просто заучивали причинно- следственные отношения и зависимости, а осознавали их внутреннюю связь.
Работу по формированию умения устанавливать причинно- следственные связи нужно начинать в начальной школе, используя схематизацию.
На первом этапе необходимо сформировать у учащихся представления об обязательности причинно-следственной связи. В результате у них появится понимание того, что в основании любого следствия лежит причина. При объяснении педагог может использовать схему «дерево», при этом на первоначальном этапе схема может быть такая, а затем может быть трансформирована непосредственно в схему причинно-следственной связи.
На втором этапе необходимо сформировать у учащихся понимание однозначности причинно-следственной связи, то есть понимание того, что у каждого свершившегося факта своя исключительная причина.
Пример организации понимания учащимися однозначности причинно-следственной связи на уроке: Учитель задает вопросы: «Что вырастет осенью, если весной посадить в землю ядрышко гороха? Может ли вырасти картошка? Может ли вырасти фасоль?». «Что вырастет осенью, если весной посадить в землю зернышко пшеницы? Может ли вырасти рис? Может ли вырасти кукуруза?».
До понимания детей доводится следующее: для того чтобы вырос горох, необходимо посадить именно горошинку, для того, чтобы вырос пшеничный колосок, необходимо посадить именно зернышко пшеницы. Так и в причинно-следственной связи: необходима конкретная причина для того, чтобы случился какой-то конкретный факт.
На третьем этапе работа, направленная на формирование у учащихся умения понимать причинно-следственные связи, заключается в формировании представления о том, что причины случившегося факта могут носить латентный (скрытый) характер. Необходимость этого этапа работы объясняется тем, что встречаются случаи, когда для учащегося действительные причины события оказываются скрытыми, то есть «заслоненными» другими, более яркими и в связи с этим выступающими в представлениях учащихся как основные причины события. Во многих случаях это приводит к тому, что дети вместо главных, существенных причин явлений называют второстепенные, случайные факторы. Схема позволяет учащимся понять, что случившийся факт может быть обусловлен «совокупностью причин», но основная причина всегда одна.
О пагубности ошибок-причинно-следственной связи | Социальный Компас
Print PDF
В продолжение темы аберраций убеждения и познания у учёных и дилетантов — смешные примеры про сабж из замечательной книги Тома Каткарта и Дэн Клейна в «Аристотель и муравьед едут в Вашингтон. Понимание политики через философию и шутки» (М.: АНФ, 2007). Всеми ими можно бы иллюстрировать явления когнитивного диссонанса, но поскольку, как замечают авторы люди, особенно же политики журналисты и т. д. говорящие головы готовы скорей быть лжецами, чем глупцами, и поскольку о людях следует думать лучшее, пока не показано обратное, в книге это представлено как ошибки и сбои понимания, или направленная ложь, не самообман.
Cum hoc ergo propter hoc (Вместе с этим – значит вследствие этого)«Типичный пример феномена «ищем там, где светлее» – ежедневные репортажи СМИ с фондовой биржи. Они призваны оценивать состояние экономики в каждый конкретный день, однако любой экономист вам скажет, что в них отражается лишь часть общей экономической картины.
Никто, например, не рапортует нам, сколько американцев ежедневно теряют работу или оказываются ниже черты бедности. Причем никаких политических причин скрывать эту информацию не существует [но есть социальные: власть денег и угнетение труда капиталом формируют удобную для себя реальность во всём обществе. Это называется «гегемония», по Грамши. Прим.публикатора]: просто эти цифры недоступны в ежедневном режиме, и измерить соответствующие показатели куда сложнее. Значительно проще читать циферки на громадном табло Нью Йоркской фондовой биржи. Там ведь гораздо светлее!…
Вокруг понятий причины и следствия сформировалась целая ветвь логических уловок. Первая из них, описанная еще Аристотелем, известна как «вместе с этим – значит вследствие этого». Но на латыни эта фраза звучит лучше – cum hoc ergo propter hoc, хотя, если вспомнить, Аристотель был греком. Чудны дела твои, Господи!
Вот пример:
Самыми быстрыми темпами детская бедность растет в тех штатах, которые платят самые высокие социальные пособия. А самый низкий рост или даже снижение этого показателя зарегистрированы там, где власти ограничивают материальную помощь семьям с детьми иждивенцами.
– Гарри Бауэр, консервативный лоббист, президент Совета по семейным исследованиям (Family Research Council), старший вице президент некоммерческой организации «Главное внимание – семье» (Focus on the Family), утверждая, что социальные пособия стимулируют детскую бедность
В данном случае мистер Бауэр совершает фундаментальную ошибку, не принимая во внимание возможность третьего фактора, – такого как экономическое положение штатов, где уровень социальных выплат и детской бедности колебался. При более подробном рассмотрении оказывается, что в штатах, где росли объемы социальных выплат и детская бедность, средние доходы населения падали или оставались на прежнем уровне; там же, где пособия и детская бедность увеличивались медленнее всего, был зарегистрирован стабильный рост средних доходов. Иными словами, и на социальные пособия, и на уровень детской бедности повлиял экономический кризис. Мы уверены, что мистер Бауэр сожалеет о своем ошибочном рассуждении относительно всех семей Америки.
Однако мистер Бауэр – не единственный, совершивший ошибку cum hoc ergo propter hoc . Вспомним хотя бы часто повторяемое утверждение президента Буша, полагающего, что война в Ираке оберегает нашу страну от нападений:
Командующий коалиционными силами в Ираке, который является также старшим офицером этой базы, генерал Джон Вайнс, недавно отлично сформулировал эту мысль:
«Либо мы будем иметь дело с экстремистами и террористами за границей, либо они придут в наш дом, и нам придется разбираться с ними здесь».
– Президент Джордж Буш, июнь 2005 г.
Ну, и как же это работает? Может, террористы слишком заняты? Мы уверены, что «Аль Каида» сможет найти еще девятнадцать человек, если решит, что дело выгорит. В любом случае, сложно с уверенностью утверждать, что именно война в Ираке спасает Америку от новых атак. Это как если бы кто нибудь покрасил свой дом в розовый цвет, чтобы уберечь его от нападения драконов: если бы вы назвали его безумцем, он бы мог заметить, что его тактика до сих пор оказывалась вполне эффективной.
Причина и бедствие
Мелвин умирал. Он был стар, очень стар. Он много страдал в жизни. Труди, его жена, сидела на краю кровати, отирая ему лоб. Они прожили вместе больше семидесяти лет.
– Труди! – обратился Мелвин к жене. – Ты помнишь годы депрессии, когда нам едва едва хватало денег на то, чтобы выжить?
– Конечно, помню! – отозвалась та. – Ведь я была с тобой все эти годы.
– А помнишь голодные годы после войны, когда я работал на двух работах и еще успевал учиться?
– Разумеется, помню! Я и тогда была с тобой, любимый!
– А когда я потерял работу, ты ведь тоже была рядом?
– Конечно, милый! Я всегда была рядом с тобой. Всегда!
Мелвин, замолчав на несколько мгновений, пристально поглядел на свою любящую супругу.
Post hoc ergo propter hoc (После этого – значит вследствие этого)– Знаешь, Труди… Я думаю, ты приносила мне несчастья!
Post hoc ergo propter hoc – близкий родственник cum hoc ergo propter hoc . Об их родственных отношениях несложно догадаться по общей фамилии. Аргумент post hoc утверждает, что если событие Б произошло после события А, то именно А является его причиной.
Одна из областей, где легко можно встретить подобные аргументы, – царство статистики, некое явление, описанное цифрами, предстает как причина другого явления, также выраженного в цифрах. В этом ловком приемчике есть своя, особая прелесть: аудиторию завораживает впечатляющая точность статистических данных, и в упоении она даже не замечает, что один набор цифр не имеет никакого отношения к другому:
Десять штатов с самыми низкими расходами на образование в пересчете на одного ученика четыре – Северная Дакота, Южная Дакота, Теннесси и Юта – фигурируют среди десяти штатов, где учащиеся старших классов показывают наиболее высокие результаты на тестах SAT . При этом в первой десятке штатов по результатам SAT фигурирует лишь один, занявший также место среди десяти штатов с самыми высокими расходами на образование в пересчете на одного школьника, – Висконсин. Более всего расходует на школьное образование штат Нью Джерси – там расходы достигают небывалой цифры $10 561 на ученика; эту цифру используют учительские профсоюзы по всей стране, добиваясь повышения расходов на образование. Какое же место занял штат Нью Джерси по итогам SAT? Тридцать девятое…
Однако тот факт, что качество школьного обучения… [не зависит от] расходов на образование, не мешает учительским профсоюзам настаивать на том, что деньги здесь – главная переменная. Последняя шаткая линия обороны, которую все еще удерживает наше общественное образовательное лобби, проходит через умы наших сограждан, страдающих от пробелов в образовании.
– Консервативный политический обозреватель Джордж Уилл (Washington Post, 12 сентября 1993 г.)
Прежде чем анализировать аргументацию обозревателя Уилла, мы хотели бы привести слова совсем других людей:
Существует три вида лжи: ложь, наглая ложь и статистика.
– Бенджамин Дизраэли, раздражительный британский премьер министр
79,48 % статистических данных делается на коленке.
– Джон Паулос, профессор математики
Каждый четвертый человек страдает психическим расстройством. Проверьте трех своих друзей: если с ними все в порядке, значит, это вы.
– Рита Мэй Браун, остроумная феминистка
И вот еще цитата – честное слово, последняя:
Статистика – единственная из научных дисциплин, где разные специалисты, пользуясь одними и теми же цифрами, приходят к совершенно разным выводам.
– Эван Эзар, плодовитый автор афоризмов.
Мысль, которую мы пытаемся до вас донести, известна, пожалуй, всем: используя статистические данные, очень легко прийти к неверным выводам (не зря бытует выражение «ложь со статистикой в руках»). Однако далеко не все знают, что прийти к этим неверным выводам позволяет старый добрый софизм: «после этого – значит вследствие этого». Статистические данные, касающиеся явления А, нам представляют в качестве причины явления Б (также подкрепленного статистикой), которое следует за А. Или же, как в случае мистера Уилла, оратор полагает, что цифры указывают на причинно следственную связь, тогда как на самом деле ничего подобного они не демонстрируют. Проблема, разумеется, в том, что два указанных события могут быть вовсе не связаны между собой. Или, как в случае мистера Уилла, статистические данные могут оказаться недостаточными – они не показывают нам полной картины, поскольку в них недостает информации, которая относится как раз к причинно следственной взаимосвязи.
Дебора Линн в Journal of Statistics Education указывает, что мистер Уилл не принял в расчет один существенный фактор, а именно – процент школьников в каждом штате, которые принимали участие в экзамене SAT. На самом деле, большинство государственных колледжей в Северной Дакоте требуют от абитуриентов сдачи другого экзамена – ACT, так что тест SAT сдавало лишь 5% выпускников штата. При этом следует заметить, что среди этих 5% многие собирались поступать в престижные учебные заведения федерального уровня, где требуются результаты SAT. Это ребята, которые достигли значительных успехов в учебе и сочли, что им стоит попытаться замахнуться на большую цель. Для сравнения: в Нью-Джерси SAT сдавали 79% учеников выпускных классов, что, разумеется, дает нам репрезентативную выборку, позволяющую лучше оценить средний уровень школьников. Таким образом, получается, что мы сравниваем итоги сдачи SAT среди наиболее талантливых учеников из Северной Дакоты с результатами, которые продемонстрировали средние учащиеся из Нью-Джерси.
Это все равно что, сравнивая выступление четырех ямайских бобслеистов, представлявших свою страну на Олимпийских играх, со средними результатами бобслеистов США, заключить, что в среднем ямайцы значительно превосходят американцев, и в конечном итоге сделать вывод, что ямайское происхождение увеличивает шансы добиться высоких результатов в бобслее.
«Вот краткие тезисы моего выступления. А вы подберите мне статистику, подтверждающую мои слова»
Рекомендуем прочесть
Harvard Business Review Россия
Способность аналитически мыслить чрезвычайно полезна для современного руководителя. Она, как я объяснял раньше, начинается с умения собрать данные, составить простые схемы, сделать первые выводы и спланировать дальнейшие шаги. Но данные не так-то легко расстаются со своими тайнами. Мы достаточно быстро устанавливаем некие соотношения, но для глубокого понимания причинно-следственных связей требуется нечто большее. И особенно опасно путать причину со следствием.
Каждый менеджер должен строго различать корреляции и причинно-следственные связи, поскольку путаница возникает регулярно. Запуск новых продуктов, маркетинг, планирование, инвестиции — все это требует внимания и все это поминутно меняется. Большие данные и сложные аналитические инструменты устанавливают неожиданные соотношения между событиями, и главное здесь — это умение отличать действительно прекрасную возможность от сомнительной приманки. Ведь едва ли не главная задача менеджера — делать то, что в его власти, чтобы повлиять на конечный результат.
В качестве иллюстрации расскажу о своих попытках посидеть на диете.
Изначально судьба одарила меня отменным здоровьем. Я люблю заниматься спортом и никогда не отлыниваю. И все же с годами я стал набирать вес. Беда в том, что покушать я тоже люблю. Порой я задумывался насчет диеты, но не вникал ни в какие тонкости, за исключением общеизвестных («поменьше мяса, в нем холестерин!»), и до прошлого сентября всегда находил себе оправдание. Однако с 22 сентября я начал выполнять те предписания, о которых сам же рассказал в своем недавнем блоге. Это оказалось немного сложнее, чем я надеялся, но я совладал. Нашел в интернете программу, позволяющую учитывать съеденное. Через три месяца я смог нарисовать графики — я помещаю их здесь, потому именно такие методы исследования я успешно применяю в работе.
На первом графике я отмечал свой вес (синие точки) и ежедневное количество потребленных калорий (синяя линия). Здесь также указано «рекомендуемое количество калорий» (зеленая линия).
image
Потребление калорий с 22 сентября по 17 декабря 2013 года.
А теперь вникнем. Нетрудно заметить, что я ел чересчур много со второй недели по четвертую и прибавил в весе. Это ясно: между количеством потребляемых калорий и прибавкой веса существует причинно-следственная связь. Корреляция имеет реальное объяснение.
К сожалению, очевидный вывод — «Ешь меньше!» — меня не устраивает. Если б я мог есть меньше, я бы и не толстел. Придется разобраться с этим повнимательнее.
Еще одно возможное объяснение: в эти недели я путешествовал. Я нанес на график эту поездку и последующие. График подтвердил мою гипотезу: и без того не слишком правильное пищевое поведение в дороге усугубляется.
Заметьте: хотя корреляция между путешествием и прибавкой веса представляется интересной, график сам по себе не может служить доказательством причинно-следственной связи. Разумеется, путешествую я не оттого, что много ем, — но я пока что не мог объяснить, почему я переедаю, когда путешествую. Требовалось выявить еще какие-то скрытые факторы. Может быть, тут совпадает сразу несколько причин: незнакомая еда, слишком много ужинов с напитками плюс аэропортовский фаст-фуд — а может быть, проблема заключается в чем-то другом. Об этом было попросту рано судить. Путешествие оказалось «ближайшей» причиной ослабления контроля веса, но не «коренной» причиной, с которой следовало бы разобраться.
Мы подошли к ключевому моменту: выявить корреляцию — еще не значит установить причину, но это тот исходный пункт, отрываясь от которого можно изучать имеющиеся данные, рассматривать другие факты и т. д.
Например, прибавка веса в две ноябрьские недели поначалу озадачивала, ведь в это время я контролировал количество калорий. Тогда я добавил к графику занятия спортом. Оказалось, что как раз в эту пору занятия спортом резко сократились. Опять же все разумно: физические упражнения сжигают калории, меньше упражнений — больше вес. Ни в коем случае не нарушать график тренировок!
image
Занятие спортом с с 22 сентября по 17 декабря 2013 года.
Но осторожность и еще раз осторожность! Хотя с виду недостаток занятий спортом годится в качестве основной причины прибавки веса, зависимость может оказаться не такой простой. Скажем, дополнительные занятия могут пробудить аппетит и свести на нет эффект сожженных калорий. Например, летом по воскресеньям я люблю прокатиться на велосипеде и, если не ошибаюсь, после долгой поездки так и набрасываюсь на ужин. Но на этом этапе я не располагаю данными для дополнительной проверки, поэтому физические упражнения признаются в качестве «основной причины при прочих равных» и не более того.
Последний график отражает ежедневное потребление жира. Даже в последние недели, когда в целом удалось снизить потребление калорий и вес стабилизировался, жира в моей диете все еще было многовато. Я проконсультировался с диетологом, и она предупредила: в грамме жира содержится девять калорий, в то время как в грамме углеводов — всего четыре! Заметьте, что, хотя я не установил корреляцию между этими данными, мои подозрения насчет лишнего потребления жира убедительно подтверждаются реальными фактами.
image
Потребление жира с 22 сентября по 17 декабря 2013 года.
Следующий шаг: я проверяю девять дней максимального потребления жира, выявляю три основных вида пищи, в которых содержится жир, и сокращаю их в своем рационе.
Вот почему подобный анализ так полезен. Во-первых, необходимы данные. Интуиция подсказывает, что физические упражнения пойдут на пользу, но та же интуиция неоднократно обманывала меня, когда дело касалось диеты! Точно так же обстоят дела и в бизнесе. Клиенты, обратившиеся ко мне за консультацией, твердят: «я знаю то», «я знаю се» — и порой оказываются правы, но гораздо чаще заблуждаются.
Во-вторых, не бойтесь задавать трудные вопросы и о данных, и на другие темы. Я не психолог, но думаю, что отчасти не всегда полезная психология «знания» проистекает из страха ошибки. Я чувствовал себя полным дураком, обращаясь к диетологу, зато она помогла мне разобраться, чем вреден жир.
В-третьих, нужно отсеивать сомнительные данные. Дважды мой дневной рацион калорий оказывался чересчур низким, и я пометил эти дни красным крестиком. Так бывает всегда: какие-то данные оказываются ненадежными, и правильная обработка их особенно важна, когда нужна точная калибровка или когда высоки ставки. Однако если таких подозрительных точек на графике не много, можно спокойно проводить анализ.
В-четвертых, чтобы добраться до коренных причин, выбирайте не слишком много факторов — причем хорошо обоснованных. В моем случае удалось прояснить все потенциальные факторы, влияющие на вес: путешествие, физкультуру и количество жира в пище. Но пока мы еще не уверены, что эти причины — действительно коренные, нужно разобраться, что именно происходит, как один фактор соотносится с другим. Точно так же полагается действовать и в бизнесе.
В-пятых, корреляцию часто путают с причиной. Вот недавний пример: мой сын со своей женой отправился на семинар и услышал там такую фразу: «В семьях, где мужья помогают по дому и в воспитании ребенка, секса гораздо больше». Занятное совпадение, но как установить причинно-следственную связь? Когда мужья помогают, их усилия вознаграждаются сексом — или хорошая сексуальная жизнь побуждает помогать по дому? А может быть, тут задействованы какие-то скрытые факторы? Да и верна ли эта корреляция? Итак, не нужно в каждом совпадении видеть причинно-следственную связь — это лишь один из ключей, которые нужно соединить с другими, прежде чем прийти к окончательному выводу. Корреляция — не причинно-следственная связь. Но это — правильный отправной пункт.
На момент, когда я пишу это (прошло шесть недель после составления графика), я похудел на полтора килограмма. Здорово? Да нет, ничего особенно. В таких пределах прибавки и убавки веса случаются довольно часто. Тут опять же, как в бизнесе, важнее другой вопрос: надолго ли это? И хватит ли у меня силы воли, чтобы продержаться? Ведь эти графики — только начало. Диета, как и бизнес, штука сложная. Кто понимает, тот, конечно же, задаст вопросы вроде: «А вы едите фрукты?», «А как обстоит дело с насыщенными жирами?», «Сколько нужно пить?» и т. п. Чтобы от анализа была польза, приходится от первоначальных схем переходить к следующим.
И я надеюсь, что, как и в прошлый раз, читатели обрадовались, осознав, как использовать данные в поисках причинно-следственных связей. Анализ — это же пиршество мозга, не одним специалистам им тешиться!
Читайте по теме:
МОДУЛЬ 4 – Установление причинно-следственной связи ПППИ
С дополнительной информацией об установлении причинно-следственной связи можно ознакомиться в отчете Глобального консультативного комитета по безопасности вакцин (ГККБВ) «Установление причинно-следственной связи побочных проявлений после иммунизации». В отчете рассматриваются другие условия и меры, которые должны быть применены при установлении причинно-следственной связи в области безопасности вакцин..
Отчет ГККБВ: Установление причинно-следственной связи побочных проявлений после иммунизацииВо многих странах действуют системы ПППИ, и сообщениям о подозреваемых побочных проявлениях уделяется большое внимание. Такие системы были успешны при выявлении тяжелых ПППИ после того, как вакцины были разрешены к использованию. Как правило, есть необходимость в дополнительных исследованиях с целью дальнейшего расследования причинно-следственной связи ПППИ.
Несмотря на то, что наиболее надежный путь определения наличия причинно-следственной связи вакцины с побочным проявлением — это рандомизированное клинические испытание, такие испытания ограничены этапом клинической разработки вакцины. После того, как вакцина лицензирована, возможность проведения контролируемых исследований больше не рассматривается ввиду этических соображений (отказ от вакцинации).
Установление причинно-следственной связи представляет собой систематическую проверку данных о случае ПППИ. Такая оценка определяет вероятность наличия причинно-следственной связи между проявлением и полученной вакциной (вакцинами). Оценка причинно-следственной связи позволяет установить:
- имеет ли ПППИ отношение к вакцине или программе вакцинации;
- какие шаги, при необходимости, должны быть сделаны для реагирования на данное проявление.
Памятка ВОЗ по установлению причинно-следственной связи служит руководством для систематического, стандартизированного процесса оценки причинно-следственной связи в отношении серьезных побочных проявлений после иммунизации (включая кластеры проявлений).36
Памятка ВОЗ: ПППИ: Установление причинно-следственной связиРезультаты определения причинно-следственной связи помогают повысить среди работников сферы здравоохранения осведомленность о рисках, связанных с вакциной. Все это, вместе со знанием о пользе иммунизации, формирует базу для информирования родителей и /или вакцинируемых о вопросах, касающихся вакцин.
Качество оценки причинно-следственной связи зависит от:
- качества отчета о случае ПППИ,
- эффективности системы отчетности о ПППИ,
- качества процесса контроля причинно-следственной связи.
Установление причинно-следственной связи побочных проявлений с использованием вакцины основывается на пяти принципах.35
В чем разница (+ примеры!)
Перейти к тому, что вам интересно прочитать:
Супер краткое описание
Прежде чем мы начнем официально писать в блоге…
Я знаю, что некоторым из вас просто нужен быстрый, без суеты, ответ из одного предложения. Итак, если вы здесь, чтобы получить краткий ответ о том, в чем разница между причинно-следственной связью и корреляцией, вот она:
Корреляция — это связь между двумя переменными; когда одна переменная изменяется, другая переменная также изменяется.
Причинность — это когда есть реальное объяснение того, почему это происходит логически; это подразумевает причину и следствие.
Итак: причинно-следственная связь — это корреляция с причиной .
Если вам интересно прочитать полное объяснение, чтобы правильно понять термины, разницу между ними и изучить реальные примеры, продолжайте прокручивать!
Прошли дни, когда данные в основном использовались исследователями или были доступны только тем, кто обладал огромным техническим мастерством.Времена, когда получение данных было трудным испытанием, которое требовало месяцев ручного отслеживания, разработки опроса или написания кода отслеживания с нуля , превышает .
Слава богу.
В наши дни, когда все, что находится под солнцем, отслеживается и каталогизируется, каждый имеет широкий доступ к данным. Однако этот обширный доступ может стать большим барьером между компаниями, которые становятся великими, и компаниями, которые этого не делают.
Люди, которые знают, как говорить на языке данных, имеют большое преимущество, потому что они могут владеть этим мощным инструментом.
Великие маркетологи больше не придумывают кампании, основанные на интуиции; вместо этого они позволяют своим данным сказать им, на какой кампании им следует сосредоточиться, а затем используют свой маркетинговый опыт для создания именно той оптимальной кампании, определенной с помощью данных.
Отличные менеджеры по продукту предлагают тесты и изменения продукта на основе обширных исследований пользователей и данных об использовании продукта.
Каждый может использовать данные в своей роли, и получить доступ к актуальным для вас данным несложно.
Но часто самым большим препятствием является понимание: «Имея все эти данные, как мне узнать, что на самом деле важно, на чем сосредоточить свои усилия и какие шаги нужно предпринять?»
В этой записи блога, состоящей из двух частей, я покажу вам, как отвечать на эти вопросы и что означает правильное использование ваших данных.
В этом посте мы рассмотрим основы, такие как понимание того, что на самом деле представляют собой корреляция и причинная связь, и более подробно рассмотрим свойства корреляции, различные типы и роль, которую играет шум.
Во втором сообщении блога мы рассмотрим формулы для определения силы корреляции, как они могут помочь нам определить причинно-следственную связь и как понять, насколько важна каждая переменная для конечного результата.
Что такое корреляция и причинно-следственная связь?
Ключ к правильному использованию ваших данных заключается в понимании разницы между причинно-следственной связью и корреляцией, поэтому давайте теперь рассмотрим каждый из этих терминов.
Что такое причинно-следственная связь?
Суть причинно-следственной связи заключается в понимании причины и следствия.
Это что-то вроде:
- Дождевые облака вызывают дождь
- Физические упражнения вызывают рост мышц
- Переедание вызывает увеличение веса
Предполагается, что , потому что произошло x , затем следует y ; есть причина и следствие.
Однако это не особенно практично в деловой среде.
Когда вы просматриваете свои данные на практике, вы в основном ищете ответы на вопросы, в зависимости от вашей роли, например следующие:
- Какой канал привлечения клиентов является наиболее успешным и почему?
- Какие части моего продукта нравятся моим пользователям больше всего?
- Почему люди покупают мой продукт / платят за мои услуги?
И, наконец, то, что вы хотите сделать, — это различать факторы, которые действительно способствовали более успешному каналу, лучшую часть продукта или причину, по которой клиенты покупают то, что вы продаете. .
Здесь вы ищите индикаторы, которые сообщают вам, какое из ваших действий привело к желаемому результату.
Обычно это никогда не что-то одно, а скорее — комбинация множества факторов, каждый из которых в той или иной степени играет роль в конечном результате.
Итак, на практике это может стать очень трудным, потому что у вас часто происходит много вещей одновременно.
Например, если вы работаете в маркетинговой команде и видите, что ваше последнее сообщение в блоге или видео привлекает большой веб-трафик на ваш сайт, вы можете задаться вопросом, действительно ли это произошло из-за ваших усилий или из-за:
- Новое дополнение к продукту, которое команда разработчиков выпустила на прошлой неделе, или
- Приглашение вашего генерального директора в подкаст, или
- Праздники не за горами, или
- Кто-то разместил положительный отзыв о вашем продукте в популярный сайт,
- и т. д.
Или, если быть более точным, , какая часть этого увеличения трафика произошла из-за созданного вами контента по сравнению с другими переменными факторами?
Как вы понимаете, установить причинно-следственную связь может быть довольно сложно. Поскольку на практике эти вещи могут стать настолько трудными, вы часто будете сталкиваться с родственным, но более общим понятием, называемым корреляцией.
Что такое корреляция?
Корреляция описывает взаимосвязь между двумя разными переменными, которая гласит: , когда одна переменная изменяется, изменяется и другая.
Зависимые и независимые переменные
Если у вас есть пара коррелированных переменных, одна называется зависимой переменной, а другая — независимой переменной.
Значение, которое зависимая переменная принимает для , зависит от значения, которое имеет независимая переменная. Вы можете думать о независимой переменной как о той, которая задает сцену, и зависимая переменная должна реагировать соответствующим образом.
Например, если вы анализируете, сколько блюд готовят в вашем ресторане на основе количества посетителей, то количество приготовленных обедов является зависимой переменной, а количество клиентов — независимой переменной.
При большем количестве клиентов вам нужно готовить больше блюд, но если вы просто начнете готовить больше блюд, вы, вероятно, не собираетесь волшебным образом привлекать больше клиентов в свой ресторан.
Иногда эти отношения могут стать более туманными.
Например: если вы анализируете общее время просмотра ваших видео на Youtube по сравнению с количеством просмотров видео.
В этом случае зависимой переменной является время просмотра, а независимой переменной — количество просмотров, поскольку время просмотра зависит от количества просмотров и количества просмотров каждым человеком.
Хотя вы можете оценить количество просмотров на основе времени просмотра, эта взаимосвязь не имеет большого смысла, поскольку зритель сначала должен нажать на ваше видео и начать просмотр, прежде чем они смогут внести свой вклад в время просмотра.
Основные свойства корреляций
Корреляции могут быть:
- Положительный
- Отрицательный (обратно коррелированный)
- Не коррелированный
Их корреляцию можно классифицировать как:
- Слабо
- Сильно
- Идеально
В расширенном сообщении в блоге, которое выйдет на следующей неделе, мы рассмотрим статистические тесты, которые вы можете провести для определения силы корреляции, но здесь мы сначала сосредоточимся на получении лучшее понимание того, что на самом деле означает и как выглядит корреляция.
На следующих графиках показаны типы корреляций, упомянутые выше:
В каждом столбце мы показываем сначала отсутствие корреляции, затем слабую корреляцию, сильную корреляцию и идеальную корреляцию.
Первая и вторая строки показывают положительную и отрицательную линейную корреляцию соответственно.
- Положительная корреляция означает, что когда одна переменная растет, другая растет.
- Отрицательная корреляция означает, что когда одна переменная растет, другая падает.
Как мы видим, отсутствие корреляции просто показывает отсутствие взаимосвязи: перемещение влево или вправо по оси x не позволяет нам предсказать какие-либо изменения по оси y.
Например, нет корреляции между весом моей кошки и ценой нового компьютера; они не имеют никакого отношения друг к другу.
(Если бы между весом моей кошки и ценой на новый компьютер существовала положительная корреляция, у всех нас были бы большие проблемы.)
Слабая корреляция означает, что мы можем видеть положительный или отрицательный тренд корреляции, глядя на данные издалека; однако эта тенденция очень слабая и может исчезнуть, когда вы сосредоточитесь на определенной области.
Например, возьмем слабую положительную и слабую отрицательную линейную корреляцию сверху и увеличим масштаб в области x от 0 до 4.
Вот что может получиться:
И внезапно , эта слабая корреляция, которую мы видели раньше, исчезла.
Это показывает нам, что, хотя слабая корреляция может сообщить нам информацию о более крупных тенденциях, эти правила могут не работать при поиске в меньшей области.
Следовательно, когда у нас слабая корреляция, мы должны быть осторожны, чтобы не пытаться использовать ее в слишком маленьком масштабе.
Сильная корреляция означает, что мы можем увеличивать масштаб намного, намного дальше, пока нам не придется беспокоиться о том, что это соотношение не соответствует действительности. Если мы возьмем нашу сильную положительную и сильную отрицательную корреляцию сверху, а также увеличим масштаб до области x от 0 до 4, мы увидим следующее:
Верхний ряд показывает нам, как выглядят сильные корреляции, когда мы увеличиваем масштаб x между областью 0–4.Как мы видим, даже здесь корреляции все еще очень очевидны, и они все еще довольно сильны (хотя и не так сильно, как раньше).
Чтобы попасть в область, где эта корреляция больше не соблюдается, мы должны довольно сильно увеличить масштаб, что мы можем видеть в нижней строке приведенного выше графика.
Здесь мы увеличили масштаб до области, где x находится в диапазоне от 0,5 до 1,5, что составляет 10% от нашего исходного диапазона. В этом масштабе наши корреляции больше не видны, даже в слабой форме.
И, наконец, идеальная корреляция — это корреляция без шума, и не имеет значения, насколько сильно мы увеличиваем масштаб, она всегда будет оставаться идеальной. Этот тип корреляции непрактичен, но все же важно знать, как выглядит «идеальная» корреляция.
Сила корреляции и наклон?
Еще одна вещь, которую часто неправильно понимают в отношении корреляций, заключается в том, что сила корреляции зависит от наклона .
Взгляните на следующие графики.Все они, за исключением одного, демонстрируют сильную корреляцию с одинаковой силой.
Обратите внимание, как у нас может быть сильная корреляция независимо от того, большой ли у нас (левый столбец) или маленький (средний столбец) наклон.
В крайнем правом столбце показан график без корреляции, несмотря на практически полное отсутствие шума. Это связано со способом определения корреляций: насколько изменение одной переменной влияет на другую переменную.
В этом случае значение y не зависит от значения x, следовательно, это еще один пример отсутствия корреляции (хотя более реалистичный пример отсутствия корреляции больше похож на случайный разброс точек, который мы видели в визуал в предыдущем разделе.)
Что такое шум и почему он важен для измерения корреляций
Вы могли заметить, что средний столбец приведенного выше графика больше похож на идеальную корреляцию, чем крайний левый столбец. Это связано с тем, что в сила корреляции зависит от масштаба вашего шума относительно наклона.
Итак, чтобы средний и левый столбцы имели одинаковую силу корреляции, масштаб шума в среднем столбце должен быть меньше, чем масштаб шума в левом столбце, поскольку средний столбец имеет меньший (более мелкий) наклон. .
Причина этого в том, что мы более подробно обсудим в расширенном сообщении в блоге, которое выйдет на следующей неделе, так что пока просто знайте, что у вас могут быть очень сильные корреляции, даже если ваш наклон не очень большой.
Давайте сейчас сосредоточимся только на одном термине: шум.
Итак, что такое шум?
Шум ссылается на вариацию ваших данных. Он существует, потому что всегда есть много вещей, влияющих на данные, которые вы просматриваете.
Мы видели шум на графиках выше, особенно если посмотреть на различные силы корреляции.
Давайте снова возьмем это изображение:
В крайнем левом столбце мы видим много шума; данные сильно различаются, и все выглядит повсюду.
Второй столбец слева показывает общую тенденцию, как мы обсуждали выше, но по-прежнему существует множество вариаций. На нашей оси Y мы можем видеть, что значения y варьируются от 0 до 4, но ширина нашей линии составляет около 2.
В третьем слева столбце («Сильная положительная / отрицательная линейная корреляция») мы видим гораздо более четкую тенденцию. Наши данные все еще немного колеблются, но не сильно. В этом случае у нас мало шума .
В крайнем правом столбце нет никаких колебаний и отображается идеальная прямая линия без шума.
Вот так «выглядит» шум. Мы также сравнили наш шум только со значениями y, но точки данных x и y будут иметь шум, который влияет на них.
Но давайте сделаем это более практичным.
Что такое шум на самом деле и откуда он?
Представим, что вы создали игру для смартфона и посмотрите, сколько времени каждый пользователь потратил на вашу игру при первой загрузке.
Лучше всего это представить в виде гистограммы, которая может выглядеть так:
Обычно после построения точек данных, которые есть у и , появляется форма распределения, и вы можете оценить форму распределения на основе имеющихся точек.
Идеальное распределение — это то, как ваше распределение выглядел бы, если бы у вас было бесконечное количество точек данных. Это распределение может принимать любую форму; это не обязательно должно быть нормальное распределение, подобное показанному выше.
Отклонение от идеального распределения, которое мы видим на гистограмме, является еще одной формой шума. Шум изменяет точки данных на основе факторов, не зависящих от эксперимента.
Этот шум исходит от таких вещей, как:
- Пользователь запускает вашу игру, а затем забывает ее выключить, что заставляет их оставаться включенными дольше
- Другой пользователь вызван на обед своей мамой
- Игра другого пользователя вылетела, поэтому они не могли играть в первый раз
Все это создает шум, который заставляет ваши данные отклоняться от «идеальной» формы, которая была бы, если бы каждого пользователя просто поместили в пустую комнату и попросили играть в вашу игру до тех пор, пока он не перестанет чувствовать, что это нужно.
Таким образом, при любом анализе данных, который вы когда-либо проводите, следует помнить о шуме, и в идеале вы должны минимизировать влияние шума на свои данные.
Контроль шума
На ваши данные всегда будет влиять шум, но , если вы хотите попытаться уменьшить количество шума в ваших данных, вы можете попытаться контролировать некоторые из источников шума.
Например, вы можете смотреть только на тех пользователей, чье приложение не закрылось из-за ошибки, так что вы можете контролировать шум, исходящий от сбоев пользовательских приложений.
Для каждой переменной шума, которую вы контролируете, размер вашей выборки будет уменьшаться, поэтому, если вы попытаетесь контролировать слишком много вещей, у вас будет слишком мало точек данных, которые не позволят вам ничего делать. тоже полезно.
Итак, что вы хотите сделать, это определить ваши самые большие источники шума , , то есть какие переменные приводят к наибольшему количеству колебаний, и попытаться контролировать эти .
Таким образом вы сохраните размер выборки как можно большим, контролируя только несколько вещей, при этом устраняя как можно больше шума.
Конечно, поиск правильного баланса между допустимым количеством шума и желаемым размером выборки всегда зависит от того, что вы делаете, поэтому, в конце концов, вам нужно решить, будет ли количество шума, которое вы видите на вашем графике приемлемо для анализа, и если размер выборки достаточно велик.
Есть несколько математических методов, которые вы можете использовать, чтобы помочь с этим, о которых мы поговорим в расширенном сообщении в блоге на следующей неделе, если вам интересно.
Типы корреляции
Выше мы видели примеры положительных и отрицательных линейных комбинаций при разной силе корреляции, но корреляции не обязательно должны быть линейными.
Они также могут иметь множество различных форм, таких как линейные, квадратичные, экспоненциальные, логарифмические и в основном любые другие функции, о которых вы только можете подумать.
На следующих графиках показано несколько примеров коррелированных переменных:
Мы можем видеть на крайнем левом графике, что, когда значение «x» увеличивается, значение «y» увеличивается на пропорциональную величину, и эта величина всегда одинакова.
Взаимосвязь между осью x и осью y может быть описана уравнением «y = mx + b», которое делает этот тип корреляции линейным (это также легко увидеть по прямой линии на графике).
На среднем графике мы видим, что в зависимости от того, где мы находимся на графике, значение ‘y’ уменьшается (при x <~ 3), на самом деле не изменяется (примерно при x = 3) или увеличивается с х (при х> ~ 3).
Здесь очень важно отметить, что, хотя корреляции не обязательно должны быть линейными, стандартно искать только линейные корреляции, потому что их проще всего искать и легче всего проверять с помощью формул.
Давайте взглянем на несколько примеров корреляций, например:
- Чем жарче погода, тем больше мороженого вы продаете
- Чем больше голосов получает ваш контент на Reddit, тем больше посетителей страницы вы получаете из этого сообщения
- Чем больше у вас подписчиков в Instagram, тем больше продаж вы делаете в своем бизнесе
Чтобы лучше понять эти примеры, я визуализировал, как могут выглядеть графики для каждого из приведенных выше примеров.
Вот количество покупателей мороженого в зависимости от температуры:
Вот статистика посетителей страницы против голосов Reddit:
И вот график ежемесячных продаж бизнеса относительно подписчиков в Instagram:
Обратите внимание, что ни один из них не имеет реальной линейной формы.
И на самом деле — наши продажи мороженого, кажется, достигают максимума примерно на 200, посещения страниц из голосов Reddit, кажется, растут намного быстрее после того, как мы дадим 20-30 голосов, а продажи продуктов, похоже, растут медленнее, когда мы попадаем в тысячи Instagram. последователи.
Итак, чтобы быть более точным, мы могли бы сказать, что первый график выглядит как «S» (он же сигмовидная форма), второй график выглядит слегка экспоненциальным или как степень отношения, а третий график выглядит немного логарифмическим, потому что он выравнивается.
Тем не менее, я по-прежнему рекомендую, чтобы, если он выглядит более или менее линейным, подумайте о том, чтобы рассматривать его части как линейные для вашего анализа.
Моя точка зрения: эти корреляции выглядят достаточно близкими к линейным, чтобы мы могли считать их части линейными, а не рассматривать их как более сложные формы, которые может быть труднее оценить и которые не приведут к значительным улучшениям ваших результатов.
Конечно, когда связь слишком далека от линейной, вы не можете считать ее просто линейной.
Итак, из приведенных выше графиков мы можем прийти к следующим выводам, рассматривая их части как линейные корреляции как часть более сложных форм:
- На графике мороженого есть определенный диапазон температур, в котором потребительский спрос быстро растет (в центре), а во внешних регионах спрос практически не меняется. Нашему магазину мороженого не нужно планировать до последнего рожка мороженого, проданного в конкретный день, но было бы очень полезно знать, сколько ведер мороженого нужно приготовить в целом, исходя из завтрашнего прогноза погоды.
- С помощью Reddit мы можем подготовить наши серверы к увеличению трафика в случае, если наша публикация начнет тренд, чтобы убедиться, что у наших пользователей не слишком долгое время загрузки на наш сайт. С помощью графика мы можем сделать обоснованные оценки ожидаемого трафика и минимизировать риск недо- или перекупленности.
- Или с нашими подписчиками в Instagram , мы знаем, какую прибыль ожидать при определенном количестве подписчиков. Но с уменьшающейся отдачей, которую мы видим на графике выше, мы можем захотеть подумать о стратегиях того, как сделать наших нынешних последователей более лояльными или заинтересованными, а не просто пытаться постоянно получать новых подписчиков.
В чем разница между причинно-следственной связью и корреляцией?
Итак, вопрос на миллион долларов: в чем разница между причинно-следственной связью и корреляцией?
Ну, короче:
Корреляция — это мера для того, как зависимая переменная реагирует на изменение независимой переменной .
Корреляция, в конце концов, — это просто число, полученное из формулы.
Причинная связь — это особый тип связи между коррелированными переменными, в котором конкретно говорится, что изменение одной переменной вызывает соответствующую реакцию другой.
Причинно-следственная связь добавляет реальный контекст и значение корреляции.
Все причинные связи являются корреляциями, но не все корреляции являются причинными связями.
У вас могут возникнуть корреляции между переменными чисто случайно, поэтому, размышляя о причинно-следственной связи, мы должны спросить себя:
- Имеет ли смысл эта корреляция? Есть ли между этими переменными фактическая связь?
- Сохранится ли / будет ли корреляция, если я посмотрю на некоторые новые данные, которые я не использовал в своем текущем анализе?
- Связь между этими переменными прямая, или они обе являются результатом какой-то другой переменной?
Примеры корреляции и причинно-следственной связи
Вот несколько быстрых примеров корреляции vs.причинно-следственная связь ниже.
Примеры корреляции, НЕ причинно-следственной связи:
- « В те дни, когда я бегаю, я замечаю на дороге больше машин. “
- Я лично НЕ ПРИЗЫВАЮ больше машин выезжать на улицу, когда я бегу. Просто потому, что я выбегаю на улицу, я вижу больше машин, чем когда остаюсь дома. Эта связь не является причинно-следственной , потому что ни машины, ни я не влияем друг на друга.
Хорошо, а как насчет примера, который на первый взгляд может показаться более связанным с :
- “ В дни, когда я пью кофе, я чувствую себя более продуктивным. «
- Я, конечно, могу чувствовать себя более продуктивно благодаря кофеину. Но это также может быть связано с тем, что я хожу в кафе, чтобы выпить кофе, и я более продуктивен в кафе, чем дома, когда есть миллион отвлекающих факторов. Эта причинно-следственная связь ЕСТЬ НЕ подтверждена.
Примеры причинно-следственной связи:
- После тренировки я чувствую себя физически истощенным.
- Это причинно-следственный , потому что я целенаправленно доводю свое тело до физического истощения при выполнении упражнений.Мышцы, которые я тренировал, истощаются (эффект) после того, как я тренируюсь (причина). Эта причинно-следственная связь IS подтверждена.
- Когда я кормлю кошку более чем двумя лакомствами в день, она становится немного более пухлой.
- Моя кошка толстеет , потому что я кормлю ее больше. Это причина и следствие. Причина в том, что я кормлю кошку лакомствами, а в результате она становится немного круглее.
Отличить причинно-следственную связь от корреляции может быть сложно, когда вещи имеют положительную или отрицательную корреляцию без какой-либо причины или из-за, казалось бы, случайных, несвязанных причин.
Представим, что каждый раз, когда я пью кофе, в Испании цены на кукурузу растут.
Это будет положительная корреляция: когда я увеличиваю потребление кофе, цена на кукурузу возрастает.
Но разве это волшебным образом делает это причинно-следственной связью? Нет.
То, что я пью больше кофе, НЕ означает, что я вызываю рост цен на кукурузу в Испании.
Между мной и ценами на кукурузу нет причинно-следственной связи.
Хотя … если по какой-то странной, сложной логистической причине глобальной цепочки поставок, связанной с моим спросом на кофе, увеличивающим производство кофе в Испании, что затем каким-то образом увеличивает стоимость на соседних кукурузных полях, тем самым фактически увеличивая цены на кукурузу, и, НА ФАКТЕ, была причинно-следственная связь … Тогда это была бы другая история.
Но, к счастью, в этом сценарии , вероятно, нет причинного эффекта, просто корреляция.
Эти примеры немного более анекдотичны с целью установить разницу между ними, но давайте рассмотрим более практический сценарий, в котором граница между причинно-следственной связью и корреляцией может быть размыта.
Например, давайте рассмотрим две переменные: 1) количество лайков на видео Youtube и 2) общее время просмотра видео.
Мы можем видеть, что с увеличением количества лайков на видео увеличивается и общее время просмотра видео. Точно так же с увеличением общего времени просмотра увеличивается и количество лайков.
Следующее изображение представляет собой построенный мною график взаимосвязи между временем просмотра и количеством лайков для выбранной группы видео на Youtube, чтобы помочь нам визуализировать эту взаимосвязь:
Здесь мы видим слабую положительную корреляцию, которая не является полностью линейной, но которую мы будем приближать к линейной для простоты.
Но что это значит? И в каком направлении идет эта корреляция? Какая из них является зависимой, а какая независимой?
Ну, эти переменные могут быть слабо связаны друг с другом:
- Чем больше лайков, тем больше людей смотрели видео дольше, потому что оно им понравилось, или
- , что больше людей понравилось видео, потому что они смотрели его дольше и получали от него удовольствие.
Объяснения в обоих направлениях имеют смысл, но можно с уверенностью сказать, ни одно из них на самом деле не вызывает друг друга.
Лучшая причинная переменная, которая также коррелирует с обеими этими переменными, — это переменная «количество просмотров» в видеороликах Youtube. Зрители несут ответственность за то, чтобы лайкать и смотреть видео, и, следовательно, они увеличивают эти цифры.
В этом случае на самом деле может происходить то, что переменная «количество просмотров» ВЫЗЫВАЕТ более высокое время просмотра и увеличение количества лайков для видео. И переменные «время просмотра» и «лайки» корреляции друг с другом только из-за их случайной связи с переменной «количество просмотров», но сами переменные «время просмотра» и «лайки» не связаны причинно. друг с другом.
Итак, как вы понимаете, существует случаев , в которых мы можем получить корреляции между переменными, которые возникают непосредственно из-за причинной связи между ними.
Важно отметить, что если у вас есть причинная переменная, которая коррелирует с несколькими другими переменными, то эти другие переменные также могут быть коррелированы друг с другом просто из-за их зависимости от одной и той же причинной переменной.
Это то, что мы видели в примере выше.
Короче говоря, корреляция — это очень важная взаимосвязь между переменными, которая может указывать на причинно-следственные связи, но сами корреляции иногда могут вводить в заблуждение или быть неинформативными.
Если мы не оценили эту взаимосвязь и не нашли фактическое значение, которое связывает две переменные, нам не следует начинать принимать решения на основе того, как мы нашли коррелированную, но в остальном, казалось бы, несвязанную переменную для поведения.
И это сообщение в блоге на этой неделе!
Следите за обновлениями на следующей неделе, и выйдет вторая часть этого сообщения в блоге, где мы более подробно рассмотрим эту тему.
Почему корреляция не подразумевает причинно-следственной связи? | Сима Сингх
Корреляция и причинно-следственная связь — это термины, которые в большинстве случаев понимаются неправильно и часто используются как взаимозаменяемые.Понимание обоих статистических терминов очень важно не только для того, чтобы делать выводы, но, что более важно, делать правильные выводы в конце. В этом посте мы поймем, почему корреляция не подразумевает причинно-следственную связь.
Мы много раз слышали, что «корреляция не вызывает причинной связи», или «корреляция не подразумевает причинной связи», или «корреляция не является причинной обусловленностью». Но что они на самом деле имеют в виду, говоря это?
Вы получите четкое представление, когда мы прочтем этот пост в блоге.Итак, начнем!
Корреляция — это статистический метод, который показывает, насколько сильно пара переменных линейно связаны и изменяются вместе. Он не говорит нам, почему и как стоят за отношениями, но просто говорит, что отношения существуют.
Пример: Корреляция между продажами мороженого и проданными солнцезащитными очками.
По мере роста продаж мороженого растут и продажи солнцезащитных очков.
Причинная связь идет дальше, чем корреляция.В нем говорится, что любое изменение значения одной переменной вызовет изменение значения другой переменной, что означает, что одна переменная вызывает другую. Его также называют причиной и следствием.
Пример: Когда человек тренируется, количество сжигаемых калорий увеличивается каждую минуту. Бывшее приводит к тому, что происходит последнее.
Итак, теперь мы знаем, что такое корреляция и причинная связь, пора понять: «Корреляция не подразумевает причинно-следственную связь!» с известным примером.
Продажи мороженого коррелируют с убийствами в Нью-Йорке (исследование)
По мере того, как продажи мороженого растут и падают, растет и количество убийств. Является ли потребление мороженого причиной смерти людей?
Нет. Две взаимосвязанные вещи не означают, что одна вызывает другую.
Корреляция не означает причинно-следственной связи, или в нашем примере мороженое не вызывает смерти людей.
Когда две несвязанные вещи связаны вместе, они могут быть связаны либо причинно-следственной связью, либо корреляцией.
В большинстве случаев корреляция возникает только из-за совпадений. То, что кажется, что один фактор влияет на другой, не означает, что это действительно так.
Корреляция — это то, о чем мы думаем, когда ничего не видим под покровом. Таким образом, чем меньше у нас информации, тем больше мы вынуждены наблюдать корреляции. Точно так же, чем больше у нас информации, тем более прозрачными станут вещи и тем больше мы сможем увидеть реальные случайные отношения.
Связь солнечных дней с продажей мороженого и убийствамиВ некоторых случаях существуют некоторые скрытые факторы, которые на каком-то уровне связаны. Как и в нашем примере с продажами мороженого и количеством убийств, погода является скрытым фактором, вызывающим обе эти вещи. Погода на самом деле вызывает рост продаж мороженого и убийств. Как и летом, люди обычно выходят на улицу, наслаждаются солнечным днем и расслабляются с мороженым. Поэтому в солнечную погоду на улице находится широкий круг людей и более широкий выбор жертв для хищников.
Нет причинно-следственной связи между мороженым и уровнем убийств, солнечная погода объединяет оба фактора. И да, продажа мороженого и убийства имеют причинно-следственную связь с погодой.
Сразу после обнаружения корреляции не делайте вывод слишком быстро. Найдите время, чтобы найти другие основные факторы, поскольку корреляция — это только первый шаг. Найдите скрытые факторы, проверьте их правильность и сделайте вывод.
Надеюсь, этот пост развеял ваши сомнения!
Спасибо за прочтение !!
Корреляция и причинно-следственная связь: определение, различия и примеры
Как маркетологи мобильной связи, мы каждый день принимаем решения на основе данных.Эти решения побуждают пользователей продолжать использовать наши приложения или удалять их. Вот почему мы должны ясно мыслить, когда сталкиваемся с данными, и остерегаться возможных проблем корреляции и причинно-следственной связи.
За последнее десятилетие организации стали отдавать предпочтение решениям, основанным на данных. Это мышление, что без доказательств нет реальной основы для решения. Это делает еще более важным использование статистики как инструмента, который дает представление о взаимосвязях между факторами в данном анализе.Статистика помогает отличить корреляции от причинно-следственных связей.
Пример корреляции и причинно-следственной связи
Моя свекровь недавно пожаловалась мне: «Каждый раз, когда я пытаюсь отправить текстовое сообщение, мой телефон зависает». Беглый взгляд на ее смартфон подтвердил мои подозрения: у нее одновременно было открыто пять игровых приложений, плюс Facebook и YouTube. Попытка отправить текстовое сообщение не приводила к зависанию, в отличие от нехватки оперативной памяти. Но она сразу связала это с последним действием, которое она совершала перед замораживанием.
Она намекала на причинно-следственную связь, где была только корреляция.
Примеры корреляции и причинно-следственной связи в мобильном маркетинге
Корреляции повсюду. Как любят говорить разоблачители теории заговора: «Если вы посмотрите достаточно долго, вы увидите закономерности».
Точно так же, если вы посмотрите достаточно долго, вы можете начать видеть причинно-следственные связи в своих данных мобильного маркетинга, где есть только корреляция. Мы пытаемся найти причину, по которой A и B встречаются одновременно.
Посмотрите, сможете ли вы определить, что есть что в приведенных ниже примерах корреляции и причинно-следственной связи:
- Реализован новый веб-дизайн >> Увеличился трафик веб-страницы
Увеличился ли трафик из-за нового дизайна (причинно-следственная связь)? Или трафик просто увеличился органически в то время, когда был выпущен новый дизайн (корреляция)? - Загрузили новые изображения в магазин приложений >> Загрузки увеличились в 2 раза
Увеличились ли загрузки из-за появления новых изображений в ваших магазинах приложений? Или они просто произошли одновременно? - Push-уведомление отправляется каждую пятницу >> Число удалений увеличивается каждую пятницу
Удаляют ли люди ваше приложение из-за ваших еженедельных push-уведомлений? Или здесь играет какой-то другой фактор? - Увеличение количества ссылок на ваш сайт >> Более высокий рейтинг в результатах поисковых систем
Приводит ли увеличение количества ссылок непосредственно к лучшему поисковому рейтингу? Или они просто коррелируют?
Чтобы лучше понять корреляцию и причинно-следственную связь, давайте начнем с определения терминов.
Искусство адаптации пользователей мобильных приложений
Произведите хорошее первое впечатление благодаря длительным отношениям с клиентами. Узнайте, как подключить пользователей к вашему приложению с помощью CleverTap.
Загрузить технический документ
Что такое корреляция?
Корреляция — это термин в статистике, обозначающий степень связи между двумя случайными величинами. Таким образом, корреляция между двумя наборами данных — это степень, в которой они похожи друг на друга.
Если A и B наблюдаются одновременно, вы указываете на корреляцию между A и B.Вы не подразумеваете, что А является причиной Б или наоборот. Вы просто говорите, что когда A наблюдается, то B наблюдается. Они движутся вместе или появляются одновременно.
Мы можем выделить три типа корреляций:
- Положительная корреляция — это когда вы наблюдаете увеличение A и B также. Или, если A уменьшается, B соответственно уменьшается. Пример: чем больше покупок совершается в вашем приложении, тем больше времени вы проводите с ним.
- Отрицательная корреляция — это когда увеличение A приводит к уменьшению B или наоборот.
- Нет корреляции — это когда две переменные совершенно не связаны и изменение A не приводит к изменению B, или наоборот.
Просто помните: корреляция не подразумевает причинно-следственной связи. Иногда это может быть совпадение. И если вы мне не верите, есть юмористический сайт, полный таких совпадений, под названием «Ложные корреляции». 1 Вот пример:
Что такое причинно-следственная связь?
Причинная связь подразумевает, что A и B имеют причинно-следственную связь друг с другом.Вы говорите, что А вызывает Б.
Причинность также известна как причинность.
- Во-первых, причинно-следственная связь означает, что два события появляются одновременно или одно за другим.
- А во-вторых, это означает, что эти две переменные не только появляются вместе, существование одной вызывает проявление другой.
Корреляция и причинно-следственная связь: почему разница имеет значение
Знание разницы между корреляцией и причинно-следственной связью может иметь огромное значение, особенно когда вы принимаете решение на основании чего-то, что может быть ошибочным.
Скажем, вам интересно, было ли увеличение ежемесячных активных пользователей в прошлом месяце вызвано недавними усилиями по оптимизации App Store. Имеет смысл проверить это, чтобы точно сказать, является ли это корреляцией или причинно-следственной связью.
Корреляция против причинно-следственной связи: как определить, является ли что-то совпадением или причинно-следственной связью
Итак, как вы проверяете свои данные, чтобы делать надежные утверждения о причинно-следственной связи? Есть пять способов сделать это — технически они называются планом экспериментов. ** Мы перечисляем их от самого надежного до самого слабого:
1. Рандомизированное и экспериментальное исследование
Допустим, вы хотите протестировать новую корзину покупок в своем приложении электронной коммерции. Ваша гипотеза состоит в том, что до того, как пользователь сможет оформить покупку и оплатить свой товар, проходит слишком много шагов, и что эта трудность является точкой трения, которая мешает им покупать чаще. Итак, вы перестроили корзину покупок в своем приложении и хотите посмотреть, увеличит ли это шансы пользователей на покупку чего-либо.
Лучший способ доказать причинную связь — провести рандомизированный эксперимент. Здесь вы случайным образом назначаете людей для тестирования экспериментальной группы.
В плане эксперимента есть контрольная группа и экспериментальная группа, обе с одинаковыми условиями, но с одной проверяемой независимой переменной. Распределяя людей для тестирования экспериментальной группы случайным образом, вы избегаете экспериментальной предвзятости, когда одни результаты предпочтительнее других.
В нашем примере вы случайным образом назначаете пользователей для тестирования новой корзины покупок, прототипа которой вы создали в своем приложении, а контрольной группе назначается использование текущей (старой) корзины покупок.
После периода тестирования просмотрите данные и посмотрите, ведет ли новая корзина к большему количеству покупок. Если это так, вы можете заявить о наличии истинной причинно-следственной связи: ваша старая корзина мешала пользователям совершить покупку. Результаты будут иметь наибольшую ценность как для внутренних заинтересованных сторон, так и для других людей за пределами вашей организации, с которыми вы решите поделиться ими, именно из-за рандомизации.
2. Квазиэкспериментальное исследование
Но что произойдет, если вы не можете рандомизировать процесс отбора пользователей для участия в исследовании? Это квазиэкспериментальный дизайн.Существует шесть типов квазиэкспериментальных схем, каждый из которых имеет различные приложения. 2
Проблема с этим методом в том, что без рандомизации статистические тесты теряют смысл. Вы не можете быть полностью уверены в том, что результаты связаны с переменной или мешающими переменными, вызванными отсутствием рандомизации.
Квазиэкспериментальные исследования обычно требуют более сложных статистических процедур для получения необходимого понимания. Исследователи также могут использовать опросы, интервью и заметки наблюдений — все это усложняет процесс анализа данных.
Предположим, вы проверяете, менее запутан ли пользовательский интерфейс в вашей последней версии, чем в старой UX. И вы специально используете свою закрытую группу бета-тестеров приложений. Группа бета-тестирования была выбрана не случайно, поскольку все они подняли руку, чтобы получить доступ к новейшим функциям. Таким образом, доказать корреляцию против причинно-следственной связи — или, в этом примере, UX вызывает путаницу — не так просто, как при использовании случайного экспериментального исследования.
Хотя ученые могут избегать результатов этих исследований как ненадежных, собранные вами данные все же могут дать вам полезную информацию (подумайте о тенденциях).
3. Корреляционное исследование
Корреляционное исследование — это когда вы пытаетесь определить, коррелированы ли две переменные или нет. Если A увеличивается, а B соответственно увеличивается, это корреляция. Просто помните, что корреляция не подразумевает причинно-следственной связи, и все будет в порядке.
Например, вы решили проверить, имеет ли более плавный UX сильную положительную корреляцию с лучшими рейтингами в магазине приложений. И после наблюдения вы видите, что когда одно увеличивается, другое тоже.Вы не говорите, что A (плавный UX) вызывает B (более высокие оценки), вы говорите, что A прочно ассоциируется с B. И, возможно, даже может предсказать это. Это корреляция.
4. Однопредметное исследование
Однопредметный дизайн чаще используется в психологии и образовании, поскольку он касается отдельного предмета. Вместо контрольной и экспериментальной группы субъект выступает в качестве своего собственного контроля. Исследователя беспокоят попытки изменить поведение или мышление человека.
В мобильном маркетинге исследование одного предмета может принимать форму просьбы к одному конкретному пользователю проверить удобство использования новой функции приложения. Вы можете попросить их выполнить одно действие несколько раз в текущем приложении, а затем попросить их попробовать то же действие в новой версии приложения. Соберите данные и посмотрите, будет ли действие выполнено быстрее в старом или новом приложении.
Очевидно, что в этой схеме используются данные одного пользователя. Его или ее опыт не может быть распространен на всех ваших пользователей, независимо от того, насколько идеально подходит ваш идеальный образ клиента.Это одна из причин, почему этот тип исследования редко используется в маркетинге.
5. Истории
К сожалению, анекдоты иногда являются единственным доказательством, которое нам нужно для установления причинной связи. Вы можете встретить:
- Персонал службы поддержки: «Клиенты считают, что новый пользовательский интерфейс сложен в использовании. Вот почему они удаляются ».
- Клиент X в Твиттере: «Мы пытались купить продукт в вашем приложении, и это привело к сбою моего телефона!»
Проблема здесь в том, что, хотя у них может быть действительная болевая точка и они могут сделать ее убедительной (и очень эмоциональной), эти истории не доказывают без сомнения, что А вызывает Б.На данный момент это действительно просто истории, и они имеют меньший вес, чем другие варианты, указанные выше.
Корреляция и причинно-следственная связь в мобильной аналитике
Итак, что мы узнали из всех этих примеров корреляции и причинно-следственной связи? Есть способы проверить, вызывают ли две переменные друг друга или просто коррелируют друг с другом.
Если вы серьезно относитесь к установлению причинно-следственной связи, вам следует использовать метод тестирования, который дает вашим данным и результатам наибольшую достоверность.Начните со случайного экспериментального плана и двигайтесь вниз. И всегда следите за тем, как вы думаете или даже озвучиваете свои прогнозы.
Есть латинская фраза, которая гласит: «Post hoc, ergo propter hoc», что означает: «После этого, следовательно, из-за этого». Идея состоит в том, что, сообщая одно утверждение перед другим, вы подразумеваете, что предыдущее привело к последнему. («Он оценил мое приложение на ноль звезд. Никто не скачивал мое приложение».) На самом деле это может быть просто корреляция или чистое совпадение.
Инфографика от CleverTap
Посмотрите, как ведущие современные бренды используют CleverTap для долгосрочного роста и удержания клиентов
Запланируйте демонстрацию прямо сейчас!
Корреляция не подразумевает причинно-следственной связи
Часто люди наивно заявляют, что изменение одной переменной вызывает изменение другой переменной.У них могут быть свидетельства из реального опыта, указывающие на корреляцию между двумя переменными, но корреляция не подразумевает причинно-следственную связь! Например, чем больше сна, тем лучше . Или более кардио заставит вас сбросить жир на животе. Эти утверждения могут быть фактически правильными. Однако с этими утверждениями нам нужны доказательства из правильно завершенного исследования, чтобы на самом деле констатировать, что между двумя переменными существует связь причинно-следственная связь .
Если кто-то заявит подобное потенциально ложное случайное утверждение, я бы посоветовал им провести независимые исследования для сбора официальных доказательств. Исследования часто проводятся исследовательскими институтами и университетами. Вот статья, опубликованная Журналом ожирения, в которой цитируется несколько исследований, которые предоставляют доказательства того, что периодические упражнения высокой интенсивности могут быть эффективными для того, чтобы заставить людей терять жир в брюшной полости.
У Тайлера Вигена на своем веб-сайте есть интересная страница, на которой изображены ложные корреляции.Ниже приведен пример, демонстрирующий сильную положительную линейную корреляцию с расходами США на науку, космос и технологии с самоубийствами через повешение, удушение и удушение.
Однако, как вы думаете, расходы США в этой области вызывают самоубийств с повешением? Моя гипотеза состоит в том, что не существует свидетельств , подтверждающих причинно-следственную связь между этими двумя переменными.
Хотя этот пример с веб-сайта Тайлера кажется экстремальным, он насмехается над тем, как люди могут сразу визуализировать взаимосвязь между двумя числовыми переменными и наивно прийти к выводу, что существует причинно-следственная связь.
Наконец, я хочу показать забавный комикс с сайта комиксов XKCD о корреляции и причинно-следственной связи. »
Шутка в том, что парень справа считает, что у него нет веских доказательств (например, проведенных через исследование), подтверждающих, что его класс статистики заставил его поверить в этот факт.
Корреляция против причинно-следственной связи | Введение в статистику
Корреляционные тесты для взаимосвязи между двумя переменными. Однако наблюдение за двумя переменными, движущимися вместе, не обязательно означает, что мы знаем, вызывает ли одна переменная появление другой.Вот почему мы обычно говорим: «корреляция не подразумевает причинно-следственной связи».
Сильная корреляция может указывать на причинно-следственную связь , но легко могут быть другие объяснения:
- Это может быть результатом случайной случайности, когда переменные кажутся связанными, но истинной основополагающей связи нет.
- Может быть третья скрытая переменная, которая заставляет отношения казаться сильнее (или слабее), чем они есть на самом деле.
Для данных наблюдений корреляции не могут подтвердить причинно-следственную связь…
Корреляции между переменными показывают нам, что в данных есть закономерность: переменные, которые у нас есть, имеют тенденцию перемещаться вместе. Однако сами по себе корреляции не показывают нам, движутся ли данные вместе , потому что одна переменная вызывает другую .
Можно найти статистически значимую и надежную корреляцию для двух переменных, которые на самом деле вообще не связаны причинно. На самом деле такие корреляции — обычное дело! Часто это происходит потому, что обе переменные связаны с разными причинными переменными, которые, как правило, совпадают с данными, которые мы измеряем.
Пример: упражнения и рак кожи
Давайте подумаем об этом на примере. Представьте, что вы просматриваете данные о состоянии здоровья. Вы наблюдаете статистически значимую положительную корреляцию между физическими упражнениями и случаями рака кожи — то есть люди, которые больше занимаются спортом, как правило, болеют раком кожи. Эта корреляция кажется сильной и надежной и проявляется во многих популяциях пациентов. Не вдаваясь в подробности, можно сделать вывод, что упражнения каким-то образом вызывают рак! Основываясь на этих выводах, вы можете даже разработать правдоподобную гипотезу: возможно, стресс от упражнений заставляет организм терять некоторую способность защищаться от солнечных лучей.
Но представьте, что на самом деле эта корреляция существует в вашем наборе данных, потому что люди, которые живут в местах, которые получают много солнечного света круглый год, значительно более активны в своей повседневной жизни, чем люди, которые живут в местах, которых нет. Это отражается в их данных как увеличение количества упражнений. В то же время повышенное ежедневное воздействие солнечного света означает увеличение числа случаев рака кожи. На обе переменные — частоту физических упражнений и рак кожи — влияла третья, причинная переменная — воздействие солнечного света, но они не были связаны причинно.
… но с хорошо спланированным эмпирическим исследованием мы
можем установить причинно-следственную связь!Различие между тем, что дает или не дает причинно-следственные доказательства, является ключевым элементом информационной грамотности. Определение причинности никогда не бывает идеальным в реальном мире. Однако существует множество экспериментальных, статистических и исследовательских методов проектирования для поиска доказательств причинно-следственных связей: например, рандомизация, контролируемые эксперименты и прогностические модели с несколькими переменными.Помимо внутренних ограничений корреляционных тестов (например, корреляции не могут не измерять тривиальные, потенциально причинно-следственные связи), важно понимать, что доказательства причинно-следственной связи обычно исходят не от отдельных статистических тестов, а от тщательного экспериментального дизайна.
Пример: болезни сердца, диета и упражнения
Например, представьте себе еще раз, что мы — исследователи здоровья, на этот раз смотрим на большой набор данных о показателях заболеваемости, диете и других видах поведения, связанных со здоровьем.Предположим, что мы обнаруживаем две корреляции: учащение сердечно-сосудистых заболеваний коррелирует с диетами с высоким содержанием жиров (положительная корреляция), а увеличение физических нагрузок коррелирует с меньшим количеством сердечных заболеваний (отрицательная корреляция). Обе эти корреляции велики, и мы надежно находим их. Конечно же, это ключ к разгадке причинно-следственной связи, не так ли?
В случае этих данных о состоянии здоровья корреляция может указывать на лежащую в основе причинную связь, но без дальнейшей работы она не может ее установить. Представьте, что после обнаружения этих корреляций в качестве следующего шага мы разрабатываем биологическое исследование, в котором изучаются способы поглощения жира организмом и его влияние на сердце.Возможно, мы найдем механизм, благодаря которому повышенное потребление жиров сохраняется таким образом, что это приводит к определенной нагрузке на сердце. Мы могли бы также внимательнее присмотреться к упражнениям и разработать рандомизированный контролируемый эксперимент, который обнаружит, что упражнения прерывают накопление жира, тем самым снижая нагрузку на сердце.
Все эти доказательства укладываются в одно объяснение: диета с высоким содержанием жиров действительно может вызывать сердечные заболевания. И первоначальная корреляция все еще сохранялась, когда мы углубились в проблему: диета с высоким содержанием жиров и сердечные заболевания связаны!
Но в этом примере обратите внимание, что наши причинные доказательства не были предоставлены самим тестом корреляции, который просто исследует взаимосвязь между данными наблюдений (такими как частота сердечных заболеваний и зарегистрированные диета и упражнения).Вместо этого мы использовали эмпирическое исследование, чтобы найти доказательства этой связи.
Итак, как мы исследуем причинно-следственную связь? При правильном расследовании!
Понимание причинно-следственной связи — сложная проблема. В реальном мире у нас никогда не бывает доступа ко всем данным, которые могут нам понадобиться для отображения всех возможных отношений между переменными. Но есть несколько ключевых стратегий, которые помогут нам изолировать и исследовать механизмы между различными переменными. Например, в контролируемом эксперименте мы можем попытаться тщательно сопоставить две группы и случайным образом применить лечение или вмешательство только к одной из групп.
Принцип рандомизации является ключевым в дизайне эксперимента, и понимание этого контекста может изменить то, что мы можем сделать из статистических тестов.
Давайте еще раз подумаем о первом примере, приведенном выше, в котором изучалась взаимосвязь между физическими упражнениями и заболеваемостью раком кожи. Представьте, что мы каким-то образом можем взять большую, глобально распределенную выборку людей и случайным образом назначить их выполнять упражнения на разных уровнях каждую неделю в течение десяти лет. По истечении этого времени мы также собираем показатели заболеваемости раком кожи для этой большой группы.В итоге мы получим набор данных, который был экспериментально разработан для проверки взаимосвязи между упражнениями и раком кожи! Поскольку упражнение напрямую управлялось в эксперименте посредством случайного распределения, оно не будет систематически связано с какими-либо другими переменными, которые могли бы отличаться между этими двумя группами (при условии, что все другие аспекты исследования действительны). Это означает, что в данном случае, поскольку наши данные были получены с помощью продуманного экспериментального плана, положительная корреляция между упражнениями и раком кожи будет значимым доказательством причинной связи.
Причинно-следственная связь в статистике: определение и примеры — видео и стенограмма урока
Корреляция не означает причинно-следственную связь
Некоторые исследования показывают, что по мере увеличения количества часов сна в сутки среди учащихся увеличивается и их средний балл успеваемости (средний балл). Это означает, что чем дольше студенты спят каждую ночь, тем выше их оценки. Большой! Теперь все, что нам нужно сделать, это подольше спать, и наши оценки улучшатся, верно?
К сожалению, не все так просто.Хотя на основании исследования определенно существует корреляция между двумя переменными, нельзя с уверенностью сказать, что увеличение одной переменной является окончательной причиной увеличения другой.
Есть фраза, которая суммирует то, что часто является источником путаницы при определении статистических отношений: корреляция не означает причинно-следственную связь. В следующем разделе мы увидим, что именно это означает. Итак, давайте продолжим эту ситуацию, чтобы определить, могут ли быть задействованы какие-то другие переменные, которые могли бы объяснить взаимосвязь между сном и оценками.
Скрытые переменные
В приведенной выше ситуации мы увидели взаимосвязь между сном и оценками. Основываясь на этом, мы могли предположить, что больше сна всегда будет приводить к более высоким оценкам или что будет причинно-следственная связь. Однако могут быть и другие переменные, которые могли бы объяснить, почему оценки выше у тех, кто спит дольше: скрытые переменные. Скрытые переменные — это переменные, которые, возможно, не наблюдались или не учитывались в исследовании или эксперименте, но которые могут повлиять на результаты.
Итак, какие возможные скрытые переменные могут объяснять более высокие оценки? Что ж, может быть, ученики, которые спят дольше, с самого начала будут более прилежными и, следовательно, будут получать более высокие оценки независимо от того, сколько они спят. Невозможно точно узнать, какие скрытые переменные, если таковые имеются, могли быть задействованы в исследовании сна, но нам определенно нужно быть осторожными, чтобы не путать корреляцию с причинно-следственной связью, потому что это не одно и то же.
Резюме урока
В этом уроке мы увидели, что причинно-следственная связь утверждает, что изменение одного события или переменной вызовет изменение другого.Причинность не следует путать с корреляцией, которая показывает взаимосвязь между событиями, но не объясняет, почему и как эти события связаны. Помните, что это связано с скрытыми переменными или переменными, которые, возможно, не наблюдались или не учитывались в исследовании или эксперименте, но которые могут повлиять на результаты.
Понимание исследований в области здравоохранения · Корреляция и причинно-следственная связь
Наука часто измеряет взаимосвязь между двумя или более факторами.Например, ученые могут захотеть узнать, приводит ли употребление большого количества колы к кариесу зубов, или они могут захотеть выяснить, вызывает ли прыжок на батуте проблемы с суставами.
- Корреляция — это когда два фактора (или переменные) связаны, но один не обязательно вызывает другой
- Причинно-следственная связь — это когда один фактор (или переменная) вызывает другой
В примере с прыжками на батуте исследование может показать, что люди, которые проводят много времени, прыгая на батуте, более склонны к развитию проблем с суставами, и в этом случае может возникнуть соблазн сделать вывод, что прыжки на батуте вызывают проблем с суставами.Однако возможно также, что прыгуны на батуте в исследовании также были бегунами на длинные дистанции. Таким образом, можно сказать, что существует корреляция между прыжками на батуте и проблемами суставов, но мы не знаем наверняка, являются ли прыжки на батуте причиной проблем с суставами.
Часто легко найти доказательства корреляции между двумя вещами, но трудно найти доказательства того, что одно на самом деле вызывает другое.Когда изменения в одной переменной вызывают изменение другой переменной, это описывается как причинно-следственная связь . Самое важное, что нужно понять, это то, что корреляция — это , а не , то же самое, что причинно-следственная связь — иногда две вещи могут иметь общие отношения, но одна из них не вызывает другую. Например, чем больше пожарных машин будет вызвано на пожар, тем больший ущерб может причинить пожар. В этом случае повреждение не является результатом вызова дополнительных пожарных машин. Фактически, обе переменные (количество пожарных машин и размер нанесенного ущерба) вызваны размером пожара.
Даже если — это причинно-следственная связь между переменными, может быть трудно определить направление связи — какая переменная вызывает изменение другой? Например, может существовать корреляция между настроением людей и их физическим здоровьем, но не очевидно, какая переменная влияет на другую — улучшает ли хорошее настроение физическое здоровье или хорошее физическое здоровье улучшает настроение людей?
Некоторые типы исследований могут предоставить нам доказательства причинно-следственных связей между двумя вещами, в то время как другие типы могут только помочь нам найти корреляции.Например, рандомизированные контролируемые испытания могут предоставить убедительные доказательства причинно-следственных связей, в то время как перекрестные исследования, такие как разовые опросы, не могут.
Читая исследования в области здравоохранения, важно помнить о разнице между корреляцией и причинно-следственной связью и задавать вопрос, подтверждением какого из них является исследование, если таковое имеется.