Причинно следственные связи это: Причинно-следственная связь — Психологос

Содержание

Причинно-следственную связь сделали одновременно прямой и обратной

Наука Физики смогли

Сложность 9.2

Делитель луча света (beamsplitter)

Peeter Piksarv

Физики из Университета Вены и Австрийской академии наук показали, что в квантовой механике может существовать ситуация, в которой нельзя определить точную причинно-следственную связь между событиями в эксперименте. Это первый эксперимент такого рода, в котором неопределенность причинности измеряется напрямую. В его основе лежит установка, в которой реализуется суперпозиция порядка выполнения операций: над фотоном одновременно выполняют операцию

A, потом B и операцию B, потом A. Подобные процессы могут найти применение в разработке алгоритмов для квантовых компьютеров. Исследование опубликовано в журнале Science Advances.

В зависимости от состояния управляющего параметра (сверху) либо Алиса делает операцию прежде Боба, либо Боб прежде Алисы. Если параметр оказывается квантовым, то он может находиться в суперпозиции значений — тогда возникает суперпозиция порядков операций. Одновременно и Алиса получает фотон раньше Боба и Боб раньше Алисы.

Giulia Rubino et al. / Science Advances, 2017

Поделиться

Принцип причинности (наличие причинно-следственной связи) — одно из фундаментальных свойств физики и других наук, позволяющее разделять один процесс на последовательность шагов, каждый из которых становится причиной последующего. Например, лампочка загорается после того, как мы замыкаем электрическую цепь выключателем, гром возникает из-за удара молнии, но не наоборот.

Принцип причинности лежит в основе специальной теории относительности, запрещая чему-либо перемещаться быстрее скорости света. 

В квантовой механике подобные свойства часто оказываются устроенными более сложно. К примеру, запутанные состояния специальным образом нарушают ее локальность: если взять две запутанные частицы и провести измерение над одной из них, это моментально (то есть быстрее скорости света) скажется на другой, как бы далеко она ни находилась. При этом не нарушаются причинно-следственные связи — моментальной передачи полезной информации не происходит. 

Для того, чтобы доказать квантовую природу запутанности состояний были разработаны неравенства Белла. Это выражение, которое ограничивает частоту совпадений результатов двух случайных измерений двух запутанных частиц. Подробнее о них можно прочесть в описании недавнего эксперимента с участием космических генераторов случайных чисел. Кроме того, есть специальный математический аппарат, который позволяет определить, являются ли два состояния разделимыми или не разделимыми (запутанными) — «свидетель запутанности».

Это некоторая функция (след специальной матрицы), которая оказывается больше или равна нулю для разделимых состояний и меньше нуля — для неразделимых.

Оказывается, в квантовой механике можно поставить эксперимент, в котором возникает неопределенность причинно-следственных связей. С помощью похожего математического аппарата («свидетеля причинности») можно показать, что процесс, лежащий в основе эксперимента, не разделим на последовательности элементарных операций.

Основу эксперимента можно пояснить на таком примере. Пусть у нас есть число (например, единица), над которым мы хотим провести две последовательные операции: умножить его на два и возвести в квадрат. В классической ситуации, в зависимости от порядка операций, мы получим два разных результата. Пусть порядок операций будет зависеть от того, выпадет орел или решка при броске монеты. Тогда мы будем получать с вероятностью 50 процентов «четыре» и с вероятностью 50 процентов «два». Очевидно, что зная результат вычисления мы можем восстановить порядок операций и представить все результаты эксперимента как сумму двух путей вычисления.

 

В квантовой версии эксперимента порядок операций связан с состоянием «Кота Шредингера» — суперпозицией двух состояний. Роль числа в эксперименте будет выполнять состояние фотона (поляризация), а вместо умножения и возведения в степень будут происходить изменения поляризации. Аналогами математических операций являются «отзеркаливание» плоскости поляризации и превращение линейной поляризации в круговую или эллиптическую. От порядка этих операций зависит конечное состояние фотона. Чтобы обеспечить два варианта порядка операций для фотона необходимо создать две возможных траектории: в одной он будет проходить сначала через прибор

A, потом B, в другой — наоборот. Суперпозиция двух траекторий может возникнуть, например, если направить одиночный фотон на светоделитель, полупрозрачное зеркало. 

Такие эксперименты уже проводились. Однако доказать, что две траектории находятся в суперпозиции удавалось лишь очень косвенно. Например, недавно физики построили вычислительный алгоритм, в основе которого лежит суперпозиция порядка квантовых операций. Он позволял определить, есть ли разница в последовательности выполнения двух неизвестных операций или нет, причем делал это эффективнее, чем алгоритмы с классическим порядком операций. Лишь по уменьшению сложности вычислений в эксперименте авторы подтвердили, что в установке реализуется неопределенный порядок операций. 

Авторы новой работы поставили эксперимент, в котором суперпозицию последовательностей квантовых операций можно исследовать напрямую. Главная сложность состояла в том, что квантовое состояние разрушается при измерении, а для прямого определения суперпозиции необходимо было внедрить измерение в траекторию фотона. Чтобы избежать разрушения состояния авторы добились в эксперименте уничтожения информации о том, какой конкретно путь был выбран до попадания фотона в детектор. 

Схема экспериментальной установки

Giulia Rubino et al. / Science Advances, 2017

Поделиться

Установка для исследования суперпозиции порядка квантовых операций устроена следующем образом.

На первом этапе оптоволокно, по которому путешествуют одиночные фотоны, направляет свет на светоделитель. Отраженный свет попадает сначала на модуль B (Боб), где происходит поворот плоскости поляризации фотона, затем направляется в модуль A (Алиса), где происходит еще одна серия поворотов плоскости поляризации. Затем, в том же модуле A, свет попадает на поляризующий светоделитель — фотоны с вертикальной поляризацией отправляются на одну пару детекторов, с горизонтальной — пройдя через еще одну серию поворотов плоскости поляризации — на другую пару детекторов. Перед детекторами располагается светоделитель, стирающий информацию о том, по какому пути пришел фотон. Преломленный луч попадает сначала в модуль А, затем в B и в детектор.

Таким образом, в эксперименте возникают сразу два «типа» суперпозиций. Первый — суперпозиция поляризаций одиночного фотона, второй — суперпозиция путей, по которым путешествовал фотон. Физики измеряют лишь поляризацию фотона после того, как он пролетел через установку и составляют «томограмму» — зависимость конечного состояния фотона от начального.

Математическое описание, как и в случае со «свидетелем запутанности» позволяет ученым построить функцию, отличающую разделимые траектории от не разделимых (суперпозиции). Собрав статистику физики показали, что внутри установки действительно реализуется суперпозиция порядков операций над фотоном — статистическая значимость этого результата достигает семи сигма (стандартных отклонений).

Интересно, что эксперимент решает довольно простую задачу — как и в более ранних работах, он позволяет определить, есть ли разница между последовательностями операций A, затем B

и B, затем A. Причем, любой классический алгоритм потребовал бы двух обращений к каждой из операций (A и B). Алгоритм, предложенный авторами, требует лишь одного обращения к каждой операции. По словам ученых, в ситуации когда операций больше, чем две, подобные суперпозиции порядков вычислений дадут еще больший прирост в скорости решения задачи.

Этот результат можно сравнить с тем, как квантовые компьютеры оказались эффективнее классических в некоторых задачах. Квантовые алгоритмы, например, алгоритм Шора разложения чисел на простые множители, используют то, что квантовые биты находятся в суперпозиции состояний «нуля» и «единицы». Здесь же возникает новая, дополнительная суперпозиция — порядка элементарных операций в алгоритме.

Владимир Королёв

Читайте также

Подводные археологи не нашли следов пожара на корабле «Грипсхунден»

«Джеймс Уэбб» рассмотрел Нептун и его кольца

Ионолет продержался в воздухе почти пять минут

Клизма майя, алгоритм для сплетников и краш-лось

Рассказываем о лауреатах Шнобелевской премии 2022 года

Причинно-следственная связь и продуктовые риски

Чтобы стать организацией, ориентированной на продукт, нужно инвестировать в результат — и, как говорится, бинго.


Перевод статьи Cause & Effect and Product Risk

БИЗНЕС


Морис Корнелис Эшер, «Водопад»

Главное — причина и следствие

Принимая решение об инвестировании в продукт, помните: всегда существует вероятность, что ваши инвестиции не дадут желаемых результатов. Одна из категорий такого риска — бизнес-риски, в том числе опасность ошибиться на этапе замысла и создать «неправильный продукт». Управлять подобными рисками позволяет продукт-менеджмент.

Есть две серьезные проблемы, с которыми сталкиваются группы разработчиков, и эти проблемы тесно связаны между собой. Чтобы работать более эффективно, команда должна решить обе: сначала одну, потом другую — порядок продиктован их взаимосвязью.

Первая состоит в том, что команды формируют бэклог, не опираясь на причинно-следственные связи. Команда попросту принимает заказы — «сделать, потому что так сказал кто-то». Это основной антипаттерн, который я обнаруживаю при первой встрече с людьми.

Решить эту проблему можно, если перейти на более эффективный метод управления — от системы «выталкивания» к системе «вытягивания». Мы управляем формированием спроса, чтобы он отвечал возможностям команды. Без этого не обойтись, чтобы избежать проблем в будущем. Но это решение «в лоб», между тем существует более тонкий подход — и он требует усовершенствовать мастерство продукт-менеджмента. Нам надо научиться мыслить причинно-следственными категориями, и это поможет согласовать наши действия.

Сегодня принято называть такой подход нацеленным на результат — в противовес нацеленному на показатели. Чтобы стать организацией, ориентированной на продукт, нужно инвестировать в результат — и, как говорится, бинго.

Уяснить это тонкое различие при решении первой проблемы помогает простое сравнение до и после.

  • До: Создать X, потому что наш гендир считает, что это важно (привет Ричу Миронову).
  • После: Создать X, потому что с его помощью мы сможем реализовать преимущество Y.

Создавая продукты, от которых можно ожидать определенных результатов, мы имеем больше шансов на успех. Но разве наш гипотетический генеральный директор не стремится к достижению результата? Разумеется, но каков этот результат? Здесь-то и надо искать корень проблемы, а значит, и ключ к ее решению. Нужно, чтобы каждый понимал, каким образом конкретные инвестиции помогут достичь желаемого результата.

Выявить связь между тем, что мы планируем создать, и причинами, по которым мы решили это сделать, помогают карты влияния (impact maps). Есть и другие техники решения этой проблемы — а решать ее вам придется, но карты влияния я считаю самым изящным методом.

Двигаясь по карте влияния в обратном направлении — справа налево, — мы можем изучить «заказ», который нас попросили взять, и проанализировать свои намерения.

  1. Мы создаем X, чтобы решить проблему A для пользователя B.
  2. Если проблема A будет решена, пользователь B может изменить свое поведение C.
  3. Если поведение C изменится, это приведет к измеримому результату D.
  4. Измеримый результат D — это практическая составляющая преимущества Y.

Когда мы совместно приходим к пониманию того, что «создание X» явным образом связано с «реализацией преимущества Y», мы решаем первую проблему. Карта влияния хороша тем, что мы ставим под сомнение одни связи и исследуем другие, разрабатываем более эффективные планы, переключаемся на более масштабные задачи. При этом члены команды глубже понимают контекст, что повышает вероятность успешной реализации и эффективность стейкхолдер-менеджмента.

Прежде чем мы сможем признать вторую проблему, нужно принять во внимание еще один аспект разработки планов — выявление и устранение рисков. Наш план, даже изложенный четко и грамотно, содержит скрытые риски, которые следует выявить. Скрытые риски содержатся в допущениях и становятся явными, если сформулировать эти допущения как гипотезы.

  1. Мы предполагаем, что создание X решит проблему A для пользователя B.
  2. Мы предполагаем, что решение проблемы A приведет к изменению поведения C.
  3. Мы предполагаем, что изменение поведения C будет способствовать результату D.

Мы используем выражения такого вида, чтобы признать риск, что позволяет нам принимать решения. Одни риски мы исключаем, другие учитываем. А некоторые устраняем. Когда потенциальная ценность слишком высока, чтобы ею пренебречь, а риск слишком велик, чтобы на него идти, мы проводим эксперимент, чтобы устранить неопределенность.

По моему опыту, для этого проще всего сформулировать гипотезу, которую можно проверить. Условия эксперимента, проводимого для защиты от риска, должны включать все неблагоприятные факторы, препятствующие выполнению плана. При этом сами планы бывают комплексными, а их последствия для организации — очень широкими. Наличие четкой структуры, которая дает возможность изолировать соответствующие переменные, и проверка гипотез помогают управлять организацией и понять, как устранить потенциальные риски.

Гипотеза описывает

предполагаемые причину и следствие

Мы полагаем, что [некое событие — «причина»]
приведет к [другому событию — «следствию»]

Визуализируя предположения на карте влияния, я выделяю две категории предположений: одно в пространстве задачи и одно в пространстве решения. Я строю гипотезы о решении и гипотезы о результате. Я регулярно работаю с командами, которые не знакомы с планированием экспериментов, и четкие определения помогают связать эти методы с уже сложившимся у них представлением о своих обязанностях.

Гипотетическое решение в верхней части карты влияния — это высказывание, которое гласит: «Если мы создадим такой продукт, он решит эту задачу и вызовет или сделает возможным желаемое изменение поведения». Причина — это то, что мы хотим создать, следствие — итоговое изменение поведения. В мире измеряемых параметров такое изменение поведения — это опережающий индикатор (ожидаемой выгоды). У нас есть то, что мы можем сделать, и то, что мы можем оценить, чтобы проверить, работает ли наш продукт.

Гипотетический результат в верхней части карты влияния — это высказывание, которое гласит: «Если мы вызовем изменение поведения (лучше, больше, новые виды деятельности и т. д.), мы получим вот такой желаемый результат». В мире измеряемых параметров это запаздывающий индикатор. Теперь у нас есть полный цикл — чтобы оценить влияние продукта, который мы хотим создать.

Такая качественная увязка причины и следствия — первый шаг к определению неявной ценности в вашем плане, второй шаг — это ее количественная оценка.

Наше гипотетическое решение может выглядеть, к примеру, так:

Мы думаем, что, если добавить кнопку «Купить в один клик» на каждую страницу с товаром в нашем мобильном приложении, число заказов от существующих покупателей увеличится.

Говорит ли это о том, что идея удачная? Нет. У нас нет критериев, чтобы понять, оправданы ли затраты на ее реализацию.

[По большому счету обоснованность затрат зависит от цены возможности, а не от расходов на реализацию, но это отдельная тема, обсудим ее в другой раз. Просто поинтересуйтесь, что говорит о цене возможности и цене задержки Дональд Рейнертсен.]

Дело в том, что пока мы не дали количественную оценку результата. Давайте попробуем сделать это.

Мы думаем, что, если добавить кнопку «Купить в один клик» на каждую страницу с товаром в нашем мобильном приложении, число заказов от 30% существующих покупателей увеличится на 1%.

Разговор внезапно принимает другой оборот: вместо «и правда, отличная идея» появляется «каким образом ты получил эти цифры?». Это именно то, к чему мы стремились!

Количественная оценка гипотез накладывает на нас ответственность. Это мощный инструмент, и, когда я прошу людей дать своим высказываниям количественную характеристику, поначалу они всегда испытывают неловкость.

Иногда они чувствуют себя неуютно, потому что боятся наказания: а вдруг руководство спросит с них за то, что они огласили предположительные цифры. [Здесь есть две проблемы — одна организационная, другая связана с оценками и обязательствами.]

Впрочем, есть и другая веская причина для дискомфорта. Чтобы переключиться с объемов на результат, нужно переместить свой локус ответственности из зоны контроля (что вы создаете) в зону влияния (работает это или нет). Гипотезы помогают нам справиться с неопределенностью, присущей такому переключению.

Мотивированные рассуждения —

оставайтесь с нами

И это приводит нас ко второй проблеме — мы рискуем истолковать результаты в пользу своих гипотез, вместо того чтобы использовать их для объективной оценки. О том, как этого не допустить, мы поговорим в следующий раз.

4 февраля 2019

Оригинал статьи

Scott Sehlhorst

@sehlhorst

Основатель Tyner Blain

Другие статьи


Экспертно-пользовательский анализ интерфейса: как он выглядит и какие числа за ним стоят

Показываем на примере UX-тестирования интернет-магазина канцтоваров, почему важно прорабатывать микросценарии и как их отсутствие влияет на процесс покупки.


Как проектировать интерфейсы профессиональных систем

При разработке профессиональных интерфейсов дизайнеры часто не предусматривают четких сценариев использования — их может быть очень много. Зато пользователи точно будут обучаться.


Книги «Собаки Павловой»

Раздаём три бесплатных книги «Собаки Павловой»: как решать сложные UX-задачи, как писать digital-тексты и как работать над IT-проектами с подрядчиками


Как анализировать информацию, искать причинно-следственные связи и не совершать логические ошибки


Ирина Балманжи

Почему наши умозаключения так часто оказываются ошибочными? Что такое корреляция и причинность? Как рассуждать и делать выводы, опираясь на научный метод? Умение видеть взаимосвязь между явлениями нельзя рассматривать как необязательную опцию. Нам нужен этот навык, чтобы извлекать из массивов данных полезную информацию и уверенно прокладывать курс в океане повседневных решений.

Книга «Почему» научит правильно анализировать данные и определять причинно-следственные связи там, где они есть. Делимся интересными мыслями из нее.

Восприятие и умозаключения

Как вы впервые обнаружили, что лампочка загорается, если повернуть выключатель? Откуда вы знаете, что ружье, выстреливая, производит громкий звук, а не наоборот?

Мы получаем знания о причинах двумя основными путями:

  1. Восприятие (каузальный опыт). Видя, как в окно влетает кирпич, один бильярдный шар ударяет другой, заставляя катиться, горящая спичка поджигает фитиль свечи, мы получаем впечатления о причинной зависимости на основе входящей сенсорной информации.
  2. Умозаключения (опосредованные выводы о причинности с помощью дедуктивного метода и на основе некаузальной информации). Причины таких событий, как пищевые отравления, войны и хорошее здоровье, нельзя воспринять непосредственным образом — их предстоит вывести путем логического мышления на основе чего-то, отличающегося от непосредственных наблюдений.

Доверие, которое мы питаем к причинному восприятию, может нас подвести. Если вы слышите громкий звук, а после этого в комнате зажигается свет, легко решить, что эти события взаимосвязаны; однако временная привязка громкого звука и момента, когда некто щелкает выключателем, может быть простым совпадением.


Доверие к причинному восприятию может нас подвести. Источник

Временная и пространственная близость событий — параметры, из-за которых мы нередко делаем ложные выводы.

Например, мы часто слышим, что человеку сделали прививку от гриппа, а к вечеру у него развились схожие с гриппом симптомы, и люди верят, что именно укол стал поводом к этому. Но вакцина против гриппа, содержащая неактивную форму вируса, не может вызвать болезнь. Среди огромного количества привитых у некоторых развиваются другие сходные болезни (по чистому совпадению), или они подхватывают вирус, ожидая приема в клинике.

Время

Близлежащие по времени события могут привести к ошибочным заключениям о причинности. Представьте: у вас разболелась голова и вы приняли некое средство. Через несколько часов боль ушла. Можно ли утверждать, что помогло лекарство?

Временной паттерн позволяет сделать предположение, что ослабление симптома произошло благодаря приему лекарства, однако вы не можете сказать наверняка, что боль не прошла бы сама. Вам пришлось бы провести множество выборочных экспериментов, где вы бы принимали или не принимали препарат, а потом записывали, как быстро исчезала головная боль, чтобы иметь возможность утверждать хоть что-то относительно подобной причинной зависимости. Также пришлось бы сравнить действия лекарства и плацебо.


Причинная зависимость не всегда может быть оправдана. Источник

Длительные задержки между причиной и следствием тоже способны помешать достоверному установлению причинно-следственных связей. Некоторые следствия наступают быстро (удар по бильярдному шару заставляет его двигаться), а некоторые процессы протекают в замедленном режиме. Известно, что курение вызывает рак легких; но между первой сигаретой и днем, когда диагностируют рак, пролегают долгие годы.

Побочные эффекты от приема некоторых препаратов проявляются через десятилетия. Перемены в состоянии здоровья благодаря физическим упражнениям достигаются медленно и не сразу, и, если мы будем ориентироваться только на стрелку весов, может показаться, что вес сначала даже увеличивается, потому что мускулы наращиваются быстрее, чем уходит жир. Ожидая, что следствие должно идти непосредственно за причиной, мы не видим связи между этими глубоко взаимозависимыми факторами.

Корреляция

Корреляция (соотношение, взаимосвязь) не обязательно означает причинную зависимость. Эта мысль прочно вбита в мозги любого студента, изучающего статистику; но порой ошибаются даже те, кто понимает это высказывание и согласен с ним.

Сильная взаимосвязь может показаться убедительной и инициировать ряд успешных прогнозов. Но видимые корреляции иногда объясняются еще не измеренными причинами.

К примеру, мы нашли соотношение в ситуации, когда человек, съевший плотный завтрак, вовремя успевает на работу; однако, вероятно, оба фактора имеют общую причину: человек рано встал, а значит, у него было время хорошо позавтракать, вместо того чтобы в спешке бежать на службу.


Корреляция не обязательно означает причинную зависимость.  Источник

Выявив корреляцию между двумя переменными, нужно проверить, способен ли подобный неизмеренный фактор (общая причина) объяснить эту взаимосвязь.

Более того, соотношения способны существовать, даже когда две переменные вообще никак не связаны. Корреляции бывают результатом абсолютной случайности (например, вы много раз за неделю сталкиваетесь с подругой на улице), искусственных условий эксперимента (вопросы могут быть подстроены под конкретные реакции), ошибки или сбоя (баг в компьютерной программе).

Без вариации нет корреляции

Представьте такую ситуацию: вы хотите узнать, как получить грант, поэтому спрашиваете всех друзей, которые его имеют, что, по их мнению, помогло им. Все кандидаты оформляли заявку шрифтом Times New Roman; согласно мнению половины, важно, чтобы на каждой странице была как минимум одна иллюстрация; а треть рекомендуют представить заявку за 24 часа до установленного срока. Означает ли это, что есть корреляция между названными условиями и получением гранта? Нет, не означает.

Поскольку все результаты идентичны, нельзя сказать, что произойдет, если поменять шрифт или представить заявку за минуту до истечения срока.


Без вариации нет корреляции. Источник

И тем не менее широко распространена ситуация, когда анализируются только факторы, ведущие к определенному исходу. Только представьте, насколько часто победителей спрашивают, как именно они добились успеха, а потом стараются этот успех воспроизвести, выполняя в точности те же действия.

Подобный подход полон недостатков по многим причинам, включая то, что люди просто не слишком хорошо умеют определять существенные факторы, недооценивают роль случайностей и переоценивают свои способности. В результате мы не только путаем факторы, которые по чистой случайности сопутствуют желаемому эффекту, с теми, которые действительно его обеспечивают, но и видим иллюзорные корреляции там, где их нет.


Люди не слишком хорошо умеют определять существенные факторы, недооценивают роль случайностей и переоценивают свои способности.  Источник

Беседы с победителями бесполезны, поскольку можно сделать то же самое, но не преуспеть. Возможно, все кандидаты оформляют заявки на грант шрифтом Times New Roman (а значит, те, кто не получил гранты, порекомендуют использовать другой шрифт), а может, успешные кандидаты получили грант, несмотря на избыточное количество иллюстраций в документах. Не зная совокупности положительных и отрицательных примеров, мы не сможем даже предположить наличие корреляции.

Ошибка отбора

Одна из важных причин, почему мы ошибаемся с выводами, заключается в том, что данные могут не быть репрезентативными с точки зрения исходного распределения.

Если бы нам разрешили взглянуть на статистику смертей от гриппа, но предоставили только данные о количестве больных, поступивших в лечебные учреждения, мы наблюдали бы гораздо более высокий процент летальных исходов, чем в масштабах всего населения. Это происходит потому, что люди оказываются в стационаре, как правило, с более тяжелыми случаями или дополнительными заболеваниями (и с высокими шансами смерти от гриппа). Так мы сравниваем не все исходы, а только статистику для обратившихся к врачам на фоне симптоматики гриппа.


Данные отбора должны быть репрезентативными. Источник

Или возьмем, к примеру, сайты, опрашивающие посетителей насчет их политических взглядов. В интернете не получится отобрать участников опроса случайно в масштабах всего населения, а данные источников с сильным политическим уклоном искажены еще сильнее.

Если посетители конкретной страницы активно поддерживают действующего президента, то результаты по ним, возможно, покажут, что рейтинг главы государства растет каждый раз, когда он произносит важную речь. Однако это показывает лишь то, что есть корреляция одобрения президента и произнесения им речей перед сторонниками.

Предвзятость подтверждения

Некоторые из когнитивных смещений, заставляющие нас видеть соотношение несвязанных факторов, сходны с ошибкой отбора. К примеру, предвзятость подтверждения заставляет искать доказательства в пользу определенного убеждения.

Иными словами, если вы верите, что лекарство вызывает некий побочный эффект, вы приметесь читать в интернете отзывы тех, кто уже принимал его и наблюдал это действие. Но таким образом вы игнорируете весь набор данных, не поддерживающих вашу гипотезу, вместо того чтобы искать свидетельства, которые, возможно, заставят ее переоценить.

Предвзятость подтверждения также может заставить вас отказаться от свидетельств, противоречащих вашей гипотезе; вы можете предположить, что источник сведений ненадежен или что исследование основывалось на ошибочных экспериментальных методах.


Предвзятость подтверждения. Источник

Помимо предвзятости с точки зрения доказательств, может случиться ошибка интерпретации аргументов. Если в ходе «неслепого» тестирования нового лекарства доктор помнит, что пациент принимает это средство и считает, что оно ему помогает, то может начать искать признаки его эффективности. Поскольку многие параметры субъективны (например, подвижность или усталость), это может привести к отклонениям в оценке данных индикаторов и логическим заключениям о наличии несуществующих корреляций.

Есть и специфическая форма предвзятости подтверждения — иллюзорная корреляция. Она означает поиск соотношения там, где его нет. Возможная взаимосвязь симптомов артрита и погоды настолько широко разрекламирована, что считается доказанной. Однако знание о ней может привести к тому, что пациенты будут говорить о корреляции просто из ожидания ее увидеть. Когда ученые попытались проанализировать эту проблему, взяв за основу обращения пациентов, клинические анализы и объективные показатели, то не обнаружили абсолютно никакой связи.

По материалам книги «Почему».
Обложка поста отсюда.

Ложные связи: как научиться правильно оценивать причины и следствия

Forbes Woman публикует отрывок книги Саманты Клейнберг «Почему. Руководство по поиску причин и принятию решений» издательства «Манн, Иванов и Фербер»

Почему люди часто ошибаются, пытаясь в конкретной ситуации выделить причину и следствие? Как вообще наш мозг обнаруживает причинно-следственные связи, и видят ли их маленькие дети? Как научиться правильно пользоваться понятиями о вероятности событий и корреляции между ними? На все эти вопросы Клейнберг, доцент Технологического института Стивенс в Нью-Джерси, пытается ответить в своей книге.

В 1999 году британский солиситор (категория адвокатов в Великобритании – Forbes Woman) Салли Кларк предстала перед судом по обвинению в убийстве двух своих детей. Первый сын умер внезапно в возрасте 11 недель в декабре 1996 года. Тогда это сочли смертью от естественных причин, но всего через год скончался и второй ребенок: ему было 8 недель. В обоих случаях дети казались в целом здоровыми, поэтому их внезапная гибель вызвала подозрения.

Обстоятельства были очень схожими: малыши умерли примерно в одинаковом возрасте, именно Салли Кларк обнаружила их бездыханными, дома с ними находилась она одна, и оба ребенка, согласно патологоанатомическому исследованию, имели травмы.

Изначально повреждения на теле  первого мальчика  объяснялись попытками проведения реанимации, но после гибели второго данные были пересмотрены, и ситуация показалась подозрительной. Через месяц после второй смерти обоих родителей арестовали, а позднее Салли Кларк обвинили в убийстве и вынесли приговор.

Какова вероятность того, что двое детей из одной семьи умерли от синдрома внезапной детской смерти (СВДС)?  По мнению английских обвинителей, это событие настолько невероятно, что два подобных исхода могли быть только  результатом  убийства. Этот аргумент (одна из причин в такой степени невероятна, что могла иметь место только другая) и привел к событию, ставшему одним из знаменитых примеров несправедливого приговора. И это ярчайший образец того, к каким последствиям приводит неверное применение статистики и игнорирование причинных зависимостей.

Главная из причин, по которой этот случай получил широкую известность среди статистиков и исследователей вопросов каузальности (причинности – Forbes Woman), заключается в аргументе обвинения. Он был основан, по сути, на следующем: объяснение защиты слишком невероятно, чтобы быть правдой.  В качестве эксперта сторона обвинения привлекла доктора Роя Мидоу, который заявил, что вероятность двух летальных исходов от СВДС (или, как говорят в Великобритании, «смертей в колыбели») в одной семье равна 1:73000000. Далее обвинители утверждали: эта вероятность столь ничтожна, что гибель детей никак не может проистекать от естественных причин, а следовательно, должна быть только результатом убийства.

Такая статистика совершенно неверна. Но, даже если бы она оказалась справедливой, все равно ее нельзя использовать так, как это было сделано.

Мидоу базировал свой вывод на научном докладе, в котором шансы СВДС оценивались как  1:8543, а потом заявил,  что вероятность двух смертей равна 1:8543× 8543, то есть примерно 1:730000001.

Но эти вычисления ложны, потому что заключение опиралось на предпосылку о независимости двух событий, ставших предметом судебного разбирательства (вероятность наступления независимых событий рассчитывается как произведение вероятностей этих событий – Forbes Woman).

Когда вы бросаете монетку, то шанс выпадения «орла» не влияет на то, как монетка упадет в следующий раз. Поскольку  вероятность каждого исхода всегда равна одной второй, математически корректно перемножить оба числа, если мы желаем узнать вероятность выпадения двух «орлов» подряд.

Именно это и сделал Мидоу.

Причины СВДС точно неизвестны, однако среди факторов риска указываются и окружающие условия: к примеру, курят ли родители, употребляют ли алкоголь. Это означает, что, если в семье был один случай СВДС, другой может произойти с вероятностью намного большей, чем 1:8543, поскольку у детей общая генетика и одинаковые условия жизни. То есть первая смерть дает сведения о вероятности второй.

Представленный случай, таким образом, можно сравнить с шансами киноактера на получение второго «Оскара». Ведь награды присуждаются не случайным образом: скорее, те же свойства (талант, известность, связи), что обеспечили кому-то первую  из них, повышают вероятность получения второй.

В этом и коренилась проблема дела Кларк. Поскольку оба события не были независимыми  и, напротив, для обоих могла иметься общая причина, неверно  рассчитывать вероятность простым умножением. Вместо этого, анализируя шанс второй смерти, следовало принять во внимание факт первой, а значит, определить  допустимость СВДС в семье, где уже произошла подобная трагедия. Показатель вероятности и то, как его использовали, были столь явно и ввысшей степени ошибочны, что при рассмотрении первой апелляции защита вызвала в качестве свидетеля профессионального статистика, а Королевское статистическое общество прислало письмо с выражением своих сомнений.

Неверные расчеты, однако, оказались не единственной проблемой, связанной с причинностью. Обвинители попытались поставить знак равенства между вероятностью некоего события (а именно двух СВДС)  в 1:  73000000 и возможностью того, что Салли Кларк невиновна. Подобного рода ошибочное рассуждение, когда шанс события приравнивается к вероятности вины или невиновности, известно как «заблуждение прокурора».

Но мы уже знаем, что невероятные события случаются.  Возможность двух смертей от СВДС мала, однако шанс того, что два ребенка в одной семье умрут младенцами, также крайне невысок. Значит, нужно не просто решать, принять СВДС в качестве объяснения или нет, а провести сравнение с другим доступным толкованием.

Таким образом, нужно было сравнивать вероятности убийства двоих детей в одной семье (а именно такова была версия обвинения) и того, что оба ребенка одних родителей подвержены СВДС (а обстоятельства дела позволяют это  редположить).

Вероятность смерти от СВДС двоих детей из одной семьи не равна шансу того, что эти конкретные малыши страдали таким заболеванием. В деле есть и другие факты,  включая физические доказательства, наличие мотива преступления и так далее. Их следовало учитывать наравне с вероятностными данными (например, допустимость убийства при отсутствии мотива, возможности или орудия преступления наверняка была ниже общего показателя).

Наконец, любое маловероятное событие однажды произойдет, если будет  совершено достаточно попыток. Некорректно низкая вероятность в деле Кларк (1: 73000000) все же более чем в 3 раза выше шанса выиграть в лотерею Mega Millions  (1: 258000000) (Mega Millions — популярная американская лотерея, проходящая в 44 штатах, округе Колумбия и на Виргинских островах. Минимальный  анонсируемый джекпот Mega Millions — $15 млн, а самый крупный разыгранный суперприз составил $656 млн. — Прим. ред.) Допустимость, что вы станете победителем подобной лотереи, очень мала;  а как насчет шанса, что кто-то все же выиграет? Он весьма высок. Это значит, что использование только вероятностного метода для определения вины и невиновности гарантированно приводит как минимум к ряду ошибочных приговоров. Суть в том, что для отдельного человека возможность стать участником подобных событий крайне низка, но, учитывая, что в мире живут миллионы семей с двумя детьми, где-то такое событие случается.

В итоге после повторной апелляции в январе 2003 года приговор Кларк был пересмотрен. К тому моменту она провела в тюрьме три года.

Анализируем причинно-следственные связи метрик ВКонтакте / Хабр

Всем привет, меня зовут Анвер, я работаю в команде Core ML ВКонтакте. Одна из наших задач — создавать и улучшать алгоритмы ранжирования для ленты новостей. В этой статье расскажу о том, как можно применять для этого причинно-следственный анализ — чтобы в результате сделать сервис интереснее для пользователей. Поговорим про преимущества такого подхода по сравнению с корреляционным анализом, и я предложу модификации существующих алгоритмов.

Что такое короткие и долгие метрики?

Модели ранжирования пытаются оценить вероятность того, что пользователь повзаимодействует с новостью (постом): задержит на ней внимание, поставит отметку «Нравится», напишет комментарий. Затем модель распределяет записи по убыванию этой вероятности. Поэтому, улучшая ранжирование, мы можем получить рост CTR (click-through rate) пользовательских действий: лайков, комментов и других. Эти метрики очень чувствительны к изменениям модели ранжирования. Я буду называть их короткими.

Но есть и другой тип метрик. Считается, например, что время, проведённое в приложении, или количество сессий пользователя намного лучше отражают его отношение к сервису. Будем называть такие метрики долгими.

Оптимизировать долгие метрики непосредственно через алгоритмы ранжирования — нетривиальная задача. С короткими метриками это делать намного проще: CTR лайков, например, напрямую связан с тем, насколько хорошо мы оцениваем их вероятность. Но если мы знаем причинно-следственные (или каузальные) связи между короткими и долгими метриками, то можем сфокусироваться на оптимизации лишь тех коротких метрик, которые должны предсказуемо влиять на долгие. Я попытался извлечь такие каузальные связи — и написал об этом в своей работе, которую выполнил в качестве диплома на бакалавриате ИТМО (КТ). Исследование мы проводили в лаборатории «Машинное обучение» ИТМО совместно с ВКонтакте.

Ссылки на код, датасет и песочницу

Весь код вы можете найти здесь: AnverK.

Чтобы проанализировать связи между метриками, мы использовали датасет, включающий результаты более чем 6 000 реальных A/B-тестов, которые в разное время проводила команда ВКонтакте. Датасет тоже доступен в репозитории.

В песочнице можно посмотреть, как пользоваться предложенной обёрткой: на синтетических данных.
А здесь — как применять алгоритмы к датасету: на предложенном датасете.

Боремся с ложными корреляциями

Может показаться, что для решения нашей задачи достаточно посчитать корреляции между метриками. Но это не совсем так: корреляция — это не всегда причинно-следственная связь. Допустим, мы измеряем всего четыре метрики и их причинно-следственные связи выглядят так:

Не умаляя общности, предположим, что в направлении стрелки идёт положительное влияние: чем больше лайков, тем больше SPU. В таком случае можно будет установить, что комментарии к фото положительно влияют на SPU. И решить, что если «наращивать» эту метрику, увеличится SPU. Такое явление называют ложной корреляцией: коэффициент корреляции достаточно высокий, но причинно-следственной связи нет. Ложная корреляция проявляется не только у двух следствий одной причины. Из этого же графа можно было бы сделать неверный вывод и о том, что лайки положительно влияют на количество открытий фото.

Даже на таком простом примере становится очевидно, что простой анализ корреляций приведёт к множеству неверных выводов. Восстановить причинно-следственные связи из данных позволяет causal inference (методы вывода связей). Чтобы применить их в задаче, мы выбрали наиболее подходящие алгоритмы causal inference, реализовали для них python-интерфейсы, а также добавили модификации известных алгоритмов, которые лучше работают в наших условиях.

Классические алгоритмы вывода связей

Мы рассматривали несколько методов вывода связей (causal inference): PC (Peter and Clark), FCI (Fast Causal Inference) и FCI+ (похож на FCI с теоретической точки зрения, но намного быстрее). Почитать о них подробно можно в этих источниках:

  • Causality (J. Pearl, 2009),
  • Causation, Prediction and Search (P. Spirtes et al., 2000),
  • Learning Sparse Causal Models is not NP-hard (T. Claassen et al., 2013).

Но важно понимать: первый метод (PC) предполагает, что мы наблюдаем все величины, влияющие на две метрики или более, — такая гипотеза называется Causal Sufficiency. Другие два алгоритма учитывают, что могут существовать ненаблюдаемые факторы, которые влияют на отслеживаемые метрики. То есть во втором случае каузальное представление считается более естественным и допускает наличие ненаблюдаемых факторов :

Все реализации этих алгоритмов представлены в библиотеке pcalg. Она прекрасная и гибкая, но с одним «недостатком» — написана на R (при разработке самых вычислительно тяжёлых функций используется пакет RCPP). Поэтому для перечисленных выше методов я написал обёртки в классе CausalGraphBuilder, добавив примеры его использования.

Опишу контракты функции вывода связей, то есть интерфейс и результат, который можно получить на выходе. Можно передать функцию тестирования на условную независимость. Это такой тест, который возвращает при нулевой гипотезе, что величины и условно независимы при известном множестве величин . По умолчанию используется тест, основанный на частной корреляции. Я выбрал функцию с этим тестом, потому что она используется по умолчанию в pcalg и реализована на RCPP — это делает её быстрой на практике. Также можно передать , начиная с которого вершины будут считаться зависимыми. Для алгоритмов PC и FCI также можно задать количество CPU-ядер, если не нужно писать лог работы библиотеки. Для FCI+ такой опции нет, но я рекомендую использовать именно этот алгоритм — он выигрывает по скорости. Ещё нюанс: FCI+ на данный момент не поддерживает предложенный алгоритм ориентации рёбер — дело в ограничениях библиотеки pcalg.

По итогам работы всех алгоритмов строится PAG (partial ancestral graph) в виде списка рёбер. При алгоритме PC его стоит интерпретировать как каузальный граф в классическом понимании (или байесовскую сеть): ребро, ориентированное из в , означает влияние на . Если ребро ненаправленное или двунаправленное, то мы не можем однозначно его ориентировать, а значит:

  • или имеющихся данных недостаточно, чтобы установить направление,
  • или это невозможно, потому что истинный каузальный граф, используя только наблюдаемые данные, можно установить лишь с точностью до класса эквивалентности.

Результатом работы FCI-алгоритмов будет тоже PAG, но в нём появится новый тип рёбер — с «о» на конце. Это означает, что стрелка там может как быть, так и отсутствовать. При этом важнейшее отличие FCI-алгоритмов от PC в том, что двунаправленное (с двумя стрелками) ребро даёт понять, что связываемые им вершины — следствия некой ненаблюдаемой вершины. Соответственно, двойное ребро в PC-алгоритме теперь выглядит как ребро с двумя «о» на концах. Иллюстрация для такого случая есть в песочнице с синтетическими примерами.

Модифицируем алгоритм ориентации рёбер

У классических методов есть один существенный недостаток. Они допускают, что могут быть неизвестные факторы, но при этом опираются на ещё одно слишком серьёзное предположение. Его суть в том, что функция тестирования на условную независимость должна быть идеальной. Иначе алгоритм за себя не отвечает и не гарантирует ни корректность, ни полноту графа (то, что больше рёбер сориентировать нельзя, не нарушая корректность). Много ли вы знаете идеальных тестов на условную независимость при конечной выборке? Я нет.

Несмотря на этот недостаток, скелеты графов строятся довольно убедительно, но ориентируются слишком агрессивно. Поэтому я предложил модификацию к алгоритму ориентации рёбер. Бонус: она позволяет неявным образом регулировать количество ориентированных рёбер. Чтобы понятно объяснить её суть, пришлось бы подробно говорить здесь о самих алгоритмах вывода каузальных связей. Поэтому теорию по этому алгоритму и предложенной модификации я приложу отдельно — ссылка на материал будет в конце поста.

Сравниваем модели — 1: оценка правдоподобия графа

Одну из серьёзных трудностей при выводе каузальных связей представляет, как ни странно, сравнение и оценка моделей. Как так вышло? Дело в том, что обычно истинное каузальное представление реальных данных неизвестно. И тем более мы не можем знать его с точки зрения распределения настолько точно, чтобы генерировать из него реальные данные. То есть неизвестен ground truth для большинства наборов данных. Поэтому возникает дилемма: использовать (полу-) синтетические данные с известным ground truth или пытаться обходиться без ground truth, но тестировать на реальных данных. В своей работе я попробовал реализовать два подхода к тестированию.

Первый из них — оценка правдоподобия графа:

Здесь — множество родителей вершины , — совместная информация величин и , а — энтропия величины . На самом деле второе слагаемое не зависит от структуры графа, поэтому считают, как правило, только первое. Но можно заметить, что правдоподобие не убывает от добавления новых рёбер — это необходимо учитывать при сравнении.

Важно понимать, что такая оценка работает только для сравнения байесовских сетей (выхода алгоритма PC), потому что в настоящих PAG (выход алгоритмов FCI, FCI+) у двойных рёбер совсем иная семантика.

Поэтому я сравнил ориентацию рёбер моим алгоритмом и классическим PC:

Модифицированная ориентация рёбер позволила значительно увеличить правдоподобие по сравнению с классическим алгоритмом. Но теперь важно сравнить количество рёбер:

Их стало даже меньше — это ожидаемо. Так что даже с меньшим числом рёбер удаётся восстанавливать более правдоподобную структуру графа! Здесь вы можете возразить, что правдоподобие не убывает с увеличением количества рёбер. Дело в том, что полученный граф в общем случае — это не подграф графа, полученного классическим PC-алгоритмом. Двойные рёбра могут появиться вместо одиночных, а одиночные — изменить направление. Так что никакого рукомашества!

Сравниваем модели — 2: используем подход из классификации

Перейдём ко второму способу сравнения. Будем строить PC-алгоритмом каузальный граф и выбирать из него случайный ациклический граф. После этого сгенерируем данные в каждой вершине как линейную комбинацию значений в родительских вершинах с коэффициентами с добавлением гауссова шума. Идею для такой генерации я взял из статьи «Towards Robust and Versatile Causal Discovery for Business Applications» (Borboudakis et al., 2016). Вершины, которые не имеют родителей, генерировались из нормального распределения — с параметрами, как в наборе данных для соответствующей вершины.

Когда данные получены, применяем к ним алгоритмы, которые хотим оценить. При этом у нас уже есть истинный каузальный граф. Осталось только понять, как сравнивать полученные графы с истинным. В «Robust reconstruction of causal graphical models based on conditional 2-point and 3-point information» (Affeldt et al. , 2015) предложили использовать терминологию классификации. Будем считать, что проведённое ребро — это Positive-класс, а непроведённое — Negative. Тогда True Positive () — это когда мы провели то же ребро, что и в истинном каузальном графе, а False Positive () — если провели ребро, которого в истинном каузальном графе нет. Оценивать эти величины будем с точки зрения скелета.

Чтобы учитывать направления, введём для рёбер, которые выведены верно, но с неправильно выбранным направлением. После этого будем считать так:

Затем можно считать -меру как для скелета, так и с учётом ориентации (очевидно, в этом случае она будет не выше такой меры для скелета). Однако в случае PC-алгоритма двойное ребро добавляет к только , а не , потому что одно из реальных рёбер всё-таки выведено (без Causal Sufficiency это было бы неверно).

Наконец, сравним алгоритмы:

Первые два графика — это сравнение скелетов PC-алгоритма: классического и с новой ориентацией рёбер. Они нужны, чтобы показывать верхнюю границу -меры. Вторые два — сравнение этих алгоритмов с учётом ориентации. Как видим, выигрыша нет.

Сравниваем модели — 3: выключаем Causal Sufficiency

Теперь «закроем» некоторые переменные в истинном графе и в синтетических данных после генерации. Так мы «выключим» Causal Sufficiency. Но сравнивать результаты надо будет уже не с истинным графом, а с полученным следующим образом:

  • рёбра от родителей скрытой вершины будем проводить к её детям,
  • всех детей скрытой вершины соединим двойным ребром.

Сравнивать уже будем алгоритмы FCI+ (с модифицированной ориентацией рёбер и с классической):

И теперь, когда Causal Sufficiency не выполняется, результат новой ориентации становится значительно лучше.

Появилось ещё одно важное наблюдение — алгоритмы PC и FCI строят на практике почти одинаковые скелеты. Поэтому я сравнил их выход с той ориентацией рёбер, которую предложил в своей работе.

Получилось, что алгоритмы практически не отличаются по качеству. При этом PC — шаг алгоритма построения скелета внутри FCI. Таким образом, использование алгоритма PC с ориентацией, как в FCI-алгоритме, — хорошее решение, чтобы увеличить скорость вывода связей.

Вывод

Сформулирую кратко, о чём мы поговорили в этой статье:

  1. Как задача вывода каузальных связей может возникнуть в крупной IT-компании.
  2. Что такое ложные корреляции и как они могут мешать Feature Selection.
  3. Какие алгоритмы вывода связей существуют и используются наиболее часто.
  4. Какие трудности могут возникать при выводе каузальных графов.
  5. Что такое сравнение каузальных графов и как с этим бороться.

Если вас заинтересовала тема вывода каузальных связей, загляните и в другую мою статью — в ней больше теории. Там я подробно пишу о базовых терминах, которые используются в выводе связей, а также о том, как работают классические алгоритмы и предложенная мной ориентация рёбер.

Причина и следствие / Хабр

Первая статья в серии «Методы выявления причинно-следственной связи в динамическом ценообразовании», продолжающая доклад «Causal Methods in Dynamic Pricing» (Ваня Горбань, Денис Пятых) ODS’21.

Мы привыкли, что Machine Learning предоставляет нам большое количество предиктивных методов, которые с каждым годом предсказывают события лучше и лучше. Деревья, леса, бустинги, нейронные сети, обучение с подкреплением и другие алгоритмы машинного обучения позволяют предвидеть будущее все более отчетливо. Казалось бы, что нужно еще? Просто улучшать методы и тогда мы рано или поздно будем жить в будущем так же спокойно, как и в настоящем. Однако не все так просто.

Когда мы рассматриваем бизнес задачи, мы часто сталкиваемся с двумя моментами. Во-первых, мы хотим понять что к чему относится и что с чем связано. Нам важна интерпретация. Чем сложнее модели мы используем, тем более нелинейные они. Тем больше они похожи на черную коробку, в которой очень сложно выявить связи, понятные человеческому разуму. Все же мы привыкли мыслить довольно линейно или близко к тому. Во-вторых, мы хотим понять — если мы подергаем вот эту «ручку», изменится ли результат в будущем и насколько? То есть, мы хотим увидеть причинно-следственную связь между нашим целевым событием и некоторым фактором. Как сказал Рубин — без манипуляции нет причинно следственной связи. Мы часто ошибочно принимаем обыкновенную корреляцию за эту связь. В этой серии статей мы сконцентрируемся на причинах и следствиях.

Но что не так с привычными нам методами ML? Мы строим модель, а значит, предсказывая значение целевого события мы можем менять значение одного из факторов — одной из фич и тогда мы получим соответствующее изменение таргета. Вот нам и предсказание. Все не так просто. По конструкции, большинство ML методов отлично выявляют корреляцию между признаком и таргетом, но ничего не говорят о том, произошло ли изменение целевого события именно из-за изменения значения фичи. То есть, ничего не говорят нам о том — что здесь было причиной, а что следствием.

Чтобы прояснить о чем я, давайте посмотрим на задачу с другой стороны — чуть более формальной. Часто можно встретить следующую запись для модели машинного обучения:

Здесь y — наше целевое событие, a(X) — некоторый ML алгоритм, — неустранимая ошибка. На самом деле a(X) в уравнении выше мы не знаем и часть просто предполагаем, что он именно такой, исходя из известных нам свойств целевого события и признакового пространства.

После «обучения» модели, мы получаем оценку алгоритма , с помощью которого получаем предсказания:

При этом, существует некоторая ошибка нашей оценки , которую мы можем найти. Наш алгоритм строится с целью минимизации различных функций потерь от предсказания и фактического значения целевой переменной.

Вернемся к основному вопросу. Предположим, среди наших X присутствует некоторый признак, через который мы можем влиять на таргет, что мы очень хотим делать. Назовем его T. Оставшееся множество признаков обозначим

Для того, чтобы это вписать в нашу формулу, предлагаю записать множество признаков следующим образом: . Тогда наше предсказание выглядит:

Под «воздействием» мы понимаем следующее: действительно ли, меняя T в реальности, я изменю y? Обозначим

Записывая строго (и предпологая определенный вид распределения ошибки и данных), мы хотим, чтобы следующее утверждение было верно:

То есть, мы хотим, чтобы изменив T мы получили результат и были уверены в нем также, как если бы он был изменен естественным образом. Однако, оказывается, что модели машинного обучения часто так не работают. Они находят корреляции, но это не значит, что изменив наше воздействие мы изменим результат.

Иллюстрацию этого удобно привести с помощью графа причинно-следственных связей. Подробности этого мы оставим за пределами этой статьи, но то, что я покажу будет понятно на интуитивном уровне. Предположим, наши данные описываются следующим образом:

Здесь стандартно: Y — таргет, X — признаки объекта, T — наше воздействие. За C мы принимаем здесь так называемый Confounder — переменную, воздействующую на T и на Y. Если переменная C является не наблюдаемой для нас, то стандартная модель машинного обучения, глядя на корреляцию между изменениями T и Y сможет заметить эту связь. Однако, очевидно что изменяя T мы не изменим Y — для этого должна измениться C! Здесь мы увидели частный случай проблемы эндогенности — проблема упущенной переменной. Видно, что когда мы пытаемся не просто найти корреляции между переменными и прогнозировать изменения в таргете, исходя из наблюдений, а пытаемся влиять на таргет — все становится немного сложнее.

Давайте попробуем также посмотреть на проблемы причинно-следственной связи с точки зрения их отличий от проблем Machine Learning и Statistical Learning. Отличная иллюстрация приводится в книге Elements of Causal Inference: Foundations and Learning Algorithms (Peters et al., 2017):

Типичные задачи эконометрики — statistical learning, машинного обучения — probabilistic reasoning и их связь с задачами causal learning — выявления причинно-следственных связей и causal reasoning — предсказания (управления) с учетом этих связей.

Ещё одна иллюстрация, которая помогает понять эволюцию мысли от корреляции к причинно-следственной связи (из книги The Book of Why: The New Science of Cause and Effect (Judea Pearl, Dana Mackenzie)):

Иллюстрация Maayan Harel. Мысль эволюционирует от связи наблюдений с результатом в попытки изменить реальность с помощью доступных инструментов. Финальной ступенью является сослагательное наклонение и создание воображаемых миров для понимания реальных процессов и альтернативных исходов.

Но давайте вернемся к эндогенности. Следующий раздел для того, чтобы узнать или вспомнить что же это такое.

Эндогенность

Строго говоря, эндогенность — это корреляция объясняющей переменной (признака) с ошибкой. В математической записи это выглядит следующим образом:

Если говорить о предыдущем примере, то в нем как раз это и происходит, за счет того, что . Давайте посмотрим — какие еще бывают варианты эндогенности.

Принято выделять следующие проблемы:

  • Проблема упущенной переменной (omitted variable)

  • Обратная причинно-следственная связь (reverse causality)

  • Ошибка в измерениях (measurement error)

Все эти типы эндогенности отличаются присутствием корреляции ошибки и одного из признаков.

Выглядит очень теоретически. К чему это приводит на практике? Сейчас приготовьтесь испытать дежавю (особенно, если вы смотрели телевизор в последние несколько лет):

Иллюстрации взяты из источника: https://www.tylervigen.com/spurious-correlations. Первая и третья иллюстрация действительно могут быть названы «ложными», так как процесс, который объединяет их сложно формализуем и лежит глубоко, однако второй пример вполне может быть признаком активности автомобильного рынка и притока водителей-новичков на дороги. В целом, постаравшись, все эти процессы можно объяснить проблемой ommited variable (кроме разве что маргарина).

Поставим себя на место парламентария — законотворца, который к нашему всеобщему сожалению не освоил отличие корреляций от причинно-следственных связей. Дабы укрепить семейные связи в первом случае наш герой может принять решение запретить маргарин к примеру. Это будет логично. Во втором случае, для спасения жизней своих сограждан он, пожалуй, предложит наложить эмбарго на продажу японских автомобилей, что вызовет политическую напряженность, но главное, что благое дело сделано. И, наконец, он избавит граждан США от заразы науки и технологий, тем самым пытаясь значительно снизить смертность. Что ж, может быть и не стоит изучать причинно-следственные связи, в конце концов срок депутата ограничен.

Задача

Что ж, надеюсь, что вы как минимум порадовались, посмотрев на красивые картинки, теперь перейдем к задаче, которую мы излагали в докладе. Перед нами стояла проблема улучшения системы ценообразования для товаров (мобильной техники и аксессуаров) с целью повышения прибыли бизнеса с партии этих товаров. Давайте разберем эту формулировку по словам, чтобы понять — что же от нас хотят. Начнем с конца:

  • Партия товаров

    Я предлагаю рассматривать некоторый аксессуар. Например, некоторое универсальное зарядное устройство для смартфонов. Для простоты, пусть его технология не будет подвержена старению, хотя бы на горизонте года. Пусть его продажи несильно зависят от выхода новых моделей смартфонов. Партия (stock) это заранее известный объем закупки. Мы можем воспринимать её как набор зарядных устройств, который мы купили, скажем, в январе и следующая поставка будет через год.

  • Повышение прибыли

    Прибыль давайте также понимать довольно просто. Это наша выручка (цена, умноженная на количество проданного товара) минус наши издержки (стоимость закупки). Цену хранения единицы товара будем считать пренебрежимо малой. В конце концов, для зарядных устройств это очень близко к правде. Записывая формально:

    Здесь — прибыль, — розничная цена, — количество проданного товара, -оптовая цена закупки товара.

  • Улучшение системы ценообразования Из предыдущего упрощенного уравнения не понятно — причем здесь цена? Максимум для здесь достигается за счет увеличения цены до бесконечности. Но на то она и упрощенная. Давайте сделаем её чуть реалистичней:

    Здесь мы отразили немного больше зависимостей. Очевидно, объем проданного товара зависит от цены. При этом, чем выше цена, тем меньше объем продаж. При этом, закупка у нас фиксирована и мы имеем закупленную партию как факт, так что цена закупки — константа.

Казалось бы, давайте просто решим простейшую задачу оптимизации и выставим оптимальную цену. Но, все не так просто. Во-первых у нас целый год. Все, что не будет продано за год будет продаваться с большим дисконтом и приносить убыток, хранить это станет также дорого. Мы можем считать, что все, что не продано за год — выброшено.

Во-вторых, есть конкуренты и, повышая цену, мы теряем в продажах гораздо больше, чем было бы, будь мы монополистами. В-третьих, у нас может быть очень мало истории колебания цен, чтобы выявить зависимость q(p) при больших изменениях цены.

Начнем с казалось бы более простых задач и попробуем решить все проблемы, которые описали выше и некоторые другие.

Оптимальная цена

Начнем с выставления оптимальной в моменте цены. Как выставить эту цену?

На помощь здесь конечно придет простейшая теория оптимизации и основы микроэкономики. Решим задачу оптимизации, дабы найти оптимальную цену. Из FOC:

$$ $$

И что мы видим? Нам позарез нужно понять зависимость q(p) для решения уравнения. Для начала мы решили оценить её с помощью простой модели линейной регрессии:

Здесь X — набор признаков, и, соответственно, коэффициентов при нем тоже несколько, надеюсь, никого не запутает такая нотация. предполагаем i.i.d (это очень сильное предположение, особенно учитывая автокорреляцию ошибок, если мы смотрим во времени, но, чтобы не размывать целей примера, здесь я не буду углубляться в решение этой задачи).

В результате решения этой задачи мы можем получить некую оценку , которая показывает нам каким образом количество продаж товара зависит от цены. Звучит это просто, но на деле конечно нас ждут не дождутся проблемы:

  • На каждый товар не так много наблюдений, потому есть большой риск не увидеть статистической значимости в нашем коэффициенте

  • Есть товары, цена которых исторически не менялась, а значит наша модель не сработает для них в целом (нарушены базовые предположения OLS)

  • Есть товары, для которых мы видим положительную оценку (как бы вы интерпретировали её?)

Так как мы являемся последователями стоической философии, то мы представляли даже худшие варианты развития событий — такие как столкновение с метеоритом или чума, так что то, что мы увидели нас даже обрадовало. Какие идеи у нас возникли для решения этих задач?

Число наблюдений

Очевидным способом борьбы с этой бедой кажется объединение товаров в одну выборку. Но каким образом различать их? Предположим, что зависимости не универсальны и не отличаются от товара к товару. Первой попыткой может быть добавить dummy переменные (или fixed effects) на различные товары. Но тогда мы добавим огромное число переменных и выигрыш от объединения будет крайне невелик.

Есть другой вариант — в рамках одного класса товаров, давайте опишем их некоторыми признаками, присутствие которых обусловленно классом товара, а их значения могут отличаться от одного товара к другому. Например, если это зарядные устройства, то они могут различаться типом, производителем, мощностью. Таким образом мы, вводя некоторые вполне валидные предположения, выиграем от роста количества наблюдений.

Отсутствие изменения цены

Здесь мы можем пойти двумя путями. Первый уже произошел автоматически. В результате перехода от индивидуальных товаров к их группе, мы уже добавили вариацию в цену (предполагая единую зависимость от цены для всей группы). Второй путь — рандомизация. Для тех товаров, которые не имели исторических изменений в цене, мы можем волевым усилием устроить случайные изменения цены в разумных пределах.

Положительная корреляция цены и продаж

Эта проблема интересна, особенно в контексте нашей прошлой дискуссии о причинно-следственной связи и проблеме эндогенности. Давайте подумаем — может ли быть такое, что повышая цену мы начинаем продавать больше товара? Вполне возможно, но рост продаж вряд ли будет объясняться ростом цены, особенно в контексте наших товаров. Переводя на графический язык, положительный коэффициент говорит нам о следующей зависимости между ценой и продажами:

Думаю этот график довольно наглядно показывает, что как бы нам ни хотелось ничего не делать с этим коэффициентом — не выйдет. Маловероятно, что повышая цену мы добьемся этим увеличения продаж. В противном случае, нам стоило бы поставить цену на данное зарядное устройство равной бесконечности и перепрофилировать бизнес.

И снова эндогенность

Мы задумались. То ли половина наших товаров “неправильные”, то ли здесь где-то зарыта какая-то другая собака 🐕 . Тут мы вспоминаем про проблемы эндогенности, которые мы недавно разбирали в теории и думаем — возможно ли что где-то здесь мы столкнулись с одной из них? Вполне. Давайте посмотрим что это могло быть. Огласим весь список снова:

  1. Упущенная переменная

  2. Обратно причинно-следственная связь

  3. Ошибка измерений

Предположим, что третье мы можем исключить. Мы верим нашим данным — там все хорошо и нет систематически искажающей результаты ошибки. Что насчет остальных?

Упущенная переменная. Вполне может быть. Что если мы в рамках года взяли только осень и забыли включить сезонную компоненту в анализ? Мы увидим повышение цен на товары (которое мы проводили) и повышение спроса. Более того, здесь мы чувствуем сразу присутствие и второй проблемы — мы повысили цену зная, что будет повышение спроса, а значит, повысятся продажи, а значит мы можем безболезненно поднять цену, чтобы подогнать оптимальную под возросший спрос. Вот вам и обратная причинно-следственная связь.

Еще? Давайте подумаем. Конкуренты. Что если в момент повышения наших цен — конкуренты подняли цены ещё больше. Все покупатели конечно расстроились, что такое вот происходит, но пришли к нам, так как у нас стало дешевле. Тогда можно сказать, что цены конкурентов являются упущенной переменной. Включив её, мы скорректируем нашу ошибку, наш bias.

Можно продолжить. Но зачем? Эти упражнения полезны и интересны для кого-то, но помогают ли они нам решить проблему на практике? Как получить адекватную и близкую к реальной зависимость спроса от предложения? Очень просто. Omitted variable, которую мы можем таки отыскать, мы можем просто включить в регрессионную модель, тем самым скорректировав отклонение. Однако кто гарантирует, что мы не забыли что-нибудь? Кто гарантирует, что мы включили все упущенные переменные, а тем более — кто гарантирует, что мы не забыли где-нибудь обратную причинно следственную связь? Что с ней делать?

Здесь нам на помощь приходят инструментальные переменные.

https://www.microsoft.com/en-us/research/blog/adversarial-machine-learning-and-instrumental-variables-for-flexible-causal-modeling/

Стандартно инструментальные переменные обозначаются как Z. На картинке выше видно, что инструментальная переменная должна быть подобрана так, чтобы воздействовать на итоговую зависимую переменную только через treatment переменную, которую мы хотим избавить от эндогенности (в случае на картинке — от unobserved confounder).

Давайте посмотрим как выглядит наша проблема в более строгой формулировке.

Второе слагаемое и есть bias, который мы получаем за счет эндогенности. Если существует переменная, коррелирующая с Y и X, соответственно

Классический пример использования инструментальной переменной — 2-stage least squares (2SLS) оценка. Название может подсказать нам, что этот метод имеет нечто общее с OLS (ordinary least squares) или МНК оценкой.

Шаги здесь следующие и довольно простые. Пусть у нас есть парочка инструментальных переменных . Также есть наша переменная являющаяся эндогенной (в нашем примере — это цена). Тогда два этапа выглядят так:

  1. Оценить OLS:

    где — экзогенные иксы , а — инструментальные переменные для . В итоге получим некоторую .

  2. Наша оценка получается из подстановки результата предыдущего этапа вместо Так как экзогенная по определению, то при выполнении некоторых предположений несмещенной оценкой является :

Мы здесь опустили некоторые предположения касательно инструментов, но это все же статья не только об инструментальных переменных и не такая техническая, как это возможно, поэтому интересующихся отсылаю к наилучшему источнику по теме: J.M. Wooldridge, Econometric Analysis of Cross Section and Panel Data, Chapter 5.

А не слабовато?

Вкратце — все конечно зависит от инструментов, но в целом, часто мы получаем достаточно маломощные оценки интересующего нас эффекта. В случае нашей задачи — оценки эластичности цены. Чем мощнее эта оценка, тем точнее мы можем оптимизировать цену и тем меньше изначальная выборка нам требуется для этой оптимизации.

Method of Direct Estimation

Данный метод был представлен в статье M. Ratkovic, D. Tingley, Causal Inference Through the Method of Direct Estimation. Он позволяет проводить оценку причинно-следственных связей, фокусируясь на мгновенном причинно-следственном эффекте (instantaneous causal effect), который иначе можно рассматривать как причинно-следственный эффект на уровне одного наблюдения. В своей статье Ratkovic and Tingley строят регрессию с высокой степенью нелинейности между ковариатами и treatment переменной (это например наша цена), которую затем используют для предсказания альтернативных исходов (counterfactuals). Другими словами, они строят регрессию, а затем, подставляя другие значения treatment переменной пытаются понять что с этим наблюдением было б если бы все было иначе.

Пока это выглядит немного смазанно. Давайте посмотрим подробнее на алгоритм, думаю станет понятней.

Пусть наша цена — treatment и обозначим её за T. Также, спрос (который у нас является таргетом) обозначим за Y(T). Причинно-следственный эффект изменения цены на спрос можно тогда обозначить за

здесь , a , где дельта — небольшое изменение нашей цены. В пределе мы хотим оценить частную производную:

Здесь видно, что если мы оценим линейной моделью, то получим просто коэффициент при эффекте воздействия. Однако мы не хотим делать предположения о линейной зависимости и добавляем нелинейные взаимодействия тритмента и переменных. В статье предлагается вид:

— параметры модели, — B-spline базис. Далее предлагается отфильтровать нелинейные компоненты при помощи L1 регуляризатора. Полученное подмножество называем . В дальнейшем после оценки параметров регрессии мы получаем искомый предел как:

Казалось бы, все просто. Однако здесь нигде не учитывается эндогенность. Как мы оценим то же самое, если включим инструментальные переменные?

В статье предлагается аналог 2SLS оценки, называемый LICE (Local Instantaneous Causal Effect). Во-первых, оценивается так называемый instantaneous encouragement — эффект от небольшого изменения инструмента на одном наблюдении. Он показывает эффект от изменения инструмента на тритмент (переменную воздействия):

Вторая часть оценки LICE — instantaneous intent to treat on the treated — показывает эффект от изменения инструмента на целевую переменную:

Итак, в итоге:

Можно показать, что:

Отсюда видно, что для фиксированных параметров наблюдения мы можем предсказать эффект от воздействия на него, имея наше воздействие T и инструментальную переменную Z.

ML модификация MDE

Мы не удовлетворились имеющимися моделями линейной регрессии и решили обобщить метод на работу с произвольным алгоритмом следующим образом. Давайте для начала посмотрим как выглядят модели линейной регрессии в статье:

Заменим линейную регрессию на произвольный алгоритм:

В качестве алгоритмов мы выбрали модели случайного леса. И конечно это лишь звучит просто, в дальнейшем возникло много особенностей ввиду того, что в общем случае решение, выдаваемое лесом не является гладким, так что нам пришлось аппроксимировать его гладкой функцией. Но об этом в другой раз.

Во второй части этой статьи вы узнаете как мы в итоге решили проблему негладкости решения, а также как реализовали систему динамической оптимизации цены. Надеюсь эта статья была вам полезна, ну или хотя бы расширила ваш кругозор. Спасибо!

7.2 Причинно-следственные связи – научные исследования в социальной работе

Цели обучения

  • Дать определение идиографической и номотетической причинно-следственной связи и привести пример
  • Опишите роль причинно-следственной связи в количественных исследованиях по сравнению с качественными исследованиями
  • Определите, определите и опишите каждый из основных критериев номотетических причинно-следственных связей
  • Опишите разницу между независимыми, зависимыми и управляющими переменными и приведите примеры
  • Определить гипотезу, быть в состоянии сформулировать четкую гипотезу и обсудить соответствующие роли количественных и качественных исследований, когда речь идет о гипотезах

 

Большинство социологических исследований пытаются дать какое-то причинно-следственное объяснение. Исследование вмешательства по предотвращению жестокого обращения с детьми пытается установить связь между вмешательством и изменениями в жестоком обращении с детьми. Причинность относится к идее о том, что одно событие, поведение или убеждение приведет к возникновению другого, последующего события, поведения или убеждения. Другими словами, речь идет о причине и следствии. Это кажется простым, но вы можете быть удивлены, узнав, что существует более одного способа объяснить, как одна вещь вызывает другую. Как это может быть? Как может быть много способов понять причинность?

 

Вспомните нашу главу о парадигмах, которые были аналитическими линзами, состоящими из предположений о мире. Вы помните позитивистскую парадигму как ту, которая верит в объективность, и социальную конструкционистскую парадигму, как ту, которая верит в субъективность. Обе парадигмы являются правильными, хотя и неполными, точками зрения на социальный мир и социальные науки.

Исследователь, работающий в парадигме социального конструкционизма, считал бы истину субъективной. Применительно к причинно-следственной связи это означает, что для того, чтобы попытаться понять, что стало причиной чего, нам нужно было бы сообщать о том, что говорят нам люди. Ну, это кажется довольно простым, не так ли? А что, если два разных человека увидели одно и то же событие с одной и той же точки зрения и предложили два совершенно разных объяснения того, что к чему привело? Социальный конструкционист сказал бы, что оба человека правы. Существует не одна единственная истина, истинная для всех, а множество истин, созданных и разделяемых людьми.

Когда социальные конструкционисты занимаются наукой, они пытаются установить один тип причинности — идеографическую причинность. идиографическое причинное объяснение означает, что вы попытаетесь исчерпывающе объяснить или описать свое явление, основываясь на субъективном понимании ваших участников. Эти объяснения связаны с нарративами, которые люди создают о своей жизни и опыте, и встроены в культурный, исторический и экологический контекст. Идиографические причинные объяснения настолько сильны, потому что они передают глубокое понимание явления и его контекста. С социальной конструкционистской точки зрения правда беспорядочна. Идиографическое исследование включает в себя поиск закономерностей и тем в причинно-следственных связях, установленных участниками вашего исследования.

Если это не похоже на то, что вы обычно называете «наукой», вы не одиноки. Хотя идеи, лежащие в основе идиографических исследований, довольно стары в философии, они были применены к наукам только в начале прошлого века. Если мы вспомним таких известных ученых, как Ньютон или Дарвин, они никогда не считали истину субъективной. Существовали объективно истинные законы науки, применимые во всех ситуациях. Другая парадигма была доминирующей и продолжает господствовать сегодня, позитивистская парадигма. Когда позитивисты пытаются установить причинно-следственную связь, они, как Ньютон и Дарвин, пытаются найти широкое, всеобъемлющее объяснение, универсально верное для всех людей. Это отличительная черта номотетическое причинное объяснение .

Номотетические причинные объяснения также невероятно сильны. Они позволяют ученым делать прогнозы о том, что произойдет в будущем, с определенной погрешностью. Более того, они позволяют ученым обобщать , то есть делать заявления о большом населении на основе меньшей выборки людей или предметов. Обобщение важно. У нас явно нет времени спрашивать у всех их мнение по теме, а также у нас нет возможности следить за каждым взаимодействием в социальном мире. Нам нужен тип причинно-следственного объяснения, который поможет нам предсказать и оценить истину во всех ситуациях.

Если это все еще кажется малопонятными философскими терминами, давайте рассмотрим пример. Представьте, что вы работаете в общественной некоммерческой организации, обслуживающей людей с ограниченными возможностями. Вы составляете отчет, чтобы помочь правительству штата лоббировать дополнительное финансирование программ поддержки сообщества, и вам необходимо поддержать свой аргумент в пользу дополнительного финансирования в вашем агентстве. Если вы посмотрите на номотетические исследования, вы можете узнать, как предыдущие исследования показали, что, в целом, общественные программы, подобные вашей, связаны с улучшением состояния здоровья и занятости для людей с ограниченными возможностями. Номотетическое исследование пытается объяснить, что программы на базе сообщества лучше для всем с ограниченными возможностями. Если вы посмотрите на идиографические исследования, вы получите истории и опыт людей, участвующих в общественных программах. Эти отдельные истории полны подробностей о жизненном опыте участия в общественной программе. Используя идиографическое исследование, вы можете понять, что значит быть человеком с инвалидностью, а затем сообщить об этом правительству штата. Например, человек может сказать: «В этом агентстве я чувствую себя как дома, потому что они относятся ко мне как к члену семьи» или «Это агентство помогло мне получить мою первую зарплату».

Ни одно из причинных объяснений не лучше другого. Решение провести идиографическое исследование означает, что вы попытаетесь исчерпывающе объяснить или описать свой феномен, обращая внимание на культурный контекст и субъективные интерпретации. С другой стороны, решение провести номотетическое исследование означает, что вы попытаетесь объяснить, что верно для всех, и предсказать, что будет верно в будущем. Короче говоря, идиографические объяснения имеют большую глубину, а номотетические объяснения — большую широту. Что еще более важно, социальные работники понимают ценность обоих подходов к пониманию социального мира. Социальный работник, помогающий клиенту с проблемами, связанными со злоупотреблением психоактивными веществами, ищет идиографические знания, когда он расспрашивает об истории жизни этого клиента, исследует его уникальное физическое окружение или выясняет, как он понимает свою зависимость. В то же время социальный работник также использует номотетические знания для руководства своими действиями. Номотетические исследования могут помочь им свести к минимуму факторы риска и максимизировать защитные факторы или использовать доказательную терапию, опираясь на знания о том, что в целом помогает людям с проблемами злоупотребления психоактивными веществами.

 

Один из моих любимых моментов в классе произошел на заре моей учительской карьеры. Студенты давали обратную связь по исследовательским вопросам. Я слышал, как одна группа помогала кому-то перефразировать вопрос исследования. Студент спросил: «Вы пытаетесь обобщить или нет?» Преподавание полно забавных моментов, подобных этому.

Ответив на один вопрос, вы сможете понять, как концептуализировать и разработать свой исследовательский проект. Если вы пытаетесь обобщить или создать номотетическую причинно-следственную связь, то остальные утверждения, скорее всего, будут верны: вы будете использовать количественные методы, рассуждать дедуктивно и заниматься объяснительными исследованиями. Как я могу все это знать? Разберём по частям.

Поскольку номотетические причинно-следственные связи пытаются обобщить, они должны уметь сводить явления к универсальному языку, математике. Математика позволяет нам точно измерять в универсальных терминах явления в социальном мире. Не все количественные исследования являются объяснительными. Например, описательное исследование может выявить количество людей, не имеющих жилья в вашем округе, но не скажет вам, почему они бездомные. Но почти все объяснительные исследования количественные. Поскольку исследователям-объяснениям нужно ясное объяснение «x вызывает y», им необходимо использовать универсальный язык математики для достижения своей цели. Вот почему номотетические причинно-следственные связи используют количественные методы.

Здесь мы говорили об отношениях между переменными. Когда одна переменная вызывает другую, мы имеем то, что исследователи называют независимыми и зависимыми переменными. В нашем примере с поркой и агрессивным поведением шлепки будут независимой переменной, а склонность к агрессивному поведению будет зависимой переменной. Независимая переменная является причиной, а зависимая переменная является следствием. Почему они так называются? Зависимые переменные зависят от независимых переменных. Если все это сбивает с толку, просто запомните это графическое соотношение:

.

 

Рис. 7.1 Визуальное представление номотетической причинно-следственной связи

Прочность связи — еще один важный фактор, который необходимо учитывать при попытке сделать причинно-следственные связи, когда ваш исследовательский подход является номотетической. Я не говорю о силе вашей дружбы или брака. В этом контексте сила связи относится к статистической значимости. Чем более статистически значима взаимосвязь между двумя переменными, тем больше мы можем быть уверены в силе этой взаимосвязи. Вы помните из нашего обсуждения статистической значимости в главе 3, что она обычно представляется в статистике как p Значение .

Гипотеза — это утверждение, описывающее ожидания исследователя в отношении того, что он ожидает найти. Гипотезы в количественных исследованиях представляют собой номотетические причинно-следственные связи, которые исследователь рассчитывает продемонстрировать. Он написан для описания ожидаемой связи между независимыми и зависимыми переменными. Ваш прогноз должен быть взят из теории или модели социального мира. Например, вы можете предположить, что обращение с клиническими клиентами с теплотой и позитивным отношением, вероятно, поможет им достичь своих терапевтических целей. Эта гипотеза будет использовать гуманистические теории Карла Роджерса. Использование предыдущих теорий для выдвижения гипотез является примером дедуктивного исследования. Если теория безусловного положительного отношения Роджерса верна, ваша гипотеза должна быть верна. Вот откуда мы знаем, что все номотетические причинно-следственные связи должны использовать дедуктивное рассуждение.

Давайте рассмотрим пару примеров. В исследовании сексуальных домогательств (Uggen & Blackstone, 2004),  [1] можно было бы предположить, основываясь на феминистских теориях сексуальных домогательств, что женщины чаще, чем мужчины, подвергаются определенному сексуальному домогательству. Какая здесь предсказывается причинно-следственная связь? Какая независимая, а какая зависимая переменная? В этом случае мы предположили, что пол человека (независимая переменная) будет предсказывать вероятность того, что он подвергнется сексуальным домогательствам (зависимая переменная).

Иногда исследователи предполагают, что отношения примут определенное направление. В результате можно сказать, что увеличение или уменьшение в одной области вызывает увеличение или уменьшение в другой. Например, вы можете изучить взаимосвязь между возрастом и поддержкой легализации марихуаны. Возможно, вы посещали уроки социологии и, основываясь на прочитанных теориях, предполагаете, что возраст негативно влияет на поддержку легализации марихуаны. [2] Что вы только что предположили? Вы предположили, что по мере взросления вероятность поддержки легализации марихуаны снижается. Таким образом, когда возраст (ваша независимая переменная) движется в одном направлении (вверх), поддержка легализации марихуаны (ваша зависимая переменная) движется в другом направлении (вниз). Таким образом, положительные отношения включают две переменные, движущиеся в одном направлении, а отрицательные отношения включают две переменные, движущиеся в противоположных направлениях. Если написание гипотез кажется сложным, иногда полезно нарисовать их и изобразить каждую из двух гипотез, которые мы только что обсудили.

 

Рисунок 7.2. Гипотеза, описывающая ожидаемую связь между сексом и сексуальными домогательствами. Рисунок 7.3. Гипотеза, описывающая ожидаемое направление связи между возрастом и поддержкой легализации марихуаны.

Важно отметить, что после начала исследования неэтично менять свою гипотезу, чтобы она соответствовала полученным данным. Например, что произойдет, если вы проведете исследование для проверки гипотезы из рис. 7.3 о поддержке легализации марихуаны, но не обнаружите связи между возрастом и поддержкой легализации? Это означает, что ваша гипотеза была ошибочной, но это все равно ценная информация. Это поставило бы под сомнение то, что говорится в существующей литературе по вашей теме, продемонстрировав, что необходимо провести дополнительные исследования, чтобы выяснить факторы, влияющие на поддержку легализации марихуаны. Не смущайтесь отрицательных результатов и определенно не меняйте свою гипотезу, чтобы она все время казалась верной!

Допустим, вы проводите исследование и находите доказательства, подтверждающие вашу гипотезу: с возрастом поддержка легализации марихуаны уменьшается. Успех! Причинно-следственное объяснение завершено, верно? Не совсем. Вы установили только один из критериев причинности. Основные критерии причинности связаны с ковариацией, правдоподобием, временностью и ложностью. В нашем примере на рис. 7.3 мы установили только один критерий — ковариацию. Когда переменные ковариируют , они изменяются вместе. В нашем исследовании различаются как возраст, так и поддержка легализации марихуаны. В нашей выборке есть люди разного возраста и разного уровня поддержки легализации марихуаны.

Тот факт, что между двумя переменными может существовать некоторая корреляция, не означает, что причинно-следственная связь между ними действительно правдоподобна. Правдоподобие означает, что для того, чтобы сделать заявление о том, что одно событие, поведение или убеждение вызывает другое, это утверждение должно иметь смысл. Имеет смысл, что люди из предыдущих поколений будут относиться к марихуане иначе, чем молодые поколения. Люди, выросшие во времена безумия рефрижераторов или хиппи, могут придерживаться иных взглядов, чем те, кто вырос в эпоху легализации марихуаны в медицинских и рекреационных целях.

После того, как мы установили правдоподобную взаимосвязь между двумя переменными, нам также необходимо установить, возникла ли причина до следствия, критерий временности . Возраст человека — это качество, которое проявляется задолго до любых мнений о наркополитике, поэтому во времени причина предшествует следствию. Говорить о том, что поддержка легализации марихуаны способствует увеличению возраста, бессмысленно. Даже если бы вы могли предсказать чей-то возраст, основываясь на его поддержке легализации марихуаны, вы не могли бы сказать, что чей-то возраст был вызван их поддержкой легализации.

Наконец, ученые должны установить неложность. Ложная связь — это связь, в которой связь между двумя переменными кажется причинно-следственной, но на самом деле может быть объяснена какой-то третьей переменной. Например, мы могли бы указать на тот факт, что пожилые когорты реже употребляли марихуану. Может быть, именно употребление марихуаны заставляет людей быть более открытыми для легализации, а не их возраст. Это часто называют проблемой третьей переменной, когда кажущаяся истинной причинно-следственная связь на самом деле вызвана третьей переменной, не включенной в гипотезу. В этом примере связь между возрастом и поддержкой легализации может быть больше связана с тем, что человек пробовал марихуану, чем с возрастом человека.

Количественные исследователи чувствительны к последствиям потенциально ложных отношений. Они являются важной формой критики научной работы. В результате они часто измеряют эти третьи переменные в своем исследовании, чтобы контролировать их влияние. Они называются управляющими переменными и относятся к переменным, влияние которых контролируется математически в процессе анализа данных. Контрольные переменные могут немного сбивать с толку, но подумайте об этом как о споре между вами, исследователем и критиком.

Исследователь: «Чем старше человек, тем меньше вероятность того, что он поддержит легализацию марихуаны».

Критик: «На самом деле, это больше о том, употреблял ли человек марихуану раньше. Это то, что действительно определяет, поддерживает ли кто-то легализацию марихуаны».

Исследователь: «Ну, я измерил предыдущее употребление марихуаны в своем исследовании и математически проконтролировал ее эффекты в своем анализе. Связь между возрастом и поддержкой легализации марихуаны по-прежнему статистически значима и является наиболее важной связью здесь».

Давайте рассмотрим еще несколько реальных примеров ложных сигналов. Знаете ли вы, например, что высокий уровень продаж мороженого приводит к утоплению? Конечно, это не совсем так, но между ними есть положительная связь. В этом случае третьей переменной, которая вызывает как высокие продажи мороженого, так и увеличение смертности от утопления, является время года, поскольку в летний сезон наблюдается увеличение обоих показателей (Babbie, 2010). [4] Вот еще один хороший факт: это правда, что по мере того, как растут зарплаты пресвитерианских служителей в Массачусетсе, растут и цены на ром в Гаване, Куба. Ну, да, может быть, вы говорите себе. Все знают, как сильно министры в Массачусетсе любят свой ром, верно? Не так быстро. Да, выросли и зарплаты, и цены на ром, но выросли цены практически на все остальное (Huff & Geis, 19 лет).93). [5] Наконец, исследования показывают, что чем больше пожарных присутствует на месте пожара, тем больше ущерба наносится на месте происшествия. Это утверждение, конечно же, упускает из виду то, что по мере увеличения размера пожара увеличивается и размер причиненного ущерба, а также количество пожарных, призванных на помощь (Frankfort-Nachmias & Leon-Guerrero, 2011). [6] В каждом из этих примеров наличие третьей переменной объясняет очевидную взаимосвязь между двумя исходными переменными.

В целом, следующие критерии должны быть соблюдены, чтобы корреляция считалась причинно-следственной:

  • Две переменные должны изменяться вместе.
  • Связь должна быть правдоподобной.
  • Причина должна предшествовать следствию во времени.
  • Связь не должна быть ложной (не должна быть связана с третьей переменной).

Как только эти критерии соблюдены, исследователь может сказать, что он получил номотетическое причинное объяснение, которое объективно верно. Перед исследователями стоит непростая задача. Вы почти никогда не услышите, чтобы исследователи говорили, что у них есть доказали свои гипотезы. Утверждение, которое выделено жирным шрифтом, подразумевает, что взаимосвязь существует с абсолютной уверенностью и что нет никаких шансов, что существуют условия, при которых гипотеза не была бы верна. Вместо этого исследователи склонны говорить, что их гипотезы подтвердились (или нет). Этот более осторожный способ обсуждения результатов допускает возможность обнаружения новых доказательств или новых способов изучения отношений. Исследователи также могут обсуждать нулевую гипотезу. В главе 3 мы рассмотрели, что нулевая гипотеза — это гипотеза, предсказывающая отсутствие связи между изучаемыми переменными. Если исследователь отвергает нулевую гипотезу, он говорит, что рассматриваемые переменные каким-то образом связаны друг с другом.

Помните наш вопрос: «Вы пытаетесь обобщить или нет?» Если вы ответили «нет», вы пытаетесь установить идиографическую причинно-следственную связь. Я могу предположить, что если вы пытаетесь установить идиографическую причинно-следственную связь, вы, вероятно, будете использовать качественные методы, рассуждать индуктивно и участвовать в исследовательском или описательном исследовании. Мы можем понять эти предположения, пройдясь по ним одно за другим.

Исследователи, ищущие идиографические причинно-следственные связи, не пытаются обобщать, поэтому им не нужно сводить явления к математике. На самом деле, использование языка математики для сведения социального мира к минимуму — это плохо, поскольку оно лишает причинно-следственную связь ее значения и контекста. Идиографические причинно-следственные связи связаны с рассказами и интерпретациями людей. Обычно они выражаются словами. Не во всех качественных исследованиях используются словесные данные, поскольку в некоторых могут использоваться интерпретации визуального или исполнительского искусства, хотя в подавляющем большинстве исследований в области социальных наук используются словесные данные.

 

Но подождите, я предсказал, что идиографическая причинно-следственная связь потребует описательного или исследовательского исследования. Как мы можем построить причинно-следственные связи, если мы просто описываем или исследуем тему? Разве нам не нужно проводить объяснительные исследования, чтобы построить какое-либо причинно-следственное объяснение? Объяснительные исследования пытаются установить номотетические причинно-следственные связи — показано, что независимая переменная вызывает изменения зависимой переменной. Исследовательские и описательные качественные исследования содержат некоторые причинно-следственные связи, но на самом деле они являются описанием причинно-следственных связей, установленных участниками вашего исследования. Вместо того, чтобы говорить «x вызывает y», ваши участники будут описывать свой опыт с «x», который, по их словам, был вызван и повлиял на множество других факторов, в зависимости от времени, окружающей среды и субъективного опыта. Как мы уже говорили ранее, идиографические причинные объяснения беспорядочны. Ваша работа как исследователя социальных наук состоит в том, чтобы точно описать закономерности в том, что говорят вам ваши участники.

Давайте рассмотрим пример. Если бы я спросил вас, почему вы решили стать социальным работником, что бы вы ответили? Что касается меня, я бы сказал, что я хотел быть клиницистом по психическому здоровью, когда учился в старшей школе. Мне было интересно, как люди думают. Во время моей второй стажировки по программе бакалавриата мне посоветовали стать социальным работником, потому что лицензия давала больше полномочий для возмещения страховых расходов и гибкости для смены карьеры. Это совсем не простое объяснение! Но она дает описание более глубокого понимания многих факторов, которые привели меня к тому, чтобы стать социальным работником. Если бы мы опросили многих социальных работников об их решениях стать социальными работниками, мы могли бы начать замечать закономерности. Мы можем обнаружить, что многие социальные работники начинают свою карьеру на основе множества факторов, таких как: личный опыт с инвалидностью или социальной несправедливостью, положительный опыт работы с социальными работниками или желание помочь другим. Ни один фактор не является «наиболее важным фактором», как в случае номотетических причинно-следственных связей. Вместо этого в наборе данных появляется сложная сеть факторов, зависящих от контекста, когда вы интерпретируете то, что сказали люди.

Нахождение закономерностей в данных, как вы помните из главы 6, — это суть индуктивных рассуждений. Исследователь собирает данные, обычно словесные данные, и замечает закономерности. Эти паттерны формируют теории, которые мы используем в социальной работе. Во многом идиографические причинно-следственные связи, которые вы создаете в качественных исследованиях, подобны социальным теориям, которые мы рассмотрели в главе 6 (например, теория социального обмена), и другим теориям, которые вы используете в своих практических и теоретических курсах. Теории — это объяснения того, как различные понятия связаны друг с другом, как эта сеть отношений работает в реальном мире. В то время как вы можете думать о таких теориях, как теория систем, как о теории (с большой буквы «Т»), индуктивные причинно-следственные связи подобны теории с маленькой «т». Они могут применяться только к участникам, среде и моменту времени, когда вы собирали свои данные. Тем не менее, они вносят важную информацию в совокупность знаний по изучаемой вами теме.

Со временем, по мере того, как проводятся более качественные исследования и выявляются закономерности в разных исследованиях и местах, появляются более сложные теории, объясняющие явления в различных контекстах. Таким образом, качественные исследователи используют идиографические причинно-следственные объяснения для построения теории или создания новых теорий, основанных на индуктивных рассуждениях. Количественные исследователи, с другой стороны, используют номотетические причинно-следственные связи для проверки теории , когда гипотеза создается на основе существующей теории (большое T или маленькое t) и проверяется математически (т. е. дедуктивным умозаключением).

Если вы планируете изучать насилие в семье и сексуальное насилие, вы, скорее всего, столкнетесь с Колесом власти и контроля. [6] Колесо — это модель того, как власть и контроль действуют в отношениях с физическим насилием. Колесо было разработано на основе качественных фокус-групп, проведенных защитниками сексуального и домашнего насилия в Дулуте, штат Миннесота. Хотя у защитников, вероятно, были некоторые предварительные гипотезы о том, что важно в отношениях с домашним насилием, участники этих фокус-групп предоставили информацию, которая стала Колесом власти и контроля. По мере того, как разворачивается качественное исследование, подобное этому, гипотезы становятся более конкретными и ясными, поскольку исследователи узнают из того, что разделяют их участники.

Как только теория разработана на основе качественных данных, количественный исследователь может попытаться проверить эту теорию. Например, количественный исследователь может выдвинуть гипотезу о том, что мужчины, придерживающиеся традиционных гендерных ролей, с большей вероятностью будут участвовать в домашнем насилии. Это имело бы смысл, исходя из модели Колеса Власти и Контроля, поскольку категория «использование мужских привилегий» говорит об этих отношениях. Таким образом, качественно выведенная теория может вдохновить на гипотезу количественного исследовательского проекта.

В отличие от номотетических причинно-следственных связей не существует формальных критериев (например, ковариации) для установления причинности в идиографических причинно-следственных связях. На самом деле некоторые критерии, такие как временность и чистота, могут быть нарушены. Например, если клиент-подросток говорит: «Мне трудно сказать, началась ли моя депрессия до того, как я начал пить, но обе они ухудшились, когда меня исключили из моей первой старшей школы», он признает, что часто не так просто, чтобы вещь вызывает другую. Иногда существует взаимная связь, когда одна переменная (депрессия) влияет на другую (злоупотребление алкоголем), которая затем отражается на первой переменной (депрессия), а также на других переменных (школа). Другие критерии, такие как ковариация и правдоподобие, по-прежнему имеют смысл, поскольку отношения, которые вы выделяете как часть вашего идиографического причинного объяснения, все еще должны быть правдоподобно истинными, и их элементы должны варьироваться вместе.

Точно так же идиографические причинные объяснения различаются в терминах гипотез. Если вы помните из предыдущего раздела, гипотезы в номотетических каузальных объяснениях — это проверяемые предсказания, основанные на предыдущей теории. В идиографическом исследовании у исследователя, вероятно, есть гипотезы, но они более предварительные. Вместо того, чтобы предсказывать, что «x уменьшит y», исследователи будут использовать предыдущую литературу, чтобы выяснить, какие концепции могут быть важны для участников и как, по их мнению, участники могут реагировать во время исследования. На основе анализа литературы исследователь может сформулировать несколько предварительные гипотезы о том, что они ожидают найти в своем качественном исследовании. В отличие от номотетических гипотез, они могут меняться в процессе исследования. По мере того, как исследователь узнает больше от своих участников, он может представить новые концепции, о которых говорят участники. Поскольку участники являются экспертами в области идиографических причинно-следственных связей, исследователь должен быть открыт для новых тем и соответствующим образом менять свои исследовательские вопросы и гипотезы.

Идиографические и номотетические каузальные объяснения образуют «две корзины» элементов дизайна исследования, изображенных на рис. 7.4 ниже. Позже они также определят подход к выборке, меры и анализ данных в вашем исследовании.

 

Рисунок 7.4: Две корзины (или подходы) к исследованию

В большинстве случаев смешивание компонентов из одной корзины с другой не имеет смысла. Если вы используете количественные методы с идиографическим вопросом, вы не получите глубокого понимания, необходимого для ответа на идиографический вопрос. Знание, например, что кто-то набрал 20/35 баллов по числовому индексу симптомов депрессии, не говорит вам, что депрессия значит для этого человека. Точно так же качественные методы не часто используются для дедуктивных рассуждений, потому что качественные методы обычно стремятся понять точку зрения участника, а не проверить, что существующая теория говорит о понятии.

Однако это не жесткие правила. Существует множество качественных исследований, которые пытаются проверить теорию. Социальных конструкционистских исследований с количественными методами меньше, хотя исследования иногда включают количественную информацию об участниках. Исследователи критической парадигмы могут вписаться в любую корзину, в зависимости от их исследовательского вопроса, поскольку они сосредоточены на освобождении людей от угнетающих внутренних (субъективных) или внешних (объективных) сил.

Позже в этой главе мы рассмотрим, как исследователи могут использовать оба сегмента одновременно в исследованиях смешанных методов. На данный момент важно, чтобы вы понимали логику, связывающую идеи в каждой корзине. Это не только фундаментально для того, как знание создается и проверяется в социальной работе, но и касается самих предположений и оснований, на которых строятся все теории социального мира!

 

Ключевые выводы

  • Идиографические исследования сосредоточены на субъективности, контексте и значении.
  • Номотетические исследования сосредоточены на объективности, прогнозировании и обобщении.
  • В качественных исследованиях цель обычно состоит в том, чтобы понять множество причин, объясняющих конкретный случай, который исследует исследователь.
  • В количественных исследованиях целью может быть понимание более общих причин некоторого явления, а не особенностей одного конкретного случая.
  • Для номотетических причинно-следственных связей связь должна быть правдоподобной и не ложной, а причина должна предшествовать следствию во времени.
  • В номотетической причинной связи независимая переменная вызывает изменения в зависимой переменной.
  • Гипотезы — это утверждения, основанные на теории, которые описывают ожидания исследователя относительно взаимосвязи между двумя или более переменными.
  • Качественные исследования могут создавать теории, которые можно проверить количественно.
  • Выбор идиографических или номотетических причинно-следственных связей требует рассмотрения методов, парадигм и рассуждений.
  • В зависимости от того, ищете ли вы номотетическое или идиографическое причинное объяснение, вы, вероятно, будете использовать определенные компоненты плана исследования.

 

Глоссарий

  • Причинность — идея о том, что одно событие, поведение или убеждение приведет к возникновению другого, последующего события, поведения или убеждения
  • Контрольные переменные — потенциальные эффекты «третьих переменных» контролируются математически в процессе анализа данных, чтобы выявить взаимосвязь между независимой и зависимой переменной
  • Ковариация — степень, в которой две переменные изменяются вместе
  • Зависимая переменная — переменная, зависящая от изменений независимой переменной
  • Обобщение — делать заявления о большей совокупности на основе изучения меньшей выборки
  • Гипотеза — утверждение, описывающее ожидания исследователя относительно того, что он предполагает найти
  • .
  • Идиографическое исследование — попытки исчерпывающе объяснить или описать ваше явление, основанное на субъективном понимании ваших участников
  • Независимая переменная – вызывает изменение зависимой переменной
  • Номотетическое исследование — дает более общее, широкое объяснение, которое универсально верно для всех людей
  • Правдоподобие — чтобы сделать заявление о том, что одно событие, поведение или убеждение вызывают другое, утверждение должно иметь смысл
  • Ложная связь — связь между двумя переменными кажется причинно-следственной, но на самом деле может быть объяснена какой-то третьей переменной
  • Статистическая значимость – уверенность исследователей в математической зависимости
  • Временность — любая причина, которую вы определяете, должна произойти до следствия
  • Построение теории — создание новых теорий на основе индуктивных рассуждений
  • Проверка теории — когда гипотеза создается на основе существующей теории и проверяется математически

 

Атрибуция изображений

Микадо от 3dman_eu CC-0

Прогноз погоды по телевидению от mohamed_hassan CC-0

Беатрис Бирра Рассказ историй в Музее африканского искусства Энтони Кросса общественное достояние

 


  1. Угген, К. , и Блэкстоун, А. (2004). Сексуальные домогательства как гендерное выражение власти. American Sociological Review, 69 , 64–92. ↵
  2. Фактически, существуют эмпирические данные, подтверждающие эту гипотезу. Гэллап проводил исследования по этому вопросу с 1960-х годов. Для получения дополнительной информации об их выводах см. Carroll, J. (2005). Кто поддерживает легализацию марихуаны? Получено с http://www.gallup.com/poll/19561/who-supports-marijuana-legalization.aspx ↵
  3. Рисунки 7.2 и 7.3 скопированы из Blackstone, A. (2012) Принципы социологического исследования: качественные и количественные методы. Фонд Сэйлора. Получено с: https://saylordotorg.github.io/text_principles-of-sociological-inquiry-qualitative-and-quantitative-methods/ Распространяется под лицензией CC-BY-NC-SA 3.0 (https://creativecommons.org/licenses). /by-nc-sa/3.0/) ↵
  4. Бэбби, Э. (2010). Практика социальных исследований (12-е изд.) . Белмонт, Калифорния: Уодсворт.
  5. Хафф, Д. и Гейс, И. (1993). Как соврать со статистикой . Нью-Йорк, штат Нью-Йорк: WW Norton & Co. ↵
  6. Франкфорт-Нахмиас, К. и Леон-Герреро, А. (2011). Социальная статистика для разнообразного общества . Вашингтон, округ Колумбия: Pine Forge Press. ↵

Причинно-следственные связи: значение и примеры

Изучение причинно-следственных связей является важной частью наблюдения. Например, изучая, как животное растет, исследователь будет изучать, что заставляет его охотиться за определенными видами пищи, что заставляет его отдыхать и впадать в спячку, что заставляет его спариваться и так далее. Причинно-следственные связи также играют огромную роль в аргументации, потому что причины наблюдений часто спорны.

Причинно-следственная связь Значение

Причинно-следственная связь имеет две основные характеристики: причина и следствие .

причина причина того, что что-то происходит.

эффект что-то происходит.

Вы могли заметить, насколько тесно связаны эти две идеи. Без другого ни одно из них нельзя было бы наблюдать. Вот пример. Ваш палец заставляет мяч катиться. Без пальца мяч не катится. В то же время, без шара, вы ничего не нанесли пальцем.

Сверните меня, чтобы показать причину и следствие, плоский значок.

Хотя причина и следствие взаимозависимы, мы часто рассматриваем причинно-следственную связь с точки зрения линии. Это полезно для изучения причинно-следственных связей с точки зрения аргументации.

В аргументации причинно-следственная связь — это способ, которым причина ведет к своему следствию.

В основной части эссе вы можете использовать причинно-следственные связи в качестве доказательства своего тезиса.

Причинно-следственная связь Синонимы

Причинно-следственная связь — это связь причины и следствия.

линия рассуждений использует причинно-следственные связи, чтобы сделать вывод.

Исследуя причинно-следственные связи, вы можете изучить разницу между фактом и мнением .

Типы причинно-следственных связей с примерами

Вот четыре типа причинно-следственных связей, а также примеры причинно-следственных связей.

Причинно-следственные связи

Это простые отношения A ➜ B ➜ C.

Причинно-следственная цепочка отношения — это когда одна вещь ведет к другой вещи, которая ведет к другой вещи, и так далее.

Допустим, у кого-то депрессия. Для них депрессия приводит к отсутствию мотивации, что приводит к невыполнению работы.

Причинно-следственная цепочка — это всего лишь один из способов взглянуть на эту ситуацию. Ситуация может быть представлена ​​и другими способами.

Причинный гомеостаз

Это циклы. А ➜ Б ➜ В ➜ А.

Каузальный гомеостаз — это когда что-то поддерживает собственное размножение.

Вернемся к человеку в депрессии. Для них депрессия приводит к отсутствию мотивации, что приводит к невыполнению работы, что приводит к еще большей депрессии.

В зависимости от того, что вы хотите, вы можете сформулировать причинно-следственные связи по-разному. Если вы пытаетесь описать скользкий путь депрессии, вы можете сформулировать его в виде цепочки: как она становится все хуже и хуже и приводит ко все более ужасным последствиям. Однако, чтобы описать спираль депрессии, вы можете сформулировать ее в терминах причинного гомеостаза: как депрессия приводит к усугублению депрессии.

Отношения по общей причине

Это отношения A ➜ B и C.

Отношение по общей причине — это когда одна вещь ведет к нескольким вещам.

Возьмем снова человека, страдающего депрессией. Вы также можете сформулировать их депрессию, используя взаимосвязь общей причины. В этой модели депрессия приводит к отсутствию мотивации И отсутствию аппетита.

Это соотношение отлично подходит для описания симптомов причины.

Симптомы показывают связь общей причины, flaticon.

Отношения общего эффекта

Это отношения A и B ➜ C.

Отношение общего эффекта — это когда несколько вещей приводят к одной вещи.

Например, потеря работы И расставание с кем-либо может привести к депрессии.

Эта взаимосвязь отлично подходит для определения множества причин, по которым что-то происходит.

Причинно-следственные связи в вашем эссе

При изучении причинно-следственных связей в эссе не пытайтесь определить абсолютные отношения. Как видно из рассмотренных выше примеров, вы можете подойти к теме (например, к депрессии) по-разному, используя множество моделей. Вместо этого используйте модель причинно-следственной связи, которая лучше всего соответствует вашему аргументу.

Если это еще не совсем понятно, ничего страшного. Так и будет.

Начните со своей диссертации. Скажите, что это ваша диссертация:

Габриэль Гарсиа Маркес использует сюрреалистические элементы таким образом, чтобы пролить свет на личную и уникальную колумбийскую неуверенность в прошлом и будущем. Тем не менее, Маркес ломает границы языка и культуры, потому что его уникальные истории подобны сказкам— неудобные фантазии , которые вызывают отклик на уровне сверхъестественного, где «кто и где» имеет гораздо меньшее значение, чем «как это ощущается».

Хорошо, отлично. Теперь предположим, что вы хотите найти доказательства, подтверждающие подчеркнутую часть этого тезиса. Конечно, вам понадобятся доказательства для всего тезиса, но сначала сузьте их до подчеркнутой части для этого примера.

Какие отношения помогут поддержать этот вывод?

Начните с доказательств необходимо чтобы прийти к выводу .

В этой части диссертации потребуются конкретные примеры из творчества Маркеса, символизирующие жанр сказки. Чтобы удовлетворить это, было бы здорово найти отдельные отрывки, которые соответствуют всем пунктам нашего определения сказки. Какая из моделей причинно-следственных связей была бы здесь полезна?

Похоже, модель общей причины была бы полезна. Вот как это будет работать.

Прохождение 1 жуткое, И в прохождении 1 царит мрачная атмосфера, И в прохождении 1 непонятная обстановка и период времени. Это приводит нас к выводу, что Прохождение 1 похоже на сказку.

Несколько аспектов отрывка 1 делают его символом жанра сказки.

Оттуда вы можете снова использовать модель для более полной поддержки своего тезиса.

Прохождение 1 похоже на сказку, И прохождение 2 похоже на сказку, И прохождение 3 похоже на сказку. Это приводит нас к выводу, что произведение в целом похоже на сказку.

Несколько отрывков в книге делают ее символом сказки.

Это всего лишь один из способов приблизиться к этому тезису. При использовании причинно-следственных связей для поддержки собственного тезиса будьте изобретательны. Используйте как можно больше причинно-следственных связей и исследуйте их с разных сторон. Думайте об этом, как о создании сети. Чем теснее ваши идеи связаны друг с другом из конца в конец и из стороны в сторону, тем труднее будет опровергнуть ваши выводы. Пятьдесят звеньев сильнее одного!

Причинно-следственные связи — основные выводы

  • В аргументации причинно-следственная связь — это способ, которым причина ведет к своему следствию.
  • причинно-следственная цепочка отношения — это когда одна вещь ведет к другой вещи, которая ведет к другой вещи, и так далее.
  • Каузальный гомеостаз — это когда что-то поддерживает собственное размножение.
  • Отношение по общей причине — это когда одна вещь ведет к нескольким вещам.
  • Отношение общего эффекта — это когда несколько вещей приводят к одной вещи.

9.2 Причинность

9.2 Причинность Умение устанавливать причинно-следственные связи в мире важно. Что связывает причину и следствие невидимо нам (Юм). Но мы можем заметить корреляции и из них иногда сделать выводы о причинно-следственных связях. Не все корреляции существуют потому что есть причинно-следственная связь.

Корреляции

Заявления о корреляции выражают отношение между двумя свойствами (значениями переменных) в пределах одной совокупности.
Курильщики Некурящие
Американские мужчины 51 49 
американки 34 66
На основании этих данных мы утверждаем, что 51% американских мужчины курят, и 34% американских женщин курят. Свойство быть Американский мужчина положительно коррелирует со свойством быть курильщиком, а свойство быть американской женщиной отрицательно коррелирует с быть курильщиком. Население здесь — взрослые американцы, и мы сравниваем две переменные: курение и пол; каждая переменная имеет два значения.

А положительно коррелирует с В тогда и только тогда, когда процент А среди В больше, чем процент As среди не-Bs.

А отрицательно коррелирует с В тогда и только тогда, когда процент А среди В меньше процента As среди не-Bs.

А не коррелирует с В процент As среди Bs такой же, как процент As среди не-Bs.

Оценка корреляций

Предвзятость внимания при оценке корреляций:

Медсестер попросили просмотреть 100 карточек с пациентами. информацию о них, а затем судить, были ли отношения или Связь конкретного симптома с конкретным заболеванием. Каждый карта указывала, присутствует ли симптом или нет, а также болезнь была или отсутствовала. (Смедслунд, 1963 г.)

Здесь частота симптомов и заболеваний на 100 пациентов.

Болезнь Нет болезни
Симптом 37 33 
Нет симптомов 17 13 
Полученные результаты:

Здесь нет корреляции, хотя 85% медсестры думали, что существует положительная корреляция между симптомом и болезнь. Присутствующая/присутствующая клетка была лучшим предиктором суждения субъекта; высокая цифра в этой ячейке вызвала положительное суждение.

Обратите внимание, что как для группы симптомов, так и для бессимптомная группа примерно у тех, у кого есть заболевание, и у тех, у кого его нет заболевание (имеют чуть больше, чем не имеют в обеих группах; 37-33 с симптомом, 17-13 без симптома). Болезнь у тебя или нет, примерно в два раза больше людей имеют симптом, чем не имеют его.

Субъекты склонны смотреть только на избранных ячейки для соответствующей информации.

Другой пример: отвечает ли Бог на молитвы? Многие говорят да, потому что много раз молитвы были успешными. Но что насчет остальные клетки?

Другой пример:

Испытуемых спросили, является ли мистер Максвелл, вымышленный человек, которого им предложили представить, которого они встретили на вечеринке, был профессором. Им сказали, что он либо профессор, либо руководитель, и что он принадлежал к Медвежьему клубу. Затем испытуемых спрашивали, что дополнительную информацию, которую они хотели бы иметь, чтобы вынести свое суждение. Например, какой процент профессоров в партии являются членами Медвежий клуб, или какой процент руководителей на вечеринке были членами Медвежьего клуба? 89% испытуемых хотели получить первую порцию информации, но только 54% ​​хотели вторую часть, хотя обе части важны. (Также актуальна информация о проценте профессоров на вечеринке.)

Эффекты предшествующей веры в оценку корреляций:

Клинические психологи иногда используют метод «Нарисуй человека». тесты, с помощью которых пациенты, как считается, проецируют аспекты своей личности в рисунки. Большие глаза могут указывать на то, что пациент подозревает другие или параноик; широкие плечи могут указывать на озабоченность мужественностью.

Исследования показали бесполезность этих тестов как индикаторы личностных качеств. Но в исследованиях, в которых картины и метки черт связаны таким образом, что не отражают никакой корреляции, необученные субъекты все еще заявляют, что «обнаружили», что определенные черты коррелируют с некоторые аспекты рисунков. Даже профессионалы сохраняют доверие в них, узнав об их неэффективности. Аналогичные результаты применимы к тесту Роршаха. тесты. Цитата: «Я знаю, что параноики, похоже, не привлекают большого внимания в исследованиях. лаборатории, но они делают это в моем кабинете» (Чепмен и Чепмен, 19 лет).67, 1969)

Предварительное убеждение может усилить предвзятость внимания:

Испытуемым сообщают об эксперименте, в котором детям в интернате дают определенные комбинации продуктов, чтобы увидеть влияют ли они на вероятность простуды. Прежде чем увидеть данных испытуемых просят сформулировать свои собственные гипотезы. После показа данных, на их интерпретации явно влияют их собственные гипотезы. Несмотря на то, что данные не отражают никакой корреляции, испытуемые, предположившие заранее, что тип воды (бутылированная или водопроводная) может иметь значение для простудиться также сказали, что они видели такую ​​корреляцию в примере данные. Субъекты, которые, например, предположили, что тип горчицы вызовет простуду, обратит внимание на данные о горчице/простуде и проигнорирует данные о горчице/нет холодные данные.

Причинно-следственные связи:

Причинное обобщение, например, что курение вызывает рак легких, не относится к конкретному курильщику, а констатирует особое существует связь между свойством курения и свойством получить рак легких. В качестве причинно-следственной связи это говорит не только о том, что является соотношением между двумя свойствами.

Некоторые причинные условия являются необходимыми условиями: наличие кислорода – необходимое условие горения; в без кислорода нет горения. «Причина» часто используется в этом смысл, когда устранение причины направлено на устранение следствия (что вызывает боль?)

Некоторые причинные условия являются достаточными условиями: при наличии достаточного условия эффект должен произойти (находясь в диапазон температур R в присутствии кислорода достаточен для горения многих веществ. «Причина» часто используется в этом смысле, когда мы пытаемся произвести эффект (Что делает этот металл таким прочным?)

Поиск особых обстоятельств: что было причина пожара? Кислород? или спичка поджигателя?

Причинами иногда называют INUS-состояния в том, что они являются недостаточными, но необходимыми частями ненужного, но Достаточный набор условий для эффекта. Можно сказать, что зажег спичку быть причиной его освещения. Предположим, что есть некоторый набор условий этого достаточно для зажигания спички. Сюда можно отнести присутствие кислорода, соответствующие химические вещества в спичечной головке и зажигании. Можно сказать, что удар является необходимой частью этого набора (хотя и недостаточным). само по себе), потому что без поразительного среди этих других условий спичка не зажглась бы. Но сам набор хоть и достаточен, но не необходимо, потому что другие наборы условий могли произвести освещение матча.

Чем причинно-следственные связи отличаются от корреляций?

1. Утверждение о корреляции симметрично в то время как утверждение о причинно-следственной связи асимметрично. Если бы мужчина положительно коррелирует с тем, чтобы быть курильщиком, быть курильщиком также положительно коррелирует с принадлежностью к мужскому полу. Но если курение вызывает легкие рака не обязательно, что рак легких вызывает курение.

2. Корреляции касаются фактических популяций и не являются законопослушными. Причинно-следственные связи закономерны в том смысле, что они касаются как гипотетического населения, так и фактического населения. Когда говорят, что А является причиной В, мы говорим, что если бы произошло увеличение при заболеваемости А будет увеличиваться заболеваемость В; или если бы случаи А уменьшились, случаи Б также уменьшились бы. (Если меньше люди курили, было бы меньше рака легких.) Простые корреляции относятся только для реального населения. Если успех Национальной лиги в Суперкубке просто коррелирует с падением фондового рынка, то нам не следует ожидать изменения на фондовом рынке, чтобы повлиять на результат Суперкубка (или наоборот).

Как можно судить о причинно-следственных связях на основании утверждений о корреляциях?

Например, существует сильная положительная корреляция между увеличением числа занятий по половому воспитанию и ростом в темпе гонореи. Предположим, мы пришли к выводу, что увеличение числа занятий по половому воспитанию вызвало увеличение заболеваемости гонореей.

(A) Статистическая предпосылка (утверждение о корреляции) верно или обосновано?

(B) Какие альтернативные объяснения доступны?

1. Корреляция может быть случайной или случайно. Увеличение государственного долга положительно коррелирует с увеличение заболеваемости гонореей, но причинно-следственной связи нет.

2. Связь может быть ложной, как увеличение числа занятий по половому воспитанию и увеличение частота гонореи, являющейся следствием одной и той же причины.

3. Причинно-следственная связь может быть обратной. Может ли рост заболеваемости гонореей быть причиной ощущаете потребность в дополнительных занятиях по половому воспитанию?

4. Причинно-следственная связь могла быть более сложнее, чем следует из заключения. Увеличение количества занятий по половому воспитанию могло вызвать изменение отношения к сексу, что привело к увеличению в половой жизни, что привело к увеличению заболеваемости гонореей.

5. Указанная причинно-следственная связь может быть незначительной по сравнению с другими факторами, ответственными за рост гонореи оценивать.

Предполагается ли наличие причинно-следственной связи в приведенных ниже случаях?

Одно время была сильная положительная корреляция между количеством мулов в государстве и жалованьем, выплачиваемым профессорам (чем больше мулов, тем ниже зарплата).

Существует сильная положительная корреляция между количество пожарных машин в районе Нью-Йорка и количество пожаров, которые происходят там.

Существует сильная положительная корреляция между Размер стопы и качество письма.

Существует сильная отрицательная корреляция между количество передач вперед, брошенных в футбольном матче и выигравших игра.

Употребление большого количества кофе положительно коррелирует с сердечными приступами.

Посещение больницы положительно коррелирует с умиранием.

Увеличение количества часов, которое дети смотрят Телевидение положительно коррелирует со снижением результатов SAT.

Употребление марихуаны отрицательно коррелирует с высокий средний балл.

Другой пример:

«Хотя половина населения страны имеет фторированные источники воды, а половина нет, девяносто процентов случаев СПИДа прибывают из цветущих районов, и только десять процентов прибывают из неорошаемые районы».

Любая связь?

1. Сообщества разного размера: процветающие сообщества (вероятно, большие города) могут содержать гораздо больше чем половина населения.

2. Связь может быть фиктивной: космополитическая/прогрессивная отношения могут поощрять как фторирование, так и образ жизни, связанный с СПИД

Другой пример:

Существует ли причинно-следственная связь между классом посещаемость и полученные оценки?

«Студенты с самой низкой посещаемостью заработали самые плохие оценки. Те, кто посещал 79 процентов занятий или меньше оказался в диапазоне низких C; 90 процентов и выше получили оценку выше средней B. Студент, сидевший впереди, получил «значительно более высокие оценки», но Уолш [тот исследователь] думает, что они могли бы больше интересоваться предметами».

Джон Стюарт Милль, Система логики, 1843 г.

А не является достаточным условием для В, если А встречается без В.

А не является необходимым условием для В, если В встречается без А.

Прямой метод согласования

Найдите причинно-следственную связь между эффектом и a необходимое условие

Какой фактор всегда присутствует, когда эффект настоящее?

При наличии среди проживающих в общежитии это сыпь из-за расстройства желудка, мы, вероятно, будем искать один продукт, который все пациенты ели как причину.

1. Заключение относится только к случаям считается.

2. Только вероятные: другие важные условия могли быть пропущены; это могло быть сочетанием факторов

Обратный метод согласования

Найдите причинно-следственную связь между эффектом и a достаточное условие

Какой фактор всегда отсутствует, когда вхождения эффекта нет?

Пять фабричных рабочих признаны неэффективными относительно других, выполняющих ту же работу. Эффективные работники и неэффективные работники оказались похожими во всех отношениях, за исключением один: неэффективные не были частью плана распределения прибыли. Вывод: участие в прибылях вызывает эффективность.

1. Заключение относится только к случаям считается.

2. Только вероятные: другие важные условия могли быть пропущены; это могло быть сочетанием факторов

Двойной метод соглашения

Найдите причину, которая является одновременно необходимой и достаточное условие

Какой фактор всегда присутствует, когда эффект настоящее?

Какой фактор всегда отсутствует при возникновении эффекта нет?

Восемь пациентов имеют заболевание, и каждый дано то или иное средство. Четыре пациента, которым вводили сыворотку S, вылечились. Из тех, кто излечился, никакое другое лекарство не было дано всем. Принадлежащий четверо, которые не были вылечены, каждому пациенту давали по крайней мере одно из лекарств (но не сыворотка S). Сыворотка S признана лекарством.

1. Заключение относится только к событиям считается.

2. Только вероятные: другие важные условия могли быть пропущены; это могло быть сочетанием факторов

Метод разности

Определите достаточное условие среди возможные кандидаты в конкретном случае

Фактор единственный, который присутствует когда явление присутствует и отсутствует, когда явление отсутствует.

Две идентичные белые мыши в контролируемом эксперименту давали одинаковое количество четырех разных продуктов. Кроме того, одной из мышей давали определенный препарат. Через некоторое время мышь, которая накормлен препаратом, стал нервным и возбужденным. Исследователи пришли к выводу что наркотик вызвал нервозность.

1. Менее общий вывод, чем обратный метод различия, который применяется ко всем перечисленным вхождениям

Совместный метод согласия и разногласий

Назовите необходимое и достаточное условие то, что присутствует, является конкретным явлением.

Используйте прямой метод согласования, чтобы изолировать необходимые условия (если нет фактора, нет эффекта) и метод разности чтобы изолировать те, которые также достаточны.

1. Менее общий вывод, чем двойной способ согласования, применимый ко всем перечисленным случаям;

Джордж, который регулярно занимался спортом, принимал витамины, и вдоволь отдохнул, подхватил редкое заболевание. Врачи вводят антибиотик и болезнь прошла. убежден, что излечение было вызвано то ли упражнениями, то ли отдыхом, то ли антибиотиком, врачи искали для аналогичных случаев. Из двух найденных один не тренировался, взял без витаминов и мало отдыхала. Ему прописали тот же антибиотик. был вылечен. Другой человек, который делал то же самое, что и Джордж, получил без антибиотика и не вылечили. Врачи пришли к выводу, что Джордж был лечится антибиотиком.

Метод остатков

«Отдельно от группы причинно связанных условий и явлений те нити причинной связи, которые уже известна, оставляя требуемую причинную связь в качестве «остатка».

Метод сопутствующей вариации

Сопоставьте варианты одного условия с вариантами в другой.

Поймите разницу для вашего продукта

Корреляция и причинно-следственная связь могут показаться обманчиво похожими, но признание их различий имеет решающее значение для понимания взаимосвязей между переменными. В этой статье мы дадим вам четкое определение разницы между причинно-следственной связью и корреляцией.

Далее мы сосредоточимся на корреляции и причинно-следственной связи специально для создания цифровых продуктов и понимания поведения пользователей. Менеджеры по продуктам, специалисты по данным и аналитики сочтут это полезным для использования правильных идей для увеличения роста продукта, например, влияют ли определенные функции на удержание или вовлеченность клиентов. Понимание корреляции и причинно-следственной связи может быть разницей между тратой усилий на малоценные функции и созданием продукта, которым ваши клиенты не могут перестать восхищаться.

И даже если вы не знакомы с миром продуктов, мы думаем, вам будет полезно понять, как отличить корреляцию от причинно-следственной связи.

Прочитав эту статью, вы:

  • Поймете, что такое корреляция
  • Понять, что такое причинно-следственная связь
  • Знать ключевые различия между корреляцией и причинно-следственной связью
  • Знайте два надежных решения, которые можно использовать для проверки причинно-следственной связи

В чем разница между корреляцией и причинно-следственной связью?

Хотя причинно-следственная связь и корреляция могут существовать одновременно, корреляция не подразумевает причинно-следственную связь. Причинность означает, что одна вещь вызывает другую, другими словами, действие A вызывает результат B . С другой стороны, корреляция — это просто отношение, в котором действие A связано с действием B , но одно событие не обязательно вызывает другое событие.

В этом примере существует корреляция между поеданием мороженого и получением солнечных ожогов, поскольку эти два события связаны. Но ни одно событие на самом деле вызывает другое. Вместо этого оба события вызваны чем-то другим — солнечной погодой.

Корреляцию и причинно-следственную связь часто путают, потому что человеческий разум любит находить объяснения кажущимся связанным событиям, даже если их не существует. Мы часто придумываем эти объяснения, когда две переменные кажутся настолько тесно связанными, что одна зависит от другой. Это подразумевает причинно-следственную связь, когда одно событие является результатом другого события.

Однако мы не можем просто предположить причинно-следственную связь, даже если мы видим два события, происходящие, казалось бы, одновременно, на наших глазах. Почему? Во-первых, наши наблюдения носят чисто анекдотический характер. Во-вторых, есть несколько других возможностей для ассоциации, в том числе:

  • Верно обратное : В на самом деле вызывает А.
  • Эти две вещи коррелируют, но это еще не все : А и В коррелируют, но на самом деле они вызваны С.
  • Есть еще одна переменная, связанная с : А действительно вызывает Б — до тех пор, пока происходит Г.
  • Происходит цепная реакция : А вызывает Е, что приводит Е к причине Б (но вы только своими глазами видели, что А вызывает Б).

Пример корреляции и причинно-следственной связи в продуктовой аналитике

Возможно, вы ожидаете найти причинно-следственную связь в своем продукте, когда определенные действия или поведение пользователя приводят к определенному результату.

Представьте себе: вы только что запустили новую версию своего мобильного приложения для потоковой передачи музыки. Вы предполагаете, что удержание клиентов для вашего продукта связано с социальным поведением в приложении. Вы просите свою команду разработать новую функцию, позволяющую пользователям присоединяться к «сообществам».

Через месяц после того, как вы выпустили новую функцию сообществ, ее приняли около 20% всех пользователей. Вам интересно, влияют ли сообщества на удержание, поэтому вы создаете две группы (когорты) одинакового размера со случайно выбранными пользователями. В одной когорте есть только пользователи, присоединившиеся к сообществу, а в другой — только пользователи, присоединившиеся к не присоединился к сообществу.

Ваш анализ показывает шокирующий вывод: пользователи, которые присоединились хотя бы к одному сообществу, имеют более высокий уровень удержания, чем те, кто не присоединился к сообществу.

Диаграмма анализа удержания Amplitude. Попробуйте создать его самостоятельно с помощью нашей бесплатной демо-версии самообслуживания.

На приведенной выше диаграмме почти 95% присоединившихся к сообществу (синие) все еще существуют на неделе 2 по сравнению с 55% тех, кто не присоединился к сообществу (зеленые). К 7-й неделе вы увидите 85% удержания тех, кто присоединился к сообществу, и 25% удержания тех, кто не присоединился к сообществу. Эти результаты кажутся массовым переворотом.

Но подождите. Логическая часть вас знает, что у вас недостаточно информации, чтобы сделать вывод о том, что присоединение к сообществам приводит к лучшему удержанию . Все, что вы знаете, это то, что эти два коррелируют . На самом деле, они оба могут быть вызваны каким-то другим неизвестным фактором.

В этом примере присоединение к сообществам и более высокое удержание коррелируют , но может быть и третий фактор , вызывающий и то, и другое.

Как проверить причинно-следственную связь в вашем продукте

Причинно-следственные связи не возникают случайно.

Может показаться заманчивым связать две переменные как «причину и следствие». Но выполнение этого без подтверждения причинно-следственной связи в надежном анализе может привести к ложноположительному результату — причинно-следственная связь кажется существующей, но на самом деле не является . Ложное срабатывание может произойти, если вы не тщательно проверите взаимосвязь между зависимой и независимой переменной.

Ложные срабатывания создают проблемы для понимания продукта, потому что вы можете ошибочно думать, что понимаете связь между важными результатами и поведением пользователей. Например, вы можете думать, что знаете, какое событие активации ключа приводит к долгосрочному удержанию пользователей, но без тщательного тестирования вы рискуете принять важные решения о продукте на основе неправильного поведения пользователей.

Проведите надежные эксперименты для определения причинно-следственной связи

Как только вы обнаружите корреляцию, вы можете проверить причинно-следственную связь, запустив эксперименты, которые «контролируют другие переменные и измеряют разницу».

Вы можете использовать эти два эксперимента или анализа для определения причинно-следственной связи в вашем продукте:

  • Проверка гипотез
  • A/B/n эксперименты

1.

Проверка гипотезы

Самая простая проверка гипотезы включает H0 (нулевую гипотезу) и h2 (ваша основная гипотеза) . У вас также может быть вторичная гипотеза, третичная гипотеза и так далее.

Нулевая гипотеза противоположна вашей первичной гипотезе. Почему? Хотя вы не можете доказать свою первичную гипотезу со 100% уверенностью (ближе всего вы можете получить 99%), вы можете опровергнуть свою нулевую гипотезу.

Первичная гипотеза указывает на причинно-следственную связь, которую вы исследуете, и должна определять причину (независимую переменную или переменную воздействия) и эффект (зависимая переменная или переменная результата) .

Лучше сначала создать свой h2, затем указать его противоположность и использовать ее для своего H0. Ваш h2 должен идентифицировать отношения, которые вы ожидаете между вашими независимыми и зависимыми переменными.

Если мы используем предыдущий пример и посмотрим на влияние социальных функций в приложении на удержание, вашей независимой переменной будет «присоединение к сообществу», а вашей зависимой переменной будет «удержание». Ваша основная гипотеза может быть:

h2 : Если пользователь присоединится к сообществу в рамках нашего продукта в первый месяц, он останется клиентом более одного года.

Затем отмените свой h2, чтобы сгенерировать нулевую гипотезу:

H0 : Между присоединением к сообществу и удержанием пользователей нет никакой связи.

Цель состоит в том, чтобы наблюдать, есть ли реальная разница между вашими различными гипотезами. Если вы можете отклонить нулевую гипотезу со статистической значимостью (в идеале с минимумом 95% уверенности), вы приблизились к пониманию взаимосвязи между вашими независимыми и зависимыми переменными.

В приведенном выше примере с потоковой передачей музыки, если вы можете отвергнуть нулевую гипотезу, обнаружив, что присоединение к сообществу приводит к более высокому коэффициенту удержания (с поправкой на смешанные переменные, которые могут повлиять на ваши результаты), то вы, вероятно, можете заключить, что существует некоторая взаимосвязь между присоединением к сообществу и удержанием пользователей.

Чтобы проверить эту гипотезу, разработайте уравнение, которое точно отражает взаимосвязь между ожидаемой причиной (независимой переменной или переменной воздействия) и следствием (зависимой переменной или переменной результата). Если ваша модель позволяет вам подставить значение для вашей переменной воздействия и постоянно возвращать результат, отражающий фактические наблюдаемые данные, вы, вероятно, что-то поняли.

Когда использовать проверку гипотез

Проверка гипотез полезна при попытке определить, существует ли взаимосвязь между двумя переменными, а не при рассмотрении неофициальных данных. Возможно, вы захотите просмотреть исторические данные, чтобы выполнить лонгитюдный анализ изменений с течением времени. Например, вы можете выяснить, являются ли ваши самые активные промоутеры первые последователи запуска продукта. Вы можете посмотреть на шаблоны рефералов, а также сравнить эту связь с запуском продукта с течением времени.

Или вы можете запустить перекрестный анализ , который анализирует моментальный снимок данных. Этот анализ полезен при рассмотрении эффектов конкретного воздействия и результата, а не изменений тенденции за период. Например, вы можете изучить взаимосвязь между специальными праздничными акциями и распродажами.

2. Эксперименты A/B/n

Тестирование A/B/n, или раздельное тестирование, может привести вас от корреляции к причинно-следственной связи. Посмотрите на каждую из ваших переменных, измените одну, чтобы у вас были разные версии ( вариант A и вариант B ), и посмотрим, что получится. Если ваш результат постоянно меняется (с одной и той же тенденцией), вы нашли переменную, которая имеет значение.

Два варианта макета веб-сайта — вариант A и вариант B

Если вы утверждаете, что присоединение к сообществу приводит к более высокому уровню удержания, вы должны исключить все другие переменные, которые могут повлиять на результат. Например, пользователи могли выбрать другой путь, который в конечном итоге повлиял на удержание.

Чтобы проверить наличие причинно-следственной связи, вам нужно найти прямую связь между пользователями, присоединившимися к сообществу, и долгосрочным использованием вашего приложения.

Начните с процесса адаптации. Для следующих 1000 пользователей, которые зарегистрируются, разделите их на две группы. Заставьте первую половину присоединиться к сообществу, когда они зарегистрируются (вариант A), а другую половину — нет (вариант B). Проведите эксперимент в течение 30 дней, используя инструмент для экспериментов, например Amplitude Experiment, а затем сравните показатели удержания между двумя группами.

Предположим, вы обнаружили, что группа, вынужденная присоединиться к сообществу, имеет относительно более высокий коэффициент удержания. В этом случае у вас есть доказательства, подтверждающие причинно-следственную связь между присоединением к сообществу и удержанием. Эти отношения, вероятно, стоит изучить с помощью инструмента аналитики продукта, такого как Amplitude Analytics, чтобы понять , почему сообществ способствуют удержанию.

Вы не можете быть уверены в причинно-следственной связи, пока не проведете такие эксперименты.

Когда использовать A/B/n-тестирование

A/B/n идеально подходит для сравнения влияния различных вариантов — варианта A и варианта B — на кампании, функции продукта, контент-стратегии и многое другое. Например, сплит-тест процесса адаптации вашего продукта может сравнить эффективность различных стратегий продукта на основе определенных характеристик, включая:

  • Копирование вариантов
  • Графика (стоковые фотографии и пользовательские иллюстрации)
  • Уменьшение количества полей в форме регистрации
  • Персонализация (имя, компания и сведения об отрасли)

После запуска нескольких вариантов онбординга продукта вы можете просмотреть результаты и сравнить такие показатели, как коэффициент отказа, конверсия и удержание.

Узнайте больше о метриках, которые вы можете отслеживать, в Руководстве Amplitude по метрикам продуктов .

Действуйте в соответствии с правильными соотношениями для устойчивого роста продукта

Мы всегда ищем вокруг себя объяснения и пытаемся интерпретировать то, что видим. Однако, если вы не можете четко определить причинно-следственную связь, вам следует предположить, что вы видите только корреляцию.

События, которые, исходя из здравого смысла, кажутся связанными, не могут считаться причинно-следственными, если вы не можете доказать четкую и прямую связь. И хотя причинность и корреляция могут существовать одновременно, корреляция не означает причинно-следственную связь.

Чем больше вы научитесь определять истинные корреляции внутри вашего продукта, тем лучше вы сможете расставлять приоритеты в своих инвестициях в продукт и улучшать удержание. Прочтите нашу книгу Mastering Retention Playbook , чтобы получить советы экспертов по инструментам, стратегиям и реальным примерам развития вашего продукта с помощью надежной стратегии удержания.

Ссылки

  • Что такое A/B-тестирование? Как это работает и когда использовать, Amplitude
  • Найдите событие активации ключа, чтобы запросить подключение, Clearbit
  • Измерение того, что имеет значение: как выбрать хорошую метрику, OnStartups
  • Повторный курс статистической значимости, Harvard Business Review

Определение причинно-следственной связи — Voxco

ПОДЕЛИТЕСЬ СТАТЬЕЙ ПО

Содержание

Что такое причинно-следственная связь?

Причинность — важный и широко используемый в исследованиях термин, обозначающий явление, вызывающее изменение второго события или действия. В исследованиях, когда мы говорим, что две переменные имеют причинно-следственную связь (или причинно-следственную связь), мы имеем в виду, что изменение одной переменной (известной как независимая переменная) вызывает изменение другой (зависимой переменной).

Преобразуйте процесс получения информации

Создайте действенный процесс сбора отзывов.

Подробнее

Причинное исследование

Причинное исследование, также называемое объяснительным исследованием, используется для определения степени причинно-следственной связи между двумя переменными. Эксперименты — один из самых популярных методов проведения причинно-следственных исследований на основе первичных данных.

Причинно-следственные связи состоят из трех неотъемлемых компонентов: 

  1. Временная последовательность : Причина должна иметь место до следствия.
  2. Неложная ассоциация : ковариация между причинно-следственной связью должна быть истинной и не должна быть вызвана промежуточной или неучтенной переменной, влияющей на связь.
  3. Сопутствующая вариация : вариация между двумя переменными должна быть систематической и поэтому должна возникать или изменяться вместе.

Корреляция против причинно-следственной связи

Хотя причинно-следственная связь и корреляция могут существовать одновременно, важно отметить, что корреляция не подразумевает причинно-следственной связи. Корреляция просто означает наличие статистической связи или закономерности между двумя переменными, в то время как причинно-следственная связь подразумевает не только определенный вид связи, известный как причинно-следственная связь. Это означает, что изменение одной переменной вызывает изменение другой.

Существуют две основные причины, по которым корреляция не подразумевает причинно-следственную связь: 

  • Существование мешающей переменной : Смешивающая переменная — это третья переменная, которая влияет на обе переменные, создавая впечатление, что они связаны причинно-следственной связью, даже если они не. В этом случае статистическая связь обусловлена ​​третьей переменной, а не наличием причинно-следственной связи.
  • Проблема направленности : Иногда две переменные действительно могут иметь причинно-следственную связь, однако невозможно определить, какая переменная является причиной (независимая переменная), а какая следствием (зависимая переменная).

Download Market Research Toolkit

Get market research trends guide, Online Surveys guide, Agile Market Research Guide & 5 Market research Template

The Advantages and Disadvantages of Conducting Causal Research

Advantages 
  • Можно воспроизвести : Причинное исследование облегчает создание воспроизводимых процессов.
  • Высокий уровень внутренней достоверности : Причинные исследования часто проводятся с использованием реальных экспериментов и поэтому проводятся очень систематически. Это обеспечивает ему более высокий уровень внутренней валидности.
  • Может использоваться для оценки воздействия/результатов : причинно-следственное исследование является полезным инструментом для оценки воздействия, поскольку его можно использовать для изучения результатов изменений в существующих методах и процессах.

Недостатки 
  • Сложность выполнения : Причинное исследование часто бывает утомительным, особенно в неконтролируемых условиях, поскольку невозможно учитывать или контролировать все посторонние переменные.
  • Дороговизна 906:20 : Каузальное исследование является одним из самых дорогих видов исследований, так как требует много времени и ресурсов.
  • Проблемы направленности: причинно-следственное исследование не всегда позволяет сделать вывод о том, какая переменная является зависимой, а какая независимой.

Часто задаваемые вопросы о причинно-следственной связи

Что такое причинно-следственная связь?

Причинность имеет место, когда изменение одной переменной (независимой переменной) приводит к изменению другой (зависимой переменной).

В чем разница между корреляцией и причинно-следственной связью?

Корреляция между двумя переменными просто подразумевает статистическую связь между ними. Причинность, с другой стороны, подразумевает не только то, что они связаны, но и то, что одно вызывает изменение другого.

Почему корреляция не подразумевает причинно-следственную связь?

Корреляция не всегда подразумевает причинно-следственную связь по следующим причинам;

  • Существование смешанной переменной (третьей переменной) может быть причиной статистической связи между переменными, что делает их причинно-следственными.
  • Проблемы с направленностью могут сделать невозможным определение того, какая переменная является независимой (причина), а какая зависимой (следствие).

Что такое причинное исследование?

Причинное исследование предполагает изучение связи между двумя переменными, зависимой и независимой.

Каким условиям должна удовлетворять причинно-следственная связь?

Связь между двумя переменными может быть причинной только в том случае, если она удовлетворяет трем следующим условиям;

  • Неложная ассоциация: связь не должна быть связана с третьей переменной.
  • Сопутствующая вариация: вариации должны встречаться вместе.
  • Временная последовательность: причина должна появиться раньше следствия.

Получите БЕСПЛАТНУЮ демонстрацию

Узнайте, как Voxco может преобразовать ваши исследования в области опросов за 30 минут.

company

Select CountryAfghanistanAland IslandsAlbaniaAlgeriaAmerican SamoaAndorraAngolaAnguillaAntarcticaAntigua and BarbudaArgentinaArmeniaArubaAustraliaAustriaAzerbaijanBahamasBahrainBangladeshBarbadosBelarusBelauBelgiumBelizeBeninBermudaBhutanBoliviaBonaire, Saint Eustatius and SabaBosnia and HerzegovinaBotswanaBouvet IslandBrazilBritish Indian Ocean TerritoryBritish Virgin IslandsBruneiBulgariaBurkina FasoBurundiCambodiaCameroonCanadaCape VerdeCayman IslandsCentral African RepublicChadChileChinaChristmas IslandCocos (Keeling) IslandsColombiaComorosCongo (Brazzaville)Congo (Kinshasa)Cook IslandsCosta RicaCroatiaCubaCuraçaoCyprusCzech RepublicDenmarkDjiboutiDominicaDominican RepublicEcuadorEgyptEl SalvadorEquatorial GuineaEritreaEstoniaEthiopiaFalkland IslandsFaroe IslandsFijiFinlandFranceFrench ГвианаФранцузская ПолинезияФранцузские южные территорииГабонГамбияГрузияГерманияГанаГибралтарГрецияГренландияГренадаГваделупаГуамГватемалаГернсиГвинеяГвинея-БисауГайан aHaitiHeard Island and McDonald IslandsHondurasHong KongHungaryIcelandIndiaIndonesiaIranIraqIrelandIsle of ManIsraelItalyIvory CoastJamaicaJapanJerseyJordanKazakhstanKenyaKiribatiKosovoKuwaitKyrgyzstanLaosLatviaLebanonLesothoLiberiaLibyaLiechtensteinLithuaniaLuxembourgMacao S. A.R., ChinaMacedoniaMadagascarMalawiMalaysiaMaldivesMaliMaltaMarshall IslandsMartiniqueMauritaniaMauritiusMayotteMexicoMicronesiaMoldovaMonacoMongoliaMontenegroMontserratMoroccoMozambiqueMyanmarNamibiaNauruNepalNetherlandsNew CaledoniaNew ZealandNicaraguaNigerNigeriaNiueNorfolk IslandNorth KoreaNorthern Mariana IslandsNorwayOmanPakistanPalestinian TerritoryPanamaPapua New GuineaParaguayPeruPhilippinesPitcairnPolandPortugalPuerto RicoQatarReunionRomaniaRussiaRwandaSão Tomé and PríncipeSaint BarthélemySaint HelenaSaint Kitts and NevisSaint LuciaSaint Martin (Dutch part)Saint Martin (French part)Saint Pierre and MiquelonSaint Vincent and the ГренадиныСамоаСан-МариноСаудовская АравияСенегалСербияСейшелыСьерра-ЛеонеСинг aporeSlovakiaSloveniaSolomon IslandsSomaliaSouth AfricaSouth Georgia/Sandwich IslandsSouth KoreaSouth SudanSpainSri LankaSudanSurinameSvalbard and Jan MayenSwazilandSwedenSwitzerlandSyriaTaiwanTajikistanTanzaniaThailandTimor-LesteTogoTokelauTongaTrinidad and TobagoTunisiaTurkeyTurkmenistanTurks and Caicos IslandsTuvaluUgandaUkraineUnited Arab EmiratesUnited Kingdom (UK)United States (US)United States (US) Minor Outlying IslandsUnited States (US) Virgin IslandsUruguayUzbekistanVanuatuVaticanVenezuelaVietnamWallis and FutunaWestern SaharaYemenZambiaZimbabwe

Предоставляя эту информацию, вы соглашаетесь с тем, что мы можем обрабатывать ваши персональные данные в соответствии с нашей Политикой конфиденциальности.

Ознакомьтесь со всеми типами вопросов опроса


, которые можно найти на Voxco

Подробнее

Качественное наблюдение

Качественные наблюдения: определение, типы и примеры Инструментарий исследования рынка Начните работу с набором инструментов для исследования рынка Voxco. 5-балльная шкала Лайкерта

Является ли 5-балльная шкала Лайкерта лучшим выбором для использования? ПОДЕЛИТЬСЯ СТАТЬЕЙ НА Оглавление Прежде чем узнать больше о …

Подробнее

Ориентация на клиента: все, что вам нужно знать

Ориентация на клиента: все, что вам нужно знать ПОДЕЛИТЬСЯ СТАТЬЕЙ НА Поделиться через фейсбук Поделиться в твиттере Поделиться на LinkedIn Оглавление В . ..

Подробнее

Метрики клиентского опыта (CX)

Показатели клиентского опыта (CX) ПОДЕЛИТЬСЯ СТАТЬЕЙ НА Поделиться через фейсбук Поделиться в твиттере Поделиться на LinkedIn Оглавление Введение Что …

Подробнее

CX занимает первое место – достижения в страховом секторе

Бесплатная загрузка: создавайте аналитические сведения о пути клиента, используя наши шаблоны обслуживания клиентов. Скачать сейчас ПОГОВОРИТЕ С ЭКСПЕРТОМ CX Можно утверждать, что …

Подробнее

Дизайн исследования: определение, метод и примеры

Дизайн исследования: определение, методы и примеры Начните работу с Research Design уже сегодня. Запросите бесплатную 15-минутную калибровочную…

Подробнее

Корреляция и причинно-следственная связь | Отличия, конструкции и примеры

Опубликован в 12 июля 2021 г. по Прита Бхандари. Отредактировано 21 июля 2022 г.

Корреляция означает наличие статистической связи между переменными. Причина означает, что изменение одной переменной вызывает изменение другой переменной.

В исследованиях вы могли встретить фразу «корреляция не подразумевает причинно-следственную связь». Корреляция и причинно-следственная связь — две взаимосвязанные идеи, но понимание их различий поможет вам критически оценивать и интерпретировать научные исследования.

Содержание

  1. Какая разница?
  2. Почему корреляция не означает причинно-следственную связь?
  3. Корреляционное исследование
  4. Проблема третьей переменной
  5. Ложные корреляции
  6. Проблема направленности
  7. Исследование причинно-следственных связей
  8. Часто задаваемые вопросы о корреляции и причинно-следственной связи

Какая разница?

Корреляция описывает связь между переменными: когда одна переменная изменяется, меняется и другая. Корреляция — это статистический показатель взаимосвязи между переменными. Эти переменные изменяются вместе: они коварины. Но эта ковариация не обязательно связана с прямой или косвенной причинно-следственной связью.

Причина означает, что изменения в одной переменной вызывают изменения в другой; между переменными существует причинно-следственная связь. Эти две переменные коррелируют друг с другом, и между ними также существует причинно-следственная связь.

Корреляция не подразумевает причинно-следственную связь, но причинно-следственная связь всегда подразумевает корреляцию.

Почему корреляция не означает причинно-следственную связь?

Есть две основные причины, по которым корреляция не является причинно-следственной связью. Эти проблемы важно выявить, чтобы сделать обоснованные научные выводы из исследований.

Проблема третьей переменной означает, что смешанная переменная влияет на обе переменные, делая их причинно связанными, когда это не так. Например, продажи мороженого и уровень насильственных преступлений тесно связаны, но не связаны друг с другом причинно-следственной связью. Вместо этого высокая температура, третья переменная, влияет на обе переменные по отдельности.

Проблема направленности возникает, когда две переменные коррелируют и могут фактически иметь причинно-следственную связь, но невозможно сделать вывод, какая переменная вызывает изменения в другой. Например, уровень витамина D коррелирует с депрессией, но неясно, вызывает ли низкий уровень витамина D депрессию или депрессия вызывает снижение потребления витамина D.

Вам нужно будет использовать соответствующий план исследования, чтобы различать корреляционные и причинно-следственные связи.

Планы корреляционных исследований могут демонстрировать только корреляционные связи между переменными, в то время как планы экспериментов могут проверять причинно-следственные связи.

Получение отзывов о языке, структуре и форматировании

Профессиональные редакторы вычитывают и редактируют вашу статью, уделяя особое внимание:

  • Академический стиль
  • Расплывчатые предложения
  • Грамматика
  • Согласованность стиля

См. пример

Корреляционные исследования

В корреляционном исследовании вы собираете данные о своих переменных, не манипулируя ими.

Пример: корреляционное исследование. Вы собираете данные опроса, чтобы выяснить, существует ли связь между уровнями физической активности и самооценкой. Вы спрашиваете участников об их текущем уровне физической активности и измеряете их самооценку с помощью опросника.

Вы обнаружили, что уровень физической активности положительно коррелирует с самооценкой: более низкие уровни физической активности связаны с более низкой самооценкой, а более высокие уровни физической активности связаны с более высокой самооценкой.

Корреляционные исследования обычно обладают высокой внешней достоверностью, поэтому вы можете обобщить свои выводы на реальные условия жизни. Но эти исследования имеют низкую внутреннюю валидность, что затрудняет причинно-следственную связь изменений одной переменной с изменениями другой.

Эти исследовательские планы обычно используются, когда проводить контролируемые эксперименты неэтично, слишком дорого или слишком сложно. Они также используются для изучения отношений, которые, как ожидается, не будут причинно-следственными.

Пример: корреляционное исследование. Чтобы выяснить, связано ли использование агрессивных медиа с агрессией, вы собираете данные об использовании детьми видеоигр и их поведенческих тенденциях. Вы просите родителей сообщить, сколько часов в неделю их ребенок проводит за жестокими видеоиграми, и вы опрашиваете родителей и учителей о поведении детей.

Вы обнаружите положительную корреляцию между переменными: дети, которые проводят больше времени, играя в жестокие видеоигры, имеют более высокие показатели агрессивного поведения.

Задача с третьей переменной

Без контролируемых экспериментов трудно сказать, вызвала ли интересующая вас переменная изменения в другой переменной. Посторонние переменные — это любые третьи переменные , отличные от интересующих вас переменных, которые могут повлиять на ваши результаты.

Ограниченный контроль в корреляционных исследованиях означает, что посторонние или смешанные переменные служат альтернативными объяснениями результатов. Вмешивающиеся переменные могут создать впечатление, что корреляционная связь является причинно-следственной, хотя это не так.

Пример: посторонние и смешанные переменные. В вашем исследовании жестоких видеоигр и агрессии родительское внимание является смешанной переменной, которая может влиять на то, как часто дети используют жестокие видеоигры, и на их поведенческие тенденции. Низкое родительское внимание может привести к жестокому использованию видеоигр и агрессивному поведению у детей.

Но это не то, что вы контролируете, поэтому вы можете сделать вывод только о корреляции между вашими основными переменными.

Когда две переменные коррелированы, все, что вы можете сказать, это то, что изменения в одной переменной происходят одновременно с изменениями в другой.

Ложные корреляции

Ложная корреляция — это когда две переменные кажутся связанными через скрытые третьи переменные или просто по совпадению.

Пример: Ложная корреляция В Германии и Дании статистические данные показывают четкую положительную корреляцию между популяцией аистов и коэффициентом рождаемости за несколько десятилетий. Поскольку популяция аистов колеблется, меняется и количество новорожденных. Как вы объясняете эту закономерность?

Теория аиста устанавливает простую причинно-следственную связь между переменными, чтобы доказать, что аисты физически рожают детей. Это сатирическое исследование показывает, почему нельзя установить причинно-следственную связь только на основе корреляционного исследования.

В действительности корреляция может быть объяснена третьими переменными (такими как погодные условия, изменения окружающей среды и т. д.), которые вызвали увеличение популяций как аистов, так и людей, или связь может быть чисто случайной.

При анализе корреляций в большом наборе данных со многими переменными шансы найти хотя бы один статистически значимый результат высоки. В этом случае вы, скорее всего, совершите ошибку первого рода. Это означает ошибочный вывод о наличии истинной корреляции между переменными в генеральной совокупности на основе искаженных выборочных данных.

Проблема направленности

Чтобы продемонстрировать причинно-следственную связь, вам нужно показать направленную связь без альтернативных объяснений. Эта связь может быть однонаправленной, когда одна переменная влияет на другую, или двунаправленной, когда обе переменные влияют друг на друга.

Корреляционный план не сможет различить ни одну из этих возможностей, но экспериментальный план может проверить каждое возможное направление по одному.

Пример: проблема направленности Переменные физической активности и самооценки могут быть причинно связаны тремя способами:
  • Физическая активность может повлиять на самооценку
  • Самооценка может влиять на физическую активность
  • Физическая активность и самооценка могут влиять друг на друга

В корреляционных исследованиях направленность взаимосвязи неясна, поскольку исследовательский контроль ограничен. Вы рискуете сделать вывод об обратной причинно-следственной связи, неправильном направлении отношений.

Причинное исследование

Причинно-следственные связи между переменными могут быть достоверно продемонстрированы только в контролируемых экспериментах. Эксперименты проверяют формальные предсказания, называемые гипотезами, для установления причинно-следственной связи в одном направлении за раз.

Эксперименты обладают высокой внутренней достоверностью, поэтому причинно-следственные связи могут быть продемонстрированы с достаточной степенью уверенности.

Вы можете установить направленность в одном направлении, потому что вы манипулируете независимой переменной перед измерением изменения зависимой переменной.

Пример: проверка направленности в экспериментальном плане. Вы считаете, что уровень физической активности влияет на самооценку, поэтому проверяете эту гипотезу в эксперименте. Вы применяете вмешательство физической активности и измеряете изменения в самооценке. Чтобы установить направленность, ваше вмешательство в физическую активность должно предшествовать любому наблюдаемому изменению самооценки.

Чтобы проверить, является ли эта связь двунаправленной, вам нужно разработать новый эксперимент, оценивающий, может ли самооценка влиять на уровень физической активности.

В контролируемом эксперименте вы также можете исключить влияние третьих переменных, используя случайное назначение и контрольные группы.

Случайное распределение помогает равномерно распределить характеристики участников между группами, чтобы они были похожи и сопоставимы. Контрольная группа позволяет сравнить экспериментальную манипуляцию с аналогичным лечением или отсутствием лечения.

Пример: контроль третьих переменных в плане эксперимента. Вы случайным образом помещаете каждого участника в контрольную или экспериментальную группу. Случайное назначение устраняет влияние третьих переменных характеристик участников, таких как возраст или состояние психического здоровья, которые могут повлиять на ваши результаты.

Контрольная группа получает несвязанное, сопоставимое вмешательство, в то время как экспериментальная группа получает вмешательство физической активности. Если все переменные между группами остаются постоянными, за исключением вашей обработки независимой переменной, любые различия между группами можно отнести к вашему вмешательству.

Часто задаваемые вопросы о корреляции и причинно-следственной связи

Что такое корреляция?

Корреляция отражает силу и/или направление связи между двумя или более переменными.

  • Положительная корреляция означает, что обе переменные изменяются в одном направлении.
  • А отрицательная корреляция означает, что переменные изменяются в противоположных направлениях.
  • Нулевая корреляция означает отсутствие связи между переменными.
В чем разница между корреляцией и причинно-следственной связью?

Проблема третьей переменной и направленности — две основные причины, по которым корреляция не является причинно-следственной.

Проблема с третьей переменной означает, что смешанная переменная влияет на обе переменные, заставляя их казаться причинно связанными, хотя на самом деле это не так.

Проблема направленности возникает, когда две переменные коррелируют и могут фактически иметь причинно-следственную связь, но невозможно сделать вывод, какая переменная вызывает изменения в другой.

В чем разница между корреляционным и экспериментальным исследованием?

Контролируемые эксперименты устанавливают причинно-следственную связь, тогда как корреляционные исследования показывают только связи между переменными.

  • В экспериментальном плане вы манипулируете независимой переменной и измеряете ее влияние на зависимую переменную. Другие переменные контролируются, поэтому они не могут повлиять на результаты.
  • В корреляционном плане вы измеряете переменные, не манипулируя ни одной из них.

Добавить комментарий

Ваш адрес email не будет опубликован.