Внешняя валидность — Психологос
Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.
Общие сведения
Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.
Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.
Критерии внешней валидности
Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на
- другие популяции,
- другие условия,
- другое время.
Пример нарушения внешней валидности
Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.
Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно генерализовал свою модель на представителей обоих полов.
Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.
Соблюдение внешней валидности
Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.
При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.
4.
Внешняя валидность исследования, критерии оценки, факторы, угрожающие внешней валидности.Внешняя валидность — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.
Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.
При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.
Критерии внешней валидности
Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на другие популяции, другие условия, другое время.
5. «Корреляционные» планы, исследования «ex — post — facto», их отличия от плана «безупречного эксперимента».
Знакомство с планами сбора данных при использовании корреляционного подхода важно с точки зрения как учета тех ограничений, которые обычно накладывает план сбора данных на последующие возможности их интерпретации, так и корректного использования способов статистической обработки. Планы корреляционных исследований нужно рассматривать как формы контроля при получении эмпирических данных, т.е. это аналог форм экспериментального контроля. Не приводя новых примеров, постараемся эксплицировать эти планы как схемы уже цитированных исследований. Планы ех-роst-fасtо
В заключение рассмотрим еще один специфический метод, который часто применяется в психологии. У него есть несколько наименований: эксперимент, на который ссылаются, эксперимент ех-post-facto и т.д. Он часто применяется в социологии, педагогике, а также в нейропсихологии и клинической психологии. В социологических исследованиях его часто использовали в 30 — 40-е годы. Тогда же социолог Ф.С.Чейз ввел название этого метода и разработал схемы анализа данных. В социологии и педагогике стратегия его применения состоит в следующем. Экспериментатор сам не воздействует на испытуемых. В качестве воздействия (позитивного значения независимой переменной) выступает некоторое реальное событие из их жизни. Отбирается группа «испытуемых», подвергшаяся воздействию, и группа, не испытавшая его. Отбор осуществляется на основании данных об особенностях «испытуемых» до воздействия; в качестве сведений могут выступать личные воспоминания и автобиографии, сведения из архивов, анкетные данные, медицинские карты и т.д. Затем проводится тестирование зависимой переменной у представителей «экспериментальной» и контрольной групп. Данные, полученные в результате тестирования групп, сопоставляются и делается вывод о влиянии «естественного» воздействия на дальнейшее поведение испытуемых. Тем самым план ex-post-facto имитирует схему эксперимента для двух групп с их уравниванием (лучше — рандомизацией) и тестированием после воздействия.
Эквивалентность групп достигается либо методом рандомизации, либо попарного уравнивания, при котором сходные индивиды относятся к разным группам. Метод рандомизации дает более надежные результаты, но применим лишь тогда, когда выборка, из которой мы формируем контрольную и основную группы, достаточно велика.
Этот план реализуется во многих современных исследованиях. Типичным является исследование посттравматического стресса, который возникает у некоторых лиц, оказавшихся в ситуациях, выходящих за пределы обычного жизненного опыта, связанных с угрозой для здоровья человека и его жизни. Посттравматический стресс встречается у многих (но не у всех) участников войны, жертв насилия, свидетелей и жертв природных и техногенных катастроф и т.д. Изучение причин возникновения посттравматического стресса проводится по схеме: выделяется выборка лиц, перенесших воздействие боевой ситуации, катастрофы и т.п., тестируется на предмет наличия посттравматического синдрома; результаты сопоставляются с результатами контрольной выборки. Наилучшей стратегией формирования основной и контрольной выборки является предварительный отбор » испытуемых» для тестирован ия на основе ан кетн ых данных и рандомизация групп. Но в реальности может проводиться диагностика только тех лиц, перенесших воздействие травматического фактора, которые сами обращаются с просьбой пройти обследование к психологам либо врачам. Таким образом, существует риск, что выборка добровольцев будет сильно отличаться от всей популяции перенесших травматическое воздействие. В первую очередь эти отличия проявляются в повышенной частоте встречаемости синдрома посттравматического стресса. Эффект воздействия травматического фактора на популяцию будет преувеличен. И вместе с тем эксперимент ex-post-facto — единственно возможный способ проведения таких исследований (над этими проблемами работает лаборатория психологии посттравматических состояний Института психологии РАН, руководитель — Н.В.Тарабрина).
Метод ex-post-facto часто применяется в нейропсихологии: травмы головного мозга, поражения определенных структур предоставляют уникальную возможность для выявления локализации психических функций.
Внутренняя и внешняя валидность в психологии
Внутренняя и внешняя валидность — это две концепции, которые помогают нам определить, насколько достоверны и значимы результаты исследования.
Внутренняя валидность относится к тому, насколько хорошо результаты исследования отражают истинные причинно-следственные связи в рамках исследования, а внешняя валидность относится к степени, в которой результаты исследования могут быть обобщены для других условий или групп населения.
Внутренняя валидность относится к тому, насколько хорошо проведено исследование (его план эксперимента и методы), а внешняя валидность относится к тому, насколько применимы и обобщаемы результаты для всего мира.Содержание
Внутренняя действительность
Внутренняя валидность относится к степени уверенности в том, что проверяемая причинно-следственная связь существует и заслуживает доверия.
Проверяет вероятность того, что ваше лечение стало причиной наблюдаемых вами различий в результатах. Внутренняя валидность во многом определяется экспериментальным планом и методами исследования.
Исследования с высокой степенью внутренней валидности предоставляют убедительные доказательства причинно-следственной связи, что позволяет исключить альтернативные объяснения вывода.
Исследования с низкой внутренней валидностью дают слабые доказательства причинно-следственной связи. Чем меньше вероятность смешанных или посторонних переменных, тем выше внутренняя достоверность и тем больше мы можем быть уверены в наших выводах.
Чтобы предположить причину и следствие в научном исследовании, причина должна предшествовать следствию с точки зрения времени, причина и следствие должны варьироваться вместе, и не должно быть никаких других объяснений наблюдаемой взаимосвязи. Если эти три критерия соблюдены, вы можете быть уверены, что исследование является внутренне валидным.
Внешняя действительность
Внешняя валидность относится к степени, в которой результаты исследования могут быть применены или обобщены в другом контексте.
Это важно, поскольку при установлении внешней валидности результаты исследования могут быть распространены на более широкую популяцию, а не только на относительно небольшое число субъектов, участвовавших в исследовании. В отличие от внутренней валидности, внешняя валидность не оценивает причинно-следственную связь и не исключает искажающих факторов.
Существует два типа внешней валидности: экологическая валидность и популяционная валидность.
- Экологическая валидность относится к тому, могут ли результаты исследования быть обобщены на другие ситуации или условия. Высокая экологическая валидность означает, что существует высокая степень сходства между экспериментальной установкой и другой обстановкой, и, таким образом, мы можем быть уверены, что результаты будут обобщены на эту другую обстановку.
- Валидность совокупности относится к тому, насколько хорошо экспериментальная выборка представляет другие совокупности или группы. Использование методов случайной выборки, таких как стратифицированная выборка или кластерная выборка, значительно помогает повысить достоверность совокупности.
Компромисс между внутренней и внешней валидностью
В экспериментальных исследованиях существует тенденция к отрицательной корреляции между внутренней и внешней валидностью. Это означает, что эксперименты с высокой внутренней валидностью, скорее всего, будут иметь низкую внешнюю валидность, и наоборот.
Это происходит потому, что экспериментальные условия, обеспечивающие более высокую степень внутренней валидности (например, искусственные лаборатории), вряд ли будут соответствовать реальным условиям. Таким образом, внешняя валидность слабее, потому что лабораторная среда сильно отличается от реального мира.
С другой стороны, для получения более высоких степеней внешней валидности нужны экспериментальные условия, соответствующие реальным условиям (например, наблюдательные исследования).
Однако это происходит за счет внутренней валидности, поскольку такие типы исследований повышают вероятность смешения переменных и альтернативных объяснений различий в результатах.
Решением этой проблемы является репликация! Вы хотите провести исследование в нескольких средах и условиях — сначала в контролируемой искусственной среде, чтобы установить наличие причинно-следственной связи, а затем в «реальных» условиях, чтобы проанализировать, можно ли обобщать результаты.
Внутренняя и внешняя валидность
Валидность относится к надежности плана исследования и его методов. При разработке исследования необходимо учитывать как внутреннюю валидность, так и внешнюю валидность.
Они оба влияют на достоверность результатов исследования и могут помочь определить, имеют ли результаты исследования значение или нет.
Оба они должны быть указаны в любых опубликованных научных статьях, чтобы другие исследователи могли оценить исследование и определить, являются ли результаты полезными и достоверными.
Основное различие между ними состоит в том, что внутренняя валидность относится к структуре исследования и взаимосвязи между его переменными, тогда как внешняя валидность относится к универсальности результатов. Внутренняя валидность связана с контролем; он предназначен для измерения точности эксперимента.
Внешняя валидность, с другой стороны, связана с естественностью; он предназначен для проверки того, можно ли обобщить причинно-следственную связь между зависимой и независимой переменными на реальный мир или нет.
Угрозы внутренней действительности
Отсев
Отсев относится к потере участников исследования с течением времени. Участники могут выйти из исследования или покинуть его, что означает, что результаты основаны исключительно на предвзятой выборке только тех людей, которые не решили покинуть исследование.
Различия в показателях отсева между экспериментальной и контрольной группами могут исказить результаты, повлияв на взаимосвязь между независимыми и зависимыми переменными и, таким образом, повлиять на внутреннюю валидность исследования.
Вмешивающиеся факторы
Вмешивающаяся переменная — это неизмеряемая третья переменная, которая влияет или «смешивает» взаимосвязь между независимой и зависимой переменными, предполагая наличие ложной корреляции.
Вмешивающиеся факторы представляют собой угрозу внутренней валидности, потому что вы не можете сказать, является ли прогнозируемая независимая переменная причиной результата или смешанная переменная.
Систематическая ошибка выбора участников
Это систематическая ошибка, которая может возникнуть в результате выбора или распределения исследовательских групп таким образом, что надлежащая рандомизация не достигается.
Если участники не распределяются по группам случайным образом, полученная выборка может не быть репрезентативной для исследуемой популяции. Например, некоторые члены населения могут быть включены с меньшей вероятностью, чем другие, из-за мотивации, желания принять участие в исследовании или демографических данных.
Предвзятость экспериментатора
Предвзятость экспериментатора возникает, когда экспериментатор ведет себя по-разному с разными группами в исследовании, что влияет на результаты и ставит под угрозу внутреннюю достоверность. Это может быть устранено с помощью ослепления.
Социальное взаимодействие (диффузия)
Распространение относится к случаям, когда лечение в исследовании распространяется внутри или между экспериментальной и контрольной группами. Это может произойти, когда есть взаимодействие или наблюдение между группами.
Распространение представляет угрозу для внутренней валидности, поскольку может привести к деморализации обиды. Это когда контрольная группа менее мотивирована, потому что они обижаются на группу, в которой они находятся.
Исторические события
Исторические события могут повлиять на результаты исследований, которые происходят в течение более длительных периодов времени. Например, смена политического руководства, стихийные бедствия или другие непредвиденные события могут изменить условия исследования и повлиять на результаты.
Инструментарий
Инструментарий относится к любому изменению зависимой переменной в исследовании, которое возникает в результате изменений в используемом измерительном инструменте. Это происходит, когда на этапах до и после тестирования используются разные меры.
Созревание
Созревание относится к влиянию времени на исследование. Если результаты исследования изменяются как естественный результат времени, может оказаться невозможным определить, были ли эффекты, наблюдаемые в исследовании, следствием исследуемого лечения или просто влиянием времени.
Статистическая регрессия
Регрессия к среднему значению относится к тому факту, что если одна выборка случайной величины является экстремальной, следующая выборка той же случайной величины, вероятно, будет ближе к ее среднему значению.
Это угроза внутренней валидности, поскольку участники, находящиеся на крайних этапах лечения, могут естественным образом падать в определенном направлении из-за течения времени, а не из-за прямого эффекта вмешательства.
Повторное тестирование
Повторное тестирование участников исследования с использованием одних и тех же мер повлияет на результаты вашего исследования, поскольку участники привыкнут к тестированию. Благодаря знакомству или осознанию цели исследования многие участники могут со временем добиться лучших результатов.
Угрозы внешней валидности
Характеристики выборки
Если некоторые характеристики использованной выборки были ответственны за эффект, это могло привести к ограниченной обобщаемости результатов.
Исторические события
Исторические события могут повлиять на результаты исследований, которые происходят в течение более длительных периодов времени. Например, смена политического руководства, стихийные бедствия или другие непредвиденные события могут изменить условия исследования и повлиять на результаты.
Смещение выбора участников
Это смещение, которое может возникнуть в результате выбора или распределения исследовательских групп таким образом, что надлежащая рандомизация не достигается. Если участники не распределяются по группам случайным образом, полученная выборка может не быть репрезентативной для населения, предназначенного для изучения.
Например, вероятность включения некоторых членов группы населения ниже, чем у других, из-за мотивации, желания принять участие в исследовании или демографических данных.
Ситуационные факторы
Такие факторы, как обстановка, время суток, местоположение, характеристики исследователей, шум или количество измерений, могут повлиять на обобщаемость результатов.
Повторное тестирование
Повторное тестирование участников исследования с использованием одних и тех же мер повлияет на результаты вашего исследования, поскольку участники привыкнут к тестированию. Благодаря знакомству или осознанию цели исследования многие участники могут со временем добиться лучших результатов.
Взаимодействие «приспособление-лечение» → «Применение-лечение» Взаимодействие с представлением о том, что некоторые виды лечения более или менее эффективны для конкретных людей в зависимости от их конкретных способностей или характеристик.
Эффект Хоторна
Эффект Хоторна относится к тенденции участников изменять свое поведение просто потому, что они знают, что их изучают.
Эффект экспериментатора
Предвзятость экспериментатора возникает, когда экспериментатор ведет себя по-разному с разными группами в исследовании, влияя на результаты и угрожая внешней валидности.
Эффект Джона Генри
Эффект Джона Генри относится к склонности участников контрольной группы активно работать усерднее, потому что они знают, что участвуют в эксперименте и хотят преодолеть «недостаток» пребывания в контрольной группе.
Факторы, улучшающие внутреннюю валидность
Ослепление
Ослепление относится к практике, когда участники (а иногда и исследователи) не знают, какое вмешательство они получают.
Это уменьшает влияние посторонних факторов и сводит к минимуму систематическую ошибку, поскольку любые различия в исходах могут быть связаны с вмешательством, а не со знанием участником того, получали ли они новое лечение или нет.
Случайная выборка
Использование случайной выборки для получения выборки, представляющей совокупность, которую вы хотите изучить, повысит внутреннюю достоверность.
Случайное распределение
Использование случайного распределения для распределения участников по контрольной и лечебной группам гарантирует отсутствие систематической ошибки среди исследовательских групп.
Строгий протокол исследования
Тщательно контролируемые эксперименты, как правило, улучшают внутреннюю достоверность. Эксперименты, проводимые в лабораторных условиях, как правило, имеют более высокую достоверность, поскольку это снижает изменчивость из-за других источников, помимо лечения.
Экспериментальное манипулирование
Манипулирование независимой переменной в исследовании, в отличие от простого наблюдения связи без проведения вмешательства, повышает внутреннюю достоверность.
Факторы, улучшающие внешнюю валидность
Репликация
Повторное проведение исследования с другим образцом или в других условиях для проверки повторения результатов может помочь улучшить внешнюю валидность.
Если по одной и той же теме было проведено несколько исследований, можно использовать метаанализ, чтобы определить, можно ли воспроизвести эффект независимой переменной, что сделает его более надежным.
Репликация — самый сильный метод противодействия угрозам внешней валидности за счет улучшения обобщаемости для других настроек, популяций и условий.
Полевые эксперименты
Проведение исследования вне лаборатории, в естественных, реальных условиях улучшит внешнюю валидность (однако это поставит под угрозу внутреннюю валидность)
Вероятностная выборка
быть уверенным, что все в популяции имеют равные шансы быть отобранными для выборки для исследования.Повторная калибровка
Повторная калибровка — это использование статистических методов для поддержания точности, стандартизации и воспроизводимости измерений для обеспечения надежных результатов.
Повторное взвешивание групп, если в исследовании были неравные группы по определенной характеристике (например, возрасту), является примером калибровки.
Критерии включения и исключения
Установление критериев того, кто может участвовать в исследовании, а кто нет, обеспечит четкое определение изучаемой совокупности и репрезентативность выборки.
Психологический реализм
Психологический реализм относится к процессу обеспечения того, чтобы участники воспринимали экспериментальные манипуляции как реальные события, чтобы не раскрыть цель исследования и чтобы участники не вели себя иначе, чем в реальной жизни, на основе знания цель исследования.
Примеры валидности
Внутренняя валидность
Примером исследования с высокой внутренней валидностью может быть, если вы хотите провести эксперимент, чтобы увидеть, поможет ли использование конкретной таблетки для похудения людям похудеть.
Чтобы проверить эту гипотезу, вы должны случайным образом распределить выборку участников в одну из двух групп: тех, кто примет таблетку для похудения, и тех, кто примет таблетку плацебо.
Вы можете гарантировать отсутствие предвзятости в распределении участников по группам, ослепив помощников исследователей, чтобы они не знали, какие участники входят в какие группы во время эксперимента. Участники также ослеплены, поэтому они не знают, получают ли они вмешательство или нет.
Если участники выбывают из исследования, их характеристики проверяются, чтобы убедиться в отсутствии систематической предвзятости в отношении того, кто выбыл.
Важно иметь хорошо продуманную процедуру исследования, чтобы уменьшить угрозы внутренней валидности.
Внешняя достоверность
Примером исследования с высокой внешней достоверностью может быть гипотеза о том, что практика осознанности 2 раза в неделю улучшит психическое здоровье людей с диагнозом депрессия.
Вы набираете людей в возрасте от 18 до 29 лет, у которых депрессия диагностирована не менее года назад. Выбор этой репрезентативной выборки с четко определенной изучаемой совокупностью помогает обеспечить внешнюю достоверность.
Вы даете участникам предварительное и последующее тестирование, чтобы определить, как часто они испытывали симптомы депрессии на прошлой неделе.
Во время исследования все участники прошли индивидуальную тренировку осознанности и попросили практиковать осознанность ежедневно в течение 15 минут в рамках утренней рутины.
Вы также можете воспроизвести результаты исследования, используя другие методы осознанности или разные выборки участников.
- ЭЛЕКТРОННАЯ ПОЧТА
- ФЕЙСБУК
Значение, тип и трактовки (Полное руководство)
Внешняя валидность — одна из основных целей исследователей, пытающихся установить достоверные причинно-следственные связи в качественных исследованиях.
На самом деле, если исследование имеет внешнюю валидность, это означает, что результаты исследования могут быть распространены на другие группы населения, ситуации или условия.
Таким образом, внешняя валидность является неотъемлемой частью психологических исследований, проводимых за пределами лаборатории. Почему?
Потому что без внешней валидности исследования нельзя обобщать, а исследователи не могут применять результаты исследований в реальном мире.
Тем не менее, иногда они предпочитают изучать причинно-следственные связи между переменными вместо того, чтобы обобщать результаты.
В этой статье мы исследуем значение внешней валидности и обсудим, почему она так важна для получения достоверных результатов.
Мы также рассмотрим 3 типа внешней валидности и факторы, которые улучшают или ухудшают ее. В конце мы сравним внешнюю валидность с внутренней валидностью.
Что такое внешняя валидность? Определение и значение
В общем, валидность относится к степени, в которой психологический инструмент оценивает именно то, что он претендует на оценку.
И главная ценность валидности в том, что если инструмент валиден, то результаты, полученные с его помощью, можно считать точными и поддающимися интерпретации.
Американская психологическая ассоциация (АПА) определяет валидность как «степень, в которой эмпирические данные и теоретические обоснования подтверждают адекватность и уместность выводов, сделанных на основе той или иной формы оценки».
В настоящее время исследователи пытаются достичь нескольких форм валидности, таких как внутренняя валидность, конструктивная валидность или валидность лица. Внешняя валидность является одним из них.
Внешняя валидность – это характеристика экспериментов или исследований, проводимых в естественных условиях, и связана с обобщаемостью результатов.
В то время как исследования, проводимые в лабораторных условиях, сосредоточены на выявлении причинно-следственных связей с использованием надежных методов исследования, исследования с высокой внешней достоверностью максимально приближены к реальной ситуации.
В результате результаты могут быть обобщены на реальные популяции.
Обобщаемость показывает, насколько полезно исследование для пограничных ситуаций и более широких типов людей.
Если результаты можно обобщить, это означает, что выборка репрезентативна для всего населения.
Следовательно, исследователь может заявить, что его исследование действительно стоило того, чтобы потратить столько усилий, времени и ресурсов, поскольку результаты будут использоваться в реальных жизненных ситуациях.
Вот как «обобщаемость» и «репрезентативность» связаны с внешней валидностью (Kukull & Ganguli, 2012).
Почему важна внешняя валидность?
Какова, вообще говоря, основная цель любого психологического исследования?
Проще говоря, цель проведения исследований — расширить знания в определенной области, найти реальные решения определенных проблем или получить результаты, которые помогут людям понять их проблемы или улучшить качество их жизни.
Независимо от того, проводите ли вы образовательное исследование, исследование лекарств, исследование продукта или какое-либо рецензируемое исследование, внешняя валидность необходима, чтобы гарантировать, что результаты могут быть применены к реальному миру.
Обычно исследователи, которых волнует внешняя валидность, предпочитают проводить полевое исследование, потому что полевые исследования сопровождаются более высокой внешней валидностью, чем лабораторные исследования.
Однако иногда также возможно манипулировать ситуацией и провести эксперимент с высокой внешней валидностью.
На сегодняшний день существует множество научной литературы, освещающей тему важности внешней валидности для исследований (например, Steckler & McLeroy, 2008).
И действительно, если исследователь стремится использовать свои результаты в реальной жизни, он обязан доказать, что исследование имеет внешнюю валидность и может быть распространено на более широкие ситуации и условия.
В противном случае исследование невозможно воспроизвести в других ситуациях, и ценность исследования будет поставлена под сомнение.
3 типа внешней валидности с примерами
В зависимости от направленности конкретного исследования исследователи обычно пытаются достичь различных типов валидности.
Подобно внутренней, конструктной и другим типам валидности, внешняя валидность имеет свои подтипы.
Обычно существует 3 основных типа внешней валидности: 1. популяционная валидность; 2. экологическая обоснованность; и 3. временная действительность.
Мы обсудим каждый из них ниже и приведем несколько примеров для лучшего понимания.
Популяционная валидность
Популяционная валидность — это тип внешней валидности, который оценивает степень, в которой результаты исследования могут быть обобщены на большую популяцию.
В данном случае под населением понимается группа людей, о которых исследователь пытается сделать выводы.
В отличие от этого выборка представляет собой определенную группу, которая принимает участие в исследовании.
Если результаты, полученные на выборке, могут быть применены к большей популяции, то это означает, что исследование имеет широкую популяционную валидность.
Примеры валидности населения
Вы хотите оценить гипотезу о взаимосвязи между физическими упражнениями и сном. Вы прогнозируете, что регулярное участие в лечебных упражнениях улучшает качество сна у взрослых.
Ваша целевая группа — взрослые американцы, но ваша выборка состоит примерно из 300 студентов университетов.
Несмотря на то, что все они являются взрослыми, в этом случае может быть трудно обеспечить достоверность совокупности, поскольку модель выборки учащихся не представляет все взрослое население США.
Таким образом, ваше исследование имеет низкую валидность для популяции, и результаты вашего исследования не могут быть распространены на большую популяцию.
Экологическая валидность
Экологическая валидность также является формой внешней валидности, которая представляет собой степень, в которой вы можете точно обобщать результаты исследования в различных контекстах.
Проще говоря, экологическая достоверность связана с возможностью применения ваших открытий в реальном мире.
Таким образом, если исследование имеет высокую экологическую достоверность, результаты могут быть обобщены в реальных условиях.
Однако низкая экологическая валидность означает, что результаты нельзя применять вне экспериментальной ситуации.
Примеры экологической валидности
Эксперимент Милгрэма — классический пример низкой экологической валидности.
В 1960-х годах социальный психолог Стэнли Милграм провел серию экспериментов, чтобы изучить концепцию подчинения властям.
Он случайным образом выбрал участников и велел им использовать электрические разряды все более высокого напряжения, чтобы наказать актеров, сообщивших неправильные ответы на свои вопросы.
Хотя шок был ненастоящим, а реакции жертв также были сфальсифицированы, исследование показало высокую степень подчинения властям.
Это исследование содержит революционные результаты для социальной психологии. Однако его часто критикуют из-за низкой экологичности.
На самом деле, ситуация, созданная Милгрэмом, отличалась от реальных ситуаций.
В ходе эксперимента он создал ситуацию, когда участники не могли избежать подчинения авторитету. Но реальная ситуация может быть иной.
Временная валидность
Помимо населения и смешанных факторов, время также является важным фактором, когда речь идет об определении внешней валидности.
Временная достоверность связана с течением времени в отношении результатов. В частности, этот тип валидности относится к степени, в которой результаты исследования могут быть обобщены на другой период времени.
Таким образом, высокая временная достоверность означает, что результаты исследования могут быть точно применены к различным периодам времени, а переменные по-прежнему будут актуальны в будущем.
Примеры временной валидности
Представьте, что вы Соломон Аш и проводите исследование конформизма.
Вы обнаружили, что социальное давление со стороны большинства существенно влияет на решения меньшинства. В результате люди действуют конформно.
Несмотря на то, что Аш провел это исследование еще в 1950-х годах, его результаты по-прежнему применимы в реальных ситуациях сегодняшнего дня.
Таким образом, это исследование имеет временную достоверность даже спустя почти столетие.
Список угроз внешней валидности
Как мы уже говорили, добиться внешней валидности непросто, поскольку существует несколько потенциальных угроз, препятствующих внешней валидности.
Различные ситуационные факторы, особенности образца, эффекты до и после тестирования или эффекты тестирования являются некоторыми из потенциальных факторов, которые могут восприниматься как угрозы внешней валидности.
Таким образом, хороший исследователь всегда обращает внимание на следующие факторы, чтобы обеспечить внешнюю достоверность исследования.
Эффекты до и после тестирования
Эффекты до и после тестирования являются одними из наиболее распространенных факторов, существенно влияющих на внешнюю валидность.
Предварительное тестирование — это опрос, анкета или другой тип исследовательского инструмента, который используется до начала фактического процесса проведения исследования.
Пост-тест — это заключительный этап исследования, который проводится по прошествии некоторого времени с момента его проведения, чтобы убедиться, что результаты все еще применимы.
К сожалению, предварительные и последующие тесты часто мешают обобщаемости результатов.
Причина в том, что добавленные тесты устраняют эффект причинно-следственной связи между переменными и, как следствие, создают угрозу внешней валидности.
Признаки выборки
Степень внешней валидности существенно зависит от типа выборки. Выборка является частью целевой совокупности.
На самом деле результаты следует обобщать на популяцию на основе характеристик выборки, а это означает, что разумный выбор участников является одним из важнейших факторов, влияющих на внешнюю валидность исследования.
В то время как невероятностные методы выборки, при которых участники выбираются не случайным образом и, следовательно, не представляют совокупность, представляют угрозу для внешней валидности, вероятностная выборка противостоит систематической ошибке отбора и гарантирует, что каждый член совокупности имеет равные шансы быть выбранным в образце.
Смещение выбора
Смещение выбора — еще одна угроза внешней валидности, связанная с ошибкой при выборе участников, принимающих участие в исследовании.
Для обеспечения внешней валидности важно, чтобы субъекты имели сходные черты друг с другом и представляли большую часть населения.
В противном случае их результаты нельзя обобщать. Вот почему исследователи пытаются корректировать взвешивание факторов и контролировать их.
Но иногда трудно избежать предвзятости при отборе, особенно когда участники представляют определенные группы, такие как клинические пациенты или преступники.
В этих случаях методология исследования часто не позволяет исследователям обеспечить внешнюю валидность.
Ситуационные факторы
Широкий спектр ситуационных факторов влияет на внешнюю валидность исследования.
В частности, смешанные переменные, такие как местоположение, время суток, шум, температура и даже характеристики исследователя, существенно влияют на то, как участники реагируют на исследовательские манипуляции.
Вот почему важно максимально контролировать эти ситуационные эффекты, чтобы избежать предвзятости и обеспечить внешнюю достоверность.
Эффект Хоторна
Одним из специфических факторов, влияющих на внешнюю валидность, является так называемый эффект Хоторна.
Это распространенное понятие в социальной психологии, которое отражает тенденцию участников исследования изменять свое поведение, чтобы соответствовать требованиям исследователей.
Причиной такого поведения является естественная потребность казаться социально желанной. В результате участники действуют приятным образом, что влияет на результаты и снижает точность выводов.
Взаимодействие «приспособление-лечение»
Взаимодействие «применение-лечение» (ATI) означает, что вмешательства в исследовании соответствуют атрибутам и характеристикам участника.
Причина, по которой этот фактор влияет на внешнюю валидность, заключается в том, что взаимодействия между характеристиками участников влияют на зависимую переменную и не позволяют исследователю эффективно контролировать или манипулировать ею.
Следовательно, обращение со способностями представляет собой еще одну серьезную угрозу внешней валидности.
Факторы, улучшающие внешнюю валидность
Учитывая, что иногда точность результатов исследования почти полностью зависит от внешней валидности, исследователи часто пытаются искать пути повышения внешней валидности.
Повторение исследования, учет психологического реализма, проведение полевых экспериментов или усиление рандомизации — вот некоторые из факторов, которые помогают улучшить внешнюю валидность.
Рассмотрим психологический реализм
На первый взгляд, словосочетание «психологический реализм» может показаться несколько сложным, но на самом деле оно означает, что участники исследования воспринимают экспериментальные манипуляции как реальные события.
Для этого иногда необходимо прикрыть историю и не раскрывать настоящую цель исследования, пока исследование не будет закончено.
В противном случае участники могут попытаться выглядеть социально желанными и вести себя по-другому.
Таким образом, рассмотрение психологического реализма — это один из способов улучшить внешнюю достоверность и обобщить результаты в условиях реальной жизни.
Повторная обработка или калибровка
Исследователи часто используют различные статистические методы для обеспечения или улучшения внешней достоверности.
Например, повторная обработка данных с использованием калибровочных таблиц позволяет исследователям вернуться назад и повторно обработать данные, чтобы избежать ошибок при интерпретации результатов.
Это может быть наилучшим вариантом, когда в данных есть некоторые проблемы, такие как наличие неравных групп или различных характеристик.
Репликация
Репликация — один из наиболее часто используемых методов, когда результаты не демонстрируют внешней достоверности.
Чтобы повысить достоверность, исследователи часто используют этот метод, что означает использование разных образцов из одной и той же целевой группы. Если они получают одинаковые результаты, то это означает, что исследование имеет высокую внешнюю валидность.
Но если результаты отличаются от предыдущей выборочной группы после повторения, то их результаты нельзя обобщать на популяцию.
Попробуйте полевые эксперименты
Еще один способ обеспечить внешнюю достоверность — провести эксперимент за пределами лаборатории.
Проведение полевого исследования в естественных условиях, а не в лаборатории, где исследователь должен сам манипулировать всеми переменными, является проверенным способом повышения внешней достоверности.
Тем не менее, исходя из целей и специфики исследования, не всегда возможно проводить полевые эксперименты.
Используйте критерии включения и исключения
Использование критериев включения и исключения при выборе участников для вашей выборки из целевой совокупности гарантирует, что вы точно определили совокупность и что выборка репрезентативна для совокупности.
В результате вероятность получения надежных и достоверных результатов увеличивается в соответствии со степенью внешней достоверности.
Увеличить рандомизацию
Рандомизация — это процесс, при котором участники распределяются по испытаниям совершенно случайно.
В этом случае ни участник, ни исследователь не знают, к какой группе участников относится.
В результате усиление рандомизации может повлиять на внешнюю валидность и повысить ее степень.
Причина в том, что рандомизация повышает обобщаемость ваших результатов.
Внешн. Внутренняя валидность
Внутренняя валидность — это еще один тип валидности, почти полная противоположность внешней валидности.
Фактически, внутренняя валидность — это степень надежности оцениваемой причинно-следственной связи и отсутствия влияния других факторов на переменные.
Внутренняя валидность измеряет внутреннюю согласованность используемого исследовательского инструмента или метода, а не обобщаемость результатов.
Основное различие между внешней и внутренней валидностью заключается в том, что внутренняя валидность связана с внутренней структурой методов исследования, а внешняя валидность пытается доказать универсальность результатов.
Кроме того, для достижения внутренней валидности исследователи обычно используют надежные методы исследования и строго контролируют внешние факторы.
С другой стороны, высокая внешняя валидность означает, что результаты могут быть применены к практическим ситуациям и различным контекстам.
Соответственно, результаты исследований, обладающих высокой внутренней валидностью, доказывают достоверность причинно-следственной связи между переменными, но ничего не говорят о возможности обобщения результатов.
Напротив, если исследование имеет внешнюю валидность, его результаты могут быть применены ко всей популяции.
Часто задаваемые вопросы о внешней валидности
Что является примером внешней валидности?
Пол — исследователь, и в настоящее время он принимает участие в проведении исследований рака для улучшения фармакологических методов лечения.
Хотя его методы исследования и гипотезы предсказывают ценную информацию о болезни, он беспокоится, что не сможет обобщить назначение лечения для разных групп пациентов.
Причина в том, что его исследование не обладает высокой внешней валидностью и представляет собой лишь определенный тип людей, которые принимают участие в его исследованиях.
Что такое хорошая внешняя валидность?
Основная цель внешней валидности — помочь исследователю убедиться в том, что его результаты могут быть использованы в реальных ситуациях и распространены на других людей и условия.
Таким образом, исследование имеет хорошую внешнюю валидность, когда с высокой вероятностью можно воспроизвести результаты в других ситуациях.
Возможность обобщать результаты для других людей, времени и условий — это то, что делает внешнюю валидность хорошей.
Как достигается внешняя валидность?
Чтобы достичь внешней валидности, исследователь должен убедиться, что его выводы и результаты могут быть точно обобщены на более широкую популяцию.