Внешняя валидность: Внешняя валидность — это… Что такое Внешняя валидность?

Содержание

Что такое валидность исследования и зачем это нужно?

Содержание статьи

Валидность исследования – это соответствие экспериментальной базы, выбранной автором работы, общепринятым стандартам, позволяющим добиться безупречного результата в поиске решения поставленной проблемы. Соответствие результатов экспериментов поставленной цели исследования определяется степенью валидности.

Что характеризует валидность показателя в исследовании

При проведении исследований важно добиться результата, максимально соответствующего безупречному эксперименту. Если полученный итог практической работы вплотную приближен к соответствию с установленными научными стандартами, он имеет высокие показатели валидности.

Существует две категории валидности – это внутренняя и внешняя.

Внутренняя валидность является показателем, отражающим достоверность выводов, полученных после проведения ряда реальных экспериментальных исследований в сравнении с результатами «идеальных» экспериментов, применимых для той же научной отрасли.

Является основным требованием, выдвигаемым к результатам экспериментов.

Внешняя валидность – это достоверность полученных результатов исследования по сравнению с итогами экспериментов, направленных на полное соответствие «безупречному» результату. Увеличить внешнюю валидность поможет введение дополнительных переменных с достижением экспериментального уровня, соответствующего реальному уровню аналогичных переменных в изучаемой научной отрасли.

Эксперимент, не обладающий характеристиками внешней валидности, является неверным, но в некоторых ситуациях может использоваться для проверки иных гипотез для научных отраслей, смежных с исследуемой областью знаний.

Угрозы для внутренней, внешней валидности

Основные факторы, влияющие на показатели внутренней валидности:

  • фоновые события, препятствующие проведению экспериментов;
  • естественные временные изменения, присущие объекту/предмету исследования;
  • неправильно подобранная методология исследования;
  • нестабильные результаты из-за высокого уровня погрешности выбранного инструментария;
  • взаимодействие нескольких факторов, непосредственно влияющих на внутреннюю валидность;
  • субъективные предубеждения экспериментатора (нежелание принимать во внимание детали, неправильный учет полученных результатов, неточность/невнимательность и т. д.).

Какие угрозы снижают уровень внешней валидности?

  1. Взаимодействие некачественного отбора материалов исследования и подбора методологической базы к ним.
  2. Реактивный эффект, как изменение восприимчивости предмета исследования после проведения предварительного тестирования.
  3. Взаимная интерференция, возникающая после одновременного воздействия несколькими методами исследования на один объект.

Валидность и надежность экспериментальных методов

Надежность экспериментальных методов, проведенных автором, подтверждает истинность полученных результатов. Валидность отображает степень соответствия итогов исследования к изучаемому явлению выбранной научной отрасли.

Любое валидное исследование по умолчанию является надежным, но надежное исследование не всегда является валидным.

Надежность, как устойчивая составляющая достоверного эксперимента

Надежность (воспроизводимость, устойчивость результатов эксперимента) – это возможность воспроизведения полученных результатов исследования в аналогичных реальных условиях при корреляции начальных/конечных измерений.

От чего зависит надежность проводимых экспериментов?

  1. Минимальная погрешность подобранного инструментария.
  2. Отсутствие неконтролируемой вариативности выбранной методологии исследования.
  3. Объективность исследователя.

Основная характеристика надежности – это получение одинаковых результатов при многократном проведении аналогичных экспериментов. Если все условия соблюдены правильно, методология исследования вызывает доверие.

Принципы взаимодействия валидности и надежности при выборе методов исследования

Принципы взаимодействия надежности с валидностью основываются на трех основных методах установки надежности выбранной методологической базы.

  1. Метод повторяющегося эксперимента. Суть метода – это неоднократное проведение тех же самых экспериментов одинаковыми приборами и сопоставление итоговых результатов исследования в отношении рассматриваемого объекта/явления/события.
  2. Метод альтернативной формы. Может выполняться в двух интерпретациях: один эксперимент применяется к нескольким группам объектов, комбинация экспериментов применяется к одному явлению.
  3. Метод подвыборки. Для проведения комплексного исследования, один или несколько объектов группируются в отдельные выборки с аналогичными свойствами, характеристиками.

Валидность в психологических исследованиях

Причинно-следственная связь, предшествующая эффекту от эксперимента по времени, позволяет объективно обобщить полученные выводы и принудить экспериментатора на дополнительную проработку методологической базы.

Если у экспериментатора нет альтернативных объяснений появления определенных результатов исследования, это свидетельствует о внутренней валидности проведенного эксперимента. В ряде случаев, это утверждение применимо к выявлению внешней или конструктивной валидности.

Статистическая связанность причинно-следственной связи с полученным эффектом от тестирования испытуемых, проявляющаяся при многократном повторе выбранной методологии исследования, говорит о корректности используемых методов и подтверждает наличие валидности статистического вывода.

Валидность в психологических исследованиях повышается тремя основными способами:

  • предварительное планирование методологической базы;
  • выбор схемы дальнейшей работы над отсортированными объектами по категориям;
  • проведение экспериментов над контрольной группой испытуемых.

Внешняя валидность и виды обобщений за пределами исследовательской ситуации

В самом общем смысле экспериментальная валидность относится ко всем формам экспериментального контроля, которые дают валидные или надежные выводы. Однако контроль за выводами осуществляется и вне экспериментального контроля. Результаты валидного эксперимента могут служить основанием для валидного умозаключения, если в целом реализована логически обоснованная система умозаключений, включающая взаимные переходы между разными уровнями проверяемых в эксперименте гипотез, учтена проблема асимметрии умозаключений, обоснованы широта и уровень обобщений из данных (как перенос умозаключений за пределы проведенного эксперимента).

Для того чтобы обсуждать адекватность и валидность обобщений, исследователь должен сначала убедиться, что зависимость, полученная в проведенном эксперименте, действительно представляет (отображает) связь между независимыми и зависимыми переменными, подразумеваемую в гипотезе, что не произошло подмены — намеренной или ненамеренной — изучаемой закономерности. Любое несоответствие подразумевает угрозу точности или обоснованности последующих выводов.

Во-вторых, обнаружение экспериментальной зависимости подразумевает, что все конкурирующие угрозы для достоверного заключения были устранены путем запутывания НП вторичными или связанными переменными. Если какое-либо условие НП не было случайным образом связано с активным уровнем сбивающей переменной, остается неизвестным, какой из двух, независимой или сбивающей переменной, следует приписать результирующий сдвиг в значениях ЗП (случай, в котором, учитывая возможность отклонения нулевой гипотезы или если различия в значениях ЗП выборки достоверны на выбранном уровне значимости, достоверность низкая и экспериментальный эффект можно рассматривать как артефакт).

Когда обобщения оказываются неверными, их называют артефактными. Плохой экспериментальный контроль может быть источником ошибочных выводов. Другими словами, неудачный эксперимент приводит к неверным обобщениям.

Насколько выбор конкретной формы эксперимента — экспериментального дизайна — связан с проектированием системы контроля всех возможных угроз наблюдаемой зависимости, пока не рассматривается. Следует лишь отметить, что экспериментальный дизайн как схема сбора данных, а именно фиксации ПП при различных условиях НП, предполагает также уточнение других направлений экспериментального контроля (выбор типа переменной, осуществление «первичного» контроля, устранение случайных или стабилизация дополнительных переменных, введение расширенной переменной и т.д.). Более подробное описание этих инструментов планирования станет возможным в связи с изложением оснований для классификаций типов экспериментов и экспериментальных конструкций.

Следует учесть, что формулировка системы гипотез, оценка достоверности эксперимента и реализация выводов включены как компоненты общего стандарта — во избежание опасностей для достоверного заключения.

Валидность и использование ментальных моделей экспериментов

Мы можем судить о достоверности экспериментов, которые фактически проводятся, через «внутренние очки», сквозь призму которых можно увидеть направление возможных или уже допущенных ошибок при разработке и проведении эксперимента. Р. Готтсданкер использовал удобную технику представления мысленных моделей эксперимента в виде таких инструкций.

Не следует путать термины «мысленный эксперимент» (МЭ) и «мысленная схема» эксперимента. МЭ можно понимать, во-первых, как принятую норму рефлексии психолога на всех этапах следования логике экспериментальной проверки психологической гипотезы. Во-вторых, DOE можно рассматривать в контексте использования психологом мысленной репетиции для оценки контроля угрозы для вывода эмпирической зависимости. В-третьих, DOE может представлять собой эксперимент, который не осуществим из-за отсутствия средств операционализации переменных, принятия определенных этических норм или экономических соображений и т. д.

В первых двух случаях путь продуманного экспериментирования — это обсуждение экспериментальной модели, которая определяет взаимосвязь между переменными, интересующими исследователя, при анализе эксперимента, который был фактически проведен или запланирован для фактического сбора данных. В третьем случае МЭ может представлять собой разработку заведомо нереального, т.е. в принципе невыполнимого, исследования. Однако он представляет собой способ возможной организации результатов, если бы исследователь имел доступ к предполагаемым формам экспериментального контроля.

Как и реальный эксперимент, мысленный эксперимент является средством проверки не всех психологических гипотез. Детерминистически сформулированные гипотезы, проверяемые в ДОЭ, могут быть причинно-следственными и структурно-функциональными. Последние не являются предметом экспериментов в строгом смысле слова, но могут направлять построение, например, формирующих экспериментов. Методы теоретического моделирования, которые больше подходят для проверки структурно-функциональных гипотез, не рассматриваются в данном учебнике, который построен как введение в эксперимент как метод сбора эмпирических данных.

При планировании психологического эксперимента DOE можно также понимать как внутренний, мыслительный процесс экспериментальной деятельности, который фактически используется вовне на этапах эксперимента. Фактически, все этапы планирования являются вариантами мысленного экспериментирования с целью определения лучших форм экспериментального контроля, выбора лучшего из возможных экспериментальных планов.

Функция мысленного экспериментирования включает, помимо планирования, обоснование или оценку валидности фактически проведенных экспериментов. Ментальные паттерны, по отношению к которым оцениваются свойства реального эксперимента, позволяют нам обсудить основные аспекты «правильности» построения экспериментальной модели. Правильность в данном случае означает лишь степень приближения к наилучшему мысленному воплощению условий эксперимента, соответствующих данной экспериментальной гипотезе. Экспериментатор может выбрать переменные, технику как средство операционализации этих переменных правильно или неправильно, обосновать или нет. Экспериментатор может вводить смеси НП с другими переменными или успешно избегать смесей. Он может получить более или менее надежные данные, указав то или иное количество образцов для каждого из условий НП; он может обеспечить случайное распределение условий для вспомогательных переменных по уровням НП, или он может не контролировать несистематическую изменчивость (НП, ПД, вспомогательные факторы).

Именно такое прочтение функций ментального паттерна представлено в понятиях Р. Готтсданкера о совершенных и бесконечных экспериментах, экспериментах полного согласия и безошибочных экспериментах. Все эти четыре понятия служат для уточнения критериев, по которым будет оцениваться успех планирования, организации и проведения реального эксперимента.

Типы валидности в оценке психологического эксперимента

Виды валидности — это направления сравнения реально проведенных экспериментов с мысленными образцами. Оценка валидности относится как к оценке реализации выбранных форм экспериментального контроля, так и к оценке системы выводов при организации исследования с точки зрения соответствия нормам экспериментального вывода. Нормы, относящиеся к возможным обобщениям по результатам психологических экспериментов, предполагают различие между различными типами валидности.

Внутренняя и внешняя валидность — это обязательно обсуждаемые аспекты валидного эксперимента, независимо от того, проводится ли эксперимент в научных или практических целях. Различия в выводах, сделанных из этих экспериментов, будут связаны с тем, как построено обобщение: переносится ли оно на других людей, другие ситуации, виды деятельности или на теоретическую модель.

Внутренняя валидность эксперимента говорит нам только что-то об изучаемой зависимости, то есть о взаимосвязи между независимыми и зависимыми переменными, но ничего о возможности их распространения за пределы данной экспериментальной ситуации. Если полученные данные характеризуются ненадежностью или наличием смещений (систематических, несистематических, сопутствующих), утверждение, сформулированное в экспериментальной гипотезе, не может считаться достоверным, даже если получен соответствующий ему экспериментальный эффект.

Если внутренняя валидность проведенного эксперимента считается высокой, из этого также не следует, что экспериментально установленная зависимость соответствует чему-то в реальности. Таким образом, в лабораторных экспериментах экспериментальная модель может представлять собой научную модель, которая отражает определенные отношения между операционализированными переменными. Возможно, что для этих моделей типы субъективной реальности, которые они должны представлять в экспериментальной ситуации, впоследствии не будут найдены. Таким образом, мы не найдем эмпирической модели, которую можно было бы использовать для обобщения экспериментально установленных зависимостей.

Внешняя твердость, которую предполагает решение проблем соответствия (NP, PD, DP), дает возможность обобщения на те типы ситуаций или деятельности, которым соответствуют экспериментально контролируемые переменные. Когда дело доходит до теоретических обобщений, оценка внешней валидности уступает место оценке валидности конструкции. Прояснение вопросов валидности конструкции и внешней валидности приводит исследователя к выбору типа эксперимента: естественный («дублирующий реальный мир»), искусственный (расширяющий реальный мир) или лабораторный.

Необходимо различать системы теоретических утверждений, предполагающих, что они относятся к миру реальности (для психологических теорий это мир субъективной или психологической реальности), и утверждений, не ставящих целью соотнесение мира теории и эмпирии (как онтологической реальности, если использовать терминологию П. Фресса и Ж. Пиаже). Это различие может касаться позиции автора: «Если моя теория несовместима с миром реальности, то она — реальность — должна быть хуже». Это может быть следствием того, что сформулированные психологические конструкты не совпадают на уровне эмпирических данных. Рассматривая свойства экспериментального метода, мы имеем дело с чем-то другим — возможностью эмпирической оценки теоретических причинных объяснений.

Особенности оценки достоверности лабораторного эксперимента

Особый случай — обобщение, которое связано с организацией «очищенных» условий в эксперименте для проверки так называемых точных гипотез. В этом обычно и заключается функция лабораторного эксперимента: получить данные в условиях, соответствующих причинно-следственным связям в специально сформулированной модели, чтобы эмпирически оценить объяснительную силу этой теоретической модели. Теоретические обобщения, однако, относятся не только к линии рассуждений типа «эксперимент — модель — теория». Оценка силы определенных обобщений выявляется также при анализе свойств самой теории — относящейся к «миру теорий» (а не к миру «психологической реальности»). Независимо от того, моделирует ли эксперимент ситуацию, которая отражает теоретическую модель или модель «внешнего мира», оценивается как объяснительная сила предложения, сформулированного в качестве экспериментальной гипотезы, так и возможность перехода от теории как объяснительной системы к этому эмпирически нагруженному предложению. ЭГ как эмпирическая гипотеза будет содержать переменные, которые можно не только наблюдать, но и измерять (по той или иной шкале).

Конструктивная валидность обсуждается во всех типах экспериментов с научной целью как адекватность перехода от научной гипотезы к экспериментальной гипотезе или от «рабочей» гипотезы к интерпретирующей теоретической гипотезе. Решение вопросов операциональной валидности включает этап перехода от уже сформулированных экспериментальных и контргипотез к методологическим процедурам реализации в экспериментальной модели или ситуации. Р. Готтсданкер рассматривает понятие операциональной валидности только применительно к такому типу эксперимента, как лабораторный эксперимент. В этом случае два этапа развития методологических процедур, упомянутых выше, не различаются, поскольку предполагается, что психологический конструкт представлен в том, как он измеряется. Это может быть обосновано, с одной стороны, несводимостью обобщенного понятия к его эмпирическому содержанию, а с другой — возможной неспецифичностью методологических показателей.

Валидность эксперимента и достоверность результатов

В целом, говорят, что валидность эксперимента подразумевает все формы экспериментального контроля, направленные на обеспечение всех видов валидности. Результаты валидного эксперимента могут служить основой для надежных выводов, если в целом реализована логически обоснованная система умозаключений, включая переходы между различными уровнями гипотез, проверяемых в эксперименте. Если все возможные или очевидные угрозы внутренней и внешней валидности контролируются, а проблемы операционализации и сопоставления переменных хорошо решены, то такой эксперимент классифицируется как валидный или «правильный». Из правильно поставленного эксперимента можно сделать валидные — обоснованные или «правильные» — выводы, что означает отсутствие ошибок в обобщении или ошибок в выводах, но можно ошибиться в выводах.

Ошибки в выводах или ненадежные заключения возможны как из-за неправильных обобщений, так и из-за некорректных экспериментов. Таким образом, понимая эксперимент как чувственно-объектную деятельность ученого, не следует ограничиваться описанием и оценкой того, как операционализируются переменные или как они регистрируются. Формулировка системы гипотез, оценка достоверности эксперимента и реализация выводов относятся к нормативным или нормативно-правовым регуляторам этой деятельности.

Выбор конкретной формы эксперимента связан с разработкой того или иного экспериментального дизайна (как схемы сбора данных при различных условиях НП) и с другими видами контроля (выбор типа эксперимента, осуществление «первичного» контроля, «дополнительное варьирование» переменных, введение расширенной переменной и т. д.). Решение проблем дизайна в данном случае означает «прописывание» эксперимента в системе классификаций типов экспериментов и типов экспериментальных дизайнов. Это, в свою очередь, позволяет очертить возможности и ограничения последующих выводов.

Именно предположения о возможностях последующих обобщений направляют исследователя при решении вопросов содержательного и формального дизайна экспериментов. Таким образом, проблема вывода и обобщения разрешается на два совершенно разных этапа — мысленное планирование экспериментальных конструкций и процедур и обоснование выводов на основе уже проведенных исследований. В реальных экспериментальных исследованиях это соответствует двухэтапному обобщению: в виде исходных предположений о характере зависимости между НП и БП и в виде окончательных выводов о возможности обобщений как переноса установленной зависимости за пределы экспериментальной ситуации (обобщения на теоретическую модель, на другие ситуации, виды деятельности, испытуемых и т. д.).

На странице курсовые работы по психологии вы найдете много готовых тем для курсовых по предмету «Психология».

Читайте дополнительные лекции:

  1. Психологическая защита самосознания
  2. Выготский Лев Семенович, советский психолог
  3. Невербальные проявления эмоций. Язык телодвижений — Роль невербальных средств в процессе общения
  4. Эббингауз Герман, немецкий психолог-экспериментатор
  5. Мышление, помогающее росту личности и характерные черты помогающего поведения (по Роджерсу)
  6. Нетрадиционные формы работы в коррекции речевых нарушений — Пересказ и его характеристики
  7. Особенности переживания одиночества людьми с разным уровнем жизнестойкости
  8. Социальная ситуация развития в психологии по Выготскому
  9. Дистанционное психологическое консультирование и диагностика
  10. Защитная организация личности в норме и патологии

РАЗНИЦА МЕЖДУ ВНУТРЕННЕЙ И ВНЕШНЕЙ ДЕЙСТВИТЕЛЬНОСТЬЮ | СРАВНИТЕ РАЗНИЦУ МЕЖДУ ПОХОЖИМИ ТЕРМИНАМИ — ОБРАЗОВАНИЕ

В области исследования обоснованность относится к приблизительной истинности утверждений, умозаключений или заключений. Внутренняя и внешняя валидность — это два параметра, которые используются для оц

Ключевое различие — внутренняя и внешняя валидность
 

В области исследования обоснованность относится к приблизительной истинности утверждений, умозаключений или заключений. Внутренняя и внешняя валидность — это два параметра, которые используются для оценки валидности исследования или процедуры. В ключевое отличие между внутренней и внешней действительностью заключается в том, что внутренняя валидность — это степень, в которой исследователь может заявить, что никакие другие переменные, кроме той, которую он изучает, не вызвали результат, тогда как внешняя валидность — это степень, в которой результаты исследования могут быть обобщены для всего мира.

Что такое внутренняя действительность?

Большинство исследований пытаются показать взаимосвязь между двумя переменными: зависимыми и независимыми переменными, то есть, как одна переменная (независимая переменная) влияет на другую (зависимую переменную). Если исследователь может заявить, что независимая переменная вызывает зависимую переменную, он сделал самое сильное заявление в исследовании.

Внутренняя валидность — это степень, в которой исследователь может заявить, что никакие другие переменные, кроме той, которую он изучает, не вызвали результат. Например, если мы изучаем переменную самообучения и результат экзамена, мы должны иметь возможность сказать, что никакая другая переменная (методы обучения, дополнительное обучение, уровень интеллекта и т. Д.) Не приводит к хорошим результатам экзамена.

Если существует большая вероятность того, что другие переменные могут повлиять на результат, исследование имеет низкую внутреннюю валидность. Хорошие исследования всегда разрабатываются таким образом, чтобы минимизировать вероятность того, что любые переменные, кроме независимой, влияют на зависимую переменную.

Внутренняя валидность в основном актуальна для исследований, которые пытаются установить причинно-следственную связь; они не актуальны для наблюдательных и описательных исследований. Однако внутренняя валидность может иметь значение для исследований, оценивающих эффекты определенной программы или вмешательств. В исследованиях, подобных этому, исследователя может быть интересно узнать, повлияла ли программа на разницу; например, если исследователь тестирует новую методологию обучения, он может захотеть узнать, улучшило ли она результаты, но он также хотел бы убедиться, что это его новая методология обучения, а не какие-то другие факторы, которые имели значение . Здесь в игру вступает внутренняя достоверность.

Что такое внешняя действительность?

Внешняя валидность — это обобщение вывода исследования. Чтобы быть более конкретным, это степень, в которой результаты исследования могут быть распространены на мир в целом.

Цель исследования — сделать выводы о том, как все работает в реальной работе, на основе результатов исследования. Например, мы можем обобщить результаты исследования, проведенного на выборочной совокупности, на популяцию в целом. Точно так же мы можем использовать результаты исследования, проведенного с несколькими учениками, и применить их в реальных условиях, например в школе. Однако исследователь не может делать эти выводы без внешней достоверности. Если внешняя валидность исследования низкая, результаты исследования не могут быть применены к реальному миру, а это означает, что исследование ничего не раскроет о мире за пределами исследования.

Исследователи используют такие стратегии, как модель выборки и модель ближайшего сходства, чтобы повысить внешнюю валидность своих исследований.

В чем разница между внутренней и внешней действительностью?

Определение:

Внутренняя валидность: Внутренняя валидность — это степень, в которой исследователь может заявить, что никакие другие переменные, кроме той, которую он изучает, не вызвали результат.

Внешняя валидность: Внешняя валидность — это степень, в которой результаты исследования могут быть распространены на мир в целом.

Площадь:

Внутренняя валидность: Внутренняя валидность касается связи между переменными.

Внешняя валидность: Внешняя достоверность связана с обобщением результатов.

Изображение предоставлено:

«Исследование» luckey_sun (CC BY-SA 2.0) через Commons Wikimedia

Валидность теста

Валидность теста (от англ. valid – пригодный) – критерий качества теста, используемый при выяснении степени достоверности измерения того психического свойства, качества, явления, которое хотят измерить с помощью данного теста.

Различают несколько видов валидность теста:

  • валидность теста конструктная,
  • валидность теста по критерию,
  • валидность теста по содержанию,
  • прогностическая валидность теста и др.

Валидность лучших тестов, выраженная коэффициентами корреляции (линейными, ранговыми и др.) составляет 0,3-0,8. К сожалению, есть случаи, когда тесты применяются без проверки их на в. В результате оказывается, что они бесполезны или даже вредны. Валидность теста – это показатель степени его эффективности. Она, естественно, меняется в зависимости от контингента людей, которые подвергаются тестированию, и характера их будущей деятельности. Один и тот же тест может быть высоковалидным для одной ситуации, бесполезным для другой и вредным для третьей.

Валидность теста конструктная

критерий качества теста, используемый при измерении какого-либо сложного психического феномена, имеющего иерархическую структуру, измерить который из-за этого одним актом тестирования невозможно. Так, психодиагностика интеллекта невозможна без предварительного определения понятия «интеллект», его структуры. Степень соответсвия нашего предварительного понимания и определения интеллекта реальной возможности конкретного теста, степень соответствия структуры интеллеткта структуре теста и есть в.т.к. Она нацелена на определение точности измерения сложных, устойчивых типов поведения, качеств личности, психических явлений.

Валидность теста по критерию

критерий качества теста, с помощью которого можно судить об интересующем нас аспекте психики индивида в настоящем и будущем. Для его определения необходимо сопоставить результаты тестирования с уровнем развития измеряемого признака, качества личности на практике. Например, для теста на технические способности основным критерием их определения будет выступать техническая деятельность конкретных специалистов, оценка их технических способностей с помощью экспертов, хорошо знающих испытуемых на протяжении достаточно продолжительного времени в интересующем нас аспекте. Оценка должна даваться по шкале порядковой, интервальной или отношений. В лучших тестах в. по критерию, измеренная коэффициентом корреляции, составляет от 0,3 до 0,8. Применение теста оправдано, если валидность по критерию оставляет 0,2-0,25.

Валидность теста по содержанию

критерий качества теста, используемый при вывяснении соответствия его области измеряемых психических явлений. В.т.к. показывает, насколько полно тест охватывает исследуемое множество измеряемых параметров. Если, например, нужно проверить с помощью теста математическую подготовку абитуриента вуза, то в предлагаемый тест должны быть включены математические задания, для решения которых необходимы знания по всем разделам математики, изучаемым в средней школе. Таким образом, степень соответствия структуры данного теста структуре программы математических дисциплин, изучаемых в школе, и является валидностью данного теста по содержанию. Естественно, что для обследования лиц, окончивших вузы, предназначаются тесты с иной вялидностью по содержанию.

Валидность теста прогностическая

критерий качества теста, используемый при предсказании характера развития измеряемого параметра в будущем. Одним из самых существенных недостатков подобных тестов является то, что они не учитывают неравномерность развития измеряемого параметра у различных людей в будущем. Данный вид валидности является особо ценным с практической точки зрения.

Валидность эксперимента

критерий качества эксперимента, степень его точности, в зависимости от которой выводы, полученные в его ходе могут быть распространены на всю генеральную совокупность. В.э. позволяет определить насколько всеобщими могут быть выводы, полученные путем исследования ограниченной по времени и обьему выборки. Различают внутреннюю и внешнюю валидность эксперимента.

Валидность эксперимента внешняя

критерий качества эксперимента, в зависимости от которого выводы об определенной тенденции, закономерности развития конкретных психических явлений, личностей, видов деятельности и т.д. могут быть распространены на другие явления и т.д. в данной или иной сфере. Языком математики это можно сформулировать так: насколько закономерности данного подмножества характерны для всего множества. Для определения границ применения экспериментальных выводов и необходимо определять в.э.в.

Валидность эксперимента внутренняя

критерий качества эксперимента, используемый при выяснении степени достоверности выявленной в результате эксперимента тенденции, закономерности, характерной для данной единицы множества или для всего подмножества элементов генеральной совокупности. Допустим, исследуя степень влияния освещенности на эффективность производственной деятельности ткачих, психологи обнаружили статистическую зависимость их эффективности работы от частоты смены освещения. Что является основным фактором повышения эффективности деятельности: смена освещения, внимание экспериментаторов, особое поведение руководителей в период эксперимента или другие факторы? В данном случае психологи пришли к выводу: появление молодых мужчин-исследователй в цехе, где работали женщины, и послужило причиной повышения производительности их труда. Но ведь могла быть и принята гипотеза о росте производительности ткацкого труда в зависимости от смены освещенности. В.э.в. показывает в какой степени независимая переменная (производительность труда) связана с зависимой (освещенность). Строго научное проведение психологического эксперимента предполагает определение его валидности.

Внешняя валидность и факторы ей угрожающие — Учись Как На Парах!

Эксперимент, который полностью воспроизводит внешнюю реальность, называется экспериментом полного соответствия. Мера соответствия экспериментальной процедуры реальности характеризует внешнюю валидность эксперимента.

От внешней валидности зависит переносимость результатов из лабораторных условий на реальные процессы и обобщение их на другие сферы реальности.

Внешняя валидность, как определяет ее Готтсданкер, влияет прежде всего на достоверность выводов, которую дают результаты реального эксперимента по сравнению с экспериментом полного соответствия. Для достижения высокой внешней валидности нужно, чтобы уровни дополнительных переменных в эксперименте соответствовали их уровням в реальности. Эксперимент, который не имеет внешней валидности, считается неверным. Добавим, что он неверен, если источником гипотезы является реальность, обыденное знание, а не теория.

Очевидно, что достижение полной внешней валидности невозможно в принципе, поэтому любое «чистое» аналитическое исследование является внешне не валидным.

В настоящее время факторами, влияющими на внешнюю валидность, считают неустранимые особенности эксперимента, отличающие его от реальной ситуации. Кэмпбелл относит к факторам, угрожающим внешней валидности, в первую очередь эффекты, связанные с особенностями объекта исследования: обучаемость, наличие памяти, способность эмоционально реагировать на ситуации.

Кэмпбелл называет Главные причины нарушения внешней валидности:

1. Эффект тестирования — уменьшение или увеличение восприимчивости испытуемых к экспериментальному воздействию под влиянием тестирования. Например, предварительный контроль знаний учеников может повысить их интерес к новому учебному материалу. Поскольку генеральная совокупность предварительному тестированию не подвергается, то результаты для нее могут быть нерепрезентативными.

2. Условия проведения исследования. Они вызывают реакцию испытуемого на эксперимент. Следовательно, его данные нельзя переносить на лиц, не принимавших участия в эксперименте, этими лицами является вся генеральная совокупность, кроме экспериментальной выборки.

3. Взаимодействие факторов отбора и содержания экспериментального воздействия. Их следствия — артефакты (в экспериментах с добровольцами или испытуемыми, участвующими по принуждению).

4. Интерференция экспериментальных воздействий. Испытуемые обладают памятью и обучаемостью. Если эксперимент состоит из нескольких серий, то первые воздействия не проходят для них бесследно и сказываются на появлении эффектов от последующих воздействий.

Большинство причин нарушения внешней валидности связано с особенностями психологического эксперимента, проводимого с участием человека, которые отличают психологическое исследование от эксперимента, осуществляемого специалистами других естественных наук.

Записи по теме

РАЗНИЦА МЕЖДУ ВНУТРЕННЕЙ И ВНЕШНЕЙ ДЕЙСТВИТЕЛЬНОСТЬЮ (СО СРАВНИТЕЛЬНОЙ ТАБЛИЦЕЙ) — БИЗНЕС

Валидность говорит об обоснованности дизайна и методов исследования. При проведении эксперимента исследователь преследует две цели, связанные с валидностью: сделать выводы о влиянии независимой переме

Содержание:

Валидность говорит об обоснованности дизайна и методов исследования. При проведении эксперимента исследователь преследует две цели, связанные с валидностью: сделать выводы о влиянии независимой переменной на исследуемую группу и сделать выводы о популяции в целом. Первая цель подчеркивает внутренняя валидность, а второй фокусируется на внешняя валидность.

Основное различие между внутренней и внешней валидностью состоит в том, что первая говорит о взаимосвязи между переменными, тогда как вторая касается универсальности результатов. Чтобы лучше понять тему, ознакомьтесь с этой статьей.

Сравнительная таблица

Основа для сравненияВнутренняя валидностьВнешняя валидность
Имея в видуВнутренняя достоверность — это степень, в которой эксперимент свободен от ошибок, и любая разница в измерениях обусловлена ​​независимой переменной и ничем иным.Внешняя валидность — это степень, в которой результаты исследования могут быть представлены миру в целом.
ОбеспокоенКонтрольНатуральность
Что это такое?Это показатель точности эксперимента.Он проверяет, можно ли обобщить случайные отношения, обнаруженные в эксперименте.
ОпределяетНасколько сильны методы исследования?Можно ли применить результаты исследования к реальному миру?
ОписываетСтепень обоснованности заключения.Степень, в которой исследование оправдывает обобщение результата на другой контекст.
Использовал кОбратитесь к альтернативному объяснению результата или исключите его.Обобщите результат.

Определение внутренней действительности

В статистике внутренняя достоверность используется для обозначения меры точности, которая проверяет правильность эксперимента, особенно в отношении искажения. Он измеряет, вызывают ли независимые переменные наблюдаемые эффекты на зависимые переменные или нет. Когда наблюдаемые эффекты находятся под влиянием посторонних переменных или смешиваются с ними, тогда будет трудно сделать достоверные выводы о взаимосвязи между переменными.

Просто внутренняя действительность относится к степень обоснованности причинно-следственной связи, основанной на эксперименте, что подтверждается тем, насколько эксперимент избегает систематических ошибок.

Высокая внутренняя валидность позволяет исследователю с достаточной уверенностью выбирать одно объяснение другому, поскольку оно игнорирует противоречия. Чем меньше ошибок в эксперименте, тем выше его внутренняя достоверность..

Определение внешней действительности

Термин «внешняя валидность» подразумевает определение того, могут ли случайные отношения, наблюдаемые в исследовании, быть обобщенными или нет. Он констатирует, Можно ли обобщить результаты, полученные в ходе эксперимента, на другие ситуации, и если да, то на какие настройки, группы людей и время их можно экстраполировать?

Внешняя достоверность определяет правильность результатов исследования, исследуя их применимость в разных условиях. Угрозы внешней валидности имеют место, когда конкретный набор условий исследования практически не учитывает взаимодействия других переменных реального мира.

Существует два типа внешней валидности, которая измеряет силу исследования:

  • Достоверность популяции
  • Экологическая ценность

Ключевые различия между внутренней и внешней действительностью

Представленные вам пункты описывают различия между внутренней и внешней достоверностью:

  1. Степень, в которой эксперимент свободен от ошибок и каких-либо различий в измерениях, обусловлена ​​независимой переменной, и ничто другое не известно как независимая переменная. Степень, в которой результаты исследования могут быть представлены миру в целом, известна как зависимая переменная.
  2. Внутренняя валидность — это не что иное, как мера точности эксперимента. Напротив, внешняя валидность исследует, можно ли обобщить причинно-следственную связь между зависимой и независимой переменной, обнаруженной в эксперименте.
  3. Внутренняя валидность связана с контролем посторонних переменных, тогда как внешняя валидность подчеркивает применимость результата к практическим ситуациям.
  4. Внутренняя валидность определяет силу методов исследования и дизайна. И наоборот, внешняя валидность исследует общность результатов исследования с реальным миром.
  5. Внутренняя действительность определяет степень обоснованности вывода. В отличие от этого, внешняя валидность определяет степень, в которой исследование оправдано для обобщения результата на другой контекст.
  6. Внутренняя валидность либо обращается, либо исключает альтернативное объяснение результата. Напротив, внешняя достоверность используется для обобщения результата.

Вывод

Ожидается, что экспериментальный план будет иметь как внутреннюю, так и внешнюю достоверность. Внутренняя валидность — это наиболее важное требование, которое должно присутствовать в эксперименте до того, как будут сделаны какие-либо выводы об эффектах лечения. Чтобы установить внутреннюю валидность, необходимо контролировать внешнюю валидность. С другой стороны, внешняя достоверность является краеугольным камнем хорошего плана эксперимента, и ее довольно сложно достичь.

Разница между внутренней и внешней действительностью (со сравнительной таблицей)

Последнее обновление , Surbhi S

Validity говорит о надежности дизайна и методов исследования. При проведении эксперимента исследователь преследует две цели, касающиеся валидности, то есть сделать выводы о влиянии независимой переменной на исследуемую группу и сделать выводы о популяции в целом. Первая цель делает упор на внутреннюю действительность , тогда как вторая фокусируется на внешней действительности .

Основное различие между внутренней и внешней валидностью состоит в том, что первая говорит о взаимосвязи между переменными, тогда как вторая касается универсальности результатов. Чтобы лучше понять тему, ознакомьтесь с этой статьей.

Содержание: внутренняя действительность против внешней действительности

  1. Сравнительная таблица
  2. Определение
  3. Ключевые отличия
  4. Заключение

Сравнительная таблица

Основа для сравнения Внутренняя действительность Внешняя действительность
Значение Внутренняя достоверность — это степень, в которой эксперимент свободен от ошибок, и любая разница в измерениях обусловлена ​​независимой переменной и ничем иным. Внешняя значимость — это степень, в которой результаты исследования могут быть представлены миру в целом.
Соответствует Контроль Естественность
Что это? Это показатель точности эксперимента. Проверяет, можно ли обобщить обнаруженную в эксперименте случайную связь.
Опознает Насколько сильны методы исследования? Можно ли применить результаты исследования к реальному миру?
Описывает Степень, в которой заключение является обоснованным. Степень, в которой исследование позволяет обобщить результат на другой контекст.
Используется для Адрес или исключение альтернативного объяснения результата. Обобщите результат.

Определение внутренней действительности

В статистике внутренняя достоверность используется для обозначения меры точности, которая проверяет правильность эксперимента, особенно в отношении искажения. Он определяет, вызывают ли независимые переменные наблюдаемые эффекты на зависимые переменные или нет.Когда наблюдаемые эффекты находятся под влиянием посторонних переменных или смешиваются с ними, тогда будет трудно сделать достоверные выводы о взаимосвязи между переменными.

Просто внутренняя валидность относится к степени, в которой обоснована причинно-следственная связь, основанная на эксперименте. , определяемая степенью, в которой эксперимент избегает систематических ошибок.

Высокая внутренняя валидность позволяет исследователю с достаточной уверенностью выбирать одно объяснение по сравнению с другим, поскольку оно игнорирует недоразумения. Чем меньше ошибок в эксперименте, тем выше его внутренняя достоверность. .

Определение внешней действительности

Термин «внешняя валидность» подразумевает определение того, могут ли случайные отношения, наблюдаемые в исследовании, быть обобщенными или нет. Он устанавливает, Можно ли обобщить результаты, полученные в ходе эксперимента, на другие ситуации, и если да, то на какие условия, группы людей и время их можно экстраполировать?

External Validity определяет правильность результатов исследования, исследуя их применимость в разных условиях.Угрозы внешней валидности возникают, когда конкретный набор условий исследования практически не учитывает взаимодействия других переменных реального мира.

Два типа внешней достоверности, которые измеряют силу исследования:

  • Население Срок действия
  • Экологическая ценность

Ключевые различия между внутренней и внешней действительностью

Представленные вам баллы описывают различия между внутренней и внешней валидностью:

  1. Степень, в которой эксперимент свободен от ошибок и каких-либо различий в измерениях, обусловлена ​​независимой переменной, и ничто другое не известно как независимая переменная.Степень, в которой результаты исследования могут быть представлены миру в целом, известна как зависимая переменная.
  2. Internal Validity — это не что иное, как мера точности эксперимента. Напротив, внешняя валидность проверяет, можно ли обобщить причинно-следственную связь между зависимой и независимой переменной, обнаруженной в эксперименте.
  3. Внутренняя валидность связана с контролем посторонних переменных, тогда как внешняя валидность подчеркивает применимость результата к практическим ситуациям.
  4. Внутренняя валидность определяет силу методов исследования и дизайна. И наоборот, внешняя валидность исследует общность результатов исследования с реальным миром.
  5. Internal Validity определяет степень обоснованности вывода. В отличие от этого, внешняя достоверность определяет степень, в которой исследование оправдано для обобщения результата на другой контекст.
  6. Internal Validity либо адресует, либо исключает альтернативное объяснение результата.Напротив, внешняя достоверность используется для обобщения результата.

Заключение

Ожидается, что экспериментальный план будет иметь как внутреннюю, так и внешнюю валидность. Внутренняя валидность — это наиболее важное требование, которое должно присутствовать в эксперименте до того, как будут сделаны какие-либо выводы об эффектах лечения. Чтобы установить внутреннюю валидность, следует контролировать внешнюю валидность. С другой стороны, внешняя достоверность является краеугольным камнем хорошего плана эксперимента, и добиться ее довольно сложно.

Что такое внешняя обоснованность исследования? — Определение и примеры — Видео и стенограмма урока

Важность

Давайте на мгновение вернемся к беспокойству Сары по поводу своего исследования. Она обеспокоена, потому что все ее предметы похожи друг на друга и представляют лишь очень небольшую часть населения. Если исследование Сары показывает, например, что похвала после задания повышает самооценку, что это значит для реального мира?

Если все испытуемые Сары молодые, белые и принадлежат к высшему классу, может ли она знать наверняка, что эта конкретная похвала после задания повысит самооценку пожилого работника из меньшинства и низшего класса?

Цель исследования — распространить информацию на мир в целом.Возможно, как и у Сары, цель состоит в том, чтобы обобщить население в целом на основе эксперимента, проведенного на небольшой выборке населения. Или, возможно, цель состоит в том, чтобы обобщить задачу, выполняемую в лаборатории, на реальные условия, такие как офис или школа. В любом случае цель состоит в том, чтобы сделать выводы о том, как все работает в реальном мире, на основе результатов исследования.

Но без внешней достоверности исследователь не может делать такие выводы. Если внешняя валидность исследования низка, результаты не будут хорошо отражены в других условиях.Это означает, что проведенное исследование ничего не говорит нам о мире за пределами исследования. Это очень ограниченная точка зрения!

Контроль против обобщения

Хорошо, можете подумать вы, поэтому просто убедитесь, что каждое исследование имеет много внешней достоверности. Подумаешь?

Что ж, легче сказать, чем сделать. В исследованиях есть баланс между контролем и обобщением. По сути, проблема заключается в следующем: исследование в лаборатории имеет низкую внешнюю валидность.То есть это не всегда применимо к реальному миру.

Другой вариант — проводить исследования в полевых условиях, то есть проводить исследования в реальном мире. Сара, например, могла пойти в офис или на фабрику и провести там свой эксперимент с настоящими рабочими и менеджерами. Тогда у нее будет очень высокая внешняя значимость.

Но вы не можете контролировать вещи в реальном мире так, как в лаборатории, поэтому в игру могут вступить другие переменные. Это ослабляет внутреннюю валидность или степень, в которой исследователь может сказать, что только независимая переменная вызывает зависимую переменную.

Итак, с одной стороны, вы можете проводить исследования в лаборатории и иметь полный контроль над переменными и веский аргумент, что имеет значение только ваша независимая переменная. С другой стороны, вы могли бы проводить исследования в этой области и иметь тесную связь с реальным миром и обобщать результаты.

Исследования всегда приносят плоды, и каждое исследование должно найти правильный баланс между внутренней и внешней достоверностью или контролем и обобщением. Каков этот баланс, зависит от целей исследователя и самого исследования.

Резюме урока

Внешняя валидность — это степень, в которой результаты исследования могут быть распространены на весь мир. Поскольку цель исследования — рассказать нам о мире, внешняя валидность — очень важная часть разработки исследования. Но также необходимо найти баланс между контролем над вашими переменными и способностью обобщать результаты. Это напряжение также известно как противоречие между внутренней и внешней достоверностью.

Результаты обучения

После завершения этого урока вы должны уметь:

  • Определить внешнюю достоверность
  • Объясните важность внешней валидности в исследованиях
  • Обсудить необходимость баланса контроля и обобщения при проведении исследований

5.2: Повышение внутренней и внешней валидности

Лучшие исследовательские проекты — это те, которые могут гарантировать высокий уровень внутренней и внешней валидности. Такие планы защитят от ложных корреляций, вселят большую веру в проверку гипотез и обеспечат возможность обобщения результатов, полученных из небольшой выборки, на население в целом. Контроль необходим для обеспечения внутренней достоверности (причинности) дизайна исследования и может осуществляться четырьмя способами: (1) манипулирование, (2) исключение, (3) включение и (4) статистический контроль, и (5) рандомизация.

В манипуляции исследователь манипулирует независимыми переменными на одном или нескольких уровнях (называемых «лечениями») и сравнивает эффекты лечения с контрольной группой, в которой субъекты не получают лечение. Лечение может включать новое лекарство или другую дозировку (для лечения заболевания), стиль обучения (для студентов) и так далее. Этот тип контроля достигается в экспериментальных или квазиэкспериментальных планах, но не в неэкспериментальных планах, таких как опросы.Обратите внимание, что если субъекты не могут адекватно различать различные уровни лечебных манипуляций, их ответы на разные виды лечения могут не отличаться, и манипуляции не будут успешными.

Метод исключения основан на устранении посторонних переменных путем сохранения их неизменными для разных видов лечения, например, путем ограничения исследования одним полом или одним социально-экономическим статусом. В методе включения роль посторонних переменных рассматривается путем включения их в план исследования и отдельной оценки их влияния на зависимую переменную, например, с помощью факторных планов, в которых одним фактором является пол (мужчина или женщина).Такой метод допускает большую обобщаемость, но также требует существенно больших выборок. В статистическом контроле посторонние переменные измеряются и используются как ковариаты в процессе статистического тестирования.

Наконец, метод рандомизации направлен на то, чтобы исключить влияние посторонних переменных посредством процесса случайной выборки, если можно гарантировать, что эти эффекты носят случайный (несистематический) характер. Двумя типами рандомизации являются: (1) случайный выбор , где выборка выбирается случайным образом из совокупности, и (2) случайное распределение , где субъекты, выбранные неслучайным образом, случайным образом распределяются по группам лечения.

Рандомизация также обеспечивает внешнюю валидность, позволяя обобщить выводы, сделанные на основе выборки, для генеральной совокупности, из которой составлена ​​выборка. Обратите внимание, что случайное назначение является обязательным, когда случайный выбор невозможен из-за ограничений ресурсов или доступа. Однако универсальность среди популяций установить труднее, поскольку популяции могут различаться по нескольким параметрам, и вы можете контролировать только некоторые из этих параметров.

Внутренняя и внешняя валидность (общая)

Педагогическая психология, интерактивная: внутренняя и внешняя валидность (общая)

Внутренняя и внешняя действительность


Общие вопросы

Разработано: W.Huitt, J. Hummel, D. Kaeck
Последняя редакция: январь 1999 г.


Внутренняя действительность

Одним из ключей к пониманию внутренней действительности (IV) является признание того, что когда это связано с экспериментальным исследованием, это относится как к тому, насколько хорошо было проведено исследование выполнение (план исследования, используемые операционные определения, как измерялись переменные, какие измерялось / не измерялось и т. д.), и насколько уверенно можно сделать вывод, что изменение зависимая переменная была произведена исключительно независимой переменной, а не посторонней единицы.В групповых экспериментальных исследованиях И.В. отвечает на вопрос: «Действительно ли это лечение, которое вызвало разницу между средними / отклонениями субъектов в контрольная и экспериментальная группы? » или несколько базовых показателей), IV пытается ответить на вопрос: «Верю ли я, что это было мое лечение, которое вызвало изменение в поведении субъекта, или это могло быть результат какого-то другого фактора? »В описательных исследованиях (корреляционных и т. д.) внутренний валидность относится только к точности / качеству исследования (например, насколько хорошо исследование было см. начало этого абзаца).

В своей классической книге по экспериментальным исследованиям Кэмпбелл и Стэнли (1966) идентифицируют и обсудить 8 типов посторонних переменных, которые, если их не контролировать, могут поставить под угрозу внутренняя достоверность эксперимента.

  1. История — Это уникальные переживания, которые субъекты получают между различными измерения, сделанные в эксперименте.Эти впечатления действуют как дополнительные и незапланированные, независимые переменные. Кроме того, опыт, вероятно, будет отличаться в зависимости от предметы, которые по-разному влияют на ответы испытуемых. Исследования, требующие повторные меры в отношении субъектов с течением времени с большей вероятностью будут зависеть от истории переменные, чем те, которые собирают данные за более короткие периоды времени или которые не используют повторные меры.
  2. Созревание — Это естественные (а не навязанные экспериментатором) изменения, которые происходят в результате нормального течения времени.Например, чем больше времени проходит исследование: испытуемые с большей вероятностью устают и скучают, более или менее мотивированы, поскольку функция голода или жажды, старости и т. д. Как указывают Исаак и Майкл (1971), субъекты могут работать лучше или хуже по зависимой переменной не в результате независимая переменная, но потому что они старше, более / менее мотивированы и т. д.
  3. Тестирование — Многие эксперименты предварительно проверяют субъектов, чтобы установить, что все субъекты начало учебы примерно на том же уровне и т. д.Следствие предварительного тестирования программ / протоколов заключается в том, что они могут испортить / изменить производительность субъектов в дальнейшем тесты (например, те, которые используются в качестве зависимых переменных), которые измеряют ту же область за пределами любых эффекты, вызванные самим лечением.
  4. Приборы — Изменение методов измерения (или их применения) во время учебы влияет на то, что измеряется. Кроме того, если используются люди-наблюдатели, это может быть суждением наблюдателя (ов), которое меняется с течением времени, а не испытуемыми. представление.
  5. Статистическая регрессия — Когда субъекты исследования выбираются в качестве участников потому что они набрали очень высокие или очень низкие баллы по некоторым показателям производительности (например, тест и т. д.), повторное тестирование испытуемых почти всегда приводит к другому распределение баллов, и среднее значение для этого нового распределения будет ближе к населения. Например, если все выбранные предметы изначально имели высокие баллы, средний показатель группы по ретесту будет ниже (т.е, менее экстремально), чем было изначально. И наоборот, если бы среднее значение группы было изначально низким, их среднее значение повторного тестирования было бы выше.
  6. Выборка — Испытуемые в группах сравнения (например, контрольная и экспериментальная) должны быть функционально эквивалентными в начале исследования. Если они есть, то наблюдаются различия между группами, измеряемые зависимой (ыми) переменной (ами) производительности, при конец исследования, скорее всего, будет вызван только независимой переменной, а не организменных.Если группы сравнения отличаются друг от друга на начало исследования результаты исследования необъективны.
  7. Экспериментальная смертность — Субъекты выбывают из исследований. Если одна группа сравнения испытывает более высокий уровень абстиненции / смертности, чем другие группы, тогда наблюдаемые различия между группами становятся сомнительными. Были ли наблюдаемые различия производятся независимой переменной или разными показателями отсева? (Смертность также угроза, когда показатели отсева примерно одинаковы в сравниваемых группах, но высоки.)
  8. Взаимодействие при выборе — В некоторых исследованиях метод выбора взаимодействует с одним или несколько других угроз (описанных выше), искажающих результаты исследования.

Внешнее действие

Степень, в которой результаты исследования (независимо от того, является ли исследование описательным или экспериментальный) может быть обобщен / применен к другим людям или настройкам, отражающим его внешний вид . Срок действия . Как правило, групповые исследования, использующие рандомизацию, первоначально будут иметь более высокая внешняя валидность, чем у исследований (например,g., тематические исследования и отдельные темы экспериментальные исследования), не использующие случайный выбор / назначение. Кэмпбелл и Стэнли (цитируется по Isaac & Michael, 1971) определили 4 фактора, которые отрицательно влияют на внешняя валидность исследования.

  1. Взаимодействие между тем, как были выбраны субъекты, и лечением (например, независимая переменная). Если субъекты не выбраны случайным образом из списка населения, то их конкретные демографические / организменные характеристики могут смещать их производительность и результаты исследования могут быть неприменимы к популяции или к другим группа, которая более точно представляет характеристики населения.
  2. Предварительное тестирование субъектов в исследовании может заставить их более / менее сильно реагировать на лечения, чем они были бы, если бы они не прошли предварительную проверку. В таких ситуациях исследователь (и) не может сделать вывод, что члены населения, не прошедшие предварительное тестирование будет работать аналогично участникам исследования. Переформулировано, чтобы обобщить результаты исследования, исследователь должен будет указать, что конкретный Тип предварительного тестирования также может быть проведен, потому что предварительное тестирование может служить дополнительным, непреднамеренная независимая переменная.
  3. Успеваемость испытуемых в некоторых исследованиях в большей степени является продуктом или реакцией на экспериментальный , установка (например, ситуация, в которой проводится исследование), чем это к независимой переменной. Например, субъекты, которые знают, что они участвуют в исследования, или те, кто знает, что за ними наблюдают и т. д., могут по-разному реагировать на лечение чем субъект, который прошел лечение, но не знал, что за ним наблюдают и т. д.
  4. Исследования, в которых используется нескольких лечения / вмешательств , возможно, ограничили возможность обобщения, потому что раннее лечение может иметь кумулятивный эффект на производительность субъектов.Если группа испытала лечение X1, и первое лечение было за которым следует секунда (X2), на их измеренные характеристики после X2 будут влиять оба лечения, а не только X2, потому что эффекты X1 не стираются.

Повышение внутренней и внешней достоверности

В групповых исследованиях основные методы, используемые для достижения внутренней и внешней валидности. рандомизация, использование дизайна исследования и статистический анализ, которые соответствуют типам собранных данных, и вопрос (вопросы), которые исследует (и) пытаюсь ответить.Однопредметные экспериментальные исследования почти всегда имеют высокий внутренний валидность, потому что субъекты служат их собственными средствами контроля, но, как упоминалось ранее, крайне низкий с точки зрения внешней достоверности. Однопредметные исследования приобретают внешнюю валидность в процессе репликации и расширения (т. е. повторение исследования в разные настройки, с другой тематикой и т. д.). Результаты групповых исследований также более приемлемо для научного сообщества при воспроизведении.

Список литературы

  • Кэмпбелл, Д.Т. и Стэнли Дж. К. (1966). Экспериментальные и квазиэкспериментальные проекты для исследований. Чикаго: Рэнд МакНалли.
  • Исаак С. и Майкл В. Б. (1971). Справочник по исследованиям и оценке. Сан Диего: РЕДАКТИРОВАТЬ.

Вернуться к:

Все материалы на сайте [http://www.edpsycinteractive.org] являются, если не указано иное, собственностью Уильям Г. Хайтт. Авторские права и другие законы об интеллектуальной собственности защищают эти материалы. Воспроизведение или ретрансляция материалов, полностью или частично, любым способом, без предварительного письменного согласия правообладателя, является нарушение закона об авторском праве.

Внешняя значимость в здоровой государственной политике: применение инструмента RE-AIM в области улучшения жилищных условий | BMC Public Health

Улучшение использования результатов исследований в политике и практике требует, среди прочего, четкой отчетности по элементам внешней достоверности [1–3]. Внешняя валидность, иногда называемая обобщаемостью, означает степень, в которой причинно-следственные выводы, представленные в одном исследовании, могут быть применены к различным группам населения, условиям, видам лечения и исходам [4, 5].Для вмешательств это требует четкой отчетности о характеристиках населения (включая условия и масштабы вмешательства), деталях вмешательства (включая реализацию и адаптацию к местным условиям), результатах и ​​устойчивости вмешательства и воздействия [6, 7]. Улучшенная отчетность по этим пунктам может помочь читателю оценить применимость и актуальность результатов исследования для их собственной ситуации. Утверждалось, что улучшенная отчетность по элементам внешней валидности может повысить полезность и надлежащее использование результатов исследований, а также потенциально способствовать повышению качества имеющихся доказательств [2, 3].

Несмотря на растущее признание издателями важности внешней достоверности, существует мало четких указаний о том, что следует сообщать, чтобы облегчить суждение о внешней достоверности результатов исследования [6]. В области здравоохранения много было посвящено разработке инструментов для оценки внутренней валидности, но гораздо меньше внешней валидности. Один инструмент, который формулирует необходимые элементы внешней валидности, был разработан членами команды RE-AIM [8]. Этот инструмент основан на работе Кронбаха и др. По теории обобщаемости и связанным с ней элементам UTOS [9]; Единицы (е.грамм. отдельные пациенты, модераторные переменные, подгруппы), лечения (вариации в доставке или модальности лечения), случаи (например, модели поддержания или рецидива с течением времени в ответ на лечение) и условия (например, медицинские клиники, рабочие места, школы в котором вмешательство реализуется и оценивается). Контрольный список RE-AIM был разработан для вмешательств в области общественного здравоохранения, особенно в области укрепления здоровья. Признавая ограничения разработки стандартного инструмента, авторы этого контрольного списка призвали к пилотному тестированию и доработке имеющихся инструментов [6].Этот инструмент применялся в исследованиях вмешательств по укреплению здоровья [10, 11], но, насколько нам известно, не был протестирован в области здоровой государственной политики, то есть вмешательств, не связанных со здравоохранением, таких как образование, социальное обеспечение, жилье, транспорт. и т. д.

Мы использовали недавний систематический обзор воздействия улучшения жилищных условий на здоровье [12], чтобы исследовать уровни отчетности по элементам внешней достоверности с использованием инструмента RE-AIM [8]. В этом кратком отчете представлен уровень отчетности и отражено, как может потребоваться адаптация отчетности о внешней достоверности для использования в более широкой сфере здоровой государственной политики.

Обеспечение достоверности — Курс по методологии исследования

Смешивающие переменные

Смешивающая переменная — это посторонняя переменная, которая статистически связана (или коррелирована) с независимой переменной. Это означает, что при изменении независимой переменной вместе с ней изменяется и смешивающая переменная. Неспособность принять во внимание смешивающую переменную может привести к ложному выводу о том, что зависимые переменные находятся в причинно-следственной связи с независимой переменной.Возьмем, к примеру, гипотетическое исследование, которое показало, что люди, которые носят в кармане зажигалку, чаще страдают раком. Было бы неправильно делать вывод, что существует прямая связь между этими двумя переменными или что ношение зажигалки в кармане вызывает рак. Вместо этого есть смешивающая переменная — курение; люди, которые носят в кармане зажигалку, с большей вероятностью будут курильщиками, а у тех, кто курит, с большей вероятностью будет диагностирован рак. Исследователи должны быть осторожны при выявлении и контроле потенциальных мешающих переменных, чтобы можно было точно идентифицировать и измерять связи между зависимой переменной и независимой переменной.

Срок действия

В оставшейся части этого краткого курса методов исследования будут рассмотрены различные угрозы достоверности, существующие на каждом этапе исследовательского процесса. Валидность относится к тому, хорошо ли спланировано исследование и дает ли он результаты, подходящие для обобщения на интересующую группу населения. «База знаний о методах исследования» Trochim предоставляет краткое и полезное изложение каждого типа достоверности; В этом модуле обсуждаются три основных типа достоверности, которыми должен интересоваться исследователь.(1)

Внутренняя валидность

Внутренняя валидность применяется в исследованиях, которые стремятся установить причинно-следственную связь между двумя переменными, и относится к степени, в которой исследование может сделать хорошие выводы об этой причинной связи. Внутренняя достоверность достигается, когда исследователь может окончательно заявить, что эффекты, наблюдаемые в исследовании, были вызваны манипулированием независимой переменной, а не другим фактором. Переменные, находящиеся вне контроля или рассмотрения исследователем, могут повлиять на результат исследования и, следовательно, могут помешать внутренней валидности.(2)

Construct Validity

Construct validity (Действительность конструкции) тесно связана с процессом реализации , который мы обсуждали в Модуле 1. Он относится к степени, в которой исследователь может утверждать, что точные выводы могут быть сделаны на основе введенных в действие мер в исследование теоретических построений, на которых они были основаны. Конструктивная валидность связана с обобщением специфики исследования к более широкой концепции, которую исследование пытается измерить или сделать выводы.Считается, что исследование имеет конструктивную валидность, если исследователь может продемонстрировать, что интересующие переменные были должным образом операционализированы. (3) Например, если в примере модуля 1 близорукие люди, получающие корректирующие линзы, исследователь решил ввести в действие «Экономически продуктивный» как «сумма денег, которую человек имеет в своих сбережениях», исследователь получил бы совершенно другие результаты. Люди могут иметь другие источники дохода (подарки, доход супруга, наследство и т. Д.).) кроме личной еженедельной заработной платы, которая может повлиять на эту переменную, это означает, что сумма сбережений составляет , а не , что является хорошим показателем экономической производительности; поэтому это влияет на конструктивную валидность исследования.

Внешнее действие

Исследователь часто не может работать со всей интересующей совокупностью, а вместо этого должен изучить меньшую выборку этой совокупности, чтобы сделать выводы о большей группе, из которой взята выборка. Внешняя валидность включает в себя степень, в которой выводы могут быть обобщены на более широкую популяцию.Исследование считается внешне достоверным, если выводы исследователя могут быть точно обобщены на популяцию в целом. (4) Выборочная группа должна быть репрезентативной для целевой популяции, чтобы гарантировать внешнюю валидность.

Как исследователь, при разработке исследования важно всегда помнить о концепции валидности. Хороший исследователь обсудит дизайн проекта с консультантом или группой коллег, чтобы убедиться, что его обоснованность сохраняется на каждом этапе процесса.Недостаточный исследовательский проект может сделать выводы, которые неуместны или даже опасны в применении к целевой группе населения.

Обеспечение достоверности

Дополнительную информацию о том, как обеспечить достоверность исследования, см. В разделе «Срок действия исследования».

Перейти к Модулю 4: Меры по разработке исследования >>

Сноски

(1) Трохим, В. М. К. «Дизайн» База знаний по методам исследования, 2-е издание.

(4) Пелхэм, Б. У.; Блэнтон, Х. Проведение исследований в области психологии: измерение веса дыма, 3-е издание. Wadsworth Publishing (27 февраля 2006 г.).

Что такое валидность в психологии

  1. Методы исследования
  2. Валидность

Что такое валидность?

Д-р Саул МакЛеод, опубликовано в 2013 г.


Что означает валидность в исследованиях?

Концепция действительности была сформулирована Келли (1927, стр.14), который заявил, что тест действителен, если он измеряет то, что, по его утверждению, измеряется.

Например, тест на интеллект должен измерять интеллект, а не что-то еще (например, память).

Различают внутреннюю и внешнюю действительность. Эти типы валидности имеют отношение к оценке валидности исследовательского исследования / процедуры.

Что такое внутренняя и внешняя валидность в исследованиях?

Внутренняя валидность относится к тому, вызваны ли эффекты, наблюдаемые в исследовании, манипулированием независимой переменной, а не каким-либо другим фактором.

Другими словами, существует причинно-следственная связь между независимой и зависимой переменной.

Внутренняя достоверность может быть улучшена за счет контроля посторонних переменных, использования стандартизированных инструкций, противовеса и исключения характеристик спроса и эффектов исследователя.

Внешняя валидность — это степень, в которой результаты исследования могут быть обобщены для других условий (экологическая валидность), других людей (популяционная валидность) и с течением времени (историческая валидность).

Внешнюю валидность можно улучшить, установив эксперименты в более естественных условиях и используя случайную выборку для отбора участников.


Оценка валидности теста

Оценка валидности теста

Существуют две основные категории валидности, используемые для оценки валидности теста (например, анкета, интервью, тест IQ и т. Д.): Содержание и критерий.

Что такое фактическая валидность в исследованиях?

Признание достоверности — это просто то, появляется ли тест (по номинальной стоимости) для измерения того, на что он претендует.Это наименее изощренная мера достоверности.

Тесты, цель которых ясна даже для наивных респондентов, считаются имеющими высокую достоверность. Соответственно, тесты, цель которых неясна, имеют низкую валидность (Nevo, 1985).

Прямое измерение валидности лица получают, когда людей просят оценить валидность теста, как им кажется. Этот оценщик может использовать шкалу Лайкерта для оценки достоверности лица. Например:

  1. тест очень подходит для данной цели
  2. тест очень подходит для этой цели;
  3. тест соответствует требованиям
  4. тест не соответствует требованиям
  5. тест не имеет значения и, следовательно, не подходит

Важно выбрать подходящих людей для оценки теста (например,грамм. анкета, интервью, тест на IQ и т. д.). Например, люди, которые действительно проходят тест, будут иметь все возможности для оценки его достоверности.

Также люди, которые работают с тестом, могут высказать свое мнение (например, работодатели, администраторы университетов, работодатели). Наконец, исследователь может использовать представителей широкой общественности, интересующихся тестом (например, родителей испытуемых, политиков, учителей и т. Д.).

Фактическая валидность теста может считаться надежной конструкцией только в том случае, если между оценщиками существует разумный уровень согласия.

Следует отметить, что следует избегать использования термина «фактическая достоверность», когда оценка проводится «экспертом», поскольку достоверность содержимого является более подходящей.

Наличие фактической валидности не означает, что тест действительно измеряет то, что исследователь намеревается измерить, а только по мнению рейтеров, которые, по-видимому, делают это. Следовательно, это грубая и основная мера достоверности.

Такой тестовый элемент, как « Я недавно подумал о самоубийстве », имеет очевидную достоверность в качестве элемента для измерения суицидальных когниций и может быть полезен при измерении симптомов депрессии.

Однако результаты тестов с явной валидностью заключаются в том, что они более уязвимы для предвзятости социальной желательности. Люди могут манипулировать своей реакцией, чтобы отрицать или скрывать проблемы, или преувеличивать свое поведение, чтобы представить себя в позитивном свете.

Элемент тестирования может не иметь лицевой валидности, но все же иметь общую валидность и измерять то, что, по его утверждению, измеряется. Это хорошо, потому что снижает характеристики спроса и затрудняет манипулирование респондентами своими ответами.

Например, элемент теста « Я верю во второе пришествие Христа » не будет иметь достаточной достоверности как мера депрессии (поскольку цель этого элемента неясна).

Этот элемент появился в первой версии Миннесотского многофазного опросника личности (MMPI) и загружен в шкалу депрессии.

Поскольку большинство первоначальной нормативной выборки MMPI были хорошими христианами, только христианин в депрессии мог подумать, что Христос не вернется. Таким образом, для данного конкретного религиозного образца пункт имеет общую действительность, но не является действительным.

Что такое конструктная валидность в исследованиях?

Конструктивная валидность была изобретена Корнболлом и Милом (1955). Этот тип валидности относится к степени, в которой тест захватывает конкретную теоретическую конструкцию или признак, и перекрывается с некоторыми другими аспектами валидности

Конструктивная валидность не касается простого фактического вопроса о том, измеряет ли тест атрибут .

Вместо этого речь идет о сложном вопросе о том, согласуются ли интерпретации результатов тестов с номологической сетью, включающей теоретические и наблюдательные термины (Cronbach & Meehl, 1955).

Для проверки достоверности конструкции необходимо продемонстрировать, что измеряемое явление действительно существует. Так, например, конструктивная валидность теста на интеллект зависит от модели или теории интеллекта.

Конструктивная валидность влечет за собой демонстрацию силы такой конструкции для объяснения сети результатов исследований и прогнозирования дальнейших взаимоотношений.

Чем больше доказательств валидности тестовой конструкции сможет продемонстрировать исследователь, тем лучше.Однако не существует единого метода определения валидности конструкции теста.

Вместо этого различные методы и подходы комбинируются, чтобы представить общую конструктивную валидность теста. Например, можно использовать факторный анализ и корреляционные методы.

Что такое одновременная валидность в исследованиях?

Это степень, в которой тест соответствует внешнему критерию, который известен одновременно (т. Е. Происходит одновременно).

Если новый тест подтвержден сравнением с существующим в настоящее время критерием, у нас есть одновременная валидность.

Очень часто новый IQ или личностный тест сравнивают с более старым, но похожим тестом, который, как известно, уже имеет хорошую валидность.

Что такое прогностическая достоверность в исследованиях?

Это степень, в которой тест точно предсказывает критерий, который будет применяться в будущем.

Например, на основе нового теста интеллекта можно сделать прогноз, что люди с высокими показателями в возрасте 12 лет с большей вероятностью получат университетскую степень через несколько лет.Если предсказание оправдывается, значит, тест имеет прогностическую достоверность.


Ссылки на стиль APA

Кронбах, Л. Дж., И Мил, П. Э. (1955) Конструируйте валидность в психологических тестах. Психологический бюллетень , 52, 281-302.

Hathaway, S. R., & McKinley, J. C. (1943). Руководство по многофазной инвентаризации личности в Миннесоте . Нью-Йорк: Психологическая корпорация.

Келли Т. Л. (1927). Интерпретация образовательных измерений.Нью-Йорк : Макмиллан.

Нево, Б. (1985). Повторная проверка достоверности лица. Журнал образовательных измерений , 22 (4), 287-293.


Как ссылаться на эту статью:
Как ссылаться на эту статью:

McLeod, S.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *