Внешняя валидность это – Внешняя валидность — Википедия

Содержание

Внутренняя и внешняя валидность

Внешняя и внутренняя валидность.

Боровкова Виктория И-01

ВАЛИДНОСТЬ (validity)—достоверность (или степень достоверности) вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. “В.”—центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения экспериментах

Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует (представляет) безупречный, и чем лучше эта репрезентативность, тем выше В. эксперимента. Таким образом, повышение В., т. е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера, реальных условий и, во-вторых, от адекватности выбора средств. Так, источники нарушения В., (прежде всего, ненадежность и смешение) отдаляют реальный эксперимент от безупречного, а способы их контроля, позволяют приблизиться к нему, т. е. обеспечить высокую В. для обобщения экспериментальных результатов. В. полученных данных можно оценить статистически: например, В. теста (в корреляционном исследовании) определяется степенью корреляции результатов его .выполнения с изучаемым видом деятельности испытуемых.

В соответствии с различными типами безупречного эксперимента различают внутреннюю и внешнюю В.:

— внутренняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами идеального бесконечного экспериментов. Повышение внутренней В. связано с устранением результатов действия побочных переменных и с усреднением их изменчивости и нестабильности. Внутренняя В. — первое и необходимое требование к экспериментальным выводам: эксперимент, не обладающий внутренней В., названы автором просто неудачным.

При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором[2].

Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.

Пример нарушения внутренней валидности

Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.

— внешняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами эксперимента полного соответствия. Повышение внешней В. обеспечивается достижением соответствия уровней дополнительных переменных в эксперименте уровням этих переменных в изучаемой реальности. Эксперимент, не обладающий внешней В., является неверным, не соответствующим поставленной гипотезе (но, быть может, пригодным для проверки, другой гипотезы).

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.

Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на:

-другие популяции,

-другие условия,

-другое время.

Пример нарушения внешней валидности

Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов.

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.

При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.

Следует отметить, что любую переменную (фактор), отличную от независимой, также оказывающую влияние на зависимую переменную, автор называет просто “ other ” — другая. При переводе для обозначения таких переменных используются два разных термина: “побочная” — применительно к переменной, нарушающей внутреннюю В., и “дополнительная” — переменная, уровень которой входит в экспериментальную гипотезу и должен быть адекватно представлен с целью достижения внешней В. Иногда одни и те же факторы могут выступать в эксперименте и как побочные (нарушающие внутреннюю В.), и как дополнительные (влияющие на внешнюю В.). Устранение и унификация побочных факторов, повышающая внутреннюю В., может приводить к несоответствию уровней дополнительных переменных, что снижает внешнюю В. (см. Соответствие).

-операциональная В.—разновидность внешней В. для лабораторного эксперимента; соответствие (или степень соответствия) применяемых методических процедур тем теоретическим понятиям, которые входят в экспериментальную гипотезу.

Угрозы внутренней валидности

«Угрозы внутренней валидности» — выражение, относящееся к плану исслед., к-рое интерпретаторы данных используют для описания ряда вопросов, возникающих в связи с возможными неточностями при интерпретации причинно-следственных связей между изучаемыми переменными. Некоторые из этих угроз уже упоминались, в частности, при описании квазиэкспериментов. Выражение регрессия к среднему показателю используется для описания эффекта неточного измерения текущего и будущих наблюдений, и она представляет собой серьезную угрозу для внутренней валидности плана психол. исслед.

Другой угрозой является естественное развитие, поскольку испытуемые подвержены естественным процессам созревания и развития с течением времени независимо от манипуляций, которые совершает над ними исследователь. Эта последняя гипотеза, в частности, объясняет необходимость использования в исслед. контрольных групп, позволяющих осуществлять сравнения с естественно развивающимися испытуемыми.

Еще одной угрозой является отсев. Систематическое сокращение количественного состава групп вследствие выбывания, неявок, переезда людей в другой город, незаполненных критериальных опросников, и т. д. может делать менее заметной в результатах исслед. роль тех оставшихся участников, к-рые оказываются в меньшей степени подвержены эксперим. воздействию. А ведь чем более заметны улучшения по критерию, тем лучше выглядит эффективность самого изучаемого воздействия.

Угроза отбора возникает на этапе формирования исслед. состава групп участников. Систематический отбор или пассивный отбор (собственное желание) участников для изучаемого воздействия или условия может приводить к возникновению различий среди некоторых групп перед началом исслед. Эти группы будут по-прежнему отличаться от других и после реализации воздействия — даже когда они сами не подвергались воздействию. Поэтому, для достижения высокой внутренней валидности (причинно-следственных) утверждений в отношении взаимосвязей переменных, необходима формулировка и проверка альтернативной гипотезы о том, какими могли бы быть эти эффекты в отсутствие такого воздействия или условия.

Фон относится к тем изменениям контекста проводящегося исслед., которые могут смешиваться с самими изучаемыми воздействиями. Подобное смешение делает невозможным отнесение изменений в испытуемых на счет исследуемого воздействия или внешних изменений.

Инструментальная погрешность являются угрозой внутренней валидности, почти исключительно присущей психологии, поскольку она возникает в результате происходящих со временем изменений стандартов наблюдателя или условий наблюдения. Эти изменения вызывают различия в оценках. Проблема состоит в том, что подобные расхождения в стандартах измерения могут приводить к ошибочным оценкам тех изменений, которые являются следствием изучаемых воздействий.

Эффект тестирования являются примером другой, почти исключительно присущей психологии, угрозы внутренней валидности. Она связана с эффектом улучшения показателей испытуемых просто в результате предыдущего прохождения теста.

Нестабильность, как было указано выше, вытекает из попыток интерпретировать происходящие непосредственно после эксперимента воздействия или спустя к.-л. время естественные изменения испытуемых и измерений.

Существуют также четыре аффективных угрозы внутренней валидности: подражание, компенсаторное соперничество, компенсаторное уравнивание, и деморализация. Они также присущи исключительно психол. науке, поскольку возникают в результате эмоциональных изменений у испытуемых и проводящего измерения персонала как формы адаптации к тому факту, что они не попали в число «избранных» участников исследования, получающих и осуществляющих эксперимент

Внешняя валидность и метаанализ

Наконец, существует понятие внешней валидности — суммы характеристик исследований, к-рая позволяет осуществлять обобщение или распространение получаемых в исследованиях (как результат высокой внутренней валидности) причинно-следственных утверждений на сходные категории людей, воздействий и критериев за пределами данного исследования.

Метаанализ. Внешняя валидность результатов исследования, существенно усиливается, когда объединяется и обобщается целый ряд исследований одной и той же воздействующей переменной. Такая процедура называется метаанализом. В метаанализе определяются величина эффекта, оказываемого эксперимента, воздействием и основными условиями исследования на критериальные переменные. Последние выбираются в зависимости от теоретических интересов проводящего метаанализ исследователя. Т. о., если основной анализ предполагает сравнение связей всех пар переменных, то набор интересующих метааналитика связей является набором из переменных-условий и критериальных переменных, который позволяет судить о величине эффекта изучаемого воздействия на эти критериальные переменные. Величина эффекта для каждого исследования определяется простым делением разности между средними показателями по критериальной переменной в эксперименты группах и контрольной группе на меру изменчивости индивидуальных показателей в этих группах. В результате такого анализа можно продемонстрировать, что целый ряд изучавшихся переменных условий не оказывают влияния на набор критериев, что позволяет исследователям обобщать результаты своих исследований, не оглядываясь на эти, как было установлено в ходе метаанализа, посторонние условия.

Наконец, можно определить степень влияния каждой переменной-воздействия и их различных сочетаний на критерии. Это представляет особый интерес для прикладных областей, где важно знать не только о том, что одна переменная влияет на другую, но и насколько велико такое влияние.

studfiles.net

Внешняя валидность — Психологос

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.

Критерии внешней валидности

Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на

другие популяции,
другие условия,
другое время.

Пример нарушения внешней валидности

Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно генерализовал свою модель на представителей обоих полов.

Соблюдение внешней валидности

www.psychologos.ru

Внешняя валидность — это… Что такое Внешняя валидность?

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность — соответствие реального исследования изучаемой объективной реальности.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации^[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности^[2].

Критерии внешней валидности

Пример нарушения внешней валидности

Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности»^[2], однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.

Соблюдение внешней валидности

См. также

Примечания

↑ Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 89.
↑ ¹ ² ³ Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 185.

dic.academic.ru

Внешняя валидность — Википедия. Что такое Внешняя валидность

Внешняя валидность (англ. external validity) — вид валидности, определяющий то, насколько результаты конкретного исследования можно распространить на весь класс подобных ситуаций/явлений/объектов. Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки. Внешняя валидность — соответствие реального исследования изучаемой объективной реальности.

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации^[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности^[2].

Критерии внешней валидности

Пример нарушения внешней валидности

Соблюдение внешней валидности

См. также

Примечания

↑ Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 89.
↑ ¹ ² ³ Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 185.

wiki.sc

Внешняя валидность — Howling Pixel

Общие сведения

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации^[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности^[2].

Критерии внешней валидности

Пример нарушения внешней валидности

Соблюдение внешней валидности

См. также

Примечания

↑ Дружинин В. Н. Экспериментальная психология. — 2-е изд., доп. — СПб.: Питер, 2002. С. 89.
↑ ¹ ² ³ Исследование в психологии: методы и планирование / Дж. Гудвин. — 3-е изд. — СПб.: Питер, 2004. С. 185.

Валидность (психология)

Вали́дность (англ. validity, от лат. validus — «сильный, здоровый, достойный») — обоснованность и пригодность применения методик и результатов исследования в конкретных условиях. Более прикладное определение понятия «валидность» — мера соответствия методик и результатов исследования поставленным задачам. Валидность считается фундаментальным понятием экспериментальной психологии, организационной психологии и психодиагностики.

Как в психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять (эта узкая трактовка «валидности» является наиболее популярной, по факту она соответствует понятию «конструктная валидность»). То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент (возможный лишь в теории) будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.

Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам (однако при этом валидность не измеряется в каких-либо условных единицах).

Важная особенность валидности — её нельзя установить единожды и использовать это доказательство как финальный аргумент «за» качество того или иного эксперимента или методики. Валидность необходимо постоянно обосновывать новыми данными, перепроверять в независимых исследованиях.

Внутренняя валидность

Вну́тренняя вали́дность (англ. internal validity) — вид валидности, степень влияния независимой переменной на зависимую переменную. Внутренняя валидность тем выше, чем больше вероятность того, что изменение зависимой переменной вызвано изменением именно независимой переменной (а не чего-либо ещё). Данное понятие можно рассматривать как междисциплинарное: оно широко применяется в экспериментальной психологии, а также в других сферах науки.

Внутренняя валидность — соответствие реального исследования идеальному.

Конструктная валидность

Конструктная валидность (концептуальная, понятийная валидность) — частный случай операциональной валидности, степень адекватности метода интерпретации экспериментальных данных теории, которая определяется правильностью употребления терминов той или иной теории.

Конструктная валидность, обоснованная Л. Кронбахом в 1955 году, характеризуется способностью теста к измерению такой черты, которая была обоснована теоретически (как теоретический конструкт). Когда сложно найти адекватный прагматический критерий, может быть выбрана ориентация на гипотезы, сформулированные на основе теоретических предположений об измеряемом свойстве. Подтверждение этих гипотез свидетельствует о теоретической обоснованности методики. Сначала необходимо, насколько возможно полно, содержательно описать конструкт, для измерения которого предназначен тест. Это достигается за счет формулирования гипотез о нем, предписывающих, с чем данный конструкт должен коррелировать, а с чем не должен. После чего данные гипотезы проверяются. Это наиболее эффективный способ валидизации для личностных опросников, для которых установление единственного критерия их обоснованности является затруднительным.

Конструктная валидность является наиболее комплексным и сложным видом валидности. Вместо одного результата (прежде всего прагматического) необходимо учитывать множество (чаще всего собственно психологических).

Конструктная валидность имеет отношение к попыткам обозначения любых аспектов эксперимента. Опасности нарушения конструктной валидности заключаются в неправильном обозначении причины и следствия с помощью абстрактных терминов, терминов, взятых из обыденного языка или формальной теории.

Логически-функциональная типология оценивания

Данная типология выделяет различные виды оценивания по принципу целесообразности их применения на каком-то конкретном этапе программы и/или политики. Каждый тип оценивания имеет свою функциональную характеристику, которая определяет логичность его использования на той или иной стадии.

Операциональная валидность

Операциональная валидность — частный случай внешней валидности, степень соответствия методики и плана эксперимента проверяемой гипотезе.

Операциональная валидность определяет степень соответствия используемой экспериментальной методики (экспериментальных утверждений) теоретическим положениям, которые положены в основу организации и проведения данного эксперимента.

Частью операциональной валидности можно считать конструктную валидность.

Психологический эксперимент

Психологический эксперимент — проводимый в специальных условиях опыт для получения новых научных знаний о психологии посредством целенаправленного вмешательства исследователя в жизнедеятельность испытуемого.

Различными авторами понятие «психологический эксперимент» трактуется неоднозначно, зачастую под экспериментом в психологии рассматривается комплекс разных самостоятельных эмпирических методов (собственно эксперимент, наблюдение, опрос, тестирование). Однако традиционно в экспериментальной психологии эксперимент считается самостоятельным методом.

В рамках психологического консультирования, психологическим экспериментом называют специально созданную ситуацию, предназначенную для более целостного (в различных модальностях) переживания клиентом собственного опыта.

Синдром Аспергера

Синдро́м Аспергера — общее (первазивное; англ. pervasive «обширный, глубокий, распространённый») нарушение психического развития, характеризующееся серьёзными трудностями в социальном взаимодействии, а также ограниченным, стереотипным, повторяющимся репертуаром интересов и занятий. От детского аутизма (синдрома Каннера) он отличается прежде всего тем, что речевые и когнитивные способности в целом сохраняются. Синдром часто характеризуется также выраженной неуклюжестью.

Синдром получил название в честь австрийского психиатра и педиатра Ганса Аспергера (Hans Asperger), который в 1944 году описал детей, отличавшихся отсутствием способностей к невербальной коммуникации, ограниченной эмпатией по отношению к сверстникам и физической неловкостью. Сам Аспергер использовал термин «аутистическая психопатия». В МКБ-10 синонимом синдрома Аспергера также выступает термин «шизоидное расстройство детского возраста». Согласно критериям этой классификации, синдром Аспергера проявляется с раннего детского возраста, в то время как шизоидное расстройство личности — с позднего детского либо с подросткового возраста.

Термин «синдром Аспергера» был предложен английским психиатром Лорной Уинг (англ. Lorna Wing) в публикации 1981 года. Современная концепция синдрома появилась в 1981 году и, после периода популяризации, в начале 1990-х годов были выработаны диагностические стандарты. По поводу различных аспектов синдрома всё ещё остаётся много нерешённых вопросов. Так, неизвестно, отличается ли этот синдром от высокофункционального аутизма; частично по этой причине не установлена его распространённость. Американскими исследователями было предложено вообще отказаться от диагноза «синдром Аспергера», заменив его на диагноз «расстройство аутистического спектра» с указанием степени тяжести. Данное предложение было осуществлено на практике, и в последнем, 5-м издании американского Диагностического и статистического руководства по психическим расстройствам синдром Аспергера отсутствует, его заменило расстройство аутистического спектра. Аналогично в МКБ-11 синдром Аспергера диагностируется как расстройство аутистического спектра, 6A02.0.

Точная причина синдрома неизвестна. Хотя исследования предполагают возможность генетической базы, не существует известной генетической этиологии, и нейровизуализация не идентифицирует ясной общей патологии. Нет и единого лечения, а данные в пользу эффективности существующих методов поддержки ограничены. Поддержка имеет целью улучшение симптомов и функционирования и опирается на поведенческую терапию, фокусируясь на специфических дефицитах и адресуясь к низким коммуникационным способностям, навязчивым или повторяющимся рутинным действиям и физической неуклюжести. Состояние большинства детей улучшается по мере взросления, но социальные и коммуникационные проблемы могут остаться. Некоторые исследователи и лица с синдромом Аспергера считают правильным рассматривать синдром Аспергера как отличие, а не инвалидность, которую надо лечить.

Экологическая валидность

Экологическая валидность — степень соответствия условий эксперимента исследуемой реальности. Например, в известном эксперименте Курта Левина по изучению типов лидерства отношения в группах подростков мало соответствовали отношениям в государстве, следовательно, была нарушена экологическая валидность.

На других языках

This page is based on a Wikipedia article written by authors (here).
Text is available under the CC BY-SA 3.0 license; additional terms may apply.
Images, videos and audio are available under their respective licenses.

howlingpixel.com

Внешняя валидность

Психологов-экпериментаторов часто критиковали за то, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всем остальном — очень мало. По сути, это критика внешней валидности — возможности генерализации данных, полученных в ходе исследования, за пределами содержания конкретных экспериментов. Чтобы исследование обладало наивысшей степенью внешней валидности, должна существовать возможность генерализации его результатов по трем направлениям: на другие популяции, другие условия и другое время.

Другие популяции

Именно к этому разделу относится замечание насчет крыс и второкурсников. Как мы узнали из главы 2, часть споров о правомерности исследований с животными касается того, насколько важны открытия, сделанные в ходе таких исследований, для объяснения человеческого поведения. Что касается второкурсников, вспомните, что Милграм сознательно не хотел использовать студентов и в качестве объектов для исследования подчинения и отобрал взрослых людей из нейтральной в этом отношении популяции. Однако, о большинстве психологов нельзя сказать того же. Обзор, проведенный Сирсом (Sears, 1986) в ходе исследования по социальной психологии, показал, что 75% исследований, опубликованных в этой области, в 1980 г. проводились с использованием студентов. Повторный обзор для исследований, опубликованных в 1985 г., дал результат 74%. Сире утверждал, что особенности студентов колледжей как популяции легко могут исказить общие выводы о социальных явлениях. В сравнении с основной популяцией, к примеру, студенты колледжей обладают более высокими когнитивными способностями, они более эгоистичны и восприимчивы к социальным воздействиям, а также легче меняют свое отношение к различным вопросам. По Сирсу, если в исследовании изучаются вопросы, связанные с этими особенностями, результаты, полученные при участии

студентов, могут не быть пригодными для других групп людей. Ученый считал, что исследователи должны расширить свои базы данных и воспроизводить важные открытия на различных популяциях. Но он также указал, что во многих областях исследований (например, при изучении восприятия) данные особенности студентов практически не влияют на получаемые результаты и, кроме того, студентов очень много, и поэтому они являются классическим примером удобной выборки (глава 4). Как показано во вставке 5.2, к этой группе применяется особый этический подход.

ВСТАВКА 5.2

Этика — набор участников — все становятся членами фонда

Большинство психологов-исследователей работают в колледжах и университетах и поэтому окружены потенциальными «морскими свинками» в виде студентов. Поскольку студенты не всегда охотно принимают участие в исследованиях, многие психологические факультеты университетов организуют так называемые «фонды испытуемых», или, как это называется в последнее время, «фонды участников». Этот термин обозначает группу студентов, обычно посещающих вводный курс по психологии, которых просят участвовать в исследованиях как в обязательных для данного курса занятиях. Если вы студент большого университета, то, возможно, уже имели опыт «добровольного» участия в двух или трех экспериментах, чтобы избежать снижения оценки за весь курс. Если в большом университете курс по общей психологии каждый семестр посещают 800 студентов и каждый студент записывается для участия в трех экспериментах, то исследователи получают возможность работать с 2400 участниками. Фонды испытуемых облегчают исследователям поиск участников, а их существование оправдывают тем, что участие в исследованиях входит в состав образовательного процесса (Kimmel, 1996). В идеале, участвуя в экспериментах и изучая исследуемые психологические явления, студенты получают более глубокое понимание исследовательского процесса. Чтобы сделать участие студентов действительно добровольным, кроме непосредственного участия в исследовании им предлагают на выбор несколько вариантов. Однако проблемы все равно существуют. Критики утверждают, что при формировании фондов участников в действительности не соблюдается принцип добровольности, что альтернативные занятия (например, оформление документов) зачастую настолько тягостны, что студентов по сути вынуждают участвовать в исследованиях, а также что приобретаемый опыт скорее скучный, чем поучительный (Kern, 1988). В поддержку такого мнения были проведены исследования. В исследовании Зибера и Сакса (Sieber and Saks, 1989) было обнаружено, что 89% из 366 рассмотренных факультетов содержат фонды, не соответствующие одной или нескольким рекомендациям ассоциации АРА. Тем не менее многие факультеты стараются сделать так, чтобы студенты могли извлечь пользу из подобных занятий. Например, во время дебрифинга после эксперимента по изучению памяти участникам/студентам могут рассказать о том, как данное исследование связано с главой X из учебника, используемого во вводном курсе. Также на многих факультетах студентам в качестве альтернативы предлагают творческие виды деятельности. Студенты, не участвующие в исследованиях могут: а) наблюдать проводимые эксперименты и записывать свои наблюдения, б) участвовать «за кулисами» в проектах преподавателей факультета (например, кодировать данные), в) участвовать в других мероприятиях научного коллектива или г) слушать лекции ученых, приехавших в данное учебное заведение (Kimmel, 1996). Некоторые исследования показали, что студенты в основном находят участие в экспе-

риментах весьма полезным, особенно если исследователи действительно стараются «привязать» их участие к процессу обучения, протекающему на занятиях по общей психологии (например, Landrum & Chastain, 1999; Leak, 1981).

Ассоциация АРА (1982, р. 47-48) разработала особые требования к отбору студентов для участия в исследованиях. Вот основные из них:

студенты должны быть осведомлены о требованиях курса, прежде чем на него записываться;
студенты в первый день занятий по данному предмету должны получить подробное описание требований курса, в том числе ясное описание альтернативных видов деятельности, в случае если они не хотят участвовать в исследованиях;
альтернативные виды деятельности должны быть равными участию в исследовании по времени и трудоемкости, а также, аналогично участию в экспериментах, должны иметь образовательное значение;
все предложения о проведении исследований с использованием фондов участников должны получать одобрение соответствующего исследовательского совета;
особое внимание следует обратить на вежливое обращение со студентами;
должна существовать простая и понятная процедура, посредством которой студенты могут пожаловаться на некорректное обращение. Оценка по данному предмету при этом не должна быть снижена;
все остальные требования этического кодекса АРА должны неукоснительно выполняться;
на факультете должен быть разработан механизм для периодической проверки правил использования фонда участников.

«Проблема второкурсников» — это только один пример затруднений, связанных с распространением результатов исследования на другие группы. Другой пример касается пола участников. Некоторые из наиболее известных психологических исследований ограничены изучением только мужчин (или, но гораздо реже, только женщин), но распространяют свои выводы на людей обоих полов. Вероятно, самый известный пример — это исследование Лоренса Колберга, посвященное изучению нравственного развития детей. В ходе исследования, проведенного в 1963 г., Колберг просил мальчиков-подростков прочитать, а затем разрешить различные коротко сформулированные нравственные дилеммы. На основании полученных ответов Колберг разработал теорию о шести стадиях морального развития, закрепившуюся в литературе по психологии развития. Человек, находящийся на самой высокой стадии, поступает в соответствии с универсальными принципами справедливости и соблюдения прав личности.

Теория Колберга была подвергнута критике за низкую внешнюю валидность. К примеру, Кэрол Гиллиган утверждала (Gilligan, 1982), что модель Колберга не учитывает половых различий в особенностях мышления и способах принятия моральных решений. Мужчины могут уделять огромное внимание правам личности, а женщины больше внимания обращают на сохранение взаимоотношений между людьми, а следовательно, ответы женщин на некоторые из дилемм Колберга могут не соответствовать столь «высокой ступени развития», как ответы мужчин. По мнению Гиллиган, это связано с недостатками модели Колберга, составившего выборку из подростков исключительно мужского пола.

Также психологи-исследователи обращают внимание на перенос результатов из одной культуры в другую. Например, считается, что в «индивидуалистических» культурах личность ставится выше группы и высоко ценятся личная ответственность и инициатива. С другой стороны, в «коллективистских» культурах группа оценивается выше личности (Triandis, 1995). Выводы исследований, базирующихся на одной культуре, могут не получить универсального применения. Приведем один пример. В США большинство детей учат высоко ценить личные достижения, а, например, в Японии дети считают, что если они выделяются из коллектива, то тем самым снижают ценность остальных членов группы, и поэтому личные достижения ценятся не столь высоко. В одном исследовании было обнаружено, что у американских студентов личные достижения связаны с положительными эмоциями, а у японских — с отрицательными (Kitayama, Markus, Matsumoto & Norasakkunkit, 1997). Решить, что положительное отношение к личным достижениям — это общечеловеческая особенность, значит совершить ошибку. Но означает ли это, что во всех психологических исследованиях должны проводиться межкультурные сравнения? Конечно нет. Это лишь означает, что выводы необходимо делать очень внимательно и всегда указывать группу, изучаемую в ходе исследования.

studfiles.net

Внешняя валидность — WiKi

Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации^[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности^[2].

Пример нарушения внешней валидности

Соблюдение внешней валидности

ru-wiki.org

Внутренняя и внешняя валидность

Внешняя валидность — Психологос

Общие сведения

Критерии внешней валидности

Пример нарушения внешней валидности

Соблюдение внешней валидности

Внешняя валидность — это… Что такое Внешняя валидность?

Общие сведения

Критерии внешней валидности

Пример нарушения внешней валидности

Соблюдение внешней валидности

См. также

Примечания

Внешняя валидность — Википедия. Что такое Внешняя валидность

Общие сведения

Критерии внешней валидности

Пример нарушения внешней валидности

Соблюдение внешней валидности

См. также

Примечания

Внешняя валидность — Howling Pixel

Общие сведения

Критерии внешней валидности

Пример нарушения внешней валидности

Соблюдение внешней валидности

См. также

Примечания

На других языках

Внешняя валидность

Другие популяции

Внешняя валидность — WiKi

Пример нарушения внешней валидности

Соблюдение внешней валидности

Добавить комментарий Отменить ответ