Валидность это в психологии: Валидность — Психологос

Содержание

www.Psyarticles.ru — учебные статьи по психологии

Учебные материалы по психологии и психологические статьи — основное содержание сайта.

Проект в значительной степени рассчитан на самообразование читателей, ранее систематически не изучавших психологию, однако может оказаться полезным и для специалистов, расширяющих свой профессиональный кругозор.

Материалы сайта представляют собой наиболее важные и интересные фрагменты из учебных пособий и научных работ из самых разнообразных отраслей психологии.

Проект будет полезен психологам и врачам, студентам и преподавателям, специалистам в области управления, а также широкому кругу читателей, интересующихся вопросами современной психологии.

Предпосылки возникновения конфликта в процессе общения

Рассмотрим особенности поведения человека в конфликтной ситуации прежде всего в процессе общения. В процессе человеческих взаимоотношений, как вы уже знаете из предыдущих разделов, процесс общения предполагает наличие следующих трех факторов: восприятия, эмоций и обмена информацией. В конфликтных ситуациях легко забыть об этом. Поэтому кратко рассмотрим, что же может создавать почву для их возникновения.

Социально-психологические предпосылки. Первая трудность — это разногласия из-за несовпадения ваших рассуждении с рассуждениями другой стороны. Ведь то, какой вы видите проблему, зависит от того, с какой колокольни, образно говоря, смотрите на нее.

Специфика конфликтов в образовательных процессах

В культурно-историческом подходе Л.С. Выготского процессы образования рассматриваются, с одной стороны, как предназначенные для разрешения противоречий развития общества, с другой — как обладающие внутренне противоречивым характером.

Мы придерживаемся именно этого подхода, и вслед за Л.С. Выготским и его последователями исходим из того, что конфликт представляет собой механизм развития человеческой деятельности и соответственно личности.

Современная психология: ее задачи и место в системе наук

В последние годы наблюдается бурное развитие психологической науки, обусловленное многообразием теоретических и практических задач, встающих перед нею. В нашей стране интерес к психологии особенно показателен — ей наконец-то начинают уделять то внимание, которого она заслуживает, причем практически во всех отраслях современного образования и бизнеса.

Основной задачей психологии является изучение законов психической деятельности в ее развитии. В течение последних десятилетий значительно расширились диапазон и направления психологических исследований, появились новые научные дисциплины.

Методы психологии

Методы научных исследований — это те приемы и средства, с помощью которых ученые получают достоверные сведения, используемые далее для построения научных теорий и выработки практических рекомендаций.

Сила науки во многом зависит от совершенства методов исследования, от того насколько они валидны и надежны, как быстро и эффективно данная отрасль знаний способна воспринять и использовать у себя все самое новое, передовое, что появляется в методах других наук.

Алгоритм оценки достоверности информации в результате психофизиологического исследования с применением полиграфа

Двадцать лет назад использование прибора способного отличить ложь от правды – «детектора лжи» было исключительной прерогативой спецслужб ведущих мировых держав. За прошедшие годы ситуация кардинально изменилась.

Проверки на «детекторе», стали доступными для широкого круга потребителей – правоохранительных органов, руководителей коммерческих и банковских структур, представителей кадровых служб, частных охранных предприятий и просто граждан, желающих получить достоверную информацию.

Процесс формирования двигательного навыка. Принцип активности и его развитие Н.А. Бернштейном

Переходим к следующей важной теме, совершенно по-новому раскрытой Н. А. Бернштейном, — механизмам формирования навыка. Эта проблема очень важна для психологии, так как формирование навыков составляет, как вы уже знаете, основу всякого обучения.

Процесс формирования навыка описан у Бернштейна очень подробно. Он выделил много частных фаз — порядка семи, которые объединяются в более общие периоды. Для первого знакомства достаточно будет разобрать эти периоды.

Проблема психодинамического диагноза

Психодинамическая диагностика, в отличие от дискретно-описательного диагностического подхода, укоренившегося в отечественных медицинской и психологической традициях, представляет собой прежде всего диагностику структуры личности с точки зрения ее развития.

Подобный подход, обеспечивающий целостный и всесторонний анализ личности и ее психопатологии, определяет и специфику терапевтических методов.

Психологическая профилактика конфликтов в коллективе

Многие организационные конфликты легче предупредить, чем разрешить.

Поскольку центральными фигурами конфликтов в организации являются конкретные личности, то такая профилактика должна быть личностно-ориентированной.

Остановимся на некоторых особо значимых организационно-управленческих условиях, способствующих снижению конфликтности личности.

Четыре элемента процесса убеждения

Процесс убеждения складывается из следующих элементов: агент влияния (источник сообщения), само сообщение, условия, в которых передается сообщение (контекст), и реципиент, то есть тот индивид, которому предназначено сообщение.

Само сообщение, в зависимости от его содержания, от того, как оно сформулировано и в какой форме преподнесено, также может либо убеждать, либо внушать. Но может и не иметь вообще никакого эффекта.

Повышение уровня сознания. Насколько это важно?

Тема самосовершенствования и развития человеческих качеств, можно сказать, вечная, при этом мудрые люди часто повторяют, что самой важной задачей для каждого человека является развитие его собственного сознания.

Несмотря на очевидную важность темы, серьезных и качественных материалов, посвященных этому вопросу, не так уж и много, хотя периодически все же появляются интересные работы.

6. Виды валидности:

Очевидная (внешняя валидность) — отражает, насколько по внешнему впечатлению от методики можно определить её направленность.

Конкурентная валидность — характеризует, как результаты, полученные по данной методике, коррелируют с результатами по другим тестам.

Прогностическая валидность — отражает, как задания данной методики коррелируют с каким-либо поздним временным критерием.

Валидность по внешнему критерию — показывает, как задания методики коррелируют с каким-либо внешним критерием.

Содержательная валидность — определяет, насколько задания теста отражают все аспекты исследуемой области поведения.

Конструктная валидность.Предполагает полное описание измеряемой переменной, выдвижение системы гипотез о связях ее с другими переменными, эмпирическое подтверждение (неопровержение) этих гипотез.

7. Процедура эмпирической валидизации.

Организация выборки при эмпирической валидизации зависит от временного статуса критерия. Если этот критерий — событие в прошлом (ретроспективная валидизация), то к участию в психодиагностическом обследовании достаточно привлечь только тех испытуемых, которые оказались на экстремальных полюсах по этому критерию. В результате применяется метод экстремальных (контрастных) групп. Коррелирование с суммарным баллом по тесту оценивается с помощью бисериального коэффициента по формуле (3.

2.17). При этом в статусе дихотомической переменной (на месте отдельного пункта) оказывается сам критерий валидности: x— сумма баллов по тесту, полученных «высокой» группой по критерию; — стандартная ошибка критерия, связанная с численностью «высокой» (р) и «низкой» (q) групп.

8. Провести теоретическую валидизацию методики – это показать, действительно ли методика измеряет именно то свойство, качество, которое она, по замыслу исследователя, должна измерять. Так, например, если какой-то тест разрабатывался для того, чтобы диагностировать умственное развитие школьников, надо проанализировать, действительно ли он измеряет именно это развитие, а не какие-то другие особенности(например, личность, характер и т.п.). Таким образом, для теоретической валидизации кардинальной проблемой является отношение между психическими явлениями и их показателями, посредством которых эти психические явления пытаются познать. Она показывает, что замысел автора и результаты методики совпадают.

9. Приводится 12 факторов, угрожающих валидности различных экспериментальных планов. Каждый фактор будет подробнее описан при обсуждении тех планов, в которых его действие проявляется наиболее отчетливо, и этот список будет завершен после обсуждения 10 из 16 планов. Основным при составлении этого списка было различение внутренней и внешней валидности.

Внутренняя валидность — это тот минимум, без которого не может быть интерпретирован ни один эксперимент: действительно ли именно это экспериментальное воздействие привело к изменениям в данном эксперименте? Внешняя валидность относится к возможности обобщения вывода: на какие популяции, ситуации, другие независимые переменные, параметры воздействия и переменные измерения могут быть распространены результаты эксперимента. Несомненно, что оба типа критериев являются важными, хотя часто они находятся в противоречии в том смысле, что увеличение валидности одного типа может угрожать валидности другого типа. Хотя внутренняя валидность есть условие sine qua non и хотя проблема внешней валидности, как и проблема индуктивного вывода, никогда не может быть полиостью решена, очевидно, что нашим идеалом является выбор таких экспериментальных планов, которые обеспечивают оба типа валидности. Это особенно важно для педагогических исследований, где весьма желательным является распространение данных на практические ситуации определенного характера. Различия и взаимоотношения между этими двумя видами валидности станут яснее после рассмотрения примеров при обсуждении конкретных типов эксперимента.

Далее будут представлены восемь различных классов внешних переменных, относящихся к внутренней валидности. Если эти переменные не контролируются в экспериментальном плане, то они могут дать эффекты, которые смешиваются с эффектом экспериментального воздействия. Эти переменные представляют влияние:

1) фона (history) — конкретных событий, которые происходят между первым и вторым измерением наряду с экспериментальным воздействием;

2) естественного развития (maturation) — изменений испытуемых, являющихся следствием течения времени per se (не связанных с конкретными событиями), например взросление, усиление голода, усталости и т.

п.;

3) эффекта тестирования (testing) — влияния выполнения заданий, применяемых для измерения, на результаты повторного испытания;

4) инструментальной погрешности, нестабильности измерительного инструмента (instrumentation), при которой изменения в калибровке инструмента или изменения, характеризующие наблюдателя или оценочные показатели, могут вызвать изменения в результатах измерения;

5) статистической регрессии (statistical regression), имеющей место тогда, когда группы отбираются на основе крайних показателей и оценок;

6) отбора испытуемых (selection) — неэквивалентности групп по составу, вызывающей появление систематической ошибки в результатах;

7) отсева в ходе эксперимента (experimental mortality) — неравномерности выбывания испытуемых из сравниваемых групп;

8) взаимодействий фактора отбора с естественным развитием и др., которые в ряде квазиэкспериментальных планов с несколькими группами (таких, как план 10) ошибочно принимаются за эффект экспериментальной переменной.

К факторам, ставящим под угрозу внешнюю валидность, или репрезентативность эксперимента, относятся:

9) реактивный эффект, или эффект взаимодействия тестирования, — возможное уменьшение или увеличение сензитивности, или восприимчивости, испытуемых к экспериментальному воздействию под влиянием предварительного тестирования. Результаты лиц, прошедших предварительное тестирование, будут нерепрезентативны по отношению к тем, кто не подвергался предварительному тестированию, то есть тем, из кого состоит генеральная совокупность, из которых были отобраны испытуемые;

10) эффекты взаимодействия фактора отбора и экспериментального воздействия;

11) условия организации эксперимента, вызывающие реакцию испытуемых на эксперимент, которая не позволяет распространить полученные данные о влиянии экспериментальной переменной на лиц, подвергающихся такому же воздействию в неэкспериментальных условиях;

12) взаимная интерференция экспериментальных воздействий, нередко возникающая, когда одни и те же испытуемые подвергаются нескольким воздействиям, поскольку влияние более ранних воздействий, как правило, не исчезает. Это относится особенно к планам экспериментов с одной группой (планы типа 8 и 9).

10. Диагностическая методика отличается от любой исследовательской тем, что она стандартизирована.

10.Стандартизация (по Анастази) – это единообразие процедуры проведения и оценки выполнения теста. Таким образом, стандартизация рассматривается в двух планах: как выработка единых требований к процедуре эксперимента и как определение единого критерия оценки результатов диагностических испытаний. Стандартизация процедуры эксперимента подразумевает унификацию инструкций, бланков обследования, способов регистрации результатов, условий проведения обследования.

11.Требования к проведению теста

1. инструкции следует сообщать испытуемым одинаковым образом, как правило, письменно; в случае устных указаний они даются в разных группах одними и теми же сло-вами, понятными для всех, в одинаковой манере;

ни одному испытуемому не следует давать никаких преимуществ перед другими;

3. в процессе теста не следует давать отдельным испытуемым дополнительные пояснения;

4. тест с разными группами следует проводить в одинаковое по возможности время дня, в сходных условиях;

5. временные ограничения в выполнении заданий для всех испытуемых должны быть одинаковыми и так далее.

12. Отдельно следует остановиться на классификации диагностических процедур по такому критерию, как характер оценки. Совершенно естественно, что практически любой вид психологической диагностики можно рассматривать как процедуру экспертизы, то есть «рассмотрение какого-либо вопроса экспертами для вынесения заключения», «исследование какого-либо вопроса, требующего специальных знаний с представлением мотивированного заключения» (Толковый словарь русского языка, 1995

). Конечной целью любой экспертизы является ответ на поставленный заказчиком вопрос, который оформляется в виде экспертного заключения.

Вопросы, решаемые экспертным исследованием, определяются на основе реальных потребностей практики. Основными форм

13. Выборка стандартизации — множество испытуемых, на котором собираются диагностические нормы и проводится стандартизация диагностической шкалы.

Всякая большая совокупность людей, которую хотели бы исследовать или относительно которых собираются делать выводы, называется генеральной совокупностью.

14. В общих чертах стандартизация диагностической методики, ориентированной на норму, осуществляется путем ее проведения на большой представительной выборке испытуемых, которая ничем не отличается от той, для которой данная методика предназначена. На этой группе испытуемых, называемой выборкой стандартизации, разрабатываются нормы, указывающие не только средний уровень выполнения, но и его относительную вариативность выше и ниже среднего уровня. В результате можно оценить разные степени успешности или неуспешности в выполнении диагностической пробы.

Это позволяет определить положение конкретного испытуемого относительно выборки стандартизации.

Для вычисления статистической нормы психологи-диагносты обратились к давно применяемым в биологии приемам математической статистики.

Рассмотрим пример.

На призывной пункт явилось несколько тысяч молодых людей.

Допустим, что все они примерно одного возраста. Что мы получим при измерении их роста? Обычно оказывается, что большинство почти одного роста, совсем немного будет людей очень маленького и очень высокого роста. Остальные же распределятся симметрично, уменьшаясь по количеству от среднего максимума в ту и другую сторону. Распределение рассматриваемых величин — это нормальное распределение (или распределение по нормальному закону, кривая распределения Гаусса). Математики показали, что для описания такого распределения достаточно знать два показателя — среднюю арифметическую и так называемое стандартное отклонение, которое получается путем несложных вычислений. Назовем среднюю арифметическую х, а стандартное отклонение ? (сигма малая). При нормальном распределении все изучаемые величины практически находятся в пределах х + 5 ?.

Рассмотрим как определялась статистическая норма для тестов Стэн-форд-Бине. В группу испытуемых входили 4498 человек от 2,5 до 18 лет. Усилия стэнфордских психологов были направлены на то, чтобы распределение полученных по каждому возрасту данных о выполнении тестов было близко к нормальному. Этого результата удалось добиться далеко не сразу; в некоторых случаях ученым приходилось заменять одни задания другими. В конце концов эта работа была закончена, и были подготовлены тесты по каждому возрасту со средней арифметической, равной 100, и со стандартным отклонением, равным 16. Принимается, что результаты в пределах х ± ? показывают границы наиболее характерной, представительной части распределения, границы нормы для данного возраста. При ? = 16 и х = 100 эти границы нормы будут от 84 до 116. Интерпретируется это так: результаты испытуемых, которые не выходят за эти границы, находятся в пределах нормы. Те, чьи результаты менее 84, находятся ниже нормы, а те, чьи результаты более 116, — выше нормы. Нередко этот же прием применяют и для дальнейшей классификации. Тогда результаты в пределах от х — ? до х — 2 ? интерпретируются как «несколько ниже нормы», а от х — 2 ? до х — З ? — как «значительно ниже нормы». Соответственно классифицируются результаты, находящиеся выше нормы.

15. В психодиагностике существует и другой подход к оценке результатов диагностических испытаний. В нашей стране под руководством К. М. Гуревича разрабатываются тесты, в которых в качестве точки отсчета выступает не статистическая норма, а независимый от результатов испытания, объективно заданный социально-психологический норматив.

Социально-психологический норматив реализуется в совокупности заданий, составляющих тест. Следовательно, сам тест в полном его объеме и является таким нормативом. Все сопоставления индивидуальных или групповых результатов тестирования проводятся с тем максимумом, который представляется в тесте (а это полный набор знаний). В качестве критерия оценки выступает показатель, отражающий степень близости результатов к нормативу. Имеется разработанная схема представления групповых количественных данных.

Для анализа данных относительно их близости к социально-психологическому нормативу, условно рассматриваемому как 100 %-ное выполнение всего теста, все испытуемые подразделяются по результатам тестирования на 5 подгрупп:

1) наиболее успешные — 10%; 2) близкие к успешным — 20 %; 3) средние по успешности — 40 %; 4) мало успешные — 20 %; 5) наименее успешные — 10%.

Для каждой из подгрупп подсчитывается средний процент правильно выполненных заданий. Строится система координат, где по оси абсцисс идут номера подгрупп, по оси ординат — процент выполненных каждой из подгрупп заданий. После нанесения соответствующих точек вычерчивается график, отражающий приближение каждой из подгрупп к социально-психологическому нормативу. Такая обработка проводится по результатам как теста в целом, так и каждого субтеста в отдельности.

5.3 Экспериментирование и валидность – методы исследования в психологии

Цели обучения

Объясните, что такое внутренняя валидность и почему считается, что эксперименты обладают высокой внутренней валидностью.
Объясните, что такое внешняя валидность, и оцените исследования с точки зрения их внешней валидности.
Объясните понятия построения и статистической достоверности.

Четыре важных факта

Когда мы читаем о психологических экспериментах с критической точки зрения, возникает один вопрос: «Достоверно ли это исследование?» Однако этот вопрос не так прост, как кажется, потому что в психологии существует множество различных видов валидности. Исследователи сосредоточились на четырех показателях достоверности, чтобы помочь оценить правильность эксперимента (Judd & Kenny, 19).81; Morling, 2014) ^[1] ^[2] : внутренняя валидность, внешняя валидность, конструктивная валидность и статистическая валидность. Мы подробно изучим каждую валидность.

Внутренняя валидность

Статистическая связь между двумя переменными не обязательно означает, что одна является причиной другой. «Корреляция не подразумевает причинно-следственной связи». Например, если бы люди, которые регулярно занимаются спортом, были счастливее тех, кто не занимается спортом регулярно, это не обязательно означало бы, что занятия спортом повышают уровень счастья людей. Вместо этого это может означать, что больше счастья заставляет людей заниматься спортом или что что-то вроде улучшения физического здоровья заставляет людей заниматься спортом и будьте счастливее.

Цель эксперимента, однако, состоит в том, чтобы показать, что две переменные статистически связаны, и сделать это таким образом, чтобы подтвердить вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Логика основана на следующем предположении: если исследователь создает два или более очень похожих условия, а затем манипулирует независимой переменной, чтобы получить только одно различие между ними, то любое последующее различие между условиями должно быть вызвано независимой переменной. Например, поскольку единственное различие между условиями Дарли и Латане заключалось в количестве студентов, которые, по мнению участников, участвовали в обсуждении, это различие в убеждениях должно было быть ответственным за различия в оказании помощи между условиями.

Считается, что эмпирическое исследование имеет высокую внутреннюю валидность , если способ его проведения подтверждает вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Таким образом, эксперименты обладают высокой внутренней валидностью, потому что способ их проведения — с манипулированием независимой переменной и контролем посторонних переменных — обеспечивает сильную поддержку причинно-следственных выводов. Напротив, неэкспериментальные планы исследования (например, корреляционные планы), в которых переменные измеряются, но экспериментатор не манипулирует ими, имеют низкую внутреннюю валидность.

Внешняя валидность
В то же время способ проведения экспериментов иногда вызывает разного рода критику. В частности, необходимость манипулировать независимой переменной и контролировать внешние переменные означает, что эксперименты часто проводятся в условиях, которые кажутся искусственными (Bauman, McGraw, Bartels, & Warren, 2014) ^[3] . Во многих психологических экспериментах все участники являются студентами бакалавриата и приходят в аудиторию или лабораторию, чтобы заполнить серию бумажных и карандашных вопросников или выполнить тщательно разработанное компьютеризированное задание. Рассмотрим, например, эксперимент, в котором исследователь Барбара Фредриксон и ее коллеги предложили студентам бакалавриата прийти в лабораторию на территории кампуса и выполнить тест по математике в купальниках (Fredrickson, Roberts, Noll, Quinn, & Twenge, 19).98) ^[4] . Поначалу эта манипуляция может показаться глупой. Когда студенты бакалавриата когда-нибудь должны будут выполнять тесты по математике в купальниках помимо этого эксперимента?
Мы сталкиваемся с проблемой внешней достоверности . Эмпирическое исследование имеет высокую внешнюю валидность, если способ его проведения поддерживает обобщение результатов на людей и ситуации, выходящие за рамки реально изученных. Как правило, исследования имеют более высокую внешнюю валидность, когда участники и изучаемая ситуация аналогичны тем, которые исследователи хотят обобщить, и с которыми участники сталкиваются каждый день, что часто описывается как приземленный реализм . ^{Представьте, например, что группу исследователей интересует, как на покупателей в крупных продуктовых магазинах влияет то, упакованы ли хлопья для завтрака в желтые или фиолетовые коробки. Их исследование имело бы высокую внешнюю достоверность и высокий реализм, если бы они изучали решения обычных людей, совершающих еженедельные покупки в реальном продуктовом магазине. Если бы покупатели купили гораздо больше хлопьев в фиолетовых коробках, исследователи были бы вполне уверены, что это увеличение будет справедливо для других покупателей в других магазинах. Однако их исследование было бы относительно низким по внешней валидности, если бы они изучали выборку студентов бакалавриата в лаборатории избирательного университета, которые просто оценивали привлекательность различных цветов, представленных на экране компьютера; тем не менее, это исследование будет иметь высокие психологический реализм , где один и тот же мыслительный процесс используется как в лаборатории, так и в реальном мире. Если бы учащиеся сочли фиолетовый цвет более привлекательным, чем желтый, исследователи не были бы уверены в том, что это предпочтение имеет отношение к решениям покупателей о покупке хлопьев из-за низкой внешней валидности, но они могли бы быть уверены, что визуальная обработка цветов имеет высокое значение. психологический реализм.}
Однако нам следует быть осторожными и не делать категорического вывода, что эксперименты имеют низкую внешнюю валидность. Одна из причин заключается в том, что эксперименты не должны казаться искусственными. Учтите, что эксперимент Дарли и Латане обеспечил достаточно хорошую симуляцию реальной чрезвычайной ситуации. Или рассмотрим полевые эксперименты , которые проводятся полностью за пределами лаборатории. В одном из таких экспериментов Роберт Чалдини и его коллеги изучали, предпочитают ли гости отеля повторно использовать свои полотенца в течение второго дня, а не стирать их, чтобы сэкономить воду и энергию (Cialdini, 2005) ^[5] . Эти исследователи манипулировали сообщением на карточке, оставленной в большом количестве гостиничных номеров. В одной версии сообщения подчеркивалось уважение к окружающей среде, в другой подчеркивалось, что отель пожертвует часть своих сбережений на экологические цели, а в третьей подчеркивалось, что большинство гостей отеля предпочитают повторно использовать свои полотенца. В результате гости, получившие сообщение о том, что большинство постояльцев отелей предпочитают повторно использовать свои полотенца, значительно чаще использовали собственные полотенца, чем гости, получившие любое из двух других сообщений. Учитывая то, как они провели свое исследование, весьма вероятно, что их результаты будут справедливы и для других гостей в других отелях.
Вторая причина, по которой не следует делать общий вывод о том, что эксперименты имеют низкую внешнюю валидность, заключается в том, что они часто проводятся для изучения психологических процессов , которые могут проявляться у различных людей и ситуаций. Вернемся к эксперименту Фредриксона и его коллег. Они обнаружили, что женщины в их исследовании, но не мужчины, хуже справлялись с тестом по математике, когда были в купальниках. Они утверждали, что это гендерное различие было связано с большей склонностью женщин объективировать себя — думать о себе с точки зрения стороннего наблюдателя, — что отвлекает их внимание от других задач. Более того, они утверждали, что этот процесс самообъективации и его влияние на внимание, вероятно, проявляются у самых разных женщин и ситуаций, даже если ни одна из них никогда не окажется на контрольной по математике в купальнике.
Конструктивная валидность
В дополнение к обобщаемости результатов эксперимента еще одним элементом, который необходимо тщательно изучить в исследовании, является качество манипуляций эксперимента или конструктная валидность . Исследовательский вопрос, с которого начали Дарли и Латане, звучит так: «Распространяется ли помогающее поведение?» Они предположили, что участники лаборатории с меньшей вероятностью будут помогать, если будут считать, что кроме них самих есть еще потенциальные помощники. Этот переход от исследовательского вопроса к плану эксперимента называется операционализация (дополнительную информацию об операционном определении см. в главе 4). Дарли и Латане ввели в действие независимую переменную распределения ответственности, увеличив количество потенциальных помощников. Оценивая этот план, мы бы сказали, что валидность построения была очень высокой, потому что манипуляции эксперимента очень четко соответствуют исследовательскому вопросу; был кризис, способ помочь участнику, и увеличение числа других студентов, вовлеченных в обсуждение, они предоставили способ проверить распространение.
Что, если количество состояний в исследовании Дарли и Латане изменилось? Подумайте, если бы было только два условия: один студент участвовал в обсуждении или два. Несмотря на то, что мы можем видеть уменьшение помощи, добавляя еще одного человека, это может быть не явной демонстрацией рассеяния ответственности, а просто присутствием других. Мы могли бы подумать, что это была форма социального торможения Бандуры. Конструктивная валидность будет ниже. Однако, если бы было пять условий, возможно, мы бы увидели, что снижение продолжится с большим количеством людей в обсуждении, или, возможно, оно остановится после определенного количества людей. В этой ситуации мы не обязательно узнаем больше о распределении ответственности, или это может стать другим явлением. При добавлении дополнительных условий валидность конструкции может не повыситься. При планировании собственного эксперимента подумайте, насколько хорошо исследовательский вопрос используется в вашем исследовании.
Статистическая достоверность
Статистическая достоверность касается надлежащей статистической обработки данных и достоверности статистических выводов исследователей. Существует множество различных типов тестов логической статистики (например, тесты t-, ANOVA, регрессия, корреляция), и статистическая достоверность касается использования надлежащего типа теста для анализа данных. При выборе надлежащего типа теста исследователи должны учитывать шкалу измерения, по которой измерялась их зависимая переменная, и дизайн своего исследования. Кроме того, многие тесты логической статистики содержат определенные допущения (например, данные распределяются нормально), и статистическая достоверность находится под угрозой, когда эти допущения не выполняются, но статистика, тем не менее, используется.
Одним из распространенных критических замечаний по поводу экспериментов является то, что в исследовании недостаточно участников. Основная причина этой критики заключается в том, что трудно сделать обобщение о населении на основе небольшой выборки. Вначале кажется, что эта критика касается внешней валидности, но есть исследования, в которых небольшие размеры выборки не являются проблемой (в последующих главах будет обсуждаться, как небольшие выборки, даже всего из одного человека, по-прежнему очень полезны для психологических исследований). Таким образом, небольшие размеры выборки на самом деле являются критикой статистической достоверности. Статистическая достоверность говорит о том, являются ли статистические данные, проведенные в исследовании, достоверными и подтверждают ли сделанные выводы.
Необходимо провести надлежащий статистический анализ данных, чтобы определить, были ли обнаружены предсказанные различия или взаимосвязи. Количество условий и общее количество участников будут определять общий размер эффекта. С помощью этой информации можно провести анализ мощности, чтобы убедиться, что вы обнаружите реальную разницу. При разработке исследования лучше всего подумать об анализе мощности, чтобы можно было набрать и протестировать соответствующее количество участников. Чтобы спланировать статистически достоверный эксперимент, размышление о статистических тестах в начале планирования поможет убедиться, что результатам можно верить.
Приоритизация валидности
Эти четыре большие валидности — внутренняя, внешняя, конструкционная и статистическая — полезно помнить, когда читаешь о других экспериментах и планируешь свои собственные. Однако исследователи должны расставить приоритеты, и часто невозможно иметь высокую достоверность во всех четырех областях. В исследовании Чалдини об использовании полотенец в отелях внешняя валидность была высокой, но статистическая валидность была скромнее. Это несоответствие не делает исследование недействительным, но показывает, что можно улучшить для будущих последующих исследований (Goldstein, Cialdini, & Griskevicius, 2008) ^[6] . Морлинг (2014) отмечает, что большинство психологических исследований имеют высокую внутреннюю и конструктивную валидность, но иногда приносят в жертву внешнюю валидность.
Основные выводы
Исследования обладают высокой внутренней валидностью в той мере, в какой способ их проведения подтверждает вывод о том, что независимая переменная вызвала любые наблюдаемые различия в зависимой переменной. Эксперименты, как правило, имеют высокую внутреннюю достоверность из-за манипулирования независимой переменной и контроля внешних переменных.
Внешняя валидность исследований высока в той мере, в какой результат можно обобщить на людей и ситуации, выходящие за рамки реально изучаемых. Хотя эксперименты могут показаться «искусственными» и малопривлекательными, важно учитывать, могут ли изучаемые психологические процессы проявляться в других людях и ситуациях.
Джадд, К.М. и Кенни, Д.А. (1981). Оценка воздействия социальных вмешательств . Кембридж, Массачусетс: Издательство Кембриджского университета. ↵
Морлинг, Б. (2014, апрель). Научите своих учеников быть лучшими потребителями. Наблюдатель АПС . Получено с http://www.psychologicalscience.org/index.php/publications/observer/2014/april-14/teach-your-students-to-be-better-consumers.html ↵
Bauman, C.W., McGraw, А.П., Бартельс, Д.М., и Уоррен, К. (2014). Пересматривая внешнюю валидность: озабоченность проблемами троллейбусов и другими жертвенными дилеммами в моральной психологии. Компас социальной психологии и психологии личности, 8/9, 536-554. ↵
Фредриксон, Б.Л., Робертс, Т.-А., Нолл, С.М., Куинн, Д.М., и Твенге, Дж.М. (1998). Купальник становится вами: половые различия в самообъективации, воздержании от еды и математических способностях. Журнал личности и социальной психологии, 75 , 269–284. ↵
Чалдини, Р. (2005 г., апрель). Не бросайте полотенце: используйте исследования социального влияния. Наблюдатель АПС . Получено с http://www.psychologicalscience.org/index.php/publications/observer/2005/april-05/dont-throw-in-the-towel-use-social-influence-research.html ↵
Гольдштейн, Нью-Джерси, Чалдини, Р. Б., и Грискявичюс, В. (2008). Комната с точки зрения: использование социальных норм для мотивации сохранения окружающей среды в отелях. Journal of Consumer Research, 35 , 472–482. ↵
Валидность — Центр психологии
Валидность
Валидность означает точность. Результаты действительны, если они точно показывают то, что должны показать (например, вы измерили то, что хотели? Можете ли вы обобщить результаты?).
Вам необходимо знать о внутренней и внешней действительности.
(1) Внутренняя валидность: Относится к тому, измеряло ли исследование то, что оно намеревалось измерить (например, влияние IV на DV). Чтобы выяснить, имеет ли часть исследования высокую внутреннюю валидность, спросите сами:
Электромобили контролировались? (Да)
Были ли резюме? (Нет)
Измерялось ли в ходе исследования влияние внутривенного вливания на ДВ? (Да)
Если вы найдете ответы выше, то исследование имеет высокую внутреннюю достоверность, это хорошо, потому что вы можете установить причину и следствие между IV и DV. Тщательно контролируемые исследования имеют высокую внутреннюю валидность.
Способы измерения/оценки внутренней валидности
1. Внешняя валидность: Является ли показатель номинальной стоимостью для проверки того, на что он претендует. Например, действительно ли интервью о пристрастии к алкоголю измеряет привычки употребления алкоголя или оно просто вызывает социально желательные реакции? Если он включает вопросы, вызывающие социально желательные ответы, он, скорее всего, будет иметь низкую внутреннюю валидность.
2. Параллельная валидность: Выдает ли новый тест ту же меру переменной, что и существующие тесты того же явления. Новый вопросник, определяющий факторы риска злоупотребления наркотиками, должен выявить многие из тех же факторов риска, что и существующий хорошо известный вопросник, если он обладает высокой внутренней достоверностью.
3. Прогностическая достоверность: Может ли мера точно прогнозировать будущие последствия. Например, тест, предназначенный для выявления факторов риска алкоголизма, может быть продолжен, и если достоверность будет высокой, те, у кого выявлены более высокие факторы риска, с большей вероятностью проявят признаки злоупотребления алкоголем.
При проведении исследования важно, чтобы внутренняя валидность была высокой и чтобы исследователи могли быть довольны тем, что IV является единственной переменной, влияющей на DV (в этом случае можно установить причинно-следственную связь). Чтобы улучшить внутреннюю валидность, исследователи применяют ряд различных методов.
Стратегии улучшения (повышения) внутренней валидности:
(1) Стандартизированные инструкции набор инструкций/сценариев, которым следует исследователь при проведении исследования. Эти инструкции/сценарий указывают экспериментатору, как приветствовать участника, как начинать исследование, как проводить исследование и как заканчивать исследование/благодарить участников. Этот скрипт гарантирует, что все испытания исследователя проводятся одинаково для каждого участника.
Какое EV преодолевает эта стратегия?
Эффекты экспериментатора из-за того, что экспериментатор следует сценарию, они с меньшей вероятностью заставят участников вести себя определенным образом.
Ситуационная переменная можно также избежать ситуационных переменных, поскольку обычно стандартизированные инструкции указывают экспериментатору, как именно должна быть настроена исследовательская среда (например, температура в комнате, ресурсы и т. д.), что гарантирует постоянство среды для каждого участника.
(2) Двойной слепой метод , когда участник не знает истинной цели исследования, в котором он принимает участие. Кроме того, ключевой исследователь нанимает ассистента для проведения исследования, который также не зная об истинных симах/природе эксперимента, который они проводят.
Какое EV преодолевает эта стратегия?
Характеристики спроса участники с меньшей вероятностью изменят свое поведение, если истинная цель исследования не будет доведена до их сведения до конца исследования. Это приводит к тому, что участники демонстрируют более точное поведение.
Эффекты экспериментатора Если научный сотрудник не знает истинных целей исследования, он не сможет предложить участнику, как они хотят, чтобы он вел себя/меньше вероятность того, что он повлияет на поведение участника.
(3) Простой слепой метод , когда участник, принимающий участие в исследовании, не знает об истинных целях исследования, в котором он принимает участие.
Какое EV преодолевает эта стратегия?
Характеристики спроса участники с меньшей вероятностью изменят свое поведение, если истинная цель исследования не будет доведена до их сведения до конца исследования. Это приводит к тому, что участники демонстрируют более точное поведение.
(4) Автоматизация , когда инструкции эксперимента записываются и воспроизводятся участникам (в отличие от получения инструкций непосредственно от исследователя).
Какое EV преодолевает эта стратегия?
Эффекты экспериментатора из-за того, что исследователь не вступает в контакт с участником (поскольку инструкции даются через предварительно записанную ленту), экспериментатор не сможет внушать участнику как они хотят, чтобы они вели себя/менее вероятно, чтобы повлиять на поведение участников.
(5) Экспериментальные схемы также можно использовать для повышения внутренней достоверности.
Дизайн независимых измерений , когда участники принимают участие только в одном условии в рамках исследования. Это помогает преодолеть характеристики спроса, поскольку участники, принимающие участие только в одном условии, вряд ли догадаются о цели исследования и изменят свое поведение. Также преодолевает эффекты порядка, участники, принимающие участие только в одном условии, с меньшей вероятностью будут тренироваться или скучать.
Схема повторных измерений , когда участники находятся в каждом состоянии в ходе исследования. Этот метод позволяет обойти переменные участников, потому что один и тот же участник принимает участие в каждом условии, существует постоянство в отношении характеристик участников (пол, возраст и т. д.). Это означает, что (из-за того, что переменные участников контролируются) исследование, скорее всего, будет измерять только влияние IV на DV.
План подбора пар когда участники принимают участие только в одном условии в части исследования, однако, участники в состоянии 1 сопоставляются с участниками в условии 2 по определенной характеристике (например, IQ, возраст , пол и т. д.) В этом методе не учитываются переменные участников, поскольку ключевые характеристики участников совпадают во всех условиях, и, следовательно, существует согласованность в отношении характеристик участников (пол, возраст и т. д.). Это означает, что (из-за того, что переменные участников контролируются) исследование, скорее всего, будет измерять только влияние IV на DV.
(6) Уравновешивание- Используется, когда в исследовании использовался план повторных измерений, чтобы избежать эффектов порядка . Экспериментаторы опасаются, что при использовании схемы повторных измерений результат исследования рискует оказаться предвзятым. Например, возьмем эксперимент с двумя условиями (условия A и B), если участники сначала выполняют условие A, а затем условие B, исследователи говорят, что выполнение условия A обычно отражает реальное поведение участников. Однако в условии B, поскольку участники уже завершили часть эксперимента, возможно, что их поведение может измениться одним из двух способов;
Эффекты порядка они могут стать практикованными в задании (улучшить выполнение исследовательского задания, которое им было предложено выполнить), что может привести к неестественно завышенным результатам участников (и, следовательно, не к измерению истинного поведения).
Эффекты порядка участнику может стать скучно во втором условии, и он не может пытаться/уделять эксперименту свое истинное внимание, что опять-таки будет означать, что условие B измеряет неестественное поведение.
Если исследователь просит, чтобы участники всегда выполняли условие A, за которым следует B, результаты участников всегда могут быть неестественными в условии B (т. становятся хуже, потому что после завершения теста памяти в состоянии А они теперь не могут утруждать себя выполнением теста памяти в состоянии Б). Это приведет к искажению результатов, и исследователь не сможет точно измерить то, что он намеревается измерить. Принятие метод уравновешивания вовлекал половину участников, сначала выполнивших условие A, а затем B, а другую половину участников, выполнивших сначала условие B, а затем B. Это означает, что если есть какие-либо эффекты порядка, этот отрицательный эффект будет быть распределены по обоим условиям (скорее только по одному состоянию, обычно B), что означает, что исследование будет измерять более точно то, что оно намеревается измерить. Используйте фразу ABBA, чтобы помочь вам запомнить этот метод (50% участников выполняют условия AB, 50% участников выполняют условия BA).
(7) Случайное распределение , когда участники случайным образом распределяются по условиям A или B. Это делается для справедливого распределения переменных участников. Это преодолевает переменные участников, гарантируя, что они представляют собой равномерное распределение характеристик участников, сбалансированное по всем условиям исследования.
Внешняя валидность
Внешняя валидность: Относится к тому, можно ли обобщить исследование за пределами исследовательской среды;
* другие параметры ( экологические )
* другие люди ( население )
* другое время ( временное исследование себя; Проводилось ли исследование в естественных условиях? (Да) Является ли выборка участников репрезентативной для всего целевого населения? (Да) Отражает ли время, в которое проводилось исследование, другие периоды времени (т. е. происходило ли что-то социально значимое в это время?) (Да) Если вы найдете ответы выше, значит, исследование имеет высокую внешнюю валидность, это хорошо потому что вы можете обобщить свои выводы за пределами исследовательской среды, выборки и времени.
Примеры внешней валидности:
1. Если в вашем эксперименте участвуют только мужчины, но предполагается, что он представляет всю популяцию (как мужчин, так и женщин), то можно сказать, что он имеет низкую валидность
2. Если вы проводите свой первый эксперимент в классе и получаете такие же результаты, когда повторяете его в столовой, можно сказать, что ваш эксперимент имеет высокую экологическую достоверность
3. Если вы решите воспроизвести эксперимент, проведенный в 1963, но вы получаете совсем другие результаты, тогда можно сказать, что исходный эксперимент имеет низкую временную достоверность.
Улучшение внешней валидности
Наряду с контролем внешних переменных для повышения внутренней валидности также возможно улучшить внешнюю валидность вашего исследования.
(1) Улучшение валидность популяции исследователи должны убедиться, что они провели свои исследования на широкой репрезентативной выборке. Выборка в исследовании должна включать все группы целевой совокупности.
(2) Улучшение экологической достоверности исследователи должны убедиться, что они проводят исследования в естественной, не искусственной среде.
(3) Улучшение временная валидность исследователи должны убедиться, что они неоднократно проводили свои исследования в разное время, чтобы гарантировать, что результаты отражают текущий период времени.
Оценка внешней валидности
Внешнюю валидность можно оценить по:
(1) Повторение в реальных условиях: методологию можно использовать в реальных условиях (например, Милгрэм воспроизвел свое исследование послушания в захудалом офисе).
No related posts.