Валидность (психология) | это… Что такое Валидность (психология)?
Вали́дность (англ. validity) — мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики.
Как в экспериментальной психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять. То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент (возможный лишь в теории) будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.
Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам (однако при этом валидность не измеряется в каких-либо условных единицах).
Содержание
|
Способы установления валидности теста
Существуют четыре основных способа установления валидности теста.
- I. Оценка очевидной валидности.
Очевидная валидность – валидность, при которой оценивается общее соответствие теста его назначению.
- II. Оценка содержательной валидности.
Содержательная валидность предполагает, что тест обнаруживает в себе полный набор заданий для измерения определенной черты.
- III. Оценка конструктной валидности.
Этот способ проверки заключается в проведении продуманных экспериментов. Подход первый — «конвергентная валидизация» — это проверка ожидаемой связи тестовых оценок с другими показателями. Например, если для измерения какой-либо черты существует несколько методик, целесообразным было бы провести эксперименты по хотя бы двум, и тогда при обнаружении высокой положительной корреляции их результатов между собой можно говорить о валидности.
Основной целью конвергентной валидизации является определение того, будут ли оценки теста варьироваться в соответствии с ожиданиями. Подход второй — «дивергентная валидизация» (англ.). Проверка валидности здесь заключается в том, что тест не должен измерять никакой черты, с которой он теоретически и не должен быть связан.- IV. Оценка прогностической валидности.
Прогностическая валидность заключается в том, что психологический тест часто используется для прогноза поведения. Соответственно, если прогноз оправдывается с течением времени, это говорит о том, что тест был валидным. Но для характеристики многих видов деятельности этого метода не достаточно.
Требования к идеальному тесту
- Минимальное количество заданий. Однако чем больше личностных факторов хочет измерить тестирующий, тем большее количество вопросов целесообразнее задать тестируемому.
- Тест должен соответствовать целевой группе, на которую он направлен. Верно то утверждение, что тест, направленный на одну группу, в результате тестирования которой были получены достоверные результаты, может быть невалидным в отношении другого целевого сегмента.
- Адаптация теста. Применяется в случае проведения теста в иноязычной стране.
Виды валидности
- Внешняя валидность
- Операциональная валидность
- Конструктная валидность
- Внутренняя валидность
- Экологическая валидность
- Дифференциальная валидность
- Иллюзорная валидность
- Инкрементная валидность
- Консенсусная валидность
- Критериальная валидность
- Очевидная валидность
- Валидность по возрастной дифференциации
- Прогностическая валидность
- Содержательная валидность
- Текущая валидность
- Эмпирическая валидность
См. также
- Психологический эксперимент
- Безупречный эксперимент в психологии
- Эксперимент в науке
- Психометрия и психофизика
- Психодиагностика
- Экспериментальная психология
Ссылки
- А.Я. Психология: Виды валидности
- Валидность теста — Психологический словарь
Валидность это в психологии, виды валидности, понятие
Валидность – это один из базовых критериев в психодиагностике тестов, методик, определяющий их качество, близкое к понятию достоверности. Применяется, когда нужно узнать насколько хорошо методика измеряет именно то, на что она ориентирована, соответственно то, насколько лучше отображается исследуемое качество, тем большая валидность данной методики.
Вопрос о валидности возникает сперва в процессе разработки материала, потом после применения теста или методики, если необходимо узнать, соответствует ли степень выраженности определяемой характеристики личности и методом измерения этого свойства.
Понятие валидности выражается корреляцией результатов, которые получились в результате применения теста или методики с другими характеристиками, которые также исследуются, и ее можно также аргументировать комплексно, с помощью разных приемов и критериев. Используются разные виды валидности: концептуальная, конструктивная, критериальная, содержательная валидности, со свойственными методами установления их степени достоверности. Иногда критерий достоверности является обязательным требованием к проверке психодиагностических методов, если они вызывают сомнения.
Чтобы психологическое исследование имело реальную ценность, оно должно быть не только валидным, а еще и надежным одновременно. Надежность позволяет экспериментатору быть уверенным в том, что исследуемое значение очень близко к истинному показателю. А валидный критерий важен тем, что он указывает, что изучается именно то, что экспериментатор предполагает. Важно обратить внимание на тот факт, что данный критерий может предположить надежность, но надежность предположить валидность не может. Надежные значения могут быть не валидными, но валидные обязаны быть надежными, в этом вся суть успешного исследования, тестирования.
Валидность это в психологии
В психологии понятие валидности обозначает уверенность экспериментатора в том, что он измерял именно то, что хотел с помощью определенной методики, показывает меру соответствия результатов и самой методики относительно поставленных задач. Валидное измерение – это то значение, которое измеряет именно то, для чего было создано. Например, методика, направлена на определение темперамента, должна измерять именно темперамент, а не нечто другое.
Валидность в экспериментальной психологии очень важный аспект, является важным показателем, который обеспечивает достоверность результатов, и с ним иногда больше всего возникает проблем. Совершенный эксперимент должен обладать безупречной валидностью, то есть он должен демонстрировать, что экспериментальный эффект вызван модификациями независимой переменной и полностью соответствовать действительности. Полученные результаты без ограничений можно обобщать. Если речь идет о степени данного критерия, то предполагается, что результаты будут соответствовать поставленным задачам.
Проверка на валидность осуществляется тремя способами.
Оценивание содержательной валидности, проводится, чтобы узнать уровень соответствия использованной методики и реальной действительности, в которой выражается исследуемое свойство в методике. Существует здесь также такой компонент, как очевидная, еще ее называют лицевая валидность, она характеризует степень соответствия теста к ожиданиям оцениваемых. В большинстве методик считается очень важным, чтобы участник оценки видел очевидную связь содержания процедуры оценки и действительности того объекта оценки.
Оценивание конструктной валидности исполняется для получения степени обоснованности, что тест реально вычисляет те конструкты, которые заданные и научно обоснованные.
В конструктной валидности имеются два направления. Первый называется конвергентной валидизацией, с его помощью проверяется ожидаемая связь результатов методики с характеристиками из других методик, которые измеряют исходные свойства. Если для измерения какой-то характеристики необходимо несколько методик, то рациональным решением было бы проведение экспериментов минимум двух методик, чтобы при сопоставлении результатов обнаружив высокую положительную корреляцию, можно было утверждать о валидном критерии.
Конвергентная валидизация определяет вероятность вариации оценки теста с ожиданиями. Второй подход, называется дискриминантная валидизация, в ней заключается, что методика не должна измерять никаких характеристик, с которой теоретически не должно быть корреляции.
Проверка на валидность, также бывает критериальной, она, руководствуясь статистическими методами, определяет степень соответствия результатов к заранее определенным внешним критериям. Такими критериями могут быть: непосредственные меры, независимые от результатов методики или значение социально-организационных значимых показателей деятельности. В критериальной валидности также выделяют прогностическую, она применяется при потребности прогнозирования поведения. И если получается, что этот прогноз осуществляется со временем, значит методика прогностически валидна.
Валидность теста это
Тест – это стандартизованное задание в результате применения, которого получаются данные о психофизиологическом состоянии человека и его личностные свойства, его знания, способности и навыки.
Валидность и надежность тестов – это два показателя, которые определяют их качество.
Валидность теста определяет степень соответствия исследуемого качества, характеристики, психологического свойства к тесту, с помощью которого они определяются.
Валидность теста является показателем его эффективности и применяемости к измерению необходимой характеристики. Самые качественные тесты имеют 80% валидности. При валидизации следует учитывать, что от контингента испытуемых и их характеристик, будет зависеть качество результатов. Получается, что один тест может быть как высоко достоверным, так и совсем невалидным.
Существует несколько подходов к определению валидности теста.
При измерении сложного психологического явления, которое имеет иерархическую структуру и его невозможно исследовать, применяя всего один тест, применяют конструктивную валидность. Она определяет точность исследования сложных, структурированных психологических явлений, качеств личности, измеряемых с помощью тестирования.
Валидность за критерием – это такой критерий теста, за которым определяется исследуемое психологическое явление в настоящий момент и прогнозирование особенностей этого явления в будущем. Для этого результаты, полученные при тестировании соотносятся со степенью развития измеряемого качества на практике, оценка специфических способностей в определенной деятельности. Если валидность теста имеет значение минимум 0,2 то применение такого теста является оправданным.
Содержательная валидность – это критерий теста, который применяется для определения соответствия области его измеряемых психологических конструктов, демонстрирует все полноту множества измеряемых показателей.
Прогностическая валидность – критерий, за которым можно предсказать характер развития исследуемого качества в будущем. Такой критерий качества теста очень ценный, если смотреть с практической стороны, но могут быть сложности, поскольку исключается неравномерность развития данного качества в разных людей.
Надежность теста – это критерий теста, который измеряет уровень стабильности результатов, полученных после тестирования, при повторном исследовании. Определяется путем вторичного тестирования спустя определенное количество времени и расчета корреляционного коэффициента результатов, полученных после первого и после второго тестирования. Также важно, учитывать особенности самой процедуры проведения тестов и социально-психологической структуры выборки. Один и тот же тест может иметь разную надежность, зависимо от пола, возраста, социального статуса исследуемых. Поэтому надежность может иногда иметь неточности, ошибки, которые истекают из самого процесса исследования, поэтому ищутся пути, как уменьшить влияние определенных факторов на тестирование. Можно утверждать о надежности теста, если она составляет значение 0,8-0,9.
Валидность и надежность тестов очень важны, потому что определяют тест, как измерительный инструмент. Когда надежность и валидность неизвестны, тест считается неприменяемым для применения.
В измерении надежности и валидность имеет место также этический контекст. Это особенно важно, когда результаты тестирования имеют значимость в использовании их для принятия жизненно важных решений людей. Одних людей принимают на работу, других отсеивают, одни студенты проходят в учебные заведения, а другие должны еще доучиться сначала, кому-то определяется психиатрический диагноз и лечение, а кто-то здоров – это все говорит о том, что подобные решения принимаются на основании изучения оценки поведения или специальных способностей. Например, человек ищущий работу, должен пройти тестирование, и его оценки есть решающими показателями при приеме на работу, узнает, что тест был не в меру валидным и надежным, он очень разочаруется.
Валидность методики это
Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.
Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.
В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.
Валидность также является основным требованием к психологической методике изучения психологических конструктов. Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать. Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.
Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять. Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть. Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).
Оценивание валидности методики может быть количественной или качественной. За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни. Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).
Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.
При выборе методики исследования имеет теоретическое и практическое значение определение охвата изучаемых характеристик, как важной составляющей валидности. Информация, которая содержится в названии методики практически всегда не является достаточной для суждения об области ее применения. Это просто имя методики, но под ним всегда кроется еще много чего. Хорошим примером будет методика корректурной пробы. Здесь в сферу изучаемых свойств включаются концентрация внимания, устойчивость и психомоторная скорость процессов. Такая методика дает оценку выраженности этих качеств в личности, хорошо соотноситься со значениями, полученными из других методов и обладает хорошей валидностью. Вместе с тем полученные в результате проведения корректурной пробы значения подвержены большему влиянию других факторов, относительно которых методика будет неспецифичной. Если применить корректурную пробу, чтобы измерить их, то валидность будет невысокая. Выходит,что определяя область применения методики, валидный критерий отображает уровень обоснованности результатов исследования. При небольшом количестве сопровождающих факторов, которые имеют влияние на результаты, достоверность оценок, полученных в методике будет выше. Еще достоверность результатов определяется с помощью набора измеряемых свойств, их важностью при осуществлении диагностики сложной деятельности, существенностью отображения в материале методики предмета измерения. Например, для удовлетворения требований достоверности и надежности, методика, назначенная на профотбор, должна иметь анализ большого круга различных показателей, которые наиболее важные при достижении успеха в профессии.
Виды валидности
Валидный критерий бывает нескольких видов, в зависимости на что именно он направлен.
Внутренняя валидность определяет насколько определенное экспериментально воздействие стало причиной изменений в данном эксперименте.
Внутренняя валидность определяется отношениями между независимыми и зависимыми переменными, и проходит через особенные процедуры, в результате которых определяется достоверность выводов в данном исследовании. О внутреннем критерии говорится, когда достоверно известно о зависимости причинно-следственного типа между независимыми и зависимыми переменными.
Валидность исследования определяется влиянием неконтролируемых ситуативных факторов на изучаемое явление, если оно высокое, то данный критерий будет низким. Высокая внутренняя валидность исследования является признаком качественного исследования.
Внешняя валидность обобщает вывод популяции, ситуации и других независимых переменных. От того, насколько высокая и хорошая внешняя валидность зависит возможность переноса результатов, полученных в исследовании на реальную жизнь.
Очень часто внешняя и внутренняя валидизации противоречат друг другу, потому что если увеличивается одна валидность, то это значение может повлиять на показатели другой.
Самым лучшим вариантом считается выбор экспериментальных планов, которые обеспечивали бы два вида данного критерия. Особенно это важно в случае исследований, в которых важным есть распространение результатов в определенных практических ситуациях.Содержательная валидность применима к тем тестам, в которых полностью моделируется определенная деятельность, в первую очередь, аспекте связанным с предметом. Выходит, что в самом содержании методики отражаются основные стороны психологического конструкта. Если эта характеристика имеет сложную структуру, то в самой методике должны присутствовать все входящие в него элементы. Определяется такой валидный критерий с помощью систематического контроля за содержанием, должен показывать полноту охвата всей выборки за измеряемыми параметрами. Исходя из этого должна быть проведена эмпирическая проверка методики в соответствии с ее гипотезами. Каждое задание или вопрос в назначенной области, должен иметь равные шансы на включение его к заданиям теста.
Эмпирическая валидность определяется через статистическую корреляцию, то есть считается корреляция баллов по тесту и показателей внешнего параметра, избранного как критерий валидности.
Конструктная валидность относится к теоретическому конструкту, как отдельному и включается к поиску факторов, которые объясняют поведение человека при выполнении теста или методики.
Прогностический тип валидности определяется за счет наличия очень надежного внешнего критерия, хотя информация о нем собирается через определенное время после окончания испытания. Таким внешним критерием может быть способность личности к определенному виду деятельности, для которой он был отобран за результатами психодиагностических измерений. Точность прогнозирования в этом валидном критерии находится в противоположной зависимости от времени, которое давалось для прогнозирования. И чем больше времени проходит после исследования, тем еще больше факторов будут учитываться для оценивания прогностической значимости теста.
Хотя учесть абсолютно все имеющиеся факторы практически невозможно.Ретроспективная валидность определяется за критерием, который отражает события или сстояние свойства в прошлом времени. Она может использоваться для получений знаний о предсказательных аспектах методики. Очень часто в таких тестах сопоставляют оценки развития способности в их прошлом значении и на данный момент, вычесляется насколько эффективнее стали результаты.
Экологическая валидность показывает, что некий организм в силу наследственных, генетически обусловленных или приобретенных особенностей является подготовленным к демонстрированию разнообразных форм поведения во всевозможных контекстах или в разных средах обитания. Действия организма могут быть успешными в одном времени и месте, но не настолько успешными или совсем не иметь успеха в другое время, и другом месте.
Экологическая валидность подтверждается, если результаты исследования имеют место подтверждения или должного применения их в полевых исследованиях. Проблемой лабораторных исследований есть адекватная переносимость полученных результатов на условия реальной жизни, на повседневную деятельность индивида, которая длится естественным путем. Но это тоже не является конечным подтверждением результатов, как экологически валидных, потому что предполагает генерализацию также на другие условия и обстоятельства. Часто исследования обвиняются в невысоком, экологическом валидном критерии, но вся причина бывает заключается в невозможности повторить исследование в реальной жизни.
Автор
: Практический психолог Ведмеш Н.А.Спикер Медико-психологического центра «ПсихоМед»
Валидность в исследованиях: определения, типы и примеры
Понятие валидности было сформулировано Келли (1927, стр. 14), который заявил, что тест действителен, если он измеряет то, что он должен измерять.
Например, тест на интеллект должен измерять интеллект, а не что-то еще (например, память).
Различают внутреннюю и внешнюю валидность. Эти типы валидности имеют отношение к оценке валидности исследования/процедуры.
Внутренняя и внешняя валидность в исследованиях
Внутренняя валидность относится к тому, вызваны ли эффекты, наблюдаемые в исследовании, манипулированием независимой переменной, а не каким-либо другим фактором.
Другими словами, существует причинно-следственная связь между независимыми и зависимыми переменными.
Внутреннюю валидность можно улучшить, контролируя посторонние переменные, используя стандартизированные инструкции, уравновешивая и устраняя характеристики спроса и эффекты исследователя.
Внешняя валидность относится к степени, в которой результаты исследования могут быть обобщены для других условий (экологическая валидность), других людей (популяционная валидность) и во времени (историческая валидность).
Внешнюю валидность можно повысить, поставив эксперименты в более естественной обстановке и используя случайную выборку для выбора участников.
Оценка валидности теста
Существуют две основные категории валидности, используемые для оценки валидности теста (т. е. анкеты, интервью, IQ-теста и т. д.): содержание и критерий.
Лицевая валидность
Внешняя валидность заключается просто в том, появляется ли тест (по номинальной стоимости) для измерения того, на что он претендует. Это наименее изощренная мера достоверности.
Тесты, цель которых ясна даже для наивных респондентов, считаются высоковалидными. Соответственно тесты, цель которых неясна, имеют низкую внешнюю валидность (Nevo, 1985).
Прямое измерение внешней валидности получают, когда людей просят оценить валидность теста так, как он им кажется. Этот оценщик может использовать шкалу Лайкерта для оценки достоверности лица. Например:
- тест идеально подходит для данной цели
- тест очень подходит для этой цели;
- тест адекватный
- тест неадекватен
- тест неактуален и, следовательно, не подходит
Важно выбрать подходящих людей для оценки теста (например, анкеты, интервью, теста IQ и т.
Кроме того, люди, работающие с тестом, могут высказать свое мнение (например, работодатели, администрация университетов, работодатели). Наконец, исследователь может использовать представителей широкой общественности, заинтересованных в тесте (например, родителей испытуемых, политиков, учителей и т. д.).
Внешняя валидность теста может считаться надежной конструкцией только в том случае, если между оценщиками существует разумный уровень согласия.
Следует отметить, что следует избегать термина «поверхностная валидность», когда оценка проводится «экспертом», поскольку более уместна содержательная валидность.
Внешняя валидность не означает, что тест действительно измеряет то, что намеревается измерить исследователь, но только по мнению оценщиков, что он делает это. Следовательно, это грубая и основная мера достоверности.
Тестовый вопрос, такой как « Я недавно думал о самоубийстве », имеет очевидную внешнюю валидность в качестве пункта измерения суицидальных когниций и может быть полезен при измерении симптомов депрессии.
Однако значение заданий в тестах с очевидной валидностью заключается в том, что они более уязвимы к предвзятости социальной желательности. Люди могут манипулировать своими реакциями, чтобы отрицать или скрывать проблемы, или преувеличивать поведение, чтобы представить себя в положительном свете.
Элемент теста может не иметь внешней валидности, но все же иметь общую валидность и измерять то, что заявлено для измерения. Это хорошо, потому что снижает характеристики спроса и затрудняет манипулирование ответами респондентов.
Например, тестовое задание « Я верю во второе пришествие Христа » не может быть использовано для измерения депрессии (поскольку цель этого задания неясна).
Этот пункт появился в первой версии Миннесотского многофазного личностного опросника (MMPI) и был загружен в шкалу депрессии.
Поскольку большинство из первоначальной нормативной выборки MMPI были хорошими христианами, только христианин в депрессии может подумать, что Христос не вернется. Таким образом, для этого конкретного религиозного образца пункт действительно имеет общую юридическую силу, но не юридическую силу.
Конструктивная валидность
Конструктивная валидность была изобретена Корнболлом и Милем (1955). Этот тип валидности относится к степени, в которой тест фиксирует конкретную теоретическую конструкцию или характеристику, и он пересекается с некоторыми другими аспектами валидности 9.0004
Конструктивная валидность не касается простого фактического вопроса о том, измеряет ли тест атрибут.
Вместо этого речь идет о сложном вопросе о том, согласуются ли интерпретации тестовых результатов с номологической сетью, включающей теоретические и наблюдательные термины (Cronbach & Meehl, 1955).
Для проверки достоверности построения необходимо продемонстрировать, что измеряемое явление действительно существует. Итак, конструктная валидность теста на интеллект, например, зависит от модели или теории интеллекта.
Валидность конструкции предполагает демонстрацию способности такой конструкции объяснить сеть результатов исследований и предсказать дальнейшие отношения.
Чем больше доказательств валидности построения теста может предоставить исследователь, тем лучше. Однако единого метода определения конструктной валидности теста не существует.
Вместо этого различные методы и подходы объединяются для представления общей конструктивной валидности теста. Например, можно использовать факторный анализ и корреляционные методы.
Параллельная валидность
Это степень, в которой тест соответствует внешнему критерию, известному одновременно (т. е. происходящему одновременно).
Если новый тест подтверждается сравнением с существующим в настоящее время критерием, мы имеем параллельную валидность.
Очень часто новый IQ или тест личности можно сравнить с более старым, но похожим тестом, который, как известно, уже имеет хорошую достоверность.
Прогностическая достоверность
Это степень, в которой тест точно предсказывает критерий, который возникнет в будущем.
Например, на основе нового теста интеллекта можно сделать прогноз о том, что люди с высокими показателями в возрасте 12 лет с большей вероятностью получат высшее образование через несколько лет. Если прогноз подтверждается, то тест имеет прогностическую достоверность.
СсылкиКронбах, Л.Дж., и Мил, П.Е. (1955) Конструктивная валидность в психологических тестах. Психологический бюллетень , 52, 281-302.
Хэтэуэй, С. Р., и МакКинли, Дж. К. (1943). Руководство по Миннесотскому многофазному опроснику личности . Нью-Йорк: Психологическая корпорация.
Келли, Т. Л. (1927). Интерпретация учебных измерений. Нью-Йорк : Макмиллан.
Нево, Б. (1985). Лицевая валидность пересмотрена. Журнал образовательных измерений , 22(4), 287-293.
Типы действия | Психо-йог
Типы достоверности
Достоверность
Во-первых, что такое достоверность?
Валидность относится к степени, в которой результаты или выводы исследования действительно измеряют то, что, как они утверждают, измеряют.
Например: предположим, мы хотим измерить длину стола. Итак, берем рулетку и далее приступаем к измерению высоты ножек стола.
Что не так?
Ну длину стола мы не мерили. Вместо этого мы измерили высоту стола. Итак, наше измерение длины стола неверно. Однако если бы мы намеревались измерить высоту стола, то наше измерение было бы верным, потому что мы измерили высоту стола.
Внутренняя валидность
Внутренняя валидность — это мера измерения экспериментатором зависимой переменной.
Например: предположим, что экспериментатор хочет измерить время реакции человека, и для этого он использует человека с секундомером.
Вы видите проблему с этим измерением?
Проблема в том, что человек с секундомером тоже должен реагировать. Таким образом, мы ожидаем, что это измерение недействительно.
Лучшим способом измерения этой зависимой переменной было бы использование видеокамеры. Таким образом, экспериментатору не нужно полагаться на время реакции другого человека для измерения зависимой переменной. Таким образом, делая его более действительным.
Внешняя действительность
Внешняя действительность делится на два типа. Экологическая валидность и популяционная валидность.
Внешняя валидность относится к степени, в которой результаты исследования могут быть обобщены. Важно иметь высокие уровни внешней валидности, потому что это напрямую влияет на полезность результатов и выводов исследования.
Экологическая валидность
Экологическая валидность относится к степени, в которой результаты и выводы применимы к реальной жизни.
Экологическая достоверность в основном зависит от задачи, которую должны выполнить участники. Многие говорят, что именно методология, например, лабораторных экспериментов, влияет на экологическую достоверность, но это не обязательно так. Можно провести лабораторный эксперимент с высокой экологической достоверностью, потому что задача, которую должны выполнить участники, соответствует реальной жизни.
Давайте рассмотрим пример. Представьте, что вы экспериментатор и изучаете психологию взаимодействия в магазине с продавцами.
Вы решили использовать лабораторный эксперимент, потому что он дает вам лучший контроль над посторонними переменными.
Вы создали поддельный магазин, который точно такой же, как и в реальной жизни. Затем вы предлагаете участникам пойти в магазин и купить некоторые предметы, которые они обычно покупают. Это, хотя и лабораторный эксперимент, имеет высокую экологическую достоверность, потому что задача, которую должны выполнить участники, соответствует реальной жизни.
Валидность популяции
Валидность популяции относится к степени, в которой выборка может быть обобщена на аналогичные и более широкие популяции.
Этот тип валидности важен, потому что без него исследование становится малополезным.
Давайте рассмотрим пример.
Предположим, мы изучаем влияние прослушивания Моцарта на IQ (эффект Моцарта).
Итак, мы решаем, что будем использовать выборку людей с высоким IQ, и используем случайную выборку. Эта выборка будет иметь высокую валидность для людей с высоким IQ, но главным образом потому, что мы использовали случайную выборку. Однако эта выборка будет иметь низкую валидность для всех остальных, потому что выборка чрезвычайно ограничена.
Временная валидность
Временная валидность относится к степени достоверности результатов и выводов исследования, когда мы рассматриваем различия и изменения, возникающие со временем.
Исследования, которые являются достоверными во времени, будут либо недавними исследованиями, либо будут исследованиями, в которых рассматривается что-то, что не изменилось с момента завершения исследования, например, проведенное 50 лет назад исследование представлений людей о росте может иметь высокую временную достоверность, поскольку общество не изменил своего взгляда на высоту. Тем не менее, исследование телевизионной рекламы в семидесятых и восьмидесятых годах может быть неактуальным сегодня из-за того, что в настоящее время доступно множество телевизионных каналов по сравнению с несколькими каналами, которые были доступны в то время. (Взгляните на это исследование для примера, который можно считать низким по временной достоверности: Cowpe 1989)
Лицевая валидность
Лицевая валидность относится к степени, в которой исследование появляется для измерения того, что оно претендует на измерение.
Это тип валидности, на который следует ссылаться меньше всего, потому что это не очень хорошая точка оценки, лучше использовать внутреннюю валидность. Лицевая валидность может быть вам полезна, потому что вы можете легко использовать ее в качестве оценочного балла на экзамене по психологии OCR A2, если у вас ничего не получится и вы не сможете придумать другой оценочный балл.
Исследование с высокой внешней валидностью может выглядеть так, как будто оно измеряет то, что намеревается измерить исследователь, но это не обязательно означает, что исследование является измерением того, на что оно претендует.
Давайте рассмотрим пример.
Предположим, мы пытаемся измерить влияние просмотра фильма ужасов на уровень стресса участников.
Мы показываем нашим участникам фильм ужасов и измеряем их уровень кортизола до и после.
Кортизол вырабатывается в ответ на стресс, , что означает, что на первый взгляд это исследование выглядит так, как будто оно измеряет влияние фильма ужасов на уровень стресса участников. Поэтому он имеет высокую лицевую валидность.
Однако мы не учитывали влияние того, что участники не ели во время просмотра фильма.
Мы понимаем, что отказ от еды снижает уровень глюкозы в крови наших участников, что также вызывает выработку кортизола. Это означает, что наше исследование, хотя имело высокую внешнюю валидность, имело низкую внутреннюю валидность.
Проверка достоверности
Проверка достоверности состоит из нескольких составных частей.
Под валидностью теста понимается степень значимости результатов исследования или теста.
Давайте рассмотрим пример.
Предположим, мы измеряем интеллект людей. Мы могли бы использовать тест IQ. Мы могли бы возразить, что тест IQ имеет высокий уровень валидности, потому что мы видим, что это хорошо зарекомендовавший себя тест.
Действительность конструкции
Конструктивная валидность относится к степени, в которой исследование или тест измеряют концепцию, на которую они претендуют.
Существует два типа конструктной валидности: конвергентная валидность и дискриминантная валидность.
Давайте рассмотрим пример.
Предположим, мы изучаем «Модель убеждений о здоровье» Беккера (1978)
. Мы обнаруживаем, что существует несколько когнитивных эвристик, которые люди используют, когда рассматривают возможность принятия здорового образа жизни. Все они присутствуют в модели убеждений о здоровье. Таким образом, мы можем утверждать, что наше исследование имеет высокую конструктную валидность.
Конвергентная валидность
Конвергентная валидность относится к степени, в которой тестируемые конструкции соотносятся друг с другом.
Различающая валидность
Различающая валидность относится к степени, в которой протестированные конструкции, не имеющие взаимосвязи, действительно не имеют взаимосвязи друг с другом.
Валидность содержания
Валидность содержания хорошо вытекает из валидности конструкции, поскольку валидность содержания относится к степени, в которой исследование или тест измеряет все элементы конструкции.
Например, предположим, что мы рассматриваем влияние стресса на производительность труда.
Мы предлагаем нашим участникам заполнить анкеты о том, насколько, по их мнению, на них влияет стресс на рабочем месте и насколько он влияет на их производительность.
Мы можем возразить, что содержание этого теста недостаточно достоверно, потому что оно фактически не проверяло влияние стресса на производительность труда.
Обоснованность критерия
Обоснованность критерия относится к степени достоверности результатов и выводов по сравнению с другими показателями.
Валидность критерия делится на два типа валидности: прогностическая валидность и параллельная валидность.
Прогностическая валидность
Прогностическая валидность относится к степени, в которой результаты и выводы могут быть использованы для прогнозирования применения исследования в реальной жизни.
Давайте рассмотрим пример.
Предположим, мы изучаем влияние мыслей о том, что за вами наблюдают, на поведение.
Наше исследование является повторением нескольких или других исследований, которые были проведены ранее.
Мы даем нашим участникам задание для выполнения. Во время выполнения задачи они столкнутся с несколькими признаками, указывающими на то, что за ними наблюдают, например, «за вами наблюдают операторы видеонаблюдения».
Это исследование может иметь прогностическую ценность для подобных ситуаций.
Обычно прогностическая валидность устанавливается на основе повторяющихся результатов с течением времени.
Параллельная валидность
Параллельная валидность относится к степени, в которой результаты и выводы согласуются с другими исследованиями и доказательствами.
Давайте рассмотрим пример.
Милграм (1963) изучал последствия послушания авторитету. Результаты Милгрэма совпали со многими повторениями исследования. Поэтому исследование Милгрэма имело высокую параллельную валидность.
Достоверность статистического вывода
Достоверность статистического вывода относится к степени, в которой мы можем, чтобы результаты были статистически значимыми, то есть мы можем установить причину и следствие выше случайности.
Обычно в психологических исследованиях вероятность устанавливается на уровне 5% или >0,05 вероятности. Это означает, что если результаты превышают 5%, мы примем нашу альтернативную гипотезу и отклоним нашу нулевую гипотезу. Это предполагает причину и следствие между переменными. Если результаты ниже 5%, мы примем нашу нулевую гипотезу. Результат менее 5% вероятности означает, что мы не можем установить причину и следствие, потому что результаты произошли случайно.
Репрезентативная валидность
Репрезентативная валидность, известная также как трансляционная валидность, относится к степени, в которой изучаемый конструкт или концепция могут быть перенесены в реальную жизнь.