Валидность (психология) | это… Что такое Валидность (психология)?
Вали́дность (англ. validity) — мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики.
Как в экспериментальной психологии, так и в статистике валидное измерение — такое измерение, которое измеряет то, что оно должно измерять. То есть, к примеру, при валидном измерении интеллекта измеряется именно интеллект, а не что-то другое. Безупречный эксперимент (возможный лишь в теории) будет обладать безупречной валидностью: он будет точно показывать, что экспериментальный эффект был вызван изменением независимой переменной, он будет полностью соответствовать реальности, его результаты можно обобщить без ограничений.
Когда говорят о степени валидности, рассматривается то, насколько результаты исследования соответствуют поставленным задачам (однако при этом валидность не измеряется в каких-либо условных единицах).
Содержание
|
Способы установления валидности теста
Существуют четыре основных способа установления валидности теста.
- I. Оценка очевидной валидности.
Очевидная валидность – валидность, при которой оценивается общее соответствие теста его назначению.
- II. Оценка содержательной валидности.
Содержательная валидность предполагает, что тест обнаруживает в себе полный набор заданий для измерения определенной черты.
- III. Оценка конструктной валидности.
Этот способ проверки заключается в проведении продуманных экспериментов. Подход первый — «конвергентная валидизация» — это проверка ожидаемой связи тестовых оценок с другими показателями. Например, если для измерения какой-либо черты существует несколько методик, целесообразным было бы провести эксперименты по хотя бы двум, и тогда при обнаружении высокой положительной корреляции их результатов между собой можно говорить о валидности.
Основной целью конвергентной валидизации является определение того, будут ли оценки теста варьироваться в соответствии с ожиданиями. Подход второй — «дивергентная валидизация» (англ.). Проверка валидности здесь заключается в том, что тест не должен измерять никакой черты, с которой он теоретически и не должен быть связан.- IV. Оценка прогностической валидности.
Прогностическая валидность заключается в том, что психологический тест часто используется для прогноза поведения. Соответственно, если прогноз оправдывается с течением времени, это говорит о том, что тест был валидным. Но для характеристики многих видов деятельности этого метода не достаточно.
Требования к идеальному тесту
- Минимальное количество заданий. Однако чем больше личностных факторов хочет измерить тестирующий, тем большее количество вопросов целесообразнее задать тестируемому.
- Тест должен соответствовать целевой группе, на которую он направлен. Верно то утверждение, что тест, направленный на одну группу, в результате тестирования которой были получены достоверные результаты, может быть невалидным в отношении другого целевого сегмента.
- Адаптация теста. Применяется в случае проведения теста в иноязычной стране.
Виды валидности
- Внешняя валидность
- Операциональная валидность
- Конструктная валидность
- Внутренняя валидность
- Экологическая валидность
- Дифференциальная валидность
- Иллюзорная валидность
- Инкрементная валидность
- Консенсусная валидность
- Критериальная валидность
- Очевидная валидность
- Валидность по возрастной дифференциации
- Прогностическая валидность
- Содержательная валидность
- Текущая валидность
- Эмпирическая валидность
См. также
- Психологический эксперимент
- Безупречный эксперимент в психологии
- Эксперимент в науке
- Психометрия и психофизика
- Психодиагностика
- Экспериментальная психология
Ссылки
- А.Я. Психология: Виды валидности
- Валидность теста — Психологический словарь
Валидность в психологии.
Что это, определение простыми словами, виды, примерВалидность в дословном переводе с английского языка означает «устойчивый, пригодный, соответствующий». В научных кругах данный термин используется, как показатель, который оценивает пригодность той или иной методики исследования в конкретной ситуации, условиях.
Нередко валидность ставят на одну ступень вместе с таким понятием как «надежность». Данный критерий определяет уместность и эффективность, надежность выбранных методов исследования: что и как они измеряют и характеризуют, какую картину отражают, для чего производится оценка.
Чем ближе исследователь подбирается к главному признаку проблемы, который позволяет оценить ее характер и влияние с помощью определенной методики, тем выше ее валидность. Сам процесс проверки действенности (качества) и эффективности, применимости методов исследования называется валидизацией.
Что такое валидность в психологии
Валидность – важная характеристика психологических тестов и методик. Она должна проверяться экспериментаторами наравне с надежностью методики. Критерий валидности чаще всего используется в психодиагностике. В нем раскрывается проблема соответствия полученных в ходе исследования данных «идеальным». То есть тем, которые не искажены какими-либо внутренними или внешними факторами.
В психологии ярко выражена проблема субъективности. Какими бы точными, по мнению экспериментатора, не были полученные данные – они искажены. Для проверки уровня достоверности полученного знания используется критерий валидности. Валидность не используется в точных науках: физике, химии, математике.
Это уникальный критерий психологии, позволяющий сгладить трудности получения объективных знаний. Первой причиной появления этого инструмента служит проблема точного определения изучаемой характеристики или свойства. Так, исследуя тревожность, невозможно однозначно установить диагностируемое явление. Тревожность – это и страх, и беспокойство, и волнение.
Второй причиной является субъективность исследуемого параметра психодиагностической методикой. Разработчик вкладывает в формулировки собственное значение и смысл, но это не значит, что испытуемый думает по такому же шаблону. Интерпретации одних и тех же вопросов или утверждений могут сильно отличаться.
В точных науках нет проблемы определения исследуемого объекта. Трудность составляют способы изучения. Например, ученый-физик, исследующий параметры железного шара, точно видит и осязает его. Он поставил себе цель: изучить радиус шара. Параметр объективен и находится с помощью измерения и формул.
[Править]Альфа Кронбаха
В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же общего основания. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.
Что такое валидность методики
Методика, в отличие от метода – это набор определенных действий специалиста, направленных на соответствующий результат. Метод исследования может включать в себя несколько методик. Например, метод анкетирования по классификации Б. Г. Ананьева может осуществляться с помощью разных тест-опросников.
Валидность в психологии — это соответствие целостности психодиагностической методики и отдельных её частей исследуемой психической характеристике.
ПДМ может включать несколько шкал. Например, тест-опросник, определяющий уровень невротизации-психопатизации, состоит из следующих шкал: психопатизация, невротизация и шкала «лжи». Третья измерительная шкала используется для проверки искренности испытуемого. Самая распространенная причина лжи – мотивация одобрения. Этот фактор сильно искажает статистические и индивидуальные данные.
Валидная ПДМ – это методика, диагностирующая только заданный экспериментатором узкий спектр характеристик. Она пользуется большим доверием специалистов и применяется в научных исследованиях. Чем выше коэффициент валидности, тем достовернее полученные в ходе эксперимента данные.
[Править]Надёжность как устойчивость
Устойчивость результатов теста или ретестовая надежность (англ — test-retest reliability) – возможность получения одинаковых результатов у испытуемых в различных случаях.
Устойчивость определяется с помощью повторного тестирования (ретеста):
В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Наименьшим удовлетворительным значением для ретестовой надежности является 0,5. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему).
Еще один недостаток повторного тестирования – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.
В связи с выше сказанным применяется исследование надежности психодиагностических методик с использованием параллельных форм, при которых конструируются эквивалентные или параллельные наборы заданий. При этом испытуемые выполняют совершенно другой тест при аналогичных условиях. Однако имеются трудности в доказательстве того, что обе формы являются действительно эквивалентными. Несмотря на это, на практике параллельные формы тестов оказываются полезными в установлении надежности тестов.
Что такое валидность теста
Психологический тест – разновидность психодиагностических методик. Тест пользуется наибольшей популярностью среди экспериментаторов из-за простоты применения. В комплектацию исследователя входит стимульный материал, бланки ответов и инструкции.
Тест-опросники могут исследовать такие психические характеристики испытуемого, как стрессоустойчивость, интеллект, мотивация и толерантность. Вопросы формулируются с учетом специфики целевых выборок и цели исследования.
Они могут быть закрытыми – испытуемому предлагается выбрать одно из утверждений; открытыми – испытуемый должен сам ответить на вопрос или прокомментировать утверждение; косвенными – являющимися общеизвестными фактами или мнением; прямыми – которые непосредственно оппонируют мнению индивида.
Валидность теста обеспечивает достоверность полученных с его помощью данных о психических явлениях. Без экспериментально доказанной высокой валидности тест нельзя считать эффективным. Если выполнение отдельного задания или самого теста фиксирует измеряемое психическое явление, то валидность принимает высокие значение.
Это значит, что тест валиден и надежен, так как исключены воздействия на испытуемого. Валидность теста можно подтвердить, не обладая глубочайшими познаниями в психологии.
Например, студенты 1 курса могут проверить тест с помощью испытуемых. Экспертам предлагается оценить понятность формулировок вопросов или утверждений, исходя из личного жизненного опыта. На основе полученных данных можно говорить о валидности опросника.
[Править]Надёжность как внутренняя согласованность
Внутренняя согласованность(англ. — internal consistency) определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест. Чаще всего тесты, разрабатываются таким образом, чтобы у них была высокая степень внутренней согласованности, а связи с тем, что если одна переменная измеряется частью теста, то тогда в других частях, если они не согласованы с первой, эта же переменная измеряться не может. Таким образом, чтобы тест был валидным, необходимо, чтобы он был согласован.
Однако существует и противоположная точка зрения. Кэттелл говорит о том, что высокая внутренняя согласованность на самом деле является противоположностью валидности: каждый вопрос должен затрагивать меньшую область или иметь более узкое значение, чем критерий, подвергающийся измерению. Если все вопросы являются согласованными в высокой степени, они сильно коррелируют, и, следовательно, надежный тест будет измерять только лишь сравнительно «узкую» переменную с малыми отклонениями. По рассуждениям Кэттелла, максимум валидности существует, когда все задания теста не коррелируют друг с другом, а каждое из них имеет положительную корреляцию с критерием. Однако, такой тест будет характеризоваться низкой надежностью по внутренней согласованности.
Для проверки внутренней согласованности применяются:
- Метод расщепления или метод автономных частей
- Метод эквивалентных бланков
- Альфа Кронбаха
Психометрические свойства методик психодиагностики
Психометрической основой любой методики являются шкалы. Понятие «шкала» трактуется в широком и узком значении: в первом случае шкала – это конкретная методика, во втором случае – это измерительная шкала, фиксирующая исследуемые признаки. Каждому элементу методики соответствует определенный балл или индекс, который формирует выраженность того или иного психического явления.
Измерительные шкалы разделяют на:
- Метрические: интервальные, шкалы отношений.
- Неметрические: номинативные, порядковые.
Название шкалы | Пояснение, примеры |
Номинативная (шкала наименований) | На основе общего свойства или символа относит наблюдаемое явление к соответствующему классу. Шкала наименований самая распространенная в исследовательских психодиагностических методиках. Эта шкала используется, например, в тест-опросниках. Отрицание или утверждение испытуемого сравнивается с ответами в ключе. Также номинативная шкала может предполагать выбор одного или нескольких признаков из предложенных. |
Порядковая | Разделяет сумму признаков на элементы, исходя из принципа «больше – меньше». Таким образом, она расставляет результаты в порядке возрастания или убывания. Порядковая шкала используется в тесте цветового выбора. Испытуемому предлагается выбрать один из квадратов на белом фоне, после чего выбранная фигура откладывается в сторону, и процедура повторяется. Результат: расставленные по степени привлекательности для испытуемого цвета. Каждой фигуре присваивается свой порядковый номер. |
Интервальная | Элементы упорядочены не только по принципу выраженности измеряемого признака, но и на основе распределения признаков по размеру, что выражается интервалами между числами, приписываемыми степени выраженности измеряемого признака. Интервальные шкалы часто используются при стандартизации первичных тестовых показателей. |
Отношений | Упорядочивает элементы по числовому значению, соблюдая между ними пропорциональность. Объекты разделены согласно измеряемому свойству. Числа, которые приравниваются к классам объектов, пропорциональны степени выраженности исследуемых свойств. Используется, например, при определении порогов чувствительности анализаторов. Часто применяется в психофизике. |
После определения используемой шкалы для формирования теста, нужно определить коэффициент психометрических свойств методики.
К ним относятся:
- Репрезентативность.
- Стандартность.
- Надежность.
- Валидность.
Репрезентативность – это свойство, которое распространяется на выборку испытуемых. Оно может характеризовать как популяцию, так и генеральную совокупность. Репрезентативность имеет два параметра: качественный и количественный. Качественный параметр характеризует выбор испытуемых и способы построения выборки.
Количественный параметр – это объем выборки, выраженный в числах.
В психологических исследованиях это свойство определяет, насколько возможно обобщение результатов. Например, изучаются отношения мужчин и женщин. Если взять испытуемых разного возраста (школьников, студентов, взрослых, пенсионеров), то репрезентативность такой выборки будет низкой.
Однако, если испытуемые будут примерно одного возраста и сферы деятельности (только школьники, студенты, взрослые, пенсионеры обоих полов), то репрезентативность будет высокой. В психодиагностике репрезентативность используется для того, чтобы обозначить возможность применения методики на всю генеральную совокупность.
Стандартность – это упрощение методики, приведение частей ПДМ и процедуры применения к единым нормам. ПДМ должны быть универсальны и применимы разными специалистами в различных ситуациях. При отклонении структуры ПДМ от стандартов, её результаты будет невозможно сравнить с результатами других исследований. Нестандартизованные методики используются в основном для научных исследований.
С их помощью изучаются новые психические явления. Но такой методикой нельзя пользоваться в психодиагностических целях. Ещё один важный параметр ПДМ – надежность. Она характеризует точность, устойчивость и стабильность результатов, полученных с помощью конкретной методики.
Высокая надежность методики исключает действие посторонних факторов и существенно приближает эксперимент к «чистому». Критерий надежности и валидности – это разные понятия. Причем надежность трактуется шире, чем валидность: надежность > валидность.
Например, в выходной день человек получает возможность провести время либо на рыбалке, либо на охоте. Если он решает идти на охоту, но берёт с собой удочку, то его выбор не будет валиден. Однако, если человек пошел на охоту с ружьем, и оно дало осечку, значит, выбранный метод ненадежен.
[Править]Вычисление Кронбаха
Кронбаха определяется как
,
где — число элементов в шкале, — дисперсия общего тестового балла, и — дисперсия элемента .
Альтернативный способ вычисления выглядит следующим способом:
где N — число элементов в шкале, — средняя дисперсия для выборки, — среднее значение для всех ковариаций между компонентами выборки.
В настоящее время Кронбаха считают при помощи SPSS, STATISTICA и других современных статистических пакетов, возможно и при помощи Microsoft Excel
Виды валидности
Существует много видов валидности.
Валидность в психологии делится на несколько видов.
Перечень:
- Внутренняя валидность. Характеризует соответствие полученных результатов стимульному материалу психодиагностической методики. Она определяет, действительно ли реакции испытуемых обусловлены только заданиями и фиксируют изучаемые психические свойства.
- Внешняя валидность. Высокая внешняя валидность определяет репрезентативность выборки. То есть соответствие методики выбранным категориям населения и условиям, в которых применяется.
- Концептуальная валидность. Валидность в психологии – это логичность построенной экспериментатором теории. Определяется на этапе разработки концепции изучаемого психического свойства. В проверке концептуальной валидности участвует группа экспертов-психологов, которые контролируют создание концепции и методики.
- Очевидная валидность. Высокая очевидная валидность означает применимость тестовых заданий целевой выборке. Так, если экспериментатор хочет исследовать определенные качества школьников, то и задания в методике должны быть сформулированы в расчете на уровень знаний среднестистического школьника. Помимо этого, очевидная валидность фиксирует понятность формулировок, исходя из социально-демографических характеристик, представлений и жизненного опыта испытуемых. Утверждения в опросниках бывают неоднозначны. Например, утверждение «я завожусь с пол-оборота» можно интерпретировать по-разному. Есть утверждения и вопросы, которые не соответствуют жизненному опыту испытуемых. Вопрос о какой-либо ситуации во время вождения автомобиля будет неизвестен людям, которые не умеют водить.
- Конструктная валидность. Характеризует соответствие используемых формулировок методики фиксируемым явлениям. Высокая конструктная валидность означает, что выбранные для методики понятия (например, вопросы или утверждения в тесте) фиксируют те свойства, которые хочет исследовать экспериментатор.
- Прогностическая валидность. Обозначает достоверность прогноза, сделанного на основе результатов исследования с помощью ПДМ. Этот вид валидности важен для профотбора и постановки диагноза в психиатрических клиниках. Высокая прогностическая валидность позволяет эксперту быть уверенным в назначенном курсе лечения или выборе кандидата на должность. Измеряет задатки и предпосылки испытуемого к тем или иным качествам, свойствам. Например, если сформулировать прогностическую валидность в виде вопроса, то он может прозвучать так: «Сможет ли Иванов стать квалифицированным эндокринологом?».
- Текущая валидность. Фиксирует текущее положение дел. Определяет те свойства и качества, которые есть у испытуемого на данный момент. Если сформулировать текущую валидность в виде вопроса, как в примере выше, то он будет звучать так: «Иванов – квалифицированный эндокринолог?» Часто в тестах используется прогностическая валидность. Текущая используется как замена.
- Конвергентная валидность. Определяет силу связи между частями одной ПДМ или методиками, фиксируемыми одно и то же свойства. Если конвергентная валидность двух методик высока, то, вероятно, они диагностируют общее качество. Сильная связь должна устанавливаться между утверждениями или вопросами в психодиагностической методике, которые относятся к одной шкале и фиксируют одну характеристику.
- Содержательная валидность. Валидность в психологии – это соответствие тестовых заданий диагностируемому психическому качеству. Тест не должен содержать пункты, относящиеся к диагностике других свойств. Однако, он может включать в себя шкалы «лжи» для высокой достоверности результатов.
- Дискрименантная валидность. Высокая дискрименантная валидность выявляет отсутствие связи между заданиями одной психодиагностической методики или разными ПДМ. Используется для проверки вопросов и утверждений, методик, которые должны изучать не связанные психические свойства.
[Править]См. Также Дискриминативность
Дискриминативность задач определяется как способность отделять испытуемых с высоким общим баллом по тесту от тех, кто получил низкий балл, или испытуемых с высокой продуктивностью учебной деятельности от испытуемых с низкой продуктивностью.
Другими словами, дискриминативность — способность заданий теста дифференцировать студентов относительно «максимального» или «минимального» результата теста. Определение дискриминативности тестового задания необходимо для того, чтобы поставить заслон некачественным заданиям.
Для вычисления дискриминативности будет применяться метод крайних групп: при расчете дискриминативности тестового задания учитываются результаты наиболее и наименее успешных студентов — это самый простой и наглядный метод вычисления дискриминативности.
Доля членов крайних групп может изменяться в широких пределах в зависимости от величины выборки. Чем больше выборка, тем меньшей долей испытуемых можно ограничиться при выделении групп с высоким и низким результатами. Нижняя граница «отсечения групп» составляет 10% от общего числа испытуемых в выборке, верхняя — 33%. В данном случае будет использоваться 27% группа, так как при таком процентном соотношении достигается максимальная точность определения дискриминативности. Индекс дискриминации вычисляется как разность между долей лиц, правильно решивших задачу, из «высокопродуктивной» и «низкопродуктивной» групп.
Психометрический парадокс — явление, возникающее при использовании опросников личностных; его сущность состоит в том, что вопросы (утверждения), имеющие высокий показатель дискриминативности (см. Дискриминативность заданий теста), являются неустойчивыми по отношению к повторяемости результата, и, наоборот, стабильность ответа часто отмечается у тех вопросов, которые обладают низкой дискриминативностью.
П. Айзенбергом (1941) было показано, что вопросы, которые позволяют отличать больных неврозом от других больных или здоровых, являются ненадежными; иначе говоря, мала вероятность получения того же самого ответа при повторном обследовании. В то же время с помощью вопросов, определяемых как надежные, различение изучаемых групп не достигалось или было неудовлетворительным. Позднее изучению этого явления, получившего название П. п., были посвящены работы Л. Голдберга (1963) и М. Новаковской (1975).
П. п. не может быть объяснен без психологического анализа процесса формирования ответов на вопросы личностных опросников. Согласно М. Новаковской, вопросы, оставаясь формально неизменными, подвержены семантическим (психологическим) преобразованиям как в плане интериндивидуальном, так и интра-индивидуальном. Интериндивидуальная изменчивость обусловлена двумя причинами: различия в выраженности измеряемой черты (свойства) у разных обследуемых и различия в понимании значения вопросов. Интраиндивидуальная изменчивость обусловлена вариабельностью значения, трудностью принятия решения об ответе и флуктуацией выраженности черты (последний источник изменчивости можно не учитывать, если интервал между повторными исследованиями невелик).
Для психологической интерпретации П. п. М. Новаковская предлагает различать три детерминанты ответов: выраженность черты у обследуемого; значение, придаваемое вопросу; степень легкости принятия решения об ответе. Она подчеркивает также необходимость отличать вопросы однозначные от многозначных, которые в известном смысле могут быть Уподоблены проективным стимулам.
М. Новаковская предлагает различать два вида П. п. — типа Л и типа В — и исходить из следующих гипотез их возникновения. Парадокс типа Л возникает при вопросах, поддающихся различному истолкованию (многозначных), а также в том случае, когда трудно принять решение об ответе. Такие вопросы имеют высокий показатель дискриминативности при значительной вариабельности ответа. Парадокс типа В возникает при однозначных вопросах, для которых легко подобрать ответ. Сюда же должны быть отнесены т. н. односторонние диагностические вопросы или те вопросы, для которых только один тип ответа является диагностически значимым. Подобные вопросы характеризуются слабой дискриминативностью и незначительно выраженной вариабельностью.
Необходимо учитывать П. п. при конструировании (адаптации) личностных опросников.
Примеры похожих учебных работ
18.Характеристика малоформализованных методов: наблюдение, беседа, интервью, анализ …
… по методу обозначающему: числовой метод графический метод шкала прилагательных графический метод дополняет числовой метод: чертят … Определена жестко заданная тактика проведения интервью, вопросы задаются в строго определенной последовательности. …
12.Понятие валидности, надежности, достоверности в психодиагностике
… тест признавался валидным. Таким образом, эмпирические методы обоснования валидности … значения. Это значение колеблется в определённых границах. Колебание данного значения … последовательность теста внутри себя, меру адекватности подбора вопросов. …
Критерии валидности, применяемые к качественным исследованиям.
… вопрос о валидности до последнего времени представляется одним из самых сложных. Наиболее укоренившимся определением этого понятия является то, которое приведено в книге А. Анастази: «Валидность теста … пор придают меньшее значение гуманитарному знанию …
Психодиагностические методы в психологии
… вариант дифференциации методов: Организационные методы (в эту группу входят метод наблюдения и метод эксперимента) Вспомогательные методы (сюда относят метод экспертных оценок, различные методы опроса, метод самонаблюдения, метод тестов, анализ …
Угрожающие факторы
Валидность в психологии – это свойство качественной методики, но могут возникнуть факторы, искажающие теоретически правильно построенную ПДМ. Побочные факторы сильнее проявляются в работе с плохо организованными стимулами или новыми, неясными ранее для испытуемого задачами.
Трудность составляет изучение неуравновешенных и неуверенных в себе индивидов. Главными угрозами высокой валидности являются особые характеристики тестируемого и ситуационные явления.
Достоверность результатов снижают:
- ошибки испытуемого;
- ошибки специалиста;
- ошибки, вызванные условиями или неправильного проведения диагностики.
Если диагностика не предполагает обязательного нахождения специалиста в помещении, то его присутствие может исказить результаты исследования. Комментарии и интерпретация тестовых задания тоже снижают достоверность полученных данных.
Испытуемый, заинтересованный в намеренных погрешностях тестирования или представлении себя в выгодном свете перед руководством, искажает результаты диагностики. Не меньшую опасность представляет психофизиологическое состояние тестируемого. Например, индивид сильно голоден, утомлен или страдает от мигрени.
Посторонний шум, голос, возможность обсуждать тестовые задания с другими испытуемыми, снижают точность результатов. Это относится к ошибкам условий и процедуры диагностики.
[Править]Теоретическое основание Кронбаха
Альфа Кронбаха может быть рассмотрено как расширение Кьюдера-Ричардсона-20 , которая является эквивалентом для работы с дихотомиями или переменными, принимающих только два значения (например, ответы истинно/ложно).
Α Кронбаха теоретически связана с формулой прогнозирования Спирмана-Брауна. И обе эти формулы вытекают из классической теорией теста, заключающийся в том, что достоверность результатов тестирования может быть выражена как отношение дисперсий истинной и общей оценок (ошибки и истинной оценки).
Специфика и задачи психологического эксперимента
Эксперимент направлен на доказательство или опровержение гипотезы, всегда проводится в особых экспериментальных условиях, искусственно созданных исследователем. Специфика психологического эксперимента заключается в некоторой его субъективности. Психология сталкивается с проблемами субъективности в теории и на практике.
Все знания, полученные в ходе психологических исследований, в той или иной мере субъективны, искажены сознанием испытуемого и экспериментатора. Поэтому получить полностью достоверные знания – это крайне сложная задача. Эксперимент должен соответствовать цели, задачам, исключать внешние воздействия и искажения результатов исследователем.
Задача психологического эксперимента – сделать доступными для наблюдения исследуемые психологические явления, свойства, состояния испытуемого. Для этого используется построение условий, в которых окажется тестируемый. Эти условия должны раскрывать исследуемое психическое свойство и исключать проявление других.
Психологический эксперимент отличается зависимостью от условий и уровня развития исследуемых явлений, требует строгого контроля, постоянства процесса, изоляции ненужных аспектов психики от изучаемых.
Высокая валидность применяемой методики позволяет снизить погрешность полученных результатов. Это важный фактор в психологических исследованиях, поскольку недостоверные результаты не несут никакой практической пользы.
типов действия | Психо-йог
Типы достоверности
Достоверность
Во-первых, что такое достоверность?
Валидность относится к степени, в которой результаты или выводы исследования действительно измеряют то, что, как они утверждают, измеряют.
Например: предположим, мы хотим измерить длину стола. Итак, берем рулетку и далее приступаем к измерению высоты ножек стола.
Что не так?
Ну длину стола мы не мерили. Мы измерили вместо высоты таблицы. Итак, наше измерение длины стола неверно. Однако если бы мы намеревались измерить высоту стола, то наше измерение было бы верным, потому что мы измерили высоту стола.
Внутренняя валидность
Внутренняя валидность — это мера измерения экспериментатором зависимой переменной.
Например: предположим, что экспериментатор хочет измерить время реакции человека, и для этого он использует человека с секундомером.
Видите ли вы проблему с этим измерением?
Проблема в том, что человек с секундомером тоже должен реагировать. Таким образом, мы ожидаем, что это измерение недействительно.
Лучшим способом измерения этой зависимой переменной было бы использование видеокамеры. Таким образом, экспериментатору не нужно полагаться на время реакции другого человека для измерения зависимой переменной. Таким образом, делая его более действительным.
Внешняя действительность
Внешняя действительность делится на два типа. Экологическая валидность и популяционная валидность.
Внешняя валидность относится к степени, в которой результаты исследования могут быть обобщены. Важно иметь высокие уровни внешней валидности, потому что это напрямую влияет на полезность результатов и выводов исследования.
Экологическая валидность
Экологическая валидность относится к степени, в которой результаты и выводы применимы к реальной жизни.
Экологическая достоверность в основном зависит от задачи, которую должны выполнить участники. Многие говорят, что именно методология, например, лабораторных экспериментов, влияет на экологическую достоверность, но это не обязательно так. Можно провести лабораторный эксперимент с высокой экологической достоверностью, потому что задача, которую должны выполнить участники, соответствует реальной жизни.
Давайте рассмотрим пример. Представьте, что вы экспериментатор и изучаете психологию взаимодействия в магазине с продавцами.
Вы решили использовать лабораторный эксперимент, потому что он дает вам лучший контроль над посторонними переменными.
Вы создали поддельный магазин, который точно такой же, как и в реальной жизни. Затем вы предлагаете участникам пойти в магазин и купить некоторые предметы, которые они обычно покупают. Это, хотя и лабораторный эксперимент, имеет высокую экологическую ценность, потому что задача, которую должны выполнить участники, соответствует реальной жизни.
Валидность популяции
Валидность популяции относится к степени, в которой выборка может быть обобщена на аналогичные и более широкие популяции.
Этот тип валидности важен, потому что без него полезность исследования снижается.
Давайте рассмотрим пример.
Предположим, мы изучаем влияние прослушивания Моцарта на IQ (эффект Моцарта).
Итак, мы решаем, что будем использовать выборку людей с высоким IQ, и используем случайную выборку. Эта выборка будет иметь высокую валидность для людей с высоким IQ, но главным образом потому, что мы использовали случайную выборку. Однако эта выборка будет иметь низкую валидность для всех остальных, потому что выборка чрезвычайно ограничена.
Временная валидность
Временная валидность относится к степени достоверности результатов и выводов исследования, когда мы рассматриваем различия и изменения, возникающие со временем.
Исследования, которые являются достоверными во времени, будут либо недавними исследованиями, либо будут исследованиями, в которых рассматривается что-то, что не изменилось с момента завершения исследования, например, проведенное 50 лет назад исследование представлений людей о росте может иметь высокую временную достоверность, поскольку общество не изменил своего взгляда на высоту. Тем не менее, исследование телевизионной рекламы в семидесятых и восьмидесятых годах может быть неактуальным сегодня из-за того, что в настоящее время доступно множество телевизионных каналов по сравнению с несколькими каналами, которые были доступны в то время. (Взгляните на это исследование для примера, который можно считать низким по временной достоверности: Cowpe 1989)
Лицевая валидность
Лицевая валидность относится к степени, в которой исследование появляется для измерения того, что оно претендует на измерение.
Это тип валидности, на который следует ссылаться меньше всего, потому что это не очень хорошая точка оценки, лучше использовать внутреннюю валидность. Лицевая валидность может быть вам полезна, потому что вы можете легко использовать ее в качестве оценочного балла на экзамене по психологии OCR A2, если у вас ничего не получится и вы не сможете придумать другой оценочный балл.
Исследование с высокой внешней валидностью может выглядеть так, как будто оно измеряет то, что намеревается измерить исследователь, но это не обязательно означает, что исследование — это измерение того, на что оно претендует.
Давайте рассмотрим пример.
Предположим, мы пытаемся измерить влияние просмотра фильма ужасов на уровень стресса участников.
Мы показываем нашим участникам фильм ужасов и измеряем их уровень кортизола до и после.
Кортизол вырабатывается в ответ на стресс, , что означает, что на первый взгляд это исследование выглядит так, как будто оно измеряет влияние фильма ужасов на уровень стресса участников. Поэтому он имеет высокую лицевую валидность.
Однако мы не учитывали влияние того, что участники не ели во время просмотра фильма.
Мы понимаем, что отказ от еды понизил уровень глюкозы в крови наших участников, что также вызывает выработку кортизола. Это означает, что наше исследование, хотя имеет высокую внешнюю валидность, имеет низкую внутреннюю валидность.
Проверка достоверности
Проверка достоверности состоит из нескольких составных частей.
Под валидностью теста понимается степень значимости результатов исследования или теста.
Давайте рассмотрим пример.
Предположим, мы измеряем интеллект людей. Мы могли бы использовать тест IQ. Мы могли бы возразить, что тест IQ имеет высокий уровень валидности, потому что мы видим, что это хорошо зарекомендовавший себя тест.
Действительность конструкции
Конструктивная валидность относится к степени, в которой исследование или тест измеряют концепцию, на которую они претендуют.
Существует два типа конструктной валидности: конвергентная валидность и дискриминантная валидность.
Давайте рассмотрим пример.
Предположим, мы изучаем «Модель убеждений о здоровье» Беккера (1978)
. Мы обнаруживаем, что существует несколько когнитивных эвристик, которые люди используют, когда рассматривают возможность принятия здорового образа жизни. Все они присутствуют в модели убеждений о здоровье. Таким образом, мы можем утверждать, что наше исследование имеет высокую конструктную валидность.
Конвергентная валидность
Конвергентная валидность относится к степени, в которой тестируемые конструкции соотносятся друг с другом.
Различающая валидность
Различающая валидность относится к степени, в которой протестированные конструкции, не имеющие взаимосвязи, действительно не имеют взаимосвязи друг с другом.
Валидность содержания
Валидность содержания хорошо вытекает из валидности конструкции, поскольку валидность содержания относится к степени, в которой исследование или тест измеряет все элементы конструкции.
Например, предположим, что мы рассматриваем влияние стресса на производительность труда.
Мы предлагаем нашим участникам ответить на вопросники, насколько, по их мнению, на них влияет стресс на рабочем месте и насколько он влияет на их производительность.
Мы можем возразить, что содержание этого исследования недостаточно достоверно, потому что оно не проверяло влияние стресса на производительность труда.
Обоснованность критерия
Обоснованность критерия относится к степени достоверности результатов и выводов по сравнению с другими показателями.
Валидность критерия делится на два типа валидности: прогностическая валидность и параллельная валидность.
Прогностическая валидность
Прогностическая валидность относится к степени, в которой результаты и выводы могут быть использованы для прогнозирования применения исследования в реальной жизни.
Давайте рассмотрим пример.
Предположим, мы изучаем влияние мыслей о том, что за вами наблюдают, на поведение.
Наше исследование является повторением нескольких или других исследований, которые были проведены ранее.
Мы даем нашим участникам задание для выполнения. Во время выполнения задачи они столкнутся с несколькими признаками того, что за ними наблюдают, например, «за вами наблюдают операторы видеонаблюдения».
Это исследование может иметь прогностическую ценность для подобных ситуаций.
Как правило, прогностическая достоверность определяется повторяющимися результатами с течением времени.
Параллельная валидность
Параллельная валидность относится к степени, в которой результаты и выводы согласуются с другими исследованиями и доказательствами.
Давайте рассмотрим пример.
Милграм (1963) изучал последствия послушания авторитету. Результаты Милгрэма совпали со многими повторениями исследования. Поэтому исследование Милгрэма имело высокую параллельную валидность.
Достоверность статистического заключения
Достоверность статистического заключения относится к той степени, в которой мы можем, чтобы результаты были статистически значимыми, то есть мы можем установить причину и следствие выше случайности.
Обычно в психологических исследованиях вероятность устанавливается на уровне 5% или >0,05 вероятности. Это означает, что если результаты превышают 5%, мы примем нашу альтернативную гипотезу и отклоним нашу нулевую гипотезу. Это предполагает причину и следствие между переменными. Если результаты ниже 5%, мы примем нашу нулевую гипотезу. Результат менее 5% вероятности означает, что мы не можем установить причину и следствие, потому что результаты произошли случайно.
Репрезентативная валидность
Репрезентативная валидность, известная также как трансляционная валидность, относится к степени, в которой изучаемый конструкт или концепция могут быть перенесены в реальную жизнь.
Диагностическая валидность
Диагностическая валидность мало используется в спецификации психологии OCR A2. Чаще всего используется в клинических условиях. Диагностическая валидность относится к степени точности диагноза, поставленного относительно состояния.
Инструментальная валидность
Инструментальная валидность относится к степени, в которой инструменты, используемые для измерения зависимых переменных, верны для данного измерения.
Например, вернемся к нашему исследованию таблицы ранее. Допустим, сейчас мы правильно измеряем длину стола, но потом понимаем, что наша рулетка неточна. Поэтому наше исследование имело низкую инструментальную валидность.
Дополнительная литература
Десять лучших советов по пересмотру психологии от Psych Yogi для отличников
Сводка
Срок действия | Психология | tutor2u
Исследуйте психологию
Учебные заметки
- Уровень:
- AS, A-уровень
- Доска:
- AQA, Edexcel, OCR, IB
Последнее обновление 22 марта 2021 г.
Поделиться :
Валидность относится к тому, действительно ли мера измеряет то, что, по ее утверждению, измеряет . Некоторые ключевые типы валидности рассматриваются ниже.
Внешняя достоверность
Внешняя достоверность является мерой того, выглядит ли субъективно многообещающе то, что инструмент измеряет то, что он должен измерять
- например. Можно заметить, что люди с более высокими баллами на экзаменах получают более высокие баллы по опроснику IQ; вы не можете быть уверены, что они напрямую связаны, но на первый взгляд кажется, что результаты экзаменов являются разумным показателем показателей IQ, поэтому ваша мера показывает хорошую внешнюю достоверность.
Внутренняя валидность
Внутренняя валидность является мерой того, зависят ли полученные результаты исключительно от изменений в переменной, с которой манипулируют (т. е. независимой переменной) в причинно-следственной связи. Два ключевых типа внутренней валидности:
- Конструктивная валидность – спрашивает, успешно ли мера измеряет концепцию , для которой она предназначена (например, измеряет ли опрос IQ или что-то родственное, но принципиально отличное?).
- Параллельная валидность — спрашивает, согласуется ли мера с ранее существовавшими мерами, которые проверены для проверки той же [или очень похожей] концепции (оценивается путем сопоставления мер друг с другом).
Внутреннюю валидность можно оценить на основе того, успешно ли контролируются или исключаются посторонние (т. е. нежелательные) переменные, которые также могут повлиять на результаты; чем больше контроль над такими переменными, тем больше уверенность в том, что можно найти причину и следствие, относящиеся к исследуемому конструкту.
Внешняя валидность
Внешняя валидность — это мера того, могут ли данные быть обобщены на другие ситуации за пределами исследовательской среды, в которой они были первоначально собраны. Два основных типа внешней валидности:
- Временная валидность — это высокая когда результаты исследований успешно применяются в течение времени (некоторые переменные в прошлом могут больше не иметь значения сейчас или в будущем).
- напр. Изменения в отношении к гендерным ролям с течением времени могут снизить временную достоверность данных прошлых экспериментов применительно к современным исследованиям.
- Экологическая валидность – применимы ли данные к реальному миру , исходя из условий, в которых проводится исследование, и применяемых процедур.
- напр. Лабораторные исследования могут обеспечить высокую степень контроля над посторонними переменными, которые в противном случае варьировались бы в естественной среде, поэтому результаты могут считаться слишком «искусственными» и, следовательно, иметь низкую экологическую достоверность.
- Однако мыши, например, могут вести себя одинаково в лаборатории и в дикой природе, поэтому лабораторные эксперименты, возможно, по-прежнему сохраняют здесь высокую экологическую достоверность.
- напр. Лабораторные исследования могут обеспечить высокую степень контроля над посторонними переменными, которые в противном случае варьировались бы в естественной среде, поэтому результаты могут считаться слишком «искусственными» и, следовательно, иметь низкую экологическую достоверность.