Валидность — Блог Викиум
Илья Павлов
Автор Викиум
Валидность — важнейший аспект экспериментальной психологии. Это свидетельство того, что, применяя определённую методику, специалист измерил именно то, что планировал.
Валидной считается методика, результаты которой соответствуют задачам, поставленным перед исследованием. Например, методика, разработанная для того, чтобы определить темперамент человека, должна измерять именно его, а не иные психические свойства.
Принципиальную важность валидности невозможно переоценить. Ведь именно от неё зависит достоверность проводимых тестов. Совершенный эксперимент невозможен, если методика не обладает идеальной валидностью.
Как проверить валидность?
Существует три способа, позволяющих определить, насколько методика валидна:
- Содержательная сторона
Проверка выявляет, насколько методика соответствует действительности, в которой реализуется изучаемое свойство.
- Конструктная валидность
Если методика валидна, она будет проверять научно обоснованные конструкты. Здесь же можно пойти по двум направлениям. Конвергентная валидность требует сопоставления нескольких методик, проверяющих идентичные показатели. Если между результатами будет наблюдаться корреляция, методику можно считать валидной.
При дискриминантном подходе проверяют, диагностирует ли методика только заданные характеристики и не затрагивает ли те, с которыми нет зависимости у исходных параметров.
- Критериальная проверка
Здесь используются статистические методы. Чтобы протестировать валидность, проверяют, соответствуют ли результаты испытания заранее заданным критериям.
Рассматривая критериальную валидность, также говорят о прогностической составляющей.
Такие методики применяют, когда хотят предсказать поведение. Если прогноз, сделанный с помощью методики, со временем оправдывается, экспериментальный комплекс получает статус прогностически валидного.Надёжность и валидность
Критерии надёжности рассматриваются с формальной точки зрения, тогда как содержательная сторона не учитывается.
Валидность, наоборот, обращает внимание на содержательные результаты теста. Оценивается их соответствие существующим феноменам психологии.
Надёжная методика не тождественна валидной. Например, тест, оценивающий инициативность, может продемонстрировать высокие показатели надёжности и ретестовости элементов. Однако фактически результаты будут свидетельствовать о значительной силе воли, но с точки зрения содержания инициативности не подтвердят.
Таким образом, надёжность теста является высокой, а валидность — низкой.
Внутренняя валидность и пример её нарушения
Внутренняя валидность — одна из разновидностей данного феномена. Чтобы понять её принцип, стоит рассмотреть пример, который отразит её нарушение.
Допустим, лаборатория хочет протестировать лекарство, способствующее росту. Для этого экспериментаторы отбирают несколько подростков тринадцати лет, измеряют параметры роста и дают детям лекарство.
Спустя два года снова производятся замеры, которые отражают увеличение показателей. Однако на основании изменившихся данных нельзя сделать вывод о том, что причиной перемен оказалось именно лекарство.
Нарушение внутренней валидности заключается в неучтенных факторах, которые влияют на результат исследования. В данном случае речь идёт о естественных процессах взросления. Корректный эксперимент должен был предусмотреть и их.
Методика определения определения поведения людей в различных ситуациях тоже может быть валидной или нет. Курс Викиум «Профайлинг» научит «читать людей» по невербальным признакам, выявлять скрытые намерения собеседника и прогнозировать действия оппонента.
Валидность в психологии.
Определение. ПодробнееВалидность служит основным целям любой науки – познание и власть.
Сегодня часто утверждают, что концепция валидности уникальна. Но критерий оценки или процедура оценки действительна или недействительна, и не более того. Разнообразны и многочисленны методы проверки, одни из которых теоретические или конструктивные, а другие — прагматические или просто эмпирические.
Техники валидации очень распространены, и их количество быстро растет. Но, существует только два фундаментальных типа валидности, которые в остальном взаимозависимы: теоретическая и практическая. Они соответствуют двум фундаментальным целям науки: познанию и власти. С одной стороны, чтобы познать реальность, объяснить и понять ее, то есть чтобы учесть один аспект реальности (объяснить его) в связи с другими аспектами (понять их).
С другой стороны, чтобы иметь возможность вмешиваться в реальность, чтобы до некоторой степени доминировать над ней, лучше приспособиться к ней или модифицировать ее так, чтобы она лучше соответствовала нашим целям. Это две разные цели, но не независимые.
В психометрии валидность понимается как степень, в которой инструмент или процедура измеряет то, что они предназначены для измерения. Другими словами, метод измерения будет действителен до тех пор, пока он эффективно отражает психологическую переменную, на которую он направлен. Переменная эта оценивается по ее взаимосвязи с определенным критерием, например, результатами в других переменных или связанных задачах. В этом смысле можно рассматривать различные типы достоверности: прогнозирующая валидность, конвергентная валидность, конструктивная валидность и т.д.
Валидность — это суждение или оценка того, насколько хорошо тест измеряет (оценивает) то, что он предназначен для измерения в данном контексте. В частности, это вынесение основанного на фактах суждения о целесообразности различий, сделанных на основе результатов тестов.
Валидность гарантирует, что измеряется то, что предлагается, а не что-то иное. Тест считается валидным, если он соответствует нашим целям.
Валидация — это процесс, который позволяет все больше и больше уточнять, ограничивать и улучшать измерительный «инструмент». Таким образом, тест по теории измерений будет действительным, если он действительно дает возможность измерить, например, знания, которые студенты имеют по этому предмету, а не (возможно, непреднамеренно) что-либо иное.
Наконец, срок действия валидности относится к степени, в которой тест измеряет то, что он намеревается измерить. В этом смысле тест будет пригоден для измерения пространственного мышления, например, если он измеряет этот тип рассуждения, а не что-то еще.
Валидность в психологииВалидация — это процесс сбора и оценки достоверности доказательств. И создатель теста, и пользователь теста могут сыграть роль в валидации теста для конкретной цели.
Один из способов, которым специалисты по измерениям традиционно концептуализируют валидность, состоит в трех категориях:
- Валидность содержания. Валидность контента определяет, является ли тест репрезентативным для всех аспектов конструкции. Полностью ли тест отражает то, что он нацелен на измерение.
- Валидность (текущая или прогностическая), связанная с критерием оценивает, насколько близко результаты теста соответствуют результатам другого теста одного и того же предмета.
- Валидность конструкции — это гарантия того, что метод измерения соответствует конструкции, которую вы хотите измерить.
Валидность можно разделить на два основных типа:
- Внутренняя валидностьозначает степень уверенности в том, что тестируемая причинно-следственная связь заслуживает доверия и не зависит от других факторов или переменных.
Один из ключей к пониманию внутренней валидности — это признание того, что, когда она связана с экспериментальным исследованием, она относится как к тому, насколько хорошо было проведено исследование (план исследования, используемые рабочие определения, как измерялись переменные, что измерялось/не измерялось и т.
д.), так и насколько уверенно можно сделать вывод, что изменение зависимой переменной было произведено исключительно независимой переменной, а не посторонними.В своей классической книге по экспериментальным исследованиям Кэмпбелл и Стэнли (1966) идентифицируют и обсуждают 8 типов посторонних переменных, которые, если их не контролировать, могут поставить под угрозу внутреннюю валидность эксперимента.
- История
Это уникальный опыт, полученный испытуемыми между различными измерениями, выполненными в эксперименте. Этот опыт действует как дополнительные и незапланированные независимые переменные. Исследования, в которых с течением времени проводятся повторяющиеся измерения субъектов, с большей вероятностью будут подвержены влиянию исторических переменных, чем те, которые собирают данные в более короткие периоды времени или не используют повторные измерения.
- Созревание
Это естественные (а не навязанные экспериментатором) изменения, которые происходят в результате нормального течения времени. Например, чем больше времени проходит в исследовании, тем больше вероятность того, что испытуемые устают и скучают, более или менее мотивированы в зависимости от голода или жажды и т. д.
- Тестирование
Во многих экспериментах проводится предварительное тестирование субъектов, чтобы установить, что все субъекты начинают исследование примерно на одном и том же уровне и т. д. Это может повлиять на результативность субъектов в более поздних.
- Инструменты
Изменение методов измерения (или их применения) во время исследования влияет на то, что измеряется.
- Статистическая регрессия
Это когда субъекты исследования выбираются в качестве участников из-за того, что они набрали чрезвычайно высокие или чрезвычайно низкие баллы по некоторому показателю эффективности. Повторное тестирование субъектов почти всегда приводит к другому распределению баллов. и среднее значение для этого нового распределения будет ближе к среднему значению.
- Отбор
Субъекты в группах сравнения (например, контрольная и экспериментальная) должны быть функционально эквивалентны в начале исследования. Если группы сравнения отличаются друг от друга в начале исследования, результаты исследования являются необъективными.
- Экспериментальная смертность
Испытуемые выбывают из исследований. Если одна группа сравнения испытывает более высокий уровень исключения/смертности субъектов, чем другие группы, то наблюдаемые различия между группами становятся сомнительными.
- Взаимодействие при выборе
В некоторых исследованиях метод выбора взаимодействует с одной или несколькими другими угрозами (описанными выше), искажая результаты исследования.
- Внешняя валидность относится к степени, в которой результаты исследования могут быть применены (обобщены) к другим ситуациям, группам или событиям.
Достоверность исследования во многом определяется планом эксперимента. Чтобы убедиться в достоверности используемых вами инструментов или тестов, вы также должны учитывать достоверность измерений.
Степень, в которой результаты исследования (независимо от того, является ли исследование описательным или экспериментальным) могут быть обобщены/применены к другим людям или условиям, отражает его внешнюю валидность. Как правило, групповые исследования, использующие рандомизацию, изначально будут обладать более высокой внешней валидностью, чем исследования (например, тематические исследования и экспериментальные исследования с одним субъектом), в которых не используется случайный выбор/назначение. Кэмпбелл и Стэнли определили 4 фактора, которые отрицательно влияют на внешнюю валидность исследования:
- Взаимодействие
Взаимодействие между тем, как были выбраны субъекты и лечение может произойти. Если субъекты не выбираются случайным образом из популяции, то их конкретные демографические/организменные характеристики могут влиять на их работу, и результаты исследования могут быть неприменимы к популяции или к другой группе, которая более точно представляет характеристики популяции.
- Предварительное тестирование
Это может вызвать более/менее сильную реакцию, например, на лечение, чем если бы они не прошли предварительное тестирование. Иными словами, чтобы обобщить результаты исследования, исследователь должен будет указать, что также должен проводиться определенный тип предварительного тестирования, поскольку предварительное тестирование может служить дополнительной непреднамеренной независимой переменной.
- Эффективность субъектов
Эффективность субъектов в некоторых исследованиях больше является продуктом или реакцией на экспериментальные условия (например, ситуацию, в которой проводится исследование), чем на независимую переменную.
Исследования, в которых используется несколько методов вмешательств, могут иметь ограниченную обобщаемость, поскольку ранние методы исследования могут иметь кумулятивный эффект на показатели субъектов.
Существует разница между внутренней и внешней валидностью.
Внутренняя валидность является степень уверенности, что причинно-следственная связь тестируется не зависит от других факторов или переменных.
Внешняя валидность — это степень, в которой ваши результаты могут быть обобщены на другие контексты.
- Повышение внутренней и внешней валидности
В групповых исследованиях основными методами, используемыми для достижения внутренней и внешней валидности, являются рандомизация, использование плана исследования и статистического анализа, соответствующих типам собранных данных, а также вопросам, которые исследователь(и) пытается решить, найти ответ. Экспериментальные исследования с одним субъектом почти всегда имеют высокую внутреннюю валидность, поскольку субъекты служат в качестве их собственных контролей, но они чрезвычайно низки в отношении внешней валидности. Однопредметные исследования приобретают внешнюю валидность в процессе репликации и расширения, т.
Что такое валидность психологического эксперимента?
Несмотря на свою важность, концепция экспериментальной валидности с момента своего появления получила мало развития. По этой причине цель состоит в том, чтобы обеспечить критический анализ с помощью метода философского анализа по трем осям:
- различие между альтернативными гипотезами и экспериментальными артефактами;
- списки угроз экспериментальной валидности;
- предполагаемое противоречие между внутренней и внешней валидностью.
Если разработка концепции экспериментальной валидности была недостаточной, то всему виной ограниченное рассмотрение как причинных допущений, так и неопределенности в экспериментальном контексте.
Надежность психологического эксперимента измеряет согласованность, проверяемость или повторяемость исследования. Если исследование может быть повторено и по-прежнему дает те же результаты (либо в другой группе участников, либо в течение другого периода времени), то оно считается надежным.
Со своей стороны, валидность в психологии (и не только), измеряет относительную точность или точность выводов, сделанных в результате исследования. Это относительная точность и правильность психологических исследований. Чтобы определить достоверность меры количественно, ее необходимо сравнить с критерием.
Выделяются различные типы валидности психологического эксперимента:
Валидность теста
Валидность теста — это показатель количества смысла, который можно приписать набору результатов теста. В психологических и образовательных тестах, где важность и точность тестов имеют первостепенное значение, очень важна валидность теста.
Валидность теста включает в себя ряд видов действия, в том числе критерия достоверности, обоснованности содержания и валидности. Если исследовательский проект имеет высокие баллы в этих областях, общая валидность теста высока.
- Критерий валидности
Валидность критерия устанавливает, соответствует ли тест определенному набору навыков:
- Параллельная достоверность измеряет тест против эталонного теста, а высокая корреляция указывает на то, что тест имеет сильную достоверность критерия.
- Прогностическая достоверность является мерой того, насколько хорошо тест предсказывает навыки, такие как измерение того, дает ли, например, хороший средний балл в средней школе хорошие результаты в колледже или университете.
- Валидность содержания
Валидность содержания определяет , как хорошо тест по сравнению с реальным миром. Например, тест на школьные способности должен отражать то, что на самом деле преподается в классе.
- Валидность конструкции
Валидность конструкции является мерой того, насколько хорошо тест выполняет свои требования. Тест, предназначенный для измерения депрессии, должен измерять только этот конкретный конструкт, а не тесно связанные идеалы, такие как тревога или стресс.
Валидность методики
Валидность вместе с надежностью, составляют фундаментальные свойства психометрических методов и, в более общем плане, процедур наблюдения и записи психологических переменных. В этом смысле это также применимо к экспериментальным процедурам, в которых проводится различие между внутренней и внешней валидностью.
Валидация метода относится к процессу экспериментирования и оценки для определения рабочих характеристик метода. Метод считается валидированным, когда «испытатель» подтвердил посредством объективных свидетельств и оценки этих экспериментов, что метод соответствует его предполагаемому использованию (соответствует цели).
Два из этих параметров — точность и аккуратность.
Результатом валидации является решение относительно средств управления, которые необходимо ввести, чтобы гарантировать, что метод остается действительным.
Существуют различные методологии, позволяющие определить валидность содержания теста или инструмента. Некоторые авторы заявляют, что в них входят результаты тестирования, мнение специалистов, когнитивные интервью и оценка экспертов. Других выполняют статистический анализ с различными «формулами. Качественные данные получаются благодаря таким методам как:
- Экспертная комиссия
Это методология, которая позволяет определить валидность инструмента с помощью группы экспертов для каждой из областей науки, которые должны быть рассмотрены в инструменте оценки, которые должны проанализировать, как минимум, согласованность пунктов с цели курсов, сложность заданий и оцениваемые когнитивные способности. Эта методология наиболее часто используется для проверки содержимого.
- Когнитивное интервью
Это метод, требующий от участников мысли вслух при выполнении требуемой деятельности. Полученный рассказ записывается для последующей расшифровки и анализа.
Для лучшего результата в отношении валидности содержания предлагается использовать более одной методологии, чтобы дополнять их, тем самым повышая строгость процесса.
Способы установления валидности методики
Когда валидность обсуждается в контексте определенных тестов, экспериментов или методик, может быть поставлен вопрос и о валидности метода, тестирования или иного определенного метода в целом, особенно тогда инструментом исследования определяют мета-анализ.
Для установления валидности методики используют 3 основных способа:
Методику можно считать прогностически валидной, если прогноз подтверждается с течением времени.
Все создатели своих методик должны неустанно обосновывать все виды валидности и собирать свидетельства в пользу валидности выбранных инструментов.
Часто валидность считают синонимом точности. Но нет, валидность — это не синоним точности. Таким образом, валидность результата эксперимента означает, что результату можно доверять, и люди могут принимать осмысленные решения, основываясь на качестве результатов. Это потому что тестирование проводилось с использованием проверенного метода (метод был проверен для достижения характеристик, необходимых для соответствия цели испытания, включая точность), и метод контролировался и оценивался посредством внутренних и внешних проверок (включая точность).
9 типов валидности в исследованиях (2023)
Валидность относится к тому, действительно ли тест или эксперимент делает то, для чего он предназначен.
Действительность находится в спектре. Например:
- Низкая достоверность: Теперь большинство людей знают, что стандартный тест IQ на самом деле не измеряет интеллект и не предсказывает успех в жизни.
- Высокая достоверность: Стандартный тест на беременность, напротив, имеет точность около 99%, что означает очень высокую достоверность и, следовательно, очень надежный тест.
Существует множество способов определения достоверности. Большинство из них определены ниже.
Типы валидности
1. Лицевая валидность
Лицевая валидность относится к тому, «появляется» ли шкала для измерения того, что она должна измерять. То есть кажутся ли вопросы логически связанными с изучаемым конструктом.
Например, личностная шкала, измеряющая эмоциональный интеллект, должна содержать вопросы о самосознании и эмпатии. В нем не должно быть вопросов по математике или химии.
Один из распространенных способов оценить лицевую достоверность — это попросить группу экспертов изучить шкалу и оценить ее пригодность в качестве инструмента для измерения конструкции. Если эксперты согласны с тем, что шкала измеряет то, для измерения чего она была разработана, то говорят, что шкала имеет внешнюю валидность.
Если шкала или тест не имеют объективной валидности, то люди, которые их проходят, не будут серьезными.
Конбах объясняет это следующим образом:
«Когда пациент теряет веру в лекарство, которое прописывает его врач, оно теряет большую часть своей способности улучшать его здоровье. Он может пропускать дозы и, в конце концов, может решить, что врачи не могут ему помочь, и полностью отказаться от лечения. По тем же причинам при выборе теста необходимо учитывать, насколько полезным он покажется участнику, который его выполняет, и другим непрофессионалам, которые увидят результаты» 9. 0027 (Кронбах, 1970, стр. 182).
2. Валидность содержания
Валидность содержания относится к тому, измеряет ли тест или шкала все компоненты данной конструкции. Например, если имеется пять измерений эмоционального интеллекта (EQ), то шкала, измеряющая EQ, должна содержать вопросы, касающиеся каждого измерения.
Подобно внешней валидности, содержательную валидность можно оценить, попросив экспертов в предметной области (SME) изучить тест. Если эксперты согласны с тем, что тест включает элементы, оценивающие каждую область конструкции, то тест имеет содержательную валидность.
Например, математическая часть SAT содержит вопросы, требующие навыков во многих областях математики: арифметике, алгебре, геометрии, исчислении и многих других. Поскольку есть вопросы, которые оценивают каждый тип математики, тест имеет содержательную валидность.
Разработчик теста может попросить SME оценить достоверность построения теста. Если все МСП дают тесту высокие оценки, то он имеет конструкционную валидность.
3. Конструктивная валидность
Конструктивная валидность — это степень, в которой инструмент измерения действительно оценивает то, для оценки чего он был разработан.
Существует два основных метода оценки конструктной валидности: конвергентная и дискриминантная валидность.
Конвергентная валидность включает проведение двух тестов, предназначенных для измерения одной и той же конструкции, и проведение их на выборке участников. Чем выше корреляция между двумя тестами, тем сильнее валидность конструкции.
С разной валидностью два теста, которые измеряют совершенно разные конструкции, применяются к одной и той же выборке участников. Поскольку тесты измеряют разные конструкции, между ними должна быть очень низкая корреляция.
4. Внутренняя валидность
Внутренняя валидность относится к тому, обусловлены ли результаты эксперимента манипулированием независимыми или лечебными переменными. Например, исследователь хочет изучить, как температура влияет на готовность помочь, поэтому участники исследования ждут в комнате.
Есть разные комнаты, в одной установлена нормальная температура, в одной умеренно теплая, в другой очень теплая.
На следующем этапе исследования участников просят сделать пожертвование в местную благотворительную организацию, прежде чем они примут участие в остальной части исследования. Результаты показали, что по мере повышения температуры в помещении пожертвования уменьшались.
На первый взгляд кажется, что исследование имеет внутреннюю достоверность: комнатная температура влияет на донорство. Однако, хотя в эксперименте участвовали три разные комнаты с разной температурой, каждая комната была разного размера. Самая маленькая комната была самой теплой, а комната с нормальной температурой была самой большой.
Теперь мы не знаем, повлияли ли на пожертвования температура в помещении или размер помещения. Таким образом, исследование имеет сомнительную внутреннюю валидность.
Другим способом оценки внутренней валидности является оценка межэкспертной надежности, которая помогает повысить как валидность, так и надежность исследования.
5. Внешняя валидность
Внешняя валидность относится к тому, распространяются ли результаты исследования на реальный мир или другие ситуации. Многие психологические исследования проходят в университетской лаборатории. Поэтому сеттинг не очень реалистичен.
Это создает большую проблему в отношении внешней валидности. Можем ли мы сказать, что то, что происходит в лаборатории, будет таким же, как и в реальном мире?
Например, исследование внимательности включает в себя исследователя, случайным образом назначающего разных участников исследования использовать одно из трех приложений для осознанности на своих телефонах дома каждую ночь в течение 3 недель. По истечении трех недель их уровень стресса измеряется с помощью высокотехнологичного оборудования ЭЭГ.
Это исследование имеет внешнюю валидность, поскольку участники использовали настоящие приложения и находились дома, когда использовали эти приложения. Приложения и домашняя обстановка реалистичны, поэтому исследование имеет внешнюю валидность.
6. Параллельная валидность
Параллельная валидность — это метод оценки валидности, который включает сравнение нового теста с уже существующим тестом или уже установленным критерием.
Например, недавно разработанный тест по математике для SAT необходимо будет утвердить, прежде чем предлагать его тысячам учащихся. Таким образом, новая версия теста проводится выборке математических специальностей колледжа вместе со старой версией теста.
Результаты двух тестов сравниваются путем расчета корреляции между ними. Чем выше корреляция, тем сильнее параллельная валидность нового теста.
7. Прогностическая валидность
Прогностическая валидность относится к тому, связаны ли результаты одного теста с выполнением заданного критерия. То есть может ли балл человека по тесту предсказать его результаты по критерию?
Например, ИТ-компании необходимо нанять десятки программистов для предстоящего проекта. Но проведение собеседований с сотнями соискателей занимает много времени и не очень точно определяет квалифицированных программистов.
Итак, компания разрабатывает тест, который содержит задачи программирования, аналогичные требованиям нового проекта. Компания оценивает прогностическую достоверность теста, предлагая своим нынешним программистам пройти тест, а затем сравнить их результаты с их ежегодными оценками производительности.
Результаты показывают, что программисты с высокими оценками также очень хорошо справились с тестом. Следовательно, тест имеет прогностическую валидность.
Теперь, когда новые кандидаты проходят тест, компания может предсказать, насколько хорошо они будут работать в будущем. Люди, которые хорошо справятся с тестом на предикторную переменную, будут скорее всего преуспевают в работе.
8. Обоснованность статистического заключения
Обоснованность статистического заключения относится к тому, подтверждаются ли выводы, сделанные авторами исследования, статистическими процедурами.
Например, применялся ли в исследовании правильный статистический анализ, применялись ли адекватные процедуры отбора проб, использовались ли в исследовании достоверные и надежные инструменты измерения?
Если все ответы на эти вопросы «да», то исследование имеет статистическую достоверность выводов. Однако если некоторые или все ответы «нет», то выводы исследования ставятся под сомнение.
Использование неправильного статистического анализа или выводы, основанные на очень малых размерах выборки, делают результаты сомнительными. Если результаты основаны на ошибочных процедурах, то выводы не могут быть признаны действительными.
9. Валидность критерия
Валидность критерия иногда называют прогностической валидностью. Это относится к тому, насколько хорошо оценки на одном измерительном устройстве связаны с оценками в данной области производительности (критерий).
Например, насколько хорошо результаты SAT предсказывают средний балл колледжа? Или в какой степени показатели потребительского доверия связаны с экономикой?
Примером низкой валидности критерия является то, как плохие спортивные результаты на комбайне НФЛ фактически предсказывают результаты на поле в игровой день. Есть десятки тестов, через которые проходят спортсмены, но около 99% из них никак не связаны с тем, насколько хорошо они выступают в играх.
Однако питание и физические упражнения тесно связаны с долголетием (критерий). Эти построения имеют критериальную валидность, поскольку сотни исследований показали, что питание и физические упражнения напрямую связаны с более продолжительной и здоровой жизнью.
Заключение
Существует так много типов достоверности, потому что точность измерения абстрактных понятий трудно различить. Среди экспертов также может возникнуть путаница и разногласия по поводу определения конструктов и того, как их следует измерять.
По этим причинам социологи потратили много времени на разработку различных методов для оценки достоверности своих измерительных инструментов. Иногда это открывает пути для улучшения методов, а иногда показывает ошибочность попыток предсказать будущее на основе ошибочных процедур оценки.
Ссылки
Кук, Т. Д. и Кэмпбелл, Д. Т. (1979) Квазиэксперимент: вопросы проектирования и анализа полевых настроек. Хоутон Миффлин, Бостон.
Коэн, Р. Дж., и Свердлик, М. Э. (2005). Психологическое тестирование и оценка: введение в тесты и измерения (6-е изд.). Нью-Йорк: Макгроу-Хилл.
Кронбах, Л. Дж. (1970). Основы психологического тестирования . Нью-Йорк: Харпер и Роу.
Кронбах, Л.Дж., и Мил, П.Е. (1955) Конструктивная валидность в психологических тестах. Психологический бюллетень , 52 , 281-302.
Симмс, Л. (2007). Классические и современные методы построения психологических шкал. Компас социальной психологии и психологии личности, 2 (1), 414–433. https://doi.org/10.1111/j.1751-9004.2007.00044.x
Дэйв Корнелл (доктор философии)
+ посты
Доктор Корнелл работает в сфере образования более 20 лет. Его работа включала разработку сертификатов учителей для Тринити-колледжа в Лондоне и обучение без отрыва от работы для правительств штатов в Соединенных Штатах. Он подготовил воспитателей детских садов в 8 странах и помог бизнесменам и женщинам открыть детские центры и детские сады в 3 странах.
Крис Дрю (доктор философии)
+ сообщения
Эта статья была рецензирована и отредактирована Крисом Дрю (доктор философии). Процесс рецензирования Helpful Professor включает в себя проверку фактов, редактирование и дополнение статей экспертом уровня доктора философии. Рецензенты следят за тем, чтобы весь контент отражал экспертный академический консенсус и подкреплялся ссылками на академические исследования. Доктор Дрю опубликовал более 20 научных статей в научных журналах. Он бывший редактор журнала «Развитие обучения в высшем образовании» и имеет докторскую степень в области образования, полученную в ACU.
Что такое психологическое тестирование прогнозной валидности?
Прогностическая валидность в психологии относится к способности теста или оценки измерять то, для измерения чего они предназначены. Понимание определения психологии прогностической достоверности может помочь учащемуся преуспеть в своих классах или профессионалу овладеть важным навыком для своей работы.
Что включает в себя исследование прогностической валидностиНовый человек в науке о данных или статистике может задаться вопросом: » Что такое прогностическая достоверность ?” Прогностическая валидация исследования могут проводиться как способ определения достоверности какого-либо другого теста. Эти исследования достоверности широко используются во многих областях исследований и экспертизы.
Исследование прогностической валидности предполагает определение того, насколько хорошо определенная мера, метрика или статистика могут предсказывать поведение в будущем. Это тип критериального исследования. Это исследование того, как одна переменная может предсказать результат на основе информации, предоставленной другими переменными. Важно, чтобы вся информация собиралась объективно и с использованием одних и тех же стандартов измерения. Предубеждения или различия в инструментах измерения могут повлиять на прогностическое исследование валидности.
Цель прогностического исследованияЧто такое прогностическое исследование ? Цель прогностического исследования достоверности состоит в том, чтобы выяснить, является ли какое-либо другое измерение хорошим для прогнозирования результата. Если этот другой тест или измерение окажется бесполезным для прогнозирования результата, то организация, агентство или компания могут захотеть найти другую метрику или статистику, которая имеет высокую прогностическую достоверность .
Поскольку у исследователей ограниченное количество времени и других ресурсов, они должны использовать их с умом. Исследование прогностической валидности может дать им доказательства того, стоило ли время, потраченное на измерение определенных критериев.
Как используется исследование прогностической валидностиИсследования прогностической валидности используются для прогнозирования поведения в будущем, поясняет Статистическое руководство. Они могут быть применены к реальным или смоделированным ситуациям. В лучшем случае они делаются на перспективу. Это означает, что они занимают много времени, чтобы завершить.
Исследования прогностической достоверности также требуют большого размера выборки. В некоторых случаях может быть трудно получить большой размер выборки, что является одной из причин, по которой завершение исследования прогностической достоверности может занять много времени.
Примеры исследований прогностической валидностиКогда прогностическое исследование валидности проводится в реальном мире, оно проводится с определенной целью. Одним из примеров прогностической достоверности могут быть приемные комиссии колледжей. Сотрудник приемной комиссии будет смотреть на оценки учащегося в средней школе и средний балл, чтобы предсказать успех учащегося в колледже. По окончании колледжа приемная комиссия могла просмотреть все данные и выяснить, вовремя ли закончили колледж люди с хорошими оценками в средней школе и получили ли они высокие средние баллы во время учебы в колледже. Члены приемной комиссии также могут проводить этот тип исследования с помощью таких тестов, как Scholastic Aptitude Test (SAT).
В этом примере исследование занимает много времени. Данные должны быть собраны от старшеклассников. Когда-нибудь в будущем (четыре или более года) необходимо будет снова собрать данные об успеваемости в колледже.
Необходимо провести анализ, чтобы определить, существует ли положительная или отрицательная корреляция между успеваемостью в средней школе, включая результаты тестов и средний балл, и успеваемостью в колледже. Этот анализ может быть завершен с использованием коэффициента корреляции Пирсона. Эта статистическая формула измеряет линейную связь между двумя переменными. К счастью, есть программное обеспечение, которое может вычислить эту формулу. Коэффициент корреляции Пирсона может указать нам тип линейной зависимости (положительная, отрицательная или отсутствие эффекта) и силу этой связи.
Сотрудники отдела кадров и рекрутеры также используют прогностическую проверку при приеме на работу новых сотрудников. Потенциальных сотрудников могут попросить пройти когнитивный тест, который показал способность предсказывать будущие результаты работы на определенной должности. Если бы корреляция между результатами теста и производительностью труда была статистически значимой, тест имел бы прогностическую ценность.
Другие виды валидационных исследованийВ психологических исследованиях существует семь распространенных типов валидации. Кратко остановимся на важных особенностях каждого из них.
Лицевая валидностьЭто наименее научный тип валидности в исследованиях. Это очень поверхностный анализ. Исследователь может спросить группу случайных людей, считают ли они, что оценка имеет смысл для того, что они пытаются измерить. Лицевая валидность — хорошая отправная точка, но ее никогда не следует использовать в качестве единственного метода валидности.
Конструктивная валидностьКонструктивная валидность показывает, насколько хорошо тест или эксперимент измеряет то, для чего он заявлен. Возможно, вы захотите определить, действительно ли художественная программа в начальной школе повысила художественные способности учащихся. Художественные способности — относительно абстрактное понятие. Исследователю потребуется работа, чтобы определить конструкцию, которую он пытается оценить, и определить, точно ли его инструмент оценки измеряет художественные способности.
Существует несколько психологических тестов с высокой конструкционной достоверностью. IQ-тест — один из самых известных тестов с высокой конструкционной валидностью.
Валидность содержанияВалидность содержания фокусируется на том, охватывает ли инструмент оценки или измерения все содержимое измеряемой конструкции или поведения. Если бы кто-то хотел измерить экстраверсию, ему нужно было бы определить, какие черты охватывают эту конструкцию. Если говорят, что оценка имеет высокую содержательную валидность, это означает, что тест измеряет все атрибуты экстраверсии.
Внутренняя достоверностьВнутренняя достоверность относится к степени, в которой вы можете быть уверены, что ваша независимая переменная производит наблюдаемый эффект. Исследование будет иметь внутреннюю валидность, если оно может показать заслуживающую доверия причинно-следственную связь. Исследователю может быть интересно узнать, может ли мотивационное приложение уменьшить негативное мышление. Если бы исследование показало, что негативное мышление уменьшилось после взаимодействия с мотивационным приложением и не было задействовано никаких других переменных, это было бы хорошей внутренней валидностью.
Внешняя валидностьВнешняя валидность — это способность исследования получать те же результаты за пределами контролируемой среды (например, в лаборатории) в реальном мире.
Параллельная валидностьПараллельная валидность используется для оценки степени согласия между двумя оценками, сделанными одновременно. Если учащийся набрал одинаковый балл как по бумажной, так и по электронной версии теста, тест будет иметь сильную параллельную валидность.
Валидность критерияВалидность критерия относится к тому, насколько точно тест или оценка измеряет результат, для измерения которого они были созданы. Оценки должны предсказывать результаты реальной жизни. Прогностическая валидность является вариантом этой парадигмы.
Понимание определения прогностической достоверности и того, как оно применимо к психологии, может помочь человеку продвинуться по карьерной лестнице.