Валидности это: Валидность (психология) | это… Что такое Валидность (психология)?

Содержание

Валидность это в психологии, виды валидности, понятие

Валидность – это один из базовых критериев в психодиагностике тестов, методик, определяющий их качество, близкое к понятию достоверности. Применяется, когда нужно узнать насколько хорошо методика измеряет именно то, на что она ориентирована, соответственно то, насколько лучше отображается исследуемое качество, тем большая валидность данной методики.

Вопрос о валидности возникает сперва в процессе разработки материала, потом после применения теста или методики, если необходимо узнать, соответствует ли степень выраженности определяемой характеристики личности и методом измерения этого свойства.

Понятие валидности выражается корреляцией результатов, которые получились в результате применения теста или методики с другими характеристиками, которые также исследуются, и ее можно также аргументировать комплексно, с помощью разных приемов и критериев. Используются разные виды валидности: концептуальная, конструктивная, критериальная, содержательная валидности, со свойственными методами установления их степени достоверности. Иногда критерий достоверности является обязательным требованием к проверке психодиагностических методов, если они вызывают сомнения.

Чтобы психологическое исследование имело реальную ценность, оно должно быть не только валидным, а еще и надежным одновременно. Надежность позволяет экспериментатору быть уверенным в том, что исследуемое значение очень близко к истинному показателю. А валидный критерий важен тем, что он указывает, что изучается именно то, что экспериментатор предполагает. Важно обратить внимание на тот факт, что данный критерий может предположить надежность, но надежность предположить валидность не может. Надежные значения могут быть не валидными, но валидные обязаны быть надежными, в этом вся суть успешного исследования, тестирования.

Валидность это в психологии

В психологии понятие валидности обозначает уверенность экспериментатора в том, что он измерял именно то, что хотел с помощью определенной методики, показывает меру соответствия результатов и самой методики относительно поставленных задач. Валидное измерение – это то значение, которое измеряет именно то, для чего было создано. Например, методика, направлена на определение темперамента, должна измерять именно темперамент, а не нечто другое.

Валидность в экспериментальной психологии очень важный аспект, является важным показателем, который обеспечивает достоверность результатов, и с ним иногда больше всего возникает проблем. Совершенный эксперимент должен обладать безупречной валидностью, то есть он должен демонстрировать, что экспериментальный эффект вызван модификациями независимой переменной и полностью соответствовать действительности. Полученные результаты без ограничений можно обобщать. Если речь идет о степени данного критерия, то предполагается, что результаты будут соответствовать поставленным задачам.

Проверка на валидность осуществляется тремя способами.

Оценивание содержательной валидности, проводится, чтобы узнать уровень соответствия использованной методики и реальной действительности, в которой выражается исследуемое свойство в методике. Существует здесь также такой компонент, как очевидная, еще ее называют лицевая валидность, она характеризует степень соответствия теста к ожиданиям оцениваемых. В большинстве методик считается очень важным, чтобы участник оценки видел очевидную связь содержания процедуры оценки и действительности того объекта оценки.

Оценивание конструктной валидности исполняется для получения степени обоснованности, что тест реально вычисляет те конструкты, которые заданные и научно обоснованные.

В конструктной валидности имеются два направления. Первый называется конвергентной валидизацией, с его помощью проверяется ожидаемая связь результатов методики с характеристиками из других методик, которые измеряют исходные свойства. Если для измерения какой-то характеристики необходимо несколько методик, то рациональным решением было бы проведение экспериментов минимум двух методик, чтобы при сопоставлении результатов обнаружив высокую положительную корреляцию, можно было утверждать о валидном критерии.

Конвергентная валидизация определяет вероятность вариации оценки теста с ожиданиями. Второй подход, называется дискриминантная валидизация, в ней заключается, что методика не должна измерять никаких характеристик, с которой теоретически не должно быть корреляции.

Проверка на валидность, также бывает критериальной, она, руководствуясь статистическими методами, определяет степень соответствия результатов к заранее определенным внешним критериям. Такими критериями могут быть: непосредственные меры, независимые от результатов методики или значение социально-организационных значимых показателей деятельности. В критериальной валидности также выделяют прогностическую, она применяется при потребности прогнозирования поведения. И если получается, что этот прогноз осуществляется со временем, значит методика прогностически валидна.

Валидность теста это

Тест – это стандартизованное задание в результате применения, которого получаются данные о психофизиологическом состоянии человека и его личностные свойства, его знания, способности и навыки.

Валидность и надежность тестов – это два показателя, которые определяют их качество.

Валидность теста определяет степень соответствия исследуемого качества, характеристики, психологического свойства к тесту, с помощью которого они определяются.

Валидность теста является показателем его эффективности и применяемости к измерению необходимой характеристики. Самые качественные тесты имеют 80% валидности. При валидизации следует учитывать, что от контингента испытуемых и их характеристик, будет зависеть качество результатов. Получается, что один тест может быть как высоко достоверным, так и совсем невалидным.

Существует несколько подходов к определению валидности теста.

При измерении сложного психологического явления, которое имеет иерархическую структуру и его невозможно исследовать, применяя всего один тест, применяют конструктивную валидность. Она определяет точность исследования сложных, структурированных психологических явлений, качеств личности, измеряемых с помощью тестирования.

Валидность за критерием – это такой критерий теста, за которым определяется исследуемое психологическое явление в настоящий момент и прогнозирование особенностей этого явления в будущем. Для этого результаты, полученные при тестировании соотносятся со степенью развития измеряемого качества на практике, оценка специфических способностей в определенной деятельности. Если валидность теста имеет значение минимум 0,2 то применение такого теста является оправданным.

Содержательная валидность – это критерий теста, который применяется для определения соответствия области его измеряемых психологических конструктов, демонстрирует все полноту множества измеряемых показателей.

Прогностическая валидность – критерий, за которым можно предсказать характер развития исследуемого качества в будущем. Такой критерий качества теста очень ценный, если смотреть с практической стороны, но могут быть сложности, поскольку исключается неравномерность развития данного качества в разных людей.

Надежность теста – это критерий теста, который измеряет уровень стабильности результатов, полученных после тестирования, при повторном исследовании. Определяется путем вторичного тестирования спустя определенное количество времени и расчета корреляционного коэффициента результатов, полученных после первого и после второго тестирования. Также важно, учитывать особенности самой процедуры проведения тестов и социально-психологической структуры выборки. Один и тот же тест может иметь разную надежность, зависимо от пола, возраста, социального статуса исследуемых. Поэтому надежность может иногда иметь неточности, ошибки, которые истекают из самого процесса исследования, поэтому ищутся пути, как уменьшить влияние определенных факторов на тестирование. Можно утверждать о надежности теста, если она составляет значение 0,8-0,9.

Валидность и надежность тестов очень важны, потому что определяют тест, как измерительный инструмент. Когда надежность и валидность неизвестны, тест считается неприменяемым для применения.

В измерении надежности и валидность имеет место также этический контекст. Это особенно важно, когда результаты тестирования имеют значимость в использовании их для принятия жизненно важных решений людей. Одних людей принимают на работу, других отсеивают, одни студенты проходят в учебные заведения, а другие должны еще доучиться сначала, кому-то определяется психиатрический диагноз и лечение, а кто-то здоров – это все говорит о том, что подобные решения принимаются на основании изучения оценки поведения или специальных способностей. Например, человек ищущий работу, должен пройти тестирование, и его оценки есть решающими показателями при приеме на работу, узнает, что тест был не в меру валидным и надежным, он очень разочаруется.

Валидность методики это

Валидность методики определяет соответствие того, что изучается данной методикой, тому для изучения чего именно она предназначена.

Например, если психологическая методика, которая основана на осведомленном самоотчете, назначена для исследования некого качества личности, такого качества, которое не может быть верно, оцененным самим человеком, то такая методика не будет валидной.

В большинстве случаев ответы, которые дает испытуемый на вопросы о наличии или отсутствии развитости в нем этого качества, может выражать то, как сам испытуемый воспринимает себя, или каким бы ему хотелось быть в глазах других людей.

Валидность также является основным требованием к психологической методике изучения психологических конструктов. Существует масса разных видов данного критерия, и нет пока единственного мнения о том, как правильно назвать эти виды и неизвестно каким именно видам методика обязана соответствовать. Если же методика оказывается невалидной внешне или внутренне, не рекомендуется ее использовать. Существуют два подхода к валидизации методики.

Теоретический подход выявляется в том, чтобы показать насколько действительно методика измеряет именно то качество, которое, как придумал исследователь, и обязана измерять. Это доказывается через составление с родственными показателями и теми, где связей не могло бы быть. Поэтому для подтверждения теоретического валидного критерия нужно определить степень связей с родственной методикой, имеется в виду конвергентный критерий и отсутствие такой связи с методиками, которые имеют иную теоретическую базу (дискриминантная валидность).

Оценивание валидности методики может быть количественной или качественной. За прагматическим подходом оценивается эффективность и практическая значимость методики, и для ее проведения используется независимый критерий извне, как показатель встречаемости данного качества в повседневной жизни. Таким критерием, например, может быть успеваемость (для методик на достижения, тестов на интеллект), субъективные оценки (для личностных методик), специфические способности, рисование, моделирование (для методик специальных особенностей).

Для доказательства валидности внешних критериев, выделяется четыре типа: критерии исполнения – это критерии такие, как количество выполненных заданий, время, потраченное на обучение; субъективные критерии получают вместе с опросниками, интервью или анкетами; физиологические – частота пульса, давление, физические симптомы; критерии случайности – используются, когда к цели имеет касательство или влияние определенного случая или обстоятельств.

При выборе методики исследования имеет теоретическое и практическое значение определение охвата изучаемых характеристик, как важной составляющей валидности. Информация, которая содержится в названии методики практически всегда не является достаточной для суждения об области ее применения. Это просто имя методики, но под ним всегда кроется еще много чего. Хорошим примером будет методика корректурной пробы. Здесь в сферу изучаемых свойств включаются концентрация внимания, устойчивость и психомоторная скорость процессов. Такая методика дает оценку выраженности этих качеств в личности, хорошо соотноситься со значениями, полученными из других методов и обладает хорошей валидностью. Вместе с тем полученные в результате проведения корректурной пробы значения подвержены большему влиянию других факторов, относительно которых методика будет неспецифичной. Если применить корректурную пробу, чтобы измерить их, то валидность будет невысокая. Выходит,что определяя область применения методики, валидный критерий отображает уровень обоснованности результатов исследования. При небольшом количестве сопровождающих факторов, которые имеют влияние на результаты, достоверность оценок, полученных в методике будет выше. Еще достоверность результатов определяется с помощью набора измеряемых свойств, их важностью при осуществлении диагностики сложной деятельности, существенностью отображения в материале методики предмета измерения. Например, для удовлетворения требований достоверности и надежности, методика, назначенная на профотбор, должна иметь анализ большого круга различных показателей, которые наиболее важные при достижении успеха в профессии.

Виды валидности

Валидный критерий бывает нескольких видов, в зависимости на что именно он направлен.

Внутренняя валидность определяет насколько определенное экспериментально воздействие стало причиной изменений в данном эксперименте.

Внутренняя валидность определяется отношениями между независимыми и зависимыми переменными, и проходит через особенные процедуры, в результате которых определяется достоверность выводов в данном исследовании. О внутреннем критерии говорится, когда достоверно известно о зависимости причинно-следственного типа между независимыми и зависимыми переменными.

Валидность исследования определяется влиянием неконтролируемых ситуативных факторов на изучаемое явление, если оно высокое, то данный критерий будет низким. Высокая внутренняя валидность исследования является признаком качественного исследования.

Внешняя валидность обобщает вывод популяции, ситуации и других независимых переменных. От того, насколько высокая и хорошая внешняя валидность зависит возможность переноса результатов, полученных в исследовании на реальную жизнь.

Очень часто внешняя и внутренняя валидизации противоречат друг другу, потому что если увеличивается одна валидность, то это значение может повлиять на показатели другой. Самым лучшим вариантом считается выбор экспериментальных планов, которые обеспечивали бы два вида данного критерия. Особенно это важно в случае исследований, в которых важным есть распространение результатов в определенных практических ситуациях.

Содержательная валидность применима к тем тестам, в которых полностью моделируется определенная деятельность, в первую очередь, аспекте связанным с предметом. Выходит, что в самом содержании методики отражаются основные стороны психологического конструкта. Если эта характеристика имеет сложную структуру, то в самой методике должны присутствовать все входящие в него элементы. Определяется такой валидный критерий с помощью систематического контроля за содержанием, должен показывать полноту охвата всей выборки за измеряемыми параметрами. Исходя из этого должна быть проведена эмпирическая проверка методики в соответствии с ее гипотезами. Каждое задание или вопрос в назначенной области, должен иметь равные шансы на включение его к заданиям теста.

Эмпирическая валидность определяется через статистическую корреляцию, то есть считается корреляция баллов по тесту и показателей внешнего параметра, избранного как критерий валидности.

Конструктная валидность относится к теоретическому конструкту, как отдельному и включается к поиску факторов, которые объясняют поведение человека при выполнении теста или методики.

Прогностический тип валидности определяется за счет наличия очень надежного внешнего критерия, хотя информация о нем собирается через определенное время после окончания испытания.

Таким внешним критерием может быть способность личности к определенному виду деятельности, для которой он был отобран за результатами психодиагностических измерений. Точность прогнозирования в этом валидном критерии находится в противоположной зависимости от времени, которое давалось для прогнозирования. И чем больше времени проходит после исследования, тем еще больше факторов будут учитываться для оценивания прогностической значимости теста. Хотя учесть абсолютно все имеющиеся факторы практически невозможно.

Ретроспективная валидность определяется за критерием, который отражает события или сстояние свойства в прошлом времени. Она может использоваться для получений знаний о предсказательных аспектах методики. Очень часто в таких тестах сопоставляют оценки развития способности в их прошлом значении и на данный момент, вычесляется насколько эффективнее стали результаты.

Экологическая валидность показывает, что некий организм в силу наследственных, генетически обусловленных или приобретенных особенностей является подготовленным к демонстрированию разнообразных форм поведения во всевозможных контекстах или в разных средах обитания. Действия организма могут быть успешными в одном времени и месте, но не настолько успешными или совсем не иметь успеха в другое время, и другом месте.

Экологическая валидность подтверждается, если результаты исследования имеют место подтверждения или должного применения их в полевых исследованиях. Проблемой лабораторных исследований есть адекватная переносимость полученных результатов на условия реальной жизни, на повседневную деятельность индивида, которая длится естественным путем. Но это тоже не является конечным подтверждением результатов, как экологически валидных, потому что предполагает генерализацию также на другие условия и обстоятельства. Часто исследования обвиняются в невысоком, экологическом валидном критерии, но вся причина бывает заключается в невозможности повторить исследование в реальной жизни.

Автор: Практический психолог Ведмеш Н.А.
Спикер Медико-психологического центра «ПсихоМед»

Что такое валидность исследования и зачем это нужно?

Лубянский проезд, 27/1 101000 Москва, Россия

Обновлено: 12. 02.2022

5 мин

11340

Валидность исследования

Содержание статьи

Валидность исследования – это соответствие экспериментальной базы, выбранной автором работы, общепринятым стандартам, позволяющим добиться безупречного результата в поиске решения поставленной проблемы. Соответствие результатов экспериментов поставленной цели исследования определяется степенью валидности.

Что характеризует валидность показателя в исследовании

При проведении исследований важно добиться результата, максимально соответствующего безупречному эксперименту. Если полученный итог практической работы вплотную приближен к соответствию с установленными научными стандартами, он имеет высокие показатели валидности.

Существует две категории валидности – это внутренняя и внешняя.

Внутренняя валидность является показателем, отражающим достоверность выводов, полученных после проведения ряда реальных экспериментальных исследований в сравнении с результатами «идеальных» экспериментов, применимых для той же научной отрасли. Является основным требованием, выдвигаемым к результатам экспериментов.

Внешняя валидность – это достоверность полученных результатов исследования по сравнению с итогами экспериментов, направленных на полное соответствие «безупречному» результату. Увеличить внешнюю валидность поможет введение дополнительных переменных с достижением экспериментального уровня, соответствующего реальному уровню аналогичных переменных в изучаемой научной отрасли.

Эксперимент, не обладающий характеристиками внешней валидности, является неверным, но в некоторых ситуациях может использоваться для проверки иных гипотез для научных отраслей, смежных с исследуемой областью знаний.

Угрозы для внутренней, внешней валидности

Основные факторы, влияющие на показатели внутренней валидности:

фоновые события, препятствующие проведению экспериментов;
естественные временные изменения, присущие объекту/предмету исследования;
неправильно подобранная методология исследования;
нестабильные результаты из-за высокого уровня погрешности выбранного инструментария;
взаимодействие нескольких факторов, непосредственно влияющих на внутреннюю валидность;
субъективные предубеждения экспериментатора (нежелание принимать во внимание детали, неправильный учет полученных результатов, неточность/невнимательность и т.д.).

Какие угрозы снижают уровень внешней валидности?

Взаимодействие некачественного отбора материалов исследования и подбора методологической базы к ним.
Реактивный эффект, как изменение восприимчивости предмета исследования после проведения предварительного тестирования.
Взаимная интерференция, возникающая после одновременного воздействия несколькими методами исследования на один объект.

Валидность и надежность экспериментальных методов

Надежность экспериментальных методов, проведенных автором, подтверждает истинность полученных результатов. Валидность отображает степень соответствия итогов исследования к изучаемому явлению выбранной научной отрасли.

Любое валидное исследование по умолчанию является надежным, но надежное исследование не всегда является валидным.

Надежность, как устойчивая составляющая достоверного эксперимента

Надежность (воспроизводимость, устойчивость результатов эксперимента) – это возможность воспроизведения полученных результатов исследования в аналогичных реальных условиях при корреляции начальных/конечных измерений.

От чего зависит надежность проводимых экспериментов?

Минимальная погрешность подобранного инструментария.
Отсутствие неконтролируемой вариативности выбранной методологии исследования.
Объективность исследователя.

Основная характеристика надежности – это получение одинаковых результатов при многократном проведении аналогичных экспериментов. Если все условия соблюдены правильно, методология исследования вызывает доверие.

Принципы взаимодействия валидности и надежности при выборе методов исследования

Принципы взаимодействия надежности с валидностью основываются на трех основных методах установки надежности выбранной методологической базы.

Метод повторяющегося эксперимента. Суть метода – это неоднократное проведение тех же самых экспериментов одинаковыми приборами и сопоставление итоговых результатов исследования в отношении рассматриваемого объекта/явления/события.

Метод альтернативной формы. Может выполняться в двух интерпретациях: один эксперимент применяется к нескольким группам объектов, комбинация экспериментов применяется к одному явлению.
Метод подвыборки. Для проведения комплексного исследования, один или несколько объектов группируются в отдельные выборки с аналогичными свойствами, характеристиками.

Валидность в психологических исследованиях

Причинно-следственная связь, предшествующая эффекту от эксперимента по времени, позволяет объективно обобщить полученные выводы и принудить экспериментатора на дополнительную проработку методологической базы.

Если у экспериментатора нет альтернативных объяснений появления определенных результатов исследования, это свидетельствует о внутренней валидности проведенного эксперимента. В ряде случаев, это утверждение применимо к выявлению внешней или конструктивной валидности.

Статистическая связанность причинно-следственной связи с полученным эффектом от тестирования испытуемых, проявляющаяся при многократном повторе выбранной методологии исследования, говорит о корректности используемых методов и подтверждает наличие валидности статистического вывода.

Валидность в психологических исследованиях повышается тремя основными способами:

предварительное планирование методологической базы;
выбор схемы дальнейшей работы над отсортированными объектами по категориям;
проведение экспериментов над контрольной группой испытуемых.

Была ли полезна статья?

Полезна Не очень

Опишите что вам не понравилось в статье?

Спасибо, ваш ответ принят

Закажите бесплатную консультацию по своей работе

Россия (+7 …)
Беларусь (+375 …)
Казахстан (+7 …)
Украина (+380 …)

Авторизация

Регистрация

Авторизация

Забыли пароль?

Авторизация

Регистрация

Россия (+7 . ..)
Беларусь (+375 …)
Казахстан (+7 …)
Украина (+380 …)

Я принимаю пользовательское соглашение

Помню пароль

Восстановление пароля

Оформить заказ

Выберите работу Магистерская диссертация Диссертация кандидатская Диссертация докторская Диссертация Дипломная работа Курсовая работа Контрольная работа Реферат Отчёт по практике Эссе Автореферат Аннотация Аспирантский реферат Аттестационная работа Бакалаврская работа Бизнес-план Билеты к экзаменам ВКР (выпускная квалификационная работа) Вычитка и рецензирование работ Дипломная работа (для колледжа) Дипломная работа МВА Литературный обзор к диплому Дистанционный экзамен Дневник по практике Доклад Домашняя работа Дополнительная работа по заказу Исправление и доработка готовой работы Исправление и доработка дипломной работы Кейс Конспект Копирайтинг Лабораторная работа Литературный обзор Маркетинговое исследование Монография НИР (научно-исследовательская работа) Набор текста (компьютерный) Научная статья Научный труд Онлайн-помощь Ответы на вопросы Отзыв на диплом Отчёт по преддипломной практике Отчёт по производственной практике Перевод План к дипломной работе Повышение уникальности Практическая работа Практическая работа МВА (задания, кейсы) Презентация (PPT, PPS, Prezi) Проверка выполненной работы Проверочная работа РГР (расчетно-графическая работа) Подбор литературы Раздаточный материал (речь, аннотация, презентация) Речь и презентация к диплому Решение задач Решение контрольных работ Самостоятельная работа Семестровая работа Сочинение Статьи для диссертации Статья Статья ВАК Статья, рецензия, аннотация Творческая работа Тезисный план Технико-экономическое обоснование Характеристика по практике Часть Дипломной работы Чертёж Школьный проект Шпаргалка Мотивационное письмо Другое Аналитическая справка Нормоконтроль Резюме Проектная работа Программирование Методическая копилка Портфолио Тест Таблицы Пояснительная записка Статистический анализ Краткое содержание

Срок выполнения*

Количество страниц*

Я не знаю

Дополнительная информация

Загрузить данные

Пояснение к заказу

Как бы Вы хотели, чтобы наши менеджеры к Вам обращались?

По этому номеру с Вами свяжется менеджер, чтобы уточнить детали заказа

Россия (+7 . ..)
Беларусь (+375 …)
Казахстан (+7 …)
Украина (+380 …)

На данный e-mail мы вышлем подробную информацию о Вашем заказе

Введите промокод и получите от нас персональную скидку на заказ

Я даю согласие на обработку своих персональных данных в соответствии с Политикой конфиденциальности

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам:

Отправить

3.

9. ВАЛИДНОСТЬ ТЕСТА 3.9. ВАЛИДНОСТЬ ТЕСТА

Высокая надежность теста это необходимое, но недостаточное условие получения высококачественного теста. Тест еще должен быть валидным. Валидность – это важнейшая характеристика теста, без указания которой, его нельзя считать измерительным инструментом.

Анализируя сложную ситуацию с валидностью педагогических тестов, Е.Михайлычев¹⁶ отмечает, что педагогу, заинтересовавшемуся валидностью, трудно будет разобраться в том, что же это такое.

Ниже мы приведем несколько определений валидности теста.

ВАЛИДНОСТЬ означает пригодность тестовых результатов для той цели, ради чего проводилось тестирование (В.Аванесов)¹⁷.

ВАЛИДНОСТЬ — это характеристика способности теста служить поставленной цели измерения (М.Челышкова)⁷.

ВАЛИДНОСТЬ - определяет, насколько тест отражает то, что он должен оценивать (А. Майоров)¹⁸.

Приведенные определения в целом перекликаются и являются практически равноценными. Мы несколько уточним определение, сделав акцент на цель тестирования. Тестирование как измерительная процедура, дает информацию, на основе которой в дальнейшем должно быть принято то или иное управленческое решение. Обоснованность этих решений, зачастую сильно влияющих на судьбу испытуемых, определяется надежностью и валидностью теста.

ВАЛИДНОСТЬ – это характеристика теста, отражающая его способность получать результаты, соответствующие поставленной цели и обосновывающая адекватность принимаемых решений.

После создания теста начинается процесс его валидизации. Приведем определение:

ВАЛИДИЗАЦИЯ – процесс накопления подтверждений для доказательства валидности теста¹⁹.

По нашему мнению ВАЛИДИЗАЦИЯ – это не столько сбор доказательств валидности теста, сколько процесс выполнения действий, повышающих его валидность. Вследствие этого будет расти и доказательная база валидности теста.

Выделяют три вида валидности – содержательную, критериальную и конструктную²⁰. А.Майоров приводит следующую диаграмму видов валидности¹⁸:

Рис.3.9.1. Виды валидности.

КОНСТРУКТНАЯ ВАЛИДНОСТЬ (концептуальная валидность) определяется в случаях, когда представление об измеряемом свойстве существует в форме абстрактного образа, модели. Для объяснения определенных качеств личности создается концептуальная модель, которая с помощью тестов подтверждается или опровергается.

КРИТЕРИАЛЬНАЯ ВАЛИДНОСТЬ (эмпирическая валидность) предполагает наличие внешнего критерия, корреляция с которым определяет валидность теста.

Имеется два вида критериальной валидности – текущая и прогностическая.

Текущая критериальная валидность (concurrent validity) характеризует способность теста измерять некоторые качества личности. Валидность теста подтверждается корреляцией с некоторым внешним критерием, существующим в данное время. Допустим, тест показал для некоторого испытуемого отличные знания по предмету, а школьные отметки, выставленные учителем – неудовлетворительные. Если мы в качестве внешнего, независимого и достоверного критерия выберем школьные отметки, то критериальная валидность теста – низкая, даже если он имеет высокую надежность.

Прогностическая критериальная валидность (predictive validity) характеризует способность теста предсказывать будущие качества, формирующихся в результате воздействия внешних обстоятельств или целенаправленной собственной деятельности. Этот тип валидности характеризует корреляцию результатов тестирования с внешним критерием, который появится в будущем.

СОДЕРЖАТЕЛЬНАЯ ВАЛИДНОСТЬ (content validity) характеризует тест по степени его соответствия предметной области.

Согласно А.Анастази, содержательная валидность означает систематическую проверку содержания теста, с тем чтобы установить, соответствует ли оно репрезентативной выборке измеряемой области поведения. Такая процедура валидизации обычно применяется для тестов достижений²⁰.

Содержательная валидность необязятельно означает полноту отображения изучаемой дисциплины. Например, для нормативно-ориентированного теста, полнота охвата всех тем может быть меньше, чем для критериально-ориентированного. Здесь важнее глубина проработки отдельных подтем, вопросов. Это позволит с большей эффективность дифференцировать обучаемых. Под содержанием понимается не только совокупность фактов, понятий, терминов, но и умение применять имеющиеся знания, оценивать информацию, выполнять действия, соответствующие верхним уровням таксономии Блума.

Для обеспечения содержательной валидности необходим детальный анализ учебных программ, на основании чего составляется спецификация теста. Спецификация содержит перечень учебных тем, их важность, количество и тип тестовых заданий. Оценка содержательной валидности выполняется экспертом в данной предметной области.

Согласно П.Клайну содержательная валидность определяется следующим образом:

1) указать категорию лиц, для которой предназначен тест;
2) составить список знаний, умений, навыков, подлежащих тестированию;
3) выполнить внешнюю экспертизу полученного списка на предмет его полноты и обоснованности;
4) на основе списка составить перечень заданий;
5) выполнить внешнюю экспертизу полученных заданий;
6) после проверки преобразовать их в задания в тестовой форме. В дальнейшем, на этой основе создать тестовые задания, образующие тест, который будет содержательно валидным.

Проблема валидизации педагогического теста является, видимо, самой сложной в процедуре создания высококачественного измерительного инструмента.

Надежность и достоверность исследований

Опубликован в 3 июля 2019 г. по Фиона Миддлтон. Отредактировано 31 августа 2022 г.

Надежность и валидность — понятия, используемые для оценки качества исследований. Они показывают, насколько хорошо метод, методика или тест что-то измеряют. Надежность связана с непротиворечивостью меры, а валидность связана с точностью меры.

Важно учитывать надежность и достоверность при разработке плана исследования, планировании методов и оформлении результатов, особенно в количественных исследованиях.

Надежность и валидность
	Надежность	Срок действия
Что это вам говорит?	Степень, в которой результаты могут быть воспроизведены при повторении исследования в тех же условиях.	Степень, в которой результаты действительно измеряют то, что они должны измерять.
Как оценивается?	Путем проверки согласованности результатов во времени, у разных наблюдателей и в разных частях самого теста.	Путем проверки того, насколько хорошо результаты соответствуют установленным теориям и другим показателям той же концепции.
Как они связаны?	Надежное измерение не всегда достоверно: результаты могут быть воспроизводимыми, но не обязательно правильными.	Действительное измерение, как правило, надежно: если тест дает точные результаты, они должны быть воспроизводимыми.

Содержание

Сравнение надежности и валидности
Как оцениваются надежность и валидность?
Как обеспечить достоверность и достоверность вашего исследования
Где написать о достоверности и достоверности в диссертации

Сравнение надежности и достоверности

Надежность и валидность тесно связаны, но означают разные вещи. Измерение может быть надежным, но не валидным. Однако, если измерение достоверно, оно обычно также надежно.

Что такое надежность?

Надежность относится к тому, насколько последовательно метод что-то измеряет. Если один и тот же результат может быть последовательно достигнут с использованием одних и тех же методов при одних и тех же обстоятельствах, измерение считается надежным.

Вы измеряете температуру жидкого образца несколько раз в одинаковых условиях. Термометр каждый раз показывает одну и ту же температуру, поэтому результаты надежны.

Врач использует вопросник симптомов для диагностики пациента с хроническим заболеванием. Несколько разных врачей используют один и тот же опросник у одного и того же пациента, но ставят разные диагнозы. Это указывает на низкую надежность опросника как меры состояния.

Что такое валидность?

Валидность относится к тому, насколько точно метод измеряет то, для измерения которого он предназначен. Если исследование имеет высокую достоверность, это означает, что оно дает результаты, соответствующие реальным свойствам, характеристикам и изменениям в физическом или социальном мире.

Высокая надежность является одним из показателей достоверности измерения. Если метод ненадежен, он, вероятно, недействителен.

Если термометр каждый раз показывает разные температуры, даже если вы тщательно контролируете условия, чтобы гарантировать, что температура образца остается неизменной, вероятно, термометр неисправен, и поэтому его измерения недействительны.

Если опросник по симптомам дает надежный диагноз при ответах на него в разное время и у разных врачей, это указывает на то, что он имеет высокую достоверность в качестве измерения состояния здоровья.

Однако одной надежности недостаточно для обеспечения достоверности. Даже если тест надежен, он может не точно отражать реальную ситуацию.

Термометр, который вы использовали для проверки образца, дает надежные результаты. Однако термометр не был откалиброван должным образом, поэтому результат на 2 градуса ниже истинного значения. Следовательно, измерение недействительно.

Группа участников проходит тест, предназначенный для измерения рабочей памяти. Результаты надежны, но оценки участников сильно коррелируют с их уровнем понимания прочитанного. Это указывает на то, что метод может иметь низкую достоверность: тест может измерять понимание прочитанного участниками, а не их рабочую память.

Валидность оценить труднее, чем надежность, но это даже важнее. Чтобы получить полезные результаты, методы, которые вы используете для сбора данных, должны быть достоверными: исследование должно измерять то, что заявлено для измерения. Это гарантирует, что ваше обсуждение данных и выводы, которые вы делаете, также верны.

Как оцениваются надежность и валидность?

Надежность можно оценить путем сравнения различных вариантов одного и того же измерения. Достоверность оценить труднее, но ее можно оценить, сравнив результаты с другими соответствующими данными или теорией. Методы оценки надежности и валидности обычно делятся на разные типы.

Виды надежности

Различные виды надежности можно оценить с помощью различных статистических методов.

Виды надежности
Тип надежности	Что он оценивает?	Пример
Тест-ретест	Непротиворечивость измерения во времени : вы получаете те же результаты при повторении измерения?	Группа участников заполняет анкету, предназначенную для измерения личностных качеств. Если они повторяют опросник с интервалом в несколько дней, недель или месяцев и дают одинаковые ответы, это свидетельствует о высокой ретестовой достоверности.
Интеррейтер	Непротиворечивость меры среди оценщиков или наблюдателей : получаются ли одинаковые результаты, когда разные люди проводят одно и то же измерение?	На основании контрольного списка критериев оценки пять экзаменаторов представили существенно разные результаты для одного и того же студенческого проекта. Это указывает на то, что контрольный список оценивания имеет низкую межэкспертную надежность (например, из-за того, что критерии слишком субъективны).
Внутренняя согласованность	Непротиворечивость самого измерения : получаете ли вы одинаковые результаты из разных частей теста, предназначенных для измерения одного и того же?	Вы разрабатываете анкету для измерения самооценки. Если вы случайным образом разделите результаты на две половины, между двумя наборами результатов должна быть сильная корреляция. Если два результата сильно различаются, это указывает на низкую внутреннюю согласованность.

Типы действия

Достоверность измерения можно оценить на основе трех основных типов доказательств. Каждый тип может быть оценен с помощью экспертной оценки или статистических методов.

Типы действия
Тип действия	Что он оценивает?	Пример
Конструкция	Приверженность меры существующей теории и знаниям измеряемой концепции.	Анкета самооценки может быть оценена путем измерения других черт, известных или предполагаемых, связанных с концепцией самооценки (таких как социальные навыки и оптимизм). Сильная корреляция между оценками самооценки и связанными с ней чертами указывает на высокую достоверность конструкции.
Содержимое	Степень, в которой измерение охватывает все аспекты измеряемой концепции.	Тест, целью которого является оценка уровня владения испанским языком в классе учащихся, содержит компоненты чтения, письма и разговорной речи, но не включает компонент аудирования. Эксперты сходятся во мнении, что понимание на слух является важным аспектом языковых способностей, поэтому тесту не хватает достоверности содержания для измерения общего уровня владения испанским языком.
Критерий	Степень, в которой результат меры соответствует другим действительным мерам той же концепции.	Опрос проводится для определения политических взглядов избирателей в регионе. Если результаты точно предсказывают более поздний исход выборов в этом регионе, это указывает на то, что опрос имеет высокую достоверность критерия.

Для оценки достоверности причинно-следственной связи необходимо также учитывать внутреннюю валидность (дизайн эксперимента) и внешнюю валидность (обобщаемость результатов).

Предотвратите плагиат, запустите бесплатную проверку.

Попробуй бесплатно

Как обеспечить достоверность и надежность ваших исследований

Надежность и валидность ваших результатов зависят от тщательной разработки плана исследования, выбора подходящих методов и образцов, а также тщательного и последовательного проведения исследования.

Обеспечение достоверности

Если вы используете баллы или рейтинги для измерения различий в чем-то (например, психологических чертах, уровнях способностей или физических свойствах), важно, чтобы ваши результаты максимально точно отражали реальные различия. Валидность следует учитывать на самых ранних этапах вашего исследования, когда вы решаете, как вы будете собирать свои данные.

Выберите подходящие методы измерения

Убедитесь, что ваш метод и методика измерения имеют высокое качество и предназначены для измерения именно того, что вы хотите знать. Они должны быть тщательно исследованы и основаны на имеющихся знаниях.

Например, для сбора данных о черте характера можно использовать стандартизированный вопросник, который считается надежным и действительным. Если вы разрабатываете свою собственную анкету, она должна основываться на устоявшейся теории или результатах предыдущих исследований, а вопросы должны быть тщательно и точно сформулированы.

Используйте соответствующие методы выборки для выбора объектов исследования

Чтобы получить достоверные обобщаемые результаты, четко определите исследуемую группу населения (например, люди определенного возраста, географического положения или профессии). Убедитесь, что у вас достаточно участников и что они представляют население.

Обеспечение надежности

Надежность следует учитывать на протяжении всего процесса сбора данных. Когда вы используете инструмент или метод для сбора данных, важно, чтобы результаты были точными, стабильными и воспроизводимыми.

Последовательно применяйте свои методы

Тщательно спланируйте свой метод, чтобы убедиться, что вы выполняете одни и те же шаги одинаковым образом для каждого измерения. Это особенно важно, если в работе участвуют несколько исследователей.

Например, если вы проводите интервью или наблюдения, четко определите, как будут учитываться конкретные действия или ответы, и убедитесь, что вопросы формулируются одинаково каждый раз.

Стандартизируйте условия вашего исследования

При сборе данных старайтесь, чтобы обстоятельства были как можно более последовательными, чтобы уменьшить влияние внешних факторов, которые могут привести к изменению результатов.

Например, в экспериментальной установке убедитесь, что всем участникам предоставляется одинаковая информация и они тестируются в одинаковых условиях.

Где написать о достоверности и валидности в диссертации

Уместно обсуждать надежность и валидность в различных разделах вашей диссертации, диссертации или исследовательской работы. Демонстрация того, что вы приняли их во внимание при планировании своего исследования и интерпретации результатов, делает вашу работу более достоверной и заслуживающей доверия.

Достоверность и обоснованность диссертации
Секция	Обсудить
Обзор литературы	Что сделали другие исследователи для разработки и улучшения надежных и валидных методов?
Методология	Как вы планировали свое исследование, чтобы обеспечить надежность и достоверность используемых показателей? Это включает в себя выбранный набор и размер образца, подготовку образца, внешние условия и методы измерения.
Результаты	Если вы рассчитываете надежность и достоверность, укажите эти значения вместе с вашими основными результатами.
Обсуждение	Сейчас самое время поговорить о том, насколько надежными и достоверными были ваши результаты. Были ли они последовательными и отражали ли они истинные ценности? Если нет, то почему?
Заключение	Если надежность и валидность были большой проблемой для ваших выводов, было бы полезно упомянуть об этом здесь.

Источники в этой статье

Мы настоятельно рекомендуем учащимся использовать источники в своей работе. Вы можете процитировать нашу статью (стиль APA) или глубоко погрузиться в статьи ниже.

Эта статья Scribbr

Миддлтон, Ф. (31 августа 2022 г.). Надежность и валидность в исследованиях | Отличие, типы и примеры. Скриббр. Проверено 9 октября 2022 г., с https://www.scribbr.com/methodology/reliability-vs-validity/

Процитировать эту статью

Полезна ли эта статья?

Вы уже проголосовали. Спасибо 🙂 Ваш голос сохранен 🙂 Обработка вашего голоса…

Фиона редактирует Scribbr с августа 2016 года. Она имеет степень бакалавра геологии и в настоящее время работает над получением степени магистра морских наук. Ей нравится работать со студентами по всему миру, чтобы улучшить их письмо.

4 типа достоверности исследований

Опубликован в 6 сентября 2019 г. по Фиона Миддлтон. Отредактировано 31 августа 2022 г.

В количественных исследованиях вы должны учитывать надежность и достоверность ваших методов и измерений.

Валидность говорит вам, насколько точно метод что-то измеряет. Если метод измеряет то, что заявлено для измерения, и результаты точно соответствуют реальным значениям, то его можно считать действительным. Существует четыре основных типа валидности:

Конструктивная валидность : Измеряет ли тест концепцию, для измерения которой он предназначен?
Валидность содержания : Является ли тест полностью репрезентативным для того, что он призван измерить?
Внешняя валидность : Соответствует ли содержание теста его целям?
Критерий достоверности : Точно ли результаты измеряют конкретный результат, для измерения которого они предназначены?

Обратите внимание, что в этой статье рассматриваются типы проверки достоверности, которые определяют точность фактических компонентов меры. Если вы проводите экспериментальное исследование, вам также необходимо учитывать внутреннюю и внешнюю валидность, которые касаются плана эксперимента и возможности обобщения результатов.