это, определение слова, понятие. Что такое Валидность, значение, словарь, энциклопедия
(от англ. valid – пригодный), один из основных критериев качества опыта (например, в психологии для оценки доверия к тестам). Проблема валидности возникает в процессе разработки и практического применения теста, когда ставится задача установить соответствие между степенью выраженности интересующего свойства личности и методом его измерения. Чем валиднее тест, тем лучше отображается в нем то качество (свойство), ради измерения которого он создан.
Черты, Валидность
Психологическая энциклопедия
См. валидность, черты.
Валидность
Психологическая энциклопедия
— степень, в которой результаты исследования, системы измерений или статистики являются точными или представляют то, что были предназначены представлять.
Валидность
Психологическая энциклопедия
(англ. valid — пригодный) — качество метода психологического исследования, выражающееся в его соответствии тому, для изучения и оценки чего он изначально был предназначен.
Валидность
Психологическая энциклопедия
(Validity). Понятие, обозначающее, что тест измеряет то, для чего он предназначен.
Валидность
Психологическая энциклопедия
Степень нашей уверенности в том, что тест, измерение или эксперимент действительно выполняет ту функцию, для которой они предназначены. Этот весьма общий термин по-разному используется в психологии. В процессе эксперимента мы можем оценить: 1. Внутреннюю валидность:…
Валидность, Внутренняя
Психологическая энциклопедия
Неформальная процедура, используемая для определения валидности теста посредством просмотра каждого пункта и оценки степени, в которой он выполняет предназначенную ему роль в тесте.
Валидность, Априорная
Психологическая энциклопедия
Своего рода предварительная, интуитивная оценка содержательной валидности теста. Степень, в которой пункты теста, как кажется, имеют интуитивную, априорную связь с моделями поведения, которые, как считается, они тестируют. Также называется валидное-тью здравого смысла.
Валидность, Конвергентная И Дискриминантная
Психологическая энциклопедия
Степень, в которой любой определенный инструмент тестирования обладает валидностью, будет отражать, в какой мере значения, полученные по этому тесту (а) коррелируют с факторами, с которыми в принципе они должны коррелировать на высоком уровне значимости, и (б) коррелируют с…
Валидность, Конгруэнтная
Психологическая энциклопедия
Метод установления валидности нового теста посредством корреляции значений, полученных по нему, со значениями, полученными по другому тесту с установленной валидностью. Наиболее типичный случай — тесты интеллекта, когда вновь разработанные тесты сравниваются с известными тестами…
Валидность, Дефиниционная
Психологическая энциклопедия
В принципевалидность теста, представленная тем фактом, что пункты, входящие в него, по определению, являются пунктами, отражающими измеряемые аспекты. В статье определение обратите внимание на то, что практически это понятие включает в себя нечто большее, чем кажется на первый…
Персональный сайт — Виды валидности применительно к психологическому исследованию.
Виды валидности применительно к психологическому исследованию.
Валидность исследования – оценка проведенного эмпирического исследования с точки зрения «правильности» его организации, возможности считать полученные рез-ты и сделанные выводы достоверными. Валидность при использовании методов наблюдения или эксперимента включает оценку репрезентативности исследования как степени его приближения к возможным безупречным мысленным образцам.
Валидность эксперимента – это степень соответствия его предполагаемым мысленным образцам. Различают 5 основных видов валидности: внутренняя, внешняя, операциональная, конструктная, популяционная.
Мысленные образцы эксперимента – это критерии, в отношении к которым обсуждаются разные аспекты валидности реально проводимых исследований.
Оценка психологических гипотез включает знание правил статистического вывода и оценки валидности эксперимента (внутренней и операциональной).
Оценка внутренней и операциональной валидностей позволяет оценить возможность артефактных выводов. Они обеспечивают достоверность вывода о зависимости.
Внутренняя и операциональная оцениваются в любом эксперименте, внешняя – в естественном; конструктная – при проверке теоретических гипотез; популяционная – при оценке репрезентативности выборки с точки зрения возможности переносить обобщения на популяции.
1. Внутренняя валидность – критерий оценки планирования и проведения исследования, позволяющий считать достоверными выводы относительно именно той зависимости, которая сформулирована в ЭГ, как об отношении между НП и ЗП с точки зрения приближения эксперимента к идеальному и бесконечному.
Ее оценка входит в формальное планирование. Анализ эквивалентности групп – внутренняя валидность. Угрозы исходят от систематических и несистематических смешений с ПП. Основной источник угроз в межгрупповых схемах – межиндивидуальные различия. Обеспечивает достоверность вывода о зависимости и позволяет оценить возможность артефактных выводов.
2. Внешняя валидность – критерий оценки исследования с т.зр. решения проблем соответствия сформулированных в ЭГ переменных и реализованных методически условий тем, на которые осуществляется обобщение полученных рез-тов (приближение к эксперименту полного соответствия). соответствие реального исследования изучаемой объективной реальности.
Ее оценка входит в содержательное планирование. Позволяет делать обобщение за пределы ситуации. Аспект репрезентативности испытуемых – внешняя валидность. Обеспечивает надежность как устойчивость и воспроизводимость результатов.
3. Операциональная валидность – оценка эксперимента с т. зр. степени соответствия эмпирически нагруженным понятиям НП, ЗП и ДП тех методик задания и измерения переменных, которые используются в исследовании.
Ее оценка входит содержательное и формальное планирование. В лабораторном эксперименте может совпадать с оценкой конструктной валидности. Надежность методик – аспект операциональной валидности. Оценка операциональной валидности связана с тем, насколько удачно совершен переход от формулирования гипотез к выбору методик.
4. Конструктная валидность – аналог внешней валидности; это оценка соответствия представленных в ЭГ переменных теоретическим конструктам и ТГ.
Ее оценка входит в содержательное планирование. От нее зависит оценка возможности обобщения.
5. Популяционная валидность – это оценка того, насколько правомерно распространять обобщения, полученные на ограниченной выборке, на более широкие выборки и популяции.
Оценка этого вида валидности зависит от качества отбора испытуемых из популяции и от стратегий контроля индивидуальных различий. Ее оценка влияет на возможность обобщение за пределы исследования. Репрезентативность выборки – основной аспект оценки популяционной валидности. Выборка испытуемых из популяции не может представлять ее безупречно, но высокая репрезентативность м.б. достигнута при правильных стратегиях отбора испытуемых
Надежность и валидность – Статистические решения
Количественная методология
Надежность и валидность являются важными аспектами выбора инструмента обследования. Надежность относится к степени, в которой прибор дает одинаковые результаты в нескольких испытаниях. Валидность относится к степени, в которой инструмент измеряет то, для измерения которого он был разработан. В исследованиях существует три подхода к валидности, и они включают содержательную валидность, конструктную валидность и валидность, связанную с критериями.
Валидность содержания измеряет степень, в которой элементы, составляющие шкалу, точно представляют или измеряют оцениваемую информацию. Являются ли заданные вопросы репрезентативными для возможных вопросов, которые можно было бы задать?
Узнайте, как мы помогаем редактировать главы вашей диссертации
Согласование теоретической основы, сбор статей, обобщение пробелов, формулирование четкой методологии и плана данных, а также описание теоретических и практических последствий вашего исследования являются частью наших комплексных услуг по редактированию диссертации. .
Запишитесь на БЕСПЛАТНУЮ консультацию
с экспертом по диссертации сегодня
- Своевременно принесите опыт редактирования диссертации в главы 1–5.
- Отслеживайте все изменения, а затем работайте с вами над научными работами.
- Постоянная поддержка для рассмотрения отзывов комитетов, сокращение количества исправлений.
Конструктивная валидность определяет, что означают рассчитанные баллы и можно ли их обобщить. Конструктивная валидность использует статистический анализ, например корреляции, для проверки релевантности вопросов. Вопросы из существующего аналогичного инструмента, который был признан надежным, можно сопоставить с вопросами из исследуемого инструмента, чтобы определить, присутствует ли конструктная валидность. Если оценки сильно коррелированы, это называется конвергентной валидностью. Если конвергентная валидность существует, конструктная валидность поддерживается.
Валидность, связанная с критериями, связана с тем, насколько хорошо результаты инструмента предсказывают известный результат, который они должны предсказывать. Статистический анализ, такой как корреляции, используется для определения того, существует ли валидность, связанная с критерием. Оценки рассматриваемого инструмента должны быть соотнесены с элементом, который они, как известно, предсказывают. Если существует корреляция > 0,60, также существует валидность, связанная с критерием.
Надежность можно оценить с помощью метода повторного тестирования, метода альтернативной формы, метода внутренней согласованности, метода разделения пополам и межэкспертной надежности.
Тест-ретест — это метод, при котором один и тот же инструмент применяется к одному и тому же образцу в два разных момента времени, возможно, с интервалом в один год. Если показатели в оба периода времени сильно коррелированы, > 0,60, их можно считать надежными. Метод альтернативной формы требует двух разных инструментов, имеющих одинаковое содержание. В одном и том же образце должны использоваться оба инструмента, и оценки по обоим инструментам должны быть коррелированы. Если корреляции высокие, инструмент считается надежным. Внутренняя согласованность использует один инструмент, управляемый только один раз. Коэффициент альфа (или альфа Кронбаха) используется для оценки внутренней согласованности элемента. Если значение альфа равно 0,70 или выше, инструмент считается надежным. Метод разделения пополам также требует проведения одного теста один раз. Количество пунктов в шкале делится на половины и берется корреляция для оценки надежности каждой половины теста. Для оценки надежности всего обследования необходимо применить поправку Спирмена-Брауна. Надежность между экспертами включает сравнение наблюдений двух или более человек и оценку совпадения наблюдений. В этом случае можно рассчитать значения Каппа.
Действительность | Система управления показателями
При разработке показателей термин « </p> » lang=»» xml:lang=»»> валидность » имеет особое применение, известное как тестовая валидность, которая относится к степени, в которой данные, клиническая оценка и теория поддерживают интерпретацию показателя показателя . Проще говоря, валидность теста — это эмпирическая демонстрация способности меры фиксировать или количественно определять то, что она призвана измерять.
Типы достоверности
Разработчики мер могут проверять достоверность оценок различными способами. Хотя некоторые эксперты рассматривают все виды валидности как частные случаи или подмножества Строительство достоверности , исследователи обычно ссылаются на типы достоверности отдельно: достоверность конструкции, </p> » lang=»» xml:lang=»»> Дискриминантная достоверность , ПРЕДИСКАТЕЛЬНАЯ ДЕЛАТНОСТЬ , Конвергентная достоверность , Критерий Validity и ” It is a subjective assessment by experts of whether the measure reflects the quality of care (e.g., whether the proportion of patients with blood pressure < 140/90 is a marker of quality.)</p> » lang=»» xml:lang=»»>. Стоит уместна (Messick, 1994).
Лицевая валидность
Внешняя валидность — это степень, в которой мера кажется измеряющей то, что она должна измерять «по номинальной стоимости». Это субъективная оценка экспертов, основанная на опыте того, отражает ли мера предполагаемую оценку, и исследовательское сообщество обычно считает самую слабую форму проверки достоверности, поскольку она не основана на объективном наблюдении. Тем не менее, следуя рекомендациям по лицевой валидности для ” (<a href="https://www.gpo.gov/fdsys/pkg/PLAW-111publ148/pdf/PLAW-111publ148.pdf">Pub. L. 111-148, 931</a>)</p> » lang=»» xml:lang=»»> мера качества с использованием систематического и прозрачного процесса группой определенных экспертов, не участвующих в разработке меры, может обеспечить значимую поддержку для интерпретации оценки меры.
В литературе отмечается, что существует два основных метода систематического и прозрачного процесса (Davies et al., 2011). Оба метода имеют преимущества перед более неструктурированными методами (например, опрос группы технических экспертов). Во-первых, структурированные оценки пытаются бороться с когнитивными искажениями в суждениях, которые особенно важны при выполнении сложных задач. Например, предвзятость привязки может возникнуть, когда участники дискуссии устанавливают свои первоначальные ответы в соответствии с мнением группы. И метод Delphi Group, и метод номинальной группы (NG) требуют независимой начальной оценки, чтобы закрепить мнения, основанные на собственных знаниях человека. Во-вторых, структурированные методы сосредотачивают обсуждение на конкретных темах, имеющих отношение к обоснованности мер, и позволяют всем экспертам иметь доступ к аналогичной информации перед оценкой. В-третьих, эти методы позволяют объективно количественно оценить результаты для прямого сравнения мер, чтобы лучше установить консенсуальную юридическую достоверность.
В методе Дельфи, как правило, группа экспертов независимо оценивает индикаторы, а разработчик показателей составляет рейтинги, обобщает их и распределяет для обзора перед новым раундом рейтингов. Разработчик показателя продолжает процесс до тех пор, пока рейтинги не сойдутся и не стабилизируются. Процесс Delphi позволяет создать большую панель, сводя к минимуму влияние отдельных участников и максимально повышая надежность между панелями </p> » lang=»» xml:lang=»»> . Однако, поскольку обмен мнениями и информацией происходит посредством письменной документации, нет возможности для интерактивного обсуждения.
В методике NG также используется первоначальная независимая оценка с последующим распределением обобщенных результатов. В этот момент панель затем собирается, традиционно лично, а в некоторых случаях посредством телефонной конференции, для обсуждения мнений относительно индикаторов. Затем члены группы независимо друг от друга переоценивают показатели. Этот метод основан на методе адекватности RAND. Процесс NG обеспечивает эффективный обмен информацией между членами комиссии, что особенно важно, когда члены группы предлагают уникальные точки зрения (например, различные клинические специальности, виды практики). Однако успешная фасилитация панели с личным присутствием или по телефону ограничивает размер, как правило, до 15 человек. Без эффективного модерирования со стороны фасилитатора один или два человека могут неправомерно повлиять на обсуждение. Существуют ограничения на межпанельную надежность из-за небольшого размера панели.
В Руководстве по тестированию и оценке научной приемлемости свойств измерений организация CMS, основанная на консенсусе (CBE), рекомендует использовать формальный процесс консенсуса, такой как подход Delphi или NG, для проверки внешней достоверности. Аналогичным образом, в Критериях оценки мер и Руководстве по оценке мер для одобрения CMS CBE позволяет использовать кажущуюся достоверность вместо эмпирического тестирования для новых мер, если проводится систематическая оценка и нацелена на отражение точности измеряемой целевой помощи. Для проверки обслуживания недостаточной валидности. Обзор технического обслуживания требует эмпирической проверки достоверности. Обоснование необходимо, если эмпирическая проверка достоверности невозможна.
Другие типы валидности
Другие типы валидности — за исключением валидности критерия — разработчики показателей обычно используют эмпирическую проверку валидности оценки показателя на уровне подотчетной организации. Разработчики показателей обычно используют критерий достоверности на уровне пациента/ ” Encounter serves as a focal point linking clinical, administrative, and financial information. Encounters occur in many settings—ambulatory care, inpatient care, emergency care, home health care, field and virtual (telemedicine).</p> » lang=»» xml:lang=»»> встречи .
Виды действительности
Мера действительности | Определение | Рекомендуемое использование | Пример проверки достоверности меры |
---|---|---|---|
Срок действия конструкции | Конструктивная валидность относится к степени, в которой мера количественно определяет то, что, согласно теории, она должна выполнять. Доказательства валидности конструкции часто включают эмпирическую и теоретическую поддержку интерпретации конструкции. Доказательства могут включать статистические анализы, такие как подтверждающий факторный анализ 90 107 элементов данных 90 037, чтобы убедиться, что они согласованы и представляют единую конструкцию. | В общем, чтобы продемонстрировать, что | Корреляция процесс-результат |
Конвергентная валидность | Конвергентная валидность относится к степени, в которой множественные меры/индикаторы одной базовой концепции взаимосвязаны. Примеры включают измерение корреляций между оценкой меры и другими показателями процессов, связанных с целевым результатом, или несколькими целевыми результатами с аналогичными процессами. | Форма валидности конструкции, при которой значимый результат возникает одновременно с конструкцией качества (например, стационарная смертность ). Разработчик показателя может использовать в качестве прокси показатель процесса </p> » lang=»» xml:lang=»»> с заранее установленной валидностью для того же значимого результата. | Корреляция процесс-результат или корреляция процесс-процесс (прокси) |
Критерий достоверности | Валидность критерия относится к проверке элементов данных по некоторому эталонному критерию, признанному действительным (т. е. золотому стандарту). Примеры включают проверку элементов данных, полученных с помощью автоматизированных стратегий поиска Included in this information are patient demographics, progress notes, problems, medications, vital signs, past medical history, immunizations, laboratory data, diagnoses and treatment, medications, allergies, immunizations as well as radiology images and laboratory results.”</p> » lang=»» xml:lang=»»> электронных медицинских карт (EHR) по сравнению с ручным просмотром тех же медицинских карт (т. е. золотой стандарт). Параллельная валидность и прогностическая валидность являются формами валидности критерия. | Используется для сравнения элемента данных или конструкции на уровне пациента/контакта с золотым стандартом | Электронная клиническая мера качества |
Дискриминантная достоверность | Проверка достоверности дискриминантных/контрастных групп исследует вариации между несколькими сравниваемыми группами (например, измеряемыми объектами). Разработчик показателя демонстрирует дискриминантную валидность, показывая, что показатель может различать несоизмеримые группы, которые он теоретически должен уметь различать. | Когда конструкт качества не поддается наблюдению, но есть теоретические доказательства того, что показатели должны (или не должны) быть лучше (или хуже) для групп на основе наблюдаемых характеристик | Корреляция структура-результат или |
Проверка лица | Внешняя достоверность — это степень, в которой мера кажется измеряющей то, что она должна измерять «по номинальной стоимости». | Новые меры или любые обстоятельства, при которых эмпирическая проверка достоверности оценки меры невозможна. | Модифицированный подход Дельфи, анализирующий отдельные элементы (порядковые данные) с использованием непараметрических тестов , таких как корреляция Спирмена или критерий хи-квадрат для независимости Модифицированный подход Дельфи, анализирующий все элементы (интервальные данные) <span class="glossify-exclude">Parametric methods</span> generally have high statistical power. (<a href="https://sciencing.com/parametric-nonparametric-tests-8574813.html">Tyler, 2017</a>)</p> » lang=»» xml:lang=»»> параметрические тесты, такие как корреляция Пирсона или t-тесты |
Прогностическая достоверность | Прогностическая валидность относится к способности показателей оценки предсказывать оценки других связанных показателей или исходов в будущем, особенно если исходные оценки показателей предсказывают последующий результат на уровне пациента g., safety, timeliness, effectiveness, efficiency, equity, patient centeredness) and improving health outcomes for a specific high-impact aspect of health care where there is variation in or overall poor performance.</p> » lang=»» xml:lang=»»> бесспорной важности (например, смерть, постоянная нетрудоспособность). Прогностическая валидность также относится к оценкам по одному и тому же показателю для других групп в тот же момент времени. | Форма валидности конструкции, при которой значимый результат возникает позже по времени от качественной конструкции (например, 30-дневная смертность). Разработчик показателя может использовать в качестве заменителя показатель процесса с заранее установленной валидностью для того же значимого результата. | Корреляция процесс-результат или корреляция процесс-процесс (прокси) |
Элементы данных измерения в сравнении с показателем качества
Элементы данных на уровне пациента/встречи являются строительными блоками для измерения качества, и разработчики показателей должны оценивать их на предмет надежности и достоверности. Хотя элементы данных на уровне пациента/контакта важны, разработчики показателей должны использовать вычисленные оценки показателей, чтобы делать выводы о целевом аспекте помощи. Согласно Критерии оценки мер и руководство по оценке мер для одобрения , CMS CBE примет проверку достоверности на уровне пациента/контакта и/или на уровне подотчетного объекта. Тем не менее, инструментальные меры требуют и того, и другого, а составные меры и нуждаются в эмпирическом тестировании на достоверность показателей эффективности к моменту поддержания одобрения. eCQM должны демонстрировать достоверность на уровне пациента/контакта.
При проверке достоверности элементов данных обычно анализируется согласие с другим авторитетным источником той же информации. Некоторые примеры проверки валидности с использованием элементов данных меры сравнительного анализа включают сравнение
- Данные заявлений, которые имеют коды, используемые для представления первичных клинических данных (например, Международная классификация болезней, 10-я редакция — Система кодирования клинических модификаций/процедур, Текущая процедурная терминология) для ручного извлечения из образца The subset should be chosen in such a way that it accurately represents the whole population with respect to some characteristic of interest. A sampling frame lists all eligible cases in the population of interest (i.e., denominator) and how they are selected.</p> » lang=»» xml:lang=»»> медицинских карт пациентов
- Информация о стандартизированном инструменте оценки пациентов (например, минимальный набор данных о долгосрочном уходе, набор информации об исходах и оценках, данные реестра), не извлеченная, не закодированная или расшифрованная с помощью «экспертной» оценки оценщика (проведенной примерно в то же время) для выборки пациенты
- Информация ЭУЗ, извлекаемая с использованием автоматизированных процессов, основанных на технических характеристиках