Содержательная валидность это: ВАЛИДНОСТЬ СОДЕРЖАТЕЛЬНАЯ — Гипертекстовый словарь методических терминов

Содержание

30. Содержательная валидность. Этапы валидизации. Психодиагностика

30. Содержательная валидность. Этапы валидизации. Психодиагностика

ВикиЧтение

Психодиагностика
Лучинин Алексей Сергеевич

Содержание

30. Содержательная валидность. Этапы валидизации

Содержательная валидность – один из основных типов валидности методики, характеризующий степень репрезентативности содержания заданий теста измеряемой области психических свойств.

Комплекс сведений содержательной валидности традиционно имеет наибольшее значение для тестов, исследующих деятельность, близкую или совпадающую с реальной (чаще всего учебной или профессиональной). Валидность по содержанию закладывается в тест уже при подборе заданий будущей методики. Первым этапом валидизации является определение круга исследуемых свойств, видов деятельности, расчленение сложной способности или деятельности на элементы.

На втором этапе разрабатывают собственно модель тестовой деятельности на основе наиболее важных элементов реальной деятельности. Наконец, на последнем этапе проводят анализ степени соответствия разработанной модели реальной деятельности, проверку соответствия пропорций представленности элементов в заданиях теста и в реальной деятельности.

Экспертная оценка адекватности содержания заданий теста может быть дополнена при характеристике содержательной валидности рядом эмпирических процедур. Роль этого критерия при оценке содержательной валидности заключается не в верификации конструкта, лежащего в основе теста, а лишь в анализе гипотез, приведших к выбору того или иного материала для теста.

Наряду с тестами достижений содержательная валидность является одной из важнейших форм валидизации критериально-ориентированных тестов, а также методик, предназначенных для профотбора, анализа успешности овладения профессией. Для валидизации личностных опросников и тестов интеллекта критерии содержательной валидности имеют ограниченное применение и используются лишь на начальных стадиях составления теста.

Личностные опросники не имеют того сходства с исследуемой областью поведения, как это имеет место в случае тестов достижений. Ответы на вопросы анкеты, опросника, данные проективных исследований позволяют лишь косвенно судить о реальной деятельности испытуемого. Проявление личностных свойств и реализация способностей в деятельности могут носить индивидуальный характер.

При проведении теста интеллекта эффективное решение заданий может достигаться за счет логического мышления, механической памяти, психомоторной подвижности. Опросники личностные и тесты интеллекта прямо не связаны с конкретным курсом обучения или общностью предшествовавшего жизненного опыта, на которых строится содержание тестов достижений.

Данный текст является ознакомительным фрагментом.

22. Основные типы валидности.

Понятие «комплекса валидности». Обоснование необходимости периодической валидизации психодиагностических методик

22. Основные типы валидности. Понятие «комплекса валидности». Обоснование необходимости периодической валидизации психодиагностических методик Классификация типов валидности в достаточной мере условна, так как нередко для различных критериев валидности применяются

23. Конструктная валидность. Конвергентная и дискриминантная валидности

23. Конструктная валидность. Конвергентная и дискриминантная валидности Конструктная валидность – один из основных типов валидности, отражающий степень репрезентации исследуемого психологического конструкта в результатах теста. В качестве конструкта могут выступать

24. Факторная валидность

24. Факторная валидность Факторная валидность. Прямое отношение к характеристике конструктной валидности имеет факторный анализ, позволяющий строго статистически проанализировать структуру связей показателей исследуемого теста с другими известными и латентными

25. Дифференциальная валидность. Валидность по возрастной дифференциации

25. Дифференциальная валидность. Валидность по возрастной дифференциации Дифференциальная валидность – вид конструктной валидности, рассматривающей внутренние взаимоотношения между психологическими факторами, диагностируемыми с помощью психодиагностической

26. Критериальная валидность

26. Критериальная валидность Критериальная валидность – комплекс характеристик, включающий текущую и прогностическую валидности методики и отражающий соответствие диагноза и прогноза определенному кругу критериев измеряемого явления.

В качестве критерия

29. Прогностическая валидность

29. Прогностическая валидность Прогностическая валидность – информация о том, с какой степенью точности и обоснованности методика (тест) позволяет судить о диагностируемом психологическом качестве спустя определенное время после измерения. Прогностическая валидность

33. Математическое выражение критерия валидности (коэффициент Гилфорда). Основные схемы валидизации психодиагностических

33. Математическое выражение критерия валидности (коэффициент Гилфорда). Основные схемы валидизации психодиагностических Меру совпадения (корреляции) между крайними группами по тесту и по критерию оценивают с помощью самого простого Фи-коэффициента Гилфорда: При

Этапы секстерапии

Этапы секстерапии 1.  Сбор анамнеза (отдельно у каждого партнера, а затем перекрестное уточнение полученной информации).Сбор психологического, психического, соматического анамнеза проводится согласно общепринятым установкам. При необходимости к опросу и дальнейшему

Валидность

Валидность В каждом исследовании есть переменные и отношения между ними. Поэтому, когда мы хотим описать исследование, центральным является конструкт переменных: какого вида различия изучаются и какими способами? Если мы хотим выйти за рамки описания и перейти к оценке

Валидность

Валидность При оценке валидности теста ставится следующий вопрос: измеряет ли тест то, что, как предполагается, он должен измерять? Если это, к примеру, IQ-тест, действительно он измеряет различия в уровне интеллекта или различия показателей испытуемых обусловлены чем-то

Валидность и надежность проверок на полиграфе

Валидность и надежность проверок на полиграфе Ведущими учеными подняты главные вопросы, связанные с валидностью и надежностью проверок на полиграфе. Валидность — научный термин для оценки критериев измерения. Надежность — измерение совпадения результатов, при

Валидность

Валидность Первую важную информацию такого рода, которая будет постоянно обсуждаться в данной книге, часто называют «критерием валидности». Вопрос здесь состоит в том, насколько результаты тестирования измеряют то, что они должны измерять в соответствии со своим

5.5.3. Содержательная валидность

Содержательная валидность — это третий важный вид валидности, в корне отличающийся и от критериальной, и от конструктной валидности.

Валидность по содержанию означает систематическую про­верку содержания теста с тем, чтобы установить, соответствует ли оно выборке измеряемой области поведения.

Содержательная валидность — это один из основных типов ва­лидности методики, характеризующей степень репрезентативно­сти содержания заданий теста измеряемой области психических свойств. Такая валидность обычно применяется для тестов, иссле­дующих деятельность, близкую или совпадающую с реальной, т.е. для тестов достижений, критериально-ориентированных тестов, а также методик, предназначенных для профотбора, анализа успеш­ности овладения профессией и т.п.

Для валидизации личностных опросников и тестов интеллекта содержательная валидность используется ограниченно, лишь на начальных стадиях составления теста. Обусловлено это тем, что данные виды методик обычно не имеют того внутреннего сходст­ва с исследуемыми областями поведения, какое присуще тестам достижений, следовательно, анализ их содержания может разве что выявить гипотезы, приведшие составителя к выбору опреде­ленного материала для измерения тех или иных особенностей личности. Чтобы установить валидность этих тестов, необходимо эмпирически подтвердить эти гипотезы.

Описанные выше виды валидности являются основными и должны использоваться при разработке или адаптации практиче­ски каждой психодиагностической методики.

Однако наряду с ними существует ряд других, не столь распространенных, но все же достаточно существенных видов валидности. Это валидность синтетическая, очевидная и экологическая.

Синтетическая валидность. Данный вид валидности является разновидностью валидности критериальной. Понятие синтетической валидности связано с понятиями отдельных и комплексных критериев. Чем более сложным, комплексным является изучаемый объект, тем шире и обобщенней должен быть критерий. На прак­тике часто бывает трудно найти такой критерий, и поэтому оценка валидности производится при помощи разделения общего крите­рия на элементы (отдельные критерии) в соответствии с элемен­тами оцениваемого качества или области поведения.

Очевидная валидностъ. Данный вид валидности отражает то, насколько «хорошим» тест кажется испытуемому или другому че­ловеку, не располагающему сведениями о методике и целях ее ис­пользования. Очевидная валидность не относится к объективно определяемым видам валидности, поэтому подсчитать ее коэффи­циент невозможно.

При этом, однако, она побуждает испытуемых к обследованию, способствует более серьезному и ответственному отношению к выполнению заданий теста и к заключениям, фор­мулируемым психологом.

Экологическая валидностъ. Экологическую валидность можно определить как свойство теста, проявляющееся в том, что приме­нение его для решения различных практических задач ведет к ка­чественно различной интерпретации результатов тестирования. Экологическая валидность — это валидность теста по отношению к измеряемому свойству в контексте определенной ситуации [8].

Вопросы для самопроверки

1. В чем смысл понятия «валидность теста»?

2. Каковы основные виды валидности теста?

3. Какой вид валидности делят на текущую и прогностиче­скую валидность?

4. Что такое «контаминация критерия»?

5. Какой вид валидности можно оценить с помощью процеду­ры факторного анализа?

Что такое достоверность содержимого? | Определение и примеры

Опубликован в 26 августа 2022 г. к Кассиани Николопулу. Отредактировано 30 ноября 2022 г.

Валидность содержания оценивает, насколько хорошо инструмент (например, тест) охватывает все соответствующие части конструкции, которую он призван измерить. Здесь конструкт является теоретической концепцией, темой или идеей: в частности, той, которую обычно нельзя измерить напрямую.

Достоверность содержания — это один из четырех типов достоверности измерения. Остальные три:

  • Лицевая достоверность : Соответствует ли содержание теста его целям?
  • Критерий достоверности : Точно ли результаты измеряют конкретный результат, для измерения которого они предназначены?
  • Конструктивная валидность : Измеряет ли тест концепцию, для измерения которой он предназначен?
Пример: валидность содержания на экзаменах Письменный экзамен проверяет, достаточно ли теоретических знаний у людей для получения водительских прав. Экзамен будет иметь высокую содержательную достоверность, если заданные вопросы охватывают все возможные темы курса, связанные с правилами дорожного движения. В то же время он также должен исключить все другие вопросы, не относящиеся к водительским правам.

Содержание

  1. Примеры достоверности содержимого
  2. Пошаговое руководство: Как измерить достоверность содержимого
  3. Часто задаваемые вопросы о достоверности содержимого

Примеры достоверности содержимого

Некоторые конструкты можно непосредственно наблюдать или осязать, и поэтому их легче измерить. Например, рост измеряется в дюймах. Другие конструкции труднее измерить. Депрессия, например, состоит из нескольких параметров и не может быть измерена напрямую.

Пример: содержательная валидность в психологии Психологические исследования часто включают разработку инструментов скрининга для определения метрик для клинических диагнозов. Допустим, вы заинтересованы в разработке шкалы для измерения клинических случаев депрессии.

При разработке шкалы депрессии исследователи должны установить, охватывает ли шкала весь диапазон измерений, связанных с конструктом депрессии, или только его часть. Если, например, предлагаемая шкала депрессии охватывает только поведенческие аспекты депрессии и не включает аффективные аспекты, ей не хватает содержательной валидности и существует риск систематической ошибки исследования.

Кроме того, для достижения достоверности содержания должна быть определенная степень общего согласия, например среди экспертов, относительно того, что представляет конкретная конструкция.

Пример: достоверность содержания в тестах IQ. Хотя тесты IQ десятилетиями использовались для оценки интеллекта, их часто критикуют за то, что они не учитывают сложную природу человеческого интеллекта и его множество различных компонентов.

Исследования показали, что интеллект состоит как минимум из трех различных компонентов: кратковременной памяти, рассуждений и вербального компонента.

Это означает, что существующие тесты IQ не охватывают в достаточной мере все аспекты того, что представляет собой человеческий интеллект. Для этого потребуются три отдельных теста для проверки каждого измерения. Таким образом, считается, что эти тесты имеют низкую содержательную валидность.

Пример достоверности конструкции и содержимого

Можно легко спутать валидность конструкции и содержательную валидность, но это принципиально разные понятия.

Конструктивная валидность оценивает, насколько хорошо тест измеряет то, для чего он предназначен. Если какие-либо части конструкции отсутствуют или включены нерелевантные части, валидность конструкции будет поставлена ​​под угрозу. Помните, что для того, чтобы установить достоверность конструкции, вы должны продемонстрировать как конвергентная и дивергентная (или дискриминантная) валидность .

  • Конвергентная валидность показывает, коррелирует ли тест, предназначенный для измерения конкретной конструкции, с другими тестами, оценивающими ту же конструкцию.
  • Дивергентная (или дискриминантная) валидность показывает, действительно ли два теста, которые должны а не быть сильно связанными друг с другом, не связаны друг с другом. Между результатами двух тестов, измеряющих две разные конструкции, не должно быть никакой связи.
Примечание. Если вы проводите экспериментальное исследование, вам также следует учитывать внутреннюю валидность (степень уверенности в существовании причинно-следственной связи) и внешнюю валидность (обобщаемость результатов).

С другой стороны, валидность содержания применяется к любому контексту, в котором вы создаете тест или анкету для конкретной конструкции и хотите убедиться, что вопросы действительно измеряют то, для чего вы их намереваетесь.

Пример: валидность содержания. Предположим, вы изучаете медицинские потребности сообщества с помощью опроса.
  • Высокая достоверность содержания: Если вопросы вашего опроса охватывают все аспекты потребностей в области здравоохранения, т. е. физические, психические, социальные и экологические, ваша анкета будет иметь высокую достоверность содержания.
  • Низкая валидность содержания: Если некоторые параметры потребностей в области здравоохранения опущены, результаты могут не давать точного представления о потребностях населения в области здравоохранения.
  • Высокая конвергентная валидность: Если ответы на вопросы вашего опроса коррелируют с ответами на существующие опросы о потребностях в области здравоохранения, то это указывает на то, что ваш показатель, вероятно, имеет высокую конструктную валидность. Однако не забывайте, что для того, чтобы продемонстрировать валидность конструкции, вы должны продемонстрировать и конвергентная и дивергентная (или дискриминантная) достоверность.
  • Низкая дискриминантная валидность: Если большинство вопросов вашего опроса сильно коррелируют с существующими показателями отношения населения к услугам здравоохранения, то результаты, вероятно, больше не являются достоверным показателем потребностей общества в здравоохранении. Другими словами, кажется, что ваш опрос измеряет другую конструкцию (отношение), чем предполагалось (потребности в отношении здоровья). Следовательно, он имеет низкую конструктную валидность.

В обоих случаях вопросник будет иметь низкую достоверность содержания.

Пошаговое руководство: как измерить достоверность содержимого

Правильное измерение валидности содержимого имеет важное значение — высокий показатель валидности содержимого показывает, что конструкция была измерена точно. Вы можете измерить достоверность контента, следуя пошаговому руководству ниже:

  • Шаг 1. Соберите данные у экспертов
  • Шаг 2. Рассчитайте коэффициент достоверности содержимого
  • Шаг 3: Расчет индекса достоверности содержимого

Шаг 1. Соберите данные у экспертов

Для измерения валидности контента требуется участие экспертной комиссии (SME). Здесь МСП — это люди, которые лучше других могут оценить содержание теста.

Например, группа экспертов для школьного теста по математике будет состоять из квалифицированных учителей математики, которые преподают этот предмет.

Для каждого отдельного вопроса комиссия должна оценить, является ли компонент, измеряемый вопросом, «существенным», «полезным, но не существенным» или «необязательным» для измерения конструкта.

Чем выше согласие членов группы в том, что конкретный элемент является важным, тем выше уровень достоверности содержимого этого элемента.

Примечание. Будучи студентом, у вас может не быть доступа к группе экспертов. Или, может быть, вы пишете диссертацию, и на вашей защите происходит рецензирование. В некоторых подобных случаях вместо этого можно использовать панель ваших сверстников. Только не забудьте сделать пометку об этом в своей газете.

Шаг 2. Рассчитайте коэффициент достоверности содержимого

Затем вы можете использовать следующую формулу для расчета коэффициента достоверности контента (CVR) для каждого вопроса:

Коэффициент достоверности содержания = (ne − N/2) / (N/2)
, где:

  • ne = количество экспертов по МСП, указывающих «необходимо»
  • N = общее количество экспертов по МСП
Пример: расчет коэффициента достоверности содержимого Предположим, вы просите группу из пяти экспертов оценить диагностический тест, состоящий из семи вопросов. Первый вопрос был оценен четырьмя экспертами как «основной».

Коэффициент достоверности содержания для первого вопроса будет рассчитан как:

Коэффициент достоверности содержания = (ne − N/2) / (N/2) = (4 − 5/2) / (5/2) = 0,6

Используя ту же формулу, вы рассчитываете CVR для каждого вопроса.

Обратите внимание, что эта формула дает значения в диапазоне от +1 до -1. Значения выше 0 указывают на то, что по крайней мере половина МСП согласны с тем, что вопрос является важным. Чем ближе к +1, тем выше достоверность контента.

Однако совпадение могло быть результатом совпадения. Чтобы исключить это, вы можете использовать таблица критических значений ниже. В зависимости от количества экспертов в группе коэффициент достоверности содержания (CVR) для данного вопроса не должен опускаться ниже минимального значения, также называемого критическим значением .

Количество экспертов Критическое значение
5 0,99
6 0,99
7 0,99
8 0,75
9 0,78
10 0,62
11 0,59
12 0,56
20 0,42
30 0,33
40 0,29

Шаг 3: Расчет индекса достоверности содержимого

Чтобы измерить достоверность содержания всего теста, необходимо рассчитать индекс достоверности содержимого (CVI) . CVI — это средний балл CVR по всем вопросам теста. Помните, что значения ближе к 1 означают более высокую достоверность содержимого.

Чтобы рассчитать индекс достоверности содержания (CVI) всего теста, вы берете среднее значение всех баллов CVR по семи вопросам.

Здесь это будет:

CVI = (0,6 + 0,2 − 0,2 + 0,2 − 0,2 + 0,6 + 1) / 7 = 0,31

Сравнение CVI с критическим значением для группы из 5 экспертов (0,99), вы заметили, что CVI слишком низкий. Это означает, что тест не точно измеряет то, для чего вы его намеревались. Вы решаете улучшить вопросы с низким CVR, чтобы получить более высокий CVI.

Получение отзывов о языке, структуре и форматировании

Профессиональные редакторы вычитывают и редактируют вашу статью, уделяя особое внимание:

  • Академический стиль
  • Расплывчатые предложения
  • Грамматика
  • Согласованность стиля

См. пример

Часто задаваемые вопросы о достоверности содержимого

org/FAQPage»>
В чем сходство содержания и внешней достоверности?

Лицевая валидность и валидность содержания похожи в том, что они оба оценивают, насколько подходит содержание теста. Разница в том, что лицо действительность субъективен и оценивает содержимое на поверхностном уровне.

Когда тест имеет сильную внешнюю валидность, любой согласится с тем, что вопросы теста, похоже, измеряют то, для чего они предназначены.

Например, глядя на тест по математике для 4-го класса, состоящий из задач, в которых учащиеся должны складывать и умножать, большинство людей согласятся, что он имеет сильную юридическую достоверность (т. е. он выглядит как тест по математике).

С другой стороны, достоверность содержания оценивает, насколько хорошо тест представляет все аспекты темы. Оценка валидности содержания более систематична и опирается на экспертную оценку. каждого вопроса, анализируя, охватывает ли каждый из них те аспекты, для которых был разработан тест.

Тест по математике для 4-го класса будет иметь высокую содержательную достоверность , если он охватывает все навыки, которым обучают в этом классе. Эксперты (в данном случае учителя математики) должны будут оценить достоверность содержания, сравнив тест с целями обучения.

В чем разница между содержанием и конструктной валидностью?

Валидность конструкции относится к тому, насколько хорошо тест измеряет концепцию (или конструкцию), для измерения которой он был разработан. Оценка достоверности конструкции особенно важна, когда вы исследуете понятия, которые не могут быть определены количественно и/или являются неосязаемыми, такими как интроверсия. Чтобы обеспечить конструктивная валидность ваш тест должен основываться на известных показателях интроверсии (операционализации).

С другой стороны, достоверность содержания оценивает, насколько хорошо тест представляет все аспекты конструкции. Если некоторые аспекты отсутствуют или включены нерелевантные части, тест имеет низкую содержательную валидность.

Почему важна валидность контента?

Валидность содержания показывает, насколько точно тест или другой метод измерения затрагивает различные аспекты конкретной конструкции, которую вы исследуете.

Другими словами, это поможет вам ответить на вопрос: «Измеряет ли тест все аспекты конструкции, которую я хочу измерить?» Если это так, то тест имеет высокую содержательную валидность.

Чем выше достоверность содержания, тем точнее измерение конструкции.

Если тест не включает части конструкции или включает нерелевантные части, достоверность инструмента ставится под угрозу, что ставит под сомнение ваши результаты.

Процитировать эту статью Scribbr

Если вы хотите процитировать этот источник, вы можете скопировать и вставить цитату или нажать кнопку «Цитировать эту статью Scribbr», чтобы автоматически добавить цитату в наш бесплатный генератор цитирования.

Николопулу, К. (2022, 30 ноября). Что такое достоверность содержимого? | Определение и примеры. Скриббр. Проверено 12 апреля 2023 г., с https://www.scribbr.com/methodology/content-validity/

Процитировать эту статью

Полезна ли эта статья?

Вы уже проголосовали. Спасибо 🙂 Ваш голос сохранен 🙂 Обработка вашего голоса…

Кассиани имеет академическое образование в области коммуникаций, биоэкономики и экономики замкнутого цикла. Как бывшая журналистка, ей нравится превращать сложную научную информацию в легкодоступные статьи, чтобы помочь студентам. Она специализируется на написании статей о методах исследования и предвзятости исследования.

Понимание достоверности содержания: руководство, примеры и часто задаваемые вопросы

Независимо от того, работаете ли вы непосредственно в области исследований или нет, полезно понимать основные исследовательские концепции и терминологию. Эти знания помогут вам лучше интерпретировать данные, понять точность аналитических выводов и определить, являются ли результаты исследования ошибочными.

Когда мы обсуждаем точность исследования, мы используем термин «валидность». Валидность говорит нам, насколько точно метод измеряет то, для чего он был использован.

Существует четыре различных типа валидности: внешняя валидность, валидность критерия, конструктивная валидность и содержательная валидность.

Что такое достоверность содержимого?

Валидность содержания касается того, насколько хорошо конкретный исследовательский инструмент измеряет то, что он должен измерить. В этом случае «конструкция» относится к конкретному понятию, которое не поддается непосредственному измерению. Примеры включают справедливость, счастье или красоту. Валидность конструкции можно использовать для определения того, насколько точно тест, эксперимент или аналогичный инструмент измеряет конструкцию.

Когда используется достоверность содержимого?

Валидность содержимого обычно используется для измерения точности теста. Рассматриваемый тест будет использоваться для измерения конструктов, которые слишком сложны для непосредственного измерения.

Некоторые конструкты, такие как рост или вес, легко измерить количественно. Но рассмотрим такое понятие, как здоровье. Некоторые могут рассматривать здоровье с чисто физической точки зрения. Другие считают, что хорошее здоровье требует высокого духовного, физического, умственного, эмоционального и социального уровня.

Независимо от того, определяете ли вы здоровье в соответствии с одним или несколькими параметрами, каждый из них состоит из нескольких аспектов, которые необходимо измерить.

В качестве примера возьмем физическое здоровье. Оценка физического здоровья человека может включать оценку его истории болезни, веса, состава тела, уровней активности, диеты, образа жизни и режима сна. Врач или медицинский исследователь может также проверить наличие признаков временного или хронического заболевания, травмы или злоупотребления психоактивными веществами. Кроме того, некоторые оценщики могут интересоваться только конкретными аспектами здоровья или придавать большее значение определенным аспектам.

Валидность содержания помогает исследователям понять, насколько точно прибор измеряет конкретную конструкцию. Крайне важно, чтобы исследователи разрабатывали тесты, точно определяющие конструкцию, которую они пытаются измерить, используя правильные атрибуты и характеристики.

Примеры достоверности содержания

Тест Scholastic Aptitude Test (SAT) является хорошо известным примером достоверности содержания. SAT, разработанный и организованный Советом колледжей, обычно используется для измерения готовности к поступлению в колледж и определения того, насколько успешным будет студент в колледже.

Многочисленные исследования показали статистически значимую корреляцию между сочетанием хороших оценок в средней школе, результатов SAT и оценок на первом курсе колледжа. Соответственно, SAT был стандартной частью процесса приема в колледж на протяжении десятилетий.

Однако многие критики утверждают, что SAT не дает достаточной оценки готовности к поступлению в колледж. Они отметили аспекты дизайна, которые привели к неравенству в производительности среди определенных групп тестируемых. Несмотря на то, что Совет колледжей внес изменения, ученые провели множество исследований относительно достоверности содержания SAT. Они подтвердили его ценность.

Другим примером достоверности содержания является широко используемая мера ожирения, известная как индекс массы тела (ИМТ). Эта мера включает в себя относительно простой набор вычислений, которые дают соответствующие диапазоны веса для человека относительно его роста.

Индустрия здравоохранения широко использует ИМТ, но этот показатель подвергался критике за то, насколько хорошо он измеряет ожирение. Поскольку ожирение определяется как избыток жира в организме, ИМТ не позволяет точно классифицировать людей с большой мускулатурой и низким содержанием жира, расчет ИМТ которых относит их к категории страдающих ожирением. Он также не позволяет точно измерить метаболическое ожирение (в просторечии известное как тощий жир), которое может представлять такой же риск для здоровья, как и те, у кого имеется значительное количество видимого висцерального жира.

За последние несколько лет ученые опубликовали множество статей, в которых исследуются лицо, содержание, критерий и конструктивная достоверность ИМТ в отношении ожирения.

Как измерить достоверность содержания

Измерение достоверности содержания требует некоторого времени и усилий, но очень важно убедиться, что исследование, которое вы проводите или используете, является точным.

Чтобы измерить валидность контента, вам необходимо собрать экспертные данные, найти коэффициент валидности контента и рассчитать индекс валидности контента.

Сбор данных от экспертов

Во-первых, вам нужно найти и собрать группу экспертов в области исследования, которую вы оцениваете. Вам понадобятся эти профильные эксперты (МСП) для оценки содержания используемого исследовательского инструмента.

Для исследования бухгалтерского учета вы можете собрать группу практикующих бухгалтеров и преподавателей бухгалтерского учета. Если вы оцениваете достоверность содержания фитнес-теста для теста по физкультуре в старшей школе, вы можете собрать учителей физкультуры и экспертов в области преподавания и спортивной науки.

Эти МСП будут оценивать инструмент по трехбалльной шкале (от одного до трех), ранжируя каждый вопрос в анкете, тесте или опросном инструменте как «не необходимый», «полезный, но не необходимый» или «важный». ».

Достоверность содержания вопроса тем выше, чем больше МСП оценивают его как «важный».

Определение коэффициента достоверности содержания

После того, как вы соберете эти исходные данные от SME, вы рассчитаете коэффициент достоверности содержания каждого вопроса (CVR).

CVR = (Nₑ — N/2) / (N/2)

В этой формуле Ne e относится к числу МСП, которые указали, что вопрос является важным. N равно общему количеству участвующих МСП.

При расчете CVR вы получите ответы в диапазоне от до 1 (полное несогласие) и +1 (полное согласие). Чем ближе CVR вопроса к +1, тем выше его содержание.

Теперь малые и средние предприятия могут согласиться с тем, что вопрос является важным по совпадению. Исключение этого требует таблицы критических значений. Таблица критических значений для измерения валидности содержания приведена ниже:

Number of SMEs

Minimum value

5

0.99

6

0.99

7

0.99

8

0.75

9

0.78

10

0.62

11

0.59

12

0.56

13

0.54

14

0.51

15

0.49

20

0.42

25

0. 37

30

0.33

35

0.31

40

0,29

Расчет индекса валидности содержания

После того, как вы подсчитали CVR для каждого вопроса, вы должны найти валидность содержания всего инструмента. Этот показатель называется индексом достоверности содержания (CVI). Вы можете найти CVI по взяв среднее значение всех ваших CVR .

Когда вы рассчитаете CVI, у вас останется число от -1 до +1. Однако это число само по себе недостаточно говорит о точности вашего прибора. Как и в случае с CVR, чем ближе к +1 ваш CVI, тем лучше, но вы также должны сравнить свой CVI с соответствующим минимальным значением в таблице критических значений, чтобы определить, насколько он точен.

Допустим, у вас есть тест с CVI 0,27. Если бы вы использовали панель из шести SME, вы бы обнаружили, что минимальное значение в вашей таблице критических значений равно 0,9. 9. Это значение намного выше, чем ваш CVI, а это означает, что ваш тест вообще не очень точен. Вы хотите, чтобы ваш CVI был выше, чем минимальное значение в вашей таблице критических значений, чтобы достичь соответствующего уровня точности.

Содержательная действительность против внешней достоверности

Некоторые люди путают внешнюю достоверность с достоверностью содержания, поскольку эти два термина касаются одного и того же аспекта инструментального измерения. Однако внешняя валидность включает в себя предварительную оценку того, выглядит ли инструмент подходит для измерения конструкции . Валидность содержания, с другой стороны, оценивает точность прибора при измерении конструкции.

Оценка внешней валидности включает проверку того, подходит ли инструмент для его предполагаемой цели на поверхностном уровне. Например, опрос, предназначенный для измерения состояния здоровья матерей после родов и содержащий исключительно вопросы о потреблении фаст-фуда, не будет валидным. Напротив, внешняя валидность была бы высокой, если бы опрос включал вопросы о физическом и психическом здоровье женщины, диете и физических упражнениях, балансе между работой и личной жизнью и социальной активности.

В повседневной жизни часто можно встретить тесты с достоверностью содержания. Общие примеры включают экзамены на получение водительских прав, стандартизированные тесты, такие как SAT и ACT, профессиональные экзамены на получение лицензии, такие как NCLEX 9 для медсестер, и многое другое.

Валидность содержания помогает исследователям определить эффективность измерения инструментов количественного и качественного исследования.

Например, предположим, что вы проводите исследование взглядов бэби-бумеров на сегодняшний политический дискурс. Вы должны измерить, насколько полно и эффективно ваш опрос охватил возможный диапазон мнений. Эксперты в предметной области будут рассчитывать индекс достоверности содержания опроса так же, как и для инструмента количественного исследования.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *