Стандартизация это в психологии: СТАНДАРТИЗАЦИЯ это

Содержание

📖 Стандартизация, надежность и валидность, Методы изучения поведения, Глава 3. Исследования. Детская патопсихология. Мэш Э. Страница 17. Читать онлайн


. . .

Изучение эмоциональных и поведенческих проблем детей требует, чтобы мы измерили эти проблемы способами, которые надежны, валидны и могут быть статистически проверены. Это нелегкая задача. Проблемы детей должны быть оценены на основании выборок поведения в ситуациях, которые часто отражают различные точки зрения взрослых. На эти оценки, скорее всего, повлияют возраст, пол и культурная среда ребенка, а также личные нормы оценивающих. В результате никакое одиночное измерение не способно дать полностью адекватную картину детских проблем, и необходимы множественные замеры и источники информации.

Стандартизация, надежность и валидность.

Измерения и методы, которые мы используем для изучения поведения ребенка и семьи, должны пройти тщательное исследование, с тем чтобы можно было определить, насколько точно они оценивают определенные конструкты, такие как депрессия, тревога или умственная отсталость. Использование хорошо стандартизованных, надежных и валидных единиц измерения и процедур крайне важно для подлинно научного исследования, как это показано на рис. 3.4.

Стандартизация
Приложение определенных стандартов или норм к приему, чтобы обеспечить его применимость в различных измерениях
НадежностьСтепень согласованности измерения
ВалидностьСтепень, в которой прием измеряет то, что предполагается измерить
Рис. 3.4. Понятия, которые определяют ценность наших методов измерения и оценки.

Стандартизация — это процесс, который определяет набор стандартов или норм для процедуры измерения, с тем чтобы его можно было систематически использовать при различных оценках конструкта. Эти стандарты и нормы относятся к процедурам, которым необходимо следовать во время проведения исследования, сбора и оценки данных.

В некоторых случаях измерение может проводиться на больших группах детей, которые различаются по определенным характеристикам, таким как возраст, пол, раса, социально-экономический статус или диагноз. Эти оценки можно затем использовать в целях сравнения. Например, тестовые оценки 8-летнего мальчика из среды с низким социально-экономическим статусом следует сравнивать оценками других детей, подобных ему, а не с оценками 16-летней девушки из среды с высоким социально-экономическим статусом.

Надежность относится к согласованности или повторяемости измерений. Чтобы быть надежными, измерения не должны зависеть от какого-то одного наблюдателя или клинициста; разные люди должны приходить к согласию в отношении того, что они видят. Это называют

согласием между оценивающими (interrater agreement). Представьте свою реакцию, если вы покажете ребенка трем различным психологам, и они поставят ему три разных диагноза и порекомендуют три разных метода лечения. Как вам определить, какой из диагнозов вереи? В этом случае диагнозы не будут надежными, поскольку два психолога или более не пришли к согласию. Аналогичным образом различные измерения, такие как тесты или интервью, когда они повторяются в течение короткого интервала времени, должны давать схожие результаты в обоих случаях. Другими словами, результаты должны быть стабильными во времени; это называют надежностью теста и повторного теста (test-retest reliability).

Одной надежности недостаточно для определения того, отражает ли метод цели исследователя — должна быть продемонстрирована и валидность.

Валидность метода показывает, в какой степени он действительно измеряет параметр или конструкт, который исследователь собирается измерить. Валидность можно оценить рядом способов. Во-первых, измерение можно проверить на его

лицевую валидность (face validity), или степень, в которой оно, как представляется, оценивает интересующий конструкт. Конструктная валидностъ (construct validity) относится к тому, ведут ли себя при измерении оценки так, как предсказывают теория или прошлые исследования — к значению, вкладываемому в оценки. Конвергентная валидность (convergent validity) отражает корреляцию между измерениями, которые, как ожидается, связаны между собой, — показатель степени, в которой два измерения оценивают схожие или связанные конструкты. С этой валидностью контрастирует дискриминантная валидностъ (discriminant validity), которая относится к степени корреляции между измерениями, которые, как ожидается, не связаны друг с другом.

Наконец, связанная с критерием валидность (criterion-related validity) относится к тому, насколько точно измерение предсказывает поведение в условиях, где, как мы ожидаем, оно должно это делать либо в то же самое время (конкурентная валидность — concurrent validity), либо в будущем (предиктивная валидностъ — predictive validity). Например, высокие показатели ребенка при измерении социальной тревожности должны предсказывать, что ребенок проявит тревогу или избежание в текущих социальных ситуациях и, возможно, будет испытывать трудности с установлением дружеских отношений в будущем. Связанная с критерием валидность говорит, можно ли использовать показатели, полученные при измерении, для той цели, для которой они предназначены, — обладает или нет измерение

практической пригодностью.

Измерения.

Для оценки важных параметров когнитивного, поведенческого и эмоционального функционирования детей существуют самые разные методы измерения (Mash & Terdal, 1997). Эти методы представляют собой подробные планы наблюдения и оценки детей и их окружения способами, которые выявляют относительно явные связи между интересующими переменными. Важный вопрос, касающийся методов измерения: кто будет делать выводы относительно поведения — участники с помощью методов самоотчета или исследователь, используя методы наблюдения?

Среди методов, используемых в детской патопсихологии, — интервью, вопросники, контрольные листы и оценочные шкалы, психофизиологические записи и непосредственные наблюдения за поведением (Bellack & Hersen, 1998; Kamphaus & Frick, 1996; Mash & Terdal, 1997b). Кроме того, используются разнообразные интеллектуальные, академические и нейропсихологические тесты. В этой главе мы сосредоточим внимание главным образом на том, как эти методы используются в исследовании. Об их использовании в клинической практике и о тестах и тестировании мы поговорим более подробно в главе 4 «Обследование, диагноз и терапия».

Как показано в табл. 3.1, сравнение трех наиболее часто используемых методов сбора данных — интервью, вопросников и наблюдения — демонстрирует, как они различаются между собой по важным параметрам. Поскольку информация, которую мы получаем от детей и семей часто варьирует как функция используемых методов, исследователи нередко полагаются на подход, включающий несколько методов с целью определения и оценки интересующих конструктов.

Таблица 3.1. Интервью, вопросник и наблюдение

 
Интервью
Вопросник
Наблюдение
Структура ситуацииПолуструктурированная или структурированнаяВысокоструктурированнаяСтруктурированная или естественная
Структура ответовВозможность для зондирования, распространения и проясненияВысокоструктурированная: нет возможности для зондирования и проясненияДанные, которые нужно зафиксировать, могут варьировать от очень обширных до высокоизбирательных
Требования к ресурсамТребуется значительное время для проведения интервью и кодирования ответовЭкспериментатору требуется мало времениТребуется много времени для наблюдения и кодирования его результатов
Источники погрешности
Опирается на восприятие участников и их готовность давать сведения. На ответы могут повлиять характеристики и манеры берущего интервью
Опирается на восприятие участников и их готовность давать сведенияНе опирается на откровение участников, но на результат могут повлиять их реакции
Редукция данныхТребуется анализ повествовательных ответов или запись с разбиением на категорииТребуется незначительная редукция данныхНа объект наблюдения сильно влияет система кодирования результатов наблюдения

Сообщения.

Методы, использующие сообщения, оценивают восприятия, мысли, способности, установки, представления, чувства и прошлый опыт ребенка, родителей и учителей. Этот инструментарий включает относительно неструктурированные клинические интервью, высокоструктурированные диагностические интервью и вопросники. Проблемой со всеми методами сообщения является то, насколько точно дети и родители рассказывают о собственных мыслях, чувствах и поступках.

Неточность может иметь место из-за неспособности припомнить важные события, избирательности воспоминания или тенденциозности, а также, в некоторых случаях, из-за намеренных искажений. Например, некоторые информаторы могут попытаться представить себя или других в лучшем или худшем свете. Кроме того, методы сообщения требуют определенного уровня вербальной способности и могут неточно оценивать индивидуумов, которым трудно выразить свои мысли. Очевидно, что в эту категорию попадают маленькие дети — до 7-8 лет они обычно не слишком надежные информаторы.

Психофизиология и нейроизображение.

Психофизиологические методы

оценивают связь между физиологическими процессами и поведением. Эти методы пытаются идентифицировать, какие структуры и процессы центральной нервной системы способствуют атипическому развитию и поведению детей. Среди наиболее распространенных объектов измерений активность периферической нервной системы, например, частота пульса, артериальное давление, дыхание, расширение зрачков и электрическая проводимость кожи. Например, изменения частоты пульса могут быть связаны с такими эмоциональными состояниями, как заинтересованность, гнев или печаль. Кроме того, специфические паттерны автономного возбуждения могут иметь связь с различиями в темпераменте детей — например, с их степенью застенчивости при контактах с людьми или с реакциями на новые события (см. обсуждение в главе 7).

Однако использование психофизиологических измерений, особенно в случае маленьких детей, имеет ряд ограничений. Иногда результаты этих измерений не согласуются между собой при переходе от одного исследования к другому, и, возможно, исследователям придется делать умозрительные выводы относительно того, как ребенок мог прореагировать на какое-то событие или стимул. Кроме того, на физиологический ответ ребенка могут легко влиять другие факторы, например, его реакция на регистрирующее оборудование или на другие состояния, такие как голод, усталость или скука. Эти внешние влияния необходимо минимизировать, если заключения должны быть основаны на психофизиологических измерениях.

Во многих исследованиях используются электрофизиологические измерения функционирования головного мозга, такие как электроэнцефалограмма, чтобы связать измеряемую электрическую активность мозга с текущими мыслями, эмоциями или состояниями возбуждения. Электроэнцефалограмма (ЭЭГ) регистрирует электрическую активность головного мозга, используя электроды, которые прикладывают к поверхности черепа ребенка. Поскольку различные волны ЭЭГ связаны с различными состояниями возбуждения, она позволяет определить, как эти состояния могут соотноситься с лежащими в их основе расстройствами сна. Различные паттерны активации ЭЭГ могут также указывать на различный опыт и проявления эмоций. Например, было установлено, что пугливые или заторможенные дети демонстрируют больше электрической активности в правой лобной доле мозга относительно левой лобной доли, когда их сравнивают с непугливыми детьми (Fox, 1991).

Наконец, новые способы изучения головного мозга, использующие процедуры нейроизображения, делают возможной проверку нейробиологических теорий в случае многих психических расстройств детского возраста (Thatcher, Lyon, Rumscy & Krasnegor, 1996; Zametkin, Ernst & Silver, 1998). Нейроизображением (нейроимеджингом) называют приемы, используемые для изучения структуры и/или функции головного мозга (С. A. Nelson & Bloom, 1997). Процедуры получения структурных изображений мозга включают в себя магнитно-резонансную томографию (МРТ) (magnetic resonance imaging, MRI), основанную на явлении ядерного магнитного резонанса (ЯМР) и компютерную томографию (coaxial tomographic, CT). ЯМР использует генерируемые в сильном магнитном поле и пропускаемые через ткань мозга радиосигналы с целью проведения анализа мельчайших структур мозга. Компьютерная томография показывает крупные структуры мозга. Как мы увидим, данные КТ- и ЯМР-исследований привели к созданию патофизиологических моделей, таких как церебральная модель при аутизме (глава 10 «Аутизм и детская шизофрения») и гипотеза патологического нервного созревания при СДВ (глава 5 «Гиперкинетическое расстройство и дефицит внимания (ГРДВ)»).

Также используются различные приемы функционального изображения. Двумя из наиболее часто используемых методов являются позитронно-эмиссионная томография (ПЭТ) (positron emission tomography, PET) и функциональная магнитно-резонансная томография (functional magnetic resonance imaging, fMRI). ПЭТ-сканирование оценивает церебральный метаболизм глюкозы. Глюкоза является основным источником энергии в головном мозге, поэтому измерение того, сколько ее используется, — это хороший способ определить уровень активности мозга. Изменения в кровопотоке внутри ткани мозга в ответ на специфические стимульные события выявляются магнитным способом с получением исключительно четких компьютерных изображений активизированных областей мозга. Процедуры функционального изображения обеспечивают трехмерные изображения активности мозга и дают наиболее точную информацию, касающуюся того, какие участки мозга отвечают за определенные функции или аномально функционируют в случае определенных расстройств.

Исследования с помощью нейроизображения показывают нам, что у детей с конкретным расстройством налицо структурные различия или пониженная активность в некоторых областях мозга, но они не говорят, почему это происходит. Хотя и многообещающие, процедуры получения изображения мозга для изучения психопатологии развития по-прежнему находятся в своей ранней стадии.

Наблюдение.

Вы можете многое увидеть, если будете наблюдать.

Йоги Берра

Используя систематические методы наблюдения, исследователь может непосредственно наблюдать поведение ребенка и других людей в условиях, которые простираются от неструктурированных наблюдений в естественном окружении ребенка, называемых естественным наблюдением, до высокоструктурированных ситуаций, которые предполагают использование специфических заданий или инструкций, обычно осуществляются в клинике или лаборатории и называются структурированным наблюдением (Mash, 1991). Используя естественное наблюдение, исследователь приходит в дом, класс или детский сад, чтобы пронаблюдать и зафиксировать интересующее его поведение ребенка, а часто и других людей, с которыми ребенок общается, например, родителей, учителей, братьев и сестер, сверстников. Или же исследователь может в естественной обстановке заснять на видеопленку поведение, которое можно впоследствии закодировать.

Рис. 10-летний ребенок перед началом исследования, использующего функциональную магнитно-резонансную томографию (fMRI).

Исследователь, использующий структурированные наблюдения в лаборатории или клинике, создает ситуацию или разрабатывает инструкции, чтобы вызвать поведение, представляющее особый интерес. К примеру, многочисленные исследования привязанности оценивают реакции маленьких детей на все более стрессовые эпизоды разлучения их с опекунами и воссоединения с ними в лаборатории, используя «незнакомую ситуацию» Эйнсуорта, рассмотренную в главе 2 «Теории и причины детской патопсихологии» (Ainsworth, Blehar, Waters & Wall, 1978). Путем структурирования ситуации, с тем чтобы вызвать специфическое поведение привязанности, «незнакомая ситуация» позволяет исследователям оценить надежность привязанности детей, отмечая, насколько эффективно они могут использовать своих опекунов в качестве источника утешения во время дистресса.

Структурированные лабораторные или клинические наблюдения достаточно эффективны и обладают тем преимуществом, что фокусируют наблюдения на интересующем явлении. Этот метод особенно полезен для изучения поведения ребенка, которое в повседневной жизни редко имеет место.

Структурированные наблюдения дают исследователю больший контроль над ситуацией, чем естественные наблюдения, а также обеспечивают использование других оценочных процедур. Например, когда процесс обсуждения какой-либо проблемы записывается на видеопленку, можно использовать повторные воспроизведения интеракции, чтобы спросить членов семьи, о чем они думали во время обсуждения (Sanders & Dadds, 1992). Что касается негативной стороны, то возникают вопросы по поводу того, обеспечивают ли наблюдения в лаборатории или клинике репрезентативную выборку интересующего поведения (Dadds & Sanders, 1992). Когда человека снимают на видеопленку или наблюдают за ним через сквозное зеркало, он чувствует себя в некотором роде, как в аквариуме; дети и родители могут вести себя в лаборатории не так, как в реальной жизненной обстановке. В целом, выборки поведения, которые получены с использованием методов наблюдения, — независимо от того, проводится ли оно в лаборатории или в условиях реальной жизни, — должны рассматриваться как «поведение в присутствии наблюдателя».

Итоги раздела.

— Измерения и методы, используемые для изучения поведения ребенка и семьи, должны быть стандартизированы, надежны и валидны.

Психология bookap

— Методы самоотчета включают в себя неструктурированные интервью, вопросники и формальные тесты.

— Психофизиологические методы используются для оценки связи между физиологическими процессами и поведением и включают в себя замеры частоты пульса, артериального давления, дыхания, расширения зрачков и электрической проводимости кожи.

— Электрофизиологические измерения, такие как ЭЭГ, связывают электрическую активность головного мозга с текущими мыслями, эмоциями или состояниями возбуждения.

Психология bookap

— Процедуры нейроизображения используют для изучения структуры и/или функций отдельных участков головного мозга.

— Методы наблюдения используют для непосредственного наблюдения за поведением ребенка и других людей в неструктурированных ситуациях, таких как домашняя обстановка или класс, и в структурированных ситуациях с заданиями в лаборатории или клинике.

Стандартизация методики «Личностный профиль субъектной активности» Группа компаний ИНФРА-М — Эдиторум

1. Айвазян С.А. Прикладная статистика, Основы моделирования и первичная обработка данных. Справочное издание/ С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин; под ред. С.А. Айвазяна. — М.: Финансы и статистика, 1983. — 471с.

2. Анастази, А. Психологическое тести¬рование / А. Анастази, С. Урбина. — СПб.:Питер, 2001 — 668 с.

3. Батурин Н.А.Технология разработки психодиагностических методик: монография / Н. А. Батурин, Н. Н. Мельникова; М-во образования и науки Российской Федерации, Южно-Уральский гос. ун-т. — Челябинск : ЮУрГУ, 2012. — 134, [1] с. : табл.; 21 см.; ISBN 978-5-696-04216-9

4. Бодалев А.А.Общая психодиагностика: [учебник] / [А. А. Бодалев и др.]. — Санкт-Петербург: Речь, 2006 (Санкт-Петербург : Печатный двор им. А. М. Горького). — 438, [1] с. : ил., табл.; 21 см. — (Психология).; ISBN 5-9268-0015-3 (В пер.)(Психология)

5. Ганзен В.А., Балин В.Д. Теория и методология психологического исследования. –СПб РИО, СПб ГУ, 1991, 75 с.

6. Гласс Дж., Стэнли Дж. Статистические методы в педагогике и психологии / Пер. с англ. — М.: Прогресс, 1976, 494 c.

7. Дюк В.А. Компьютерная психодиагностика / В. А. Дюк. — СПб. : Братство, 1994. – 363с, [1] с. : ил.; 21 см.; ISBN 5-87918-027-1 (В пер.)

8. Знаков В.В. Психология субъекта как методология понимания человеческого бытия // Психологический журнал, 2003, том 24, № 2, с. 95-106]

9. Знаков В.В., Рябикина З.И. Психология человеческого бытия.- М.: Смысл, 2017. – 416с.

10. Клайн, П. Справочное руководство по конструированию тестов: Введение в психометрическое проектирование / П. Клайн; под ред. Л.Ф. Бурлачука. — Киев: Изд-во ПАНЛтд, 1994 — 688 с.

11. Купер, К. Индивидуальные различия /К. Купер; под ред. И. В. Равич-Щербо. — М.:Аспект Пресс, 2000 — 527 с.

12. Мельников В. М., Ямпольский Л. Т. Введение в экспериментальную психологиюличности. — М: Просвещение, 1985,319 с.

13. Митина О.В. Разработка и адаптация психологических опросников. М.: Смысл, 2011, 235 с.

14. Петросьян С.Н., Рябикина З.И., Губанова Н.Ю. Структурная валидность методики «Личностный профиль субъектной активности» / С. Н. Петросьян, З.И. Рябикина, Н.Ю. Губанова // «Гуманизация образования» // -2021. — №1. -С. 41 – 58. DOI: 10.24411/1029-3388-2020-10148

15. Петросьян С. Н., Рябикина З. И. Типы субъектной активности: субъектно-бытийный подход. Личность и вызовы современности: интерпретация проблем различными научными школами / Под ред. З.И. Рябикиной и В.В. Знакова. – Майкоп: Адыгейский гос. ун-т; Краснодар: Кубанский гос. ун-т, 2020. – 348 с. ISBN 978-5-91692-766-5 С. 54-57.

16. Рябикина З.И. Перспективы исследований личности с теоретико-методологических позиций психологии субъекта // «Человек. Сообщество. Управление» №3, 2013. С. 6-19.

17. Фер, Р. Майкл. Психометрика: введение / Р. Майкл Фер, Верн Р. Бакарак ; под ред. Н. А. Батурина, Е. В. Эйдмана ; пер. с англ. [А. С. Науменко, А. Ю. Попов] ; М-во образования и науки Российской Федерации, Федеральное агентство по образованию, Южно-Уральский гос. ун-т, Каф. «Психологическая диагностика и консультирование». — Челябинск: Изд. центр ЮУрГУ, 2010. — 412, [1] с. : ил., табл.; 25 см.; ISBN 978-5-696-04037-0 (в пер.) Пер.: Furr, R. Michael Psychometrics Los Angeles [etc.]: Sage Publications, 2008. Психология — Методика и техника научно-исследовательской работы в области психологии — Метод тестов.

18. Шмелёв, А. Г. Психодиагностика личностных черт / А.Г. Шмелёв. — СПб.: Речь,Шмелев, А.Г. — 472, [1] с. : ил., табл.; 22 см. — (Психологический практикум).; ISBN 5-9268-0084-6(Психологический практикум) Общая психология — Психология личности — Методика и техника научно-исследовательской работы в области психологии.

19. Coaley Keith, An Introduction to Psychological Assessment and Psychometrics, 2010, doi: https://doi.org /10.4135/9781446221556

20. Cohen, P., Cohen, J., Aiken, L., & West, S. G. (1999). The problem of units and the circumstance for POMP. Multivariate Behavioral Research, 34(3), 315-346. https://doi.org /10.1207/S15327906MBR3403_2

21. Del Giudice, Marco. (2015). Gender Differences in Personality and Social Behavior // International encyclopedia of the social and behavioral sciences. 2nd ed. Ed. J. D. Wright. Elsevier, 2015, pp.750-756) 10.1016/B978-0-08-097086-8.25100-3.

22. Goodhew, Stephanie &Dawel, Amy & Edwards, Mark. (2020). Standardizing measurement in psychological studies: On why one second has different value in a sprint versus a marathon. Behavior Research Methods. 52, pp. 2338-2348. doi 10.3758/s13428-020-01383-7

23. Goodhew, S. C., & Edwards, M. (2019). Translating experimental paradigms into individual-differences research: Contributions, challenges, and practical recommendations. Consciousness and Cognition, 69, 14–25. https://doi.org/10.1016/j.concog.2019.01.008

24. Fischer, Ronald & Milfont, Taciano. (2010). Standardization in psychological research. International Journal of Psychological Research, ISSN 2011-7922, Vol. 3, Nº. 1, 2010, pags. 88-96. doi 10.21500/20112084.852.

25. Matthews, Gerald & Oddy, Keith. (2002). Ipsative and Normative Scales in Adjectival Measurement of Personality: Problems of Bias and Discrepancy. International Journal of Selection and Assessment. 5. 169 — 182. 10.1111/1468-2389.00057.

26. Saville, P. & Wilson, E. (1991). The reliability and validity of normative and ipsative approaches in the measurement of personality. Journal of Occupational Psychology, 64, 219-238.pp 219-2384 https://doi.org/10.1111/j.2044-8325.1991.tb00556x

27. Scholtz, Salome & Klerk, Werner & de Beer, Leon. (2020). The Use of Research Methods in Psychological Research: A Systematised Review. Frontiers in Research Metrics and Analytics. 5. 1. doi10.3389/frma.2020.00001.

28. Urbina, Susana. (2014). Essentials of Psychological Testing. ISBN: 978-1-118-68048-3 August 2014 400 Pages

Стандартизация в психологических исследованиях. | Международный журнал психологических исследований

Vol. 3 № 1 (2010), Научная статья

Vol. 3 № 1 (2010)

Исследовательская статья

https://doi.org/10.21500/20112084.852

Опубликовано 2010-06-30

  • Рональд Фишер +плюс;
  • Тасиано Л. Милфонт +

Рональд Фишер

Веллингтонский университет Виктории

Taciano L. Milfont

Веллингтонский университет Виктории

Ключевые слова

стандартизация
преобразование баллов
нормальное распределение
z-баллы
стили ответов
социальная желательность
культура

Как цитировать

Фишер, Р., и Л. Милфонт, Т. (2010). Стандартизация в психологических исследованиях. Международный журнал психологических исследований , 3 (1), 88–96. https://doi.org/10.21500/20112084.852

Резюме

Термин «стандартизация» использовался в психологических исследованиях по-разному, в основном в отношении стандартизации процедур, стандартизации интерпретации и стандартизации оценок. В настоящей статье стандартизация оценок будет обсуждаться более подробно. Стандартизация оценок является обычной практикой в ​​условиях, когда исследователей интересуют различные стили ответов, проблемы фальсификации или социальной желательности. В этих контекстах оценки преобразуются для повышения достоверности до анализа данных. В этой статье мы обрисуем широкую классификацию методов стандартизации, обсудим, когда и как можно стандартизировать оценки, а также какие статистические тесты доступны после преобразования. Предоставляются простые пошаговые процедуры и примеры файлов синтаксиса для SPSS. Будут обсуждаться приложения для личностной, организационной и кросс-культурной психологии. Обсуждаются ограничения этих методов, особенно с точки зрения теоретической интерпретации преобразованных оценок и использования таких оценок с многомерной статистикой.

https://doi.org/10.21500/20112084.852

Работа, отправляемая в этот журнал, должна быть оригинальной, неопубликованной или отправленной для публикации в другом месте; и если она будет принята к публикации, авторы согласятся передать авторские права Международному журналу психологических исследований.

Чтобы отказаться от авторских прав, авторы разрешают, International Journal of Psychological Research, распространять работу более широко, проверять возможность повторного использования другими и заботиться о необходимых процедурах для регистрации и управления авторскими правами; в то же время наша редакция представляет интересы автора и позволяет авторам повторно использовать его произведение в различных формах. В ответ на вышеизложенное авторы передают авторские права журналу International Journal of Psychological Research. Эта передача не подразумевает других прав, не являющихся авторскими (например, тех, которые касаются патентов). Аналогичным образом, авторы сохраняют за собой право использовать произведение полностью или частично в лекциях, книгах и курсах, а также делать копии в образовательных целях. Наконец, авторы могут свободно использовать таблицы и рисунки в своей будущей работе, везде, где делаются явные ссылки на предыдущую публикацию в International Journal of Psychological Research. Уступка авторских прав включает в себя как виртуальные права, так и формы статьи, позволяющие редакции распространять произведение так, как она считает целесообразным.

Редакция оставляет за собой право вносить изменения, которые сочтет необходимыми при применении правил публикации.

Загрузки

Данные для загрузки пока недоступны.

Самые читаемые статьи того же автора(ов)

  • Тасиано Л. Милфонт, Рональд Фишер, Проверка инвариантности измерений в группах: приложения в кросс-культурных исследованиях. , Международный журнал психологических исследований: Vol. 3 № 1 (2010): Спецвыпуск статистики в психологии.

Несколько слов о стандартизации в лонгитюдных исследованиях: не делайте

«Как правило, вы не хотите проводить полную стандартизацию z-оценки каждой переменной, потому что тогда вы теряете показатель ковариации, необходимый для процедур SEM. , и вы теряете любую информацию об изменениях среднего уровня с течением времени».

(Литтл, 2013, стр. 18)

В этой статье обсуждаются риски стандартизации и ипсатизации в лонгитюдных исследованиях. Во-первых, в нем обобщаются некоторые общие цели стандартизации в психологических исследованиях. Во-вторых, это объясняет, почему и когда стандартизация и ипсатизация проблематичны при анализе лонгитюдных данных и профилей. В-третьих, он показывает альтернативные способы достижения аналогичных целей, избегая при этом рисков.

Определения и цели Z-стандартизации и ипсатизации

Z-стандартизация и ипсатизация представляют собой процедуры преобразования абсолютных значений или рейтингов (например, 1 = совсем не согласен к 7 = полностью согласен ) в относительные оценки, отражающие ранг каждого ответа по сравнению с рангами всех ответов в этой выборке. При z-стандартизации средний балл выборки вычитается из каждого отдельного наблюдения, а затем эта разница делится на стандартное отклонение выборки. Результатом является шкала, где оценка 0 означает, что это наблюдение было на среднем уровне выборки, а z-оценка 1 отражает наблюдение, на одно стандартное отклонение превышающее среднее значение выборки. Ипсатизация также преобразует абсолютные оценки в относительные ранги, но связывает каждый ответ со средним значением отдельного человека, а не со средним значением выборки. Ответы человека искажаются путем вычитания среднего балла человека из каждого ответа, который человек дал в анкете. Положительный ипсатизированный балл означает, что человек оценил этот пункт выше (что часто означает: утвердил более сильно), чем среднее значение других пунктов в этой анкете.

Стандартизация и ипсатизация применяются для следующих целей:

(1) Стандартизация используется для приведения переменных с различными шкалами ответов (например, шкала от 1 = совсем не согласен до 7 = полностью согласен и еще один от 0 = совсем не согласен до 10 = полностью согласен) с сопоставимым показателем.

(2) Стандартизованные по Z баллы отображаются на графиках, чтобы подчеркнуть различия среднего уровня между группами или профилями наблюдений.

(3) Ипсатизация используется для учета предвзятости однородных ответов, таких как согласие (=тенденция подтверждать все пункты). Например, в кросс-культурных сравнениях элементы часто ипсатизируются, чтобы учесть предвзятость ответов, характерную для конкретной культуры (Tweed and DeLongis, 2006). С той же целью внутриличностная стандартизация применяется в интенсивных лонгитюдных исследованиях с многочисленными наблюдениями на человека в короткие промежутки времени (например, метод выборки опыта, см. Csikszentmihalyi and Schneider, 2000). В то время как ипсатизация относится к среднему баллу человека по всем переменным, внутрииндивидуальная стандартизация относится к среднему значению одной переменной по нескольким наблюдениям. Полученные ипсатизированные и внутрииндивидуальные z-показатели отражают, был ли ответ «высоким» по сравнению с другими ответами того же человека. В регрессионном анализе предикторная переменная часто ипсатируется по среднему значению выборки или группы, чтобы сделать пересечение осмысленно интерпретируемым (= «центрирование», см. Эндерс и Тофиги, 2007).

Проблемы, возникающие из-за стандартизации и ипсатизации

Хотя стандартизация и ипсатизация просты и широко распространены, существует множество сочетаний, в которых эти процедуры бесполезны или вводят в заблуждение. Для перекрестных исследований эти вопросы уже давно обсуждаются (например, Fischer and Milfont, 2010), но дополнительные проблемы возникают при изучении лонгитюдных данных или профилей. Причинами дополнительных проблем стандартизации лонгитюдных и вложенных данных являются многочисленные дополнительные возможности соотнесения рейтингов с различными системами отсчета и распределениями. В лонгитюдных исследованиях возникают вопросы: должны ли мы стандартизировать в пределах временных точек или между ними? Стандартизировать внутри или между отдельными людьми? Стандартизировать внутри или между возрастными группами/когортами? В результате проблемы:

(1) Стандартизация повторных измерений у отдельных индивидуумов препятствует изучению различий среднего уровня между индивидуумами, поскольку средний балл каждого индивидуума становится равным нулю. Стандартизированные средства не сообщают, различались ли люди в своем первоначальном опыте.

(2) Стандартизация отдельных лиц в пределах временных точек измерения затрудняет изучение изменений среднего уровня от одной временной точки к другой, потому что все средние значения во все временные точки становятся равными нулю, в то время как средние значения необработанных баллов могли показать уменьшение измеряемой переменной, такие как интерес (см. , например, Denissen et al., 2007).

(3) Стандартизация индивидуумов в разные моменты времени скрывает информацию об относительном ранге индивидуума в заданные моменты времени и препятствует распутыванию порядка рангов и стабильности среднего уровня. Например, у Анны мог быть относительно высокий интерес к первому и третьему классу по сравнению с другими в тот же момент времени. Однако, поскольку интерес часто снижается со временем, абсолютный интерес Анны был намного ниже в 3-м классе, чем в 1-м, как и у всех остальных. При стандартизации по временным точкам и отдельным лицам информация об относительном порядке ранжирования для конкретной временной точки смешивается с изменением среднего уровня, и это будет выглядеть так, как будто Анна проявляла высокий интерес в первый раз, но несколько низкий или средний интерес в другое время. два.

(4) Стандартизация отдельных лиц внутри возрастных групп/когорт препятствует изучению возрастных различий в определенные моменты времени. Например, в исследовании, в котором изучались три когорты (6-й, 8-й и 10-й классы) за 3 года (1992, 1995, 1997; см. Csikszentmihalyi and Schneider, 2000), балл изменился с 6-го на 8-й класс или с 1992 на 1995 год, потому что все они стали нулевыми.

(5) Вероятна неправильная интерпретация различий между профилями и группами, когда для сравнения этих профилей используются z-стандартизированные показатели, особенно если переменные различались по своим средним значениям и дисперсии до преобразования. Две проблемы усложняют интерпретацию групповых различий на основе z-показателей: во-первых, z-показатели представляют ранги по отношению к другим людям, а не степень, в которой пункт был подтвержден данным человеком. Если элемент имел низкий средний балл по выборке, то «высокий» z-показатель выше 0 (выше среднего по выборке) может представлять утверждение «скорее нет» ниже средней точки исходной шкалы ответов (см. Moeller et al., в нажимать). Во-вторых, построение групповых различий с использованием z-показателей часто приводит к тому, что в конечном итоге небольшие различия выглядят большими по сравнению с графиком, отображающим полную исходную шкалу ответов и необработанные оценки. Причина в том, что графики на основе z-показателей часто показывают только ту часть распределения, где профили различаются, а не полный диапазон возможных ответов (например, Tuominen-Soini et al., 2011). Это похоже на график с усеченной осью Y, который считается вводящим в заблуждение (например, Rovezzi Carroll and Carroll, 2002).

(6) Стандартизация среди отдельных лиц не должна выполняться с использованием ипсатизированных показателей, потому что это запутывает внутрииндивидуальную систему отсчета (ипсатизация) и межиндивидуальную систему отсчета (стандартизация) и ее трудно интерпретировать.

(7) Ипсатизация изменяет ковариационную матрицу таким образом, что данные становятся непригодными для корреляционных методов, таких как исследовательский и подтверждающий факторный анализ, моделирование структурными уравнениями, и многомерных методов, таких как множественная регрессия и многомерный дисперсионный анализ (Корнуэлл и Данлэп, 19).94; Клосс, 1996; Чан, 2003).

Из-за сложности лонгитюдных данных и анализа вышеописанные проблемы часто возникают одновременно. Например, стандартизация повторяющихся показателей, специфичных для конкретной ситуации, для отдельных лиц увеличивает риск неверной интерпретации средних различий z-показателей между профилями показателей состояния на уровне ситуации, потому что индивидуальное распределение этих переменных (см. задачу № 5) и межиндивидуальное распределение этих переменных (см. задачи 2–5). Это делает почти невозможным интерпретацию того, представляет ли относительно высокий ранг (z-показатель) переменную, которая была оценена как «высокая» по исходной шкале ответов конкретным человеком в конкретной ситуации. Пример взаимосвязанных проблем стандартизации см. в Denissen et al. (2007), которые применили две разные стратегии стандартизации (внутри отдельных лиц в разные моменты времени измерения и среди отдельных лиц в определенные моменты времени), а затем сравнили профили стандартизированных переменных в определенные моменты времени. Эта стратегия включает в себя три риска: риски, связанные со стандартизацией внутри отдельных лиц (проблема 1), связанные со стандартизацией во временных точках (проблемы 3 и 4) и связанные с неправильной интерпретацией средних показателей профиля (проблема 5).

Альтернативы стандартизации и ипсатизации

Для приведения различных измеряемых элементов к одной и той же метрике доступны несколько простых альтернативных монотонных масштабных преобразований, которые, в отличие от стандартизации, не изменяют многомерное распределение и ковариационную матрицу преобразованных переменных. Одним из решений является метод пропорции максимального масштабирования («POMS») (Little, 2013), который преобразует каждую шкалу в показатель от 0 (=минимально возможный) до 1 (=максимально возможный), сначала делая диапазон шкалы от 0 до наибольшего значения, а затем разделить баллы на наибольшее значение.

POMS=[(наблюдаемый-минимум)/(максимум-минимум)]

Например, для шкалы, которая изначально находилась в диапазоне от 1 до 7, сначала из каждого наблюдения вычитается значение 1, чтобы шкала изменялась от 0 до 6, а затем каждый балл делится на 6, чтобы шкала менялась от 0 до 1. В отличие от стандартизации, при этом сохраняются пропорции абсолютных расстояний между наблюдаемыми вариантами ответов.

Другим вариантом является метод процента от максимально возможного («POMP») (Cohen et al., 19).99), в результате чего каждая шкала находится в диапазоне от 0 (=минимально возможный) до 100 (=максимально возможный) путем умножения результата преобразования POMS на 100. Полученные в результате преобразования POMP баллы можно интерпретировать как проценты от возможного максимального балла. Синтаксисы SPSS для этих преобразований можно загрузить бесплатно (Moeller, 2015).

Для изучения различий среднего уровня между профилями и группами можно использовать необработанные баллы или шкалы, преобразованные с помощью метода POMS или POMP. Преимущество этого заключается в том, что баллы отражают степень индивидуального одобрения/отвержения пунктов, а групповые различия отображаются в правильных пропорциях. Обсуждение дополнительных преимуществ и альтернативных преобразований см. в Little (2013) и Cohen et al. (1999).

Для учета систематической ошибки, связанной с однородной реакцией, такой как молчаливое согласие, фактор общего метода может быть смоделирован в моделях структурных уравнений (Billiet and McClendon, 2000; Geiser and Lockhart, 2012). Например, латентная переменная с одинаковыми факторными нагрузками на все наблюдаемые ответы в вопроснике может объяснить тенденцию ответов, которая была общей для всех наблюдаемых ответов. Преимущество перед ипсатизацией заключается в том, что метрика ковариации остается полезной для всех поисковых и подтверждающих факторных анализов (EFA, CFA) и моделирования структурными уравнениями (SEM). Процедура может быть адаптирована для учета неравномерных систематических ошибок в ответах (например, комбинированная систематическая ошибка подтверждения положительно воспринимаемых вопросов и систематическая ошибка отрицания отрицательно воспринимаемых вопросов, что имеет значение при оценке достоверности симптомов). Если вместо этого используется ипсатизация с EFA, CFA или SEM, то процедура ипсатизации должна быть изменена (см. Chan and Bentler, 19).93; Чунг и Чан, 2002). Для учета погрешностей ответов при анализе профилей факторы метода и необработанные или POMS-показатели могут быть объединены в модели сочетания факторов (Lubke and Muthén, 2005; Leite and Cooper, 2010).

С учетом факторов ипсатизации и метода по-прежнему трудно отделить предвзятые стили ответов от подлинного опыта. Например, некоторые люди действительно интересуются широким спектром тем (=подтвердить все интересующие их темы) и не демонстрируют четкий профиль интересов с высоким интересом к одним и низким интересом к другим темам (Раундс и Трейси, 19).93). Чтобы отделить использование шкалы от подлинного опыта, полезно включить в анкету противоречащие элементы и конструкции или использовать шкалы достоверности, например, для оценки тенденции в целом подтверждать элементы, не обращая внимания на их содержание, или для оценки социальной желательности. Исследование «неоднородности использования масштаба» предоставляет дополнительные инструменты для этой цели (Rossi et al., 2001, 2005).

Резюме

Z-стандартизация – это широко используемая процедура, применяемая для избавления от склонности к согласию и других искажений ответов, приведения переменных разных показателей к одному показателю и подчеркивания различий между группами на графиках.

В продольных данных и анализе подгрупп наблюдений z-стандартизация приводит к ряду проблем. Он часто нежелательным образом изменяет расстояния между наблюдениями и многомерное распределение поперечных и продольных данных. Психологическая литература богата примерами неправильной интерпретации z-показателей, некоторые из которых описаны в этой статье. В то время как перекрестные исследования известны многими ловушками, лонгитюдные исследования добавляют дополнительные проблемы из-за смешанных систем отсчета (исходная шкала ответов, внутрииндивидуальное распределение, межиндивидуальное распределение в заданные моменты времени, межиндивидуальное распределение). в разные моменты времени, вариации внутри и между когортами и любые их комбинации). Как правило, нецелесообразно сначала стандартизировать переменные внутри единиц (отдельных лиц, когорт, штатов, организаций), а затем сравнивать средние баллы по этим единицам, которые дали основу для стандартизации. Это должно быть тривиально, но часто можно наблюдать в текущих исследованиях, и легко уследить или неправильно обработать, чем больше единиц и систем отсчета добавляется в структуру данных.

Моделирование факторов общего метода является полезной альтернативой для учета предвзятости ответов, избегая при этом недостатков ипсатизации. Доступны альтернативные простые преобразования монотонной шкалы для получения элементов с разными шкалами ответов для одной и той же метрики (Cohen et al., 1999; Little, 2013). Учитывая легкость и широкое распространение стандартизации в психологической литературе, кажется необходимым подчеркнуть риски и возможные неверные толкования во время методологического обучения, написания и рецензирования в психологии. Как отметил Литтл (2013), кажется разумным избегать стандартизации в лонгитюдном анализе данных и личностно-ориентированном анализе, если только исследователь полностью не осведомлен о нежелательных последствиях и не способен их избежать. Есть много хороших применений для этих процедур, но также и много рисков.

Заявление о конфликте интересов

Автор заявляет, что исследование проводилось в отсутствие каких-либо коммерческих или финансовых отношений, которые могли бы быть истолкованы как потенциальный конфликт интересов.

Благодарности

Я благодарю Катарину Салмела-Аро за ее поддержку, а также Жаклин С. Экклз, Анну-Лену Дике, Мелани Кейнер и Джулию Дитрих за предложения и поддержку и Ариэль Уайт за корректуру. Эта работа была поддержана грантом Фонда Джейкобса в рамках постдокторской программы «Пути к взрослой жизни». Эта статья была написана, когда автор работал в Хельсинкском университете, и была переработана и повторно представлена ​​после перехода автора в Йельский университет.

Ссылки

Billiet, J., and McClendon, M.J. (2000). Моделирование согласия с моделями измерения для двух сбалансированных наборов элементов. Структура. Экв. Модель. 7, 608–628. doi: 10.1207/S15328007SEM0704_5

Полный текст CrossRef | Google Scholar

Чан, В. (2003). Анализ ipsatized данных в психологических исследованиях. Поведенческая метрика 30, 99–121. doi: 10.2333/bhmk.30.99

PubMed Abstract | Полный текст перекрестной ссылки | Академия Google

Чан В. и Бентлер П. М. (1993). Ковариационный структурный анализ ипсативных данных. Соц. Методы Рез. 22, 214–247. doi: 10.1177/0049124193022002003

CrossRef Full Text | Google Scholar

Cheung, MWL, and Chan, W. (2002). Уменьшение однородной систематической ошибки ответа с помощью ипсативного измерения в множественном групповом подтверждающем факторном анализе. Структура. Экв. Модель. 9, 55–77. doi: 10.1207/S15328007SEM0901_4

Полный текст CrossRef | Академия Google

Клосс, С.Дж. (1996). О факторинге и интерпретации ипсативных данных. Дж. Оккуп. Орган. Психол. 69, 41–47. doi: 10.1111/j.2044-8325.1996.tb00598.x

Полный текст CrossRef | Google Scholar

Коэн П., Коэн Дж., Айкен Л.С. и Уэст С.Г. (1999). Проблема единиц и обстоятельств для ПОМП. Многомерное поведение. Рез. 34, 315–346. doi: 10.1207/S15327906MBR3403_2

Полный текст CrossRef | Google Scholar

Корнуэлл, Дж. М., и Данлэп, В. П. (1994). О сомнительной надежности факторизации ипсативных данных: ответ на Saville & Willson (1991). Дж. Оккуп. Орган. Психол. 67, 89–100. doi: 10.1111/j.2044-8325.1994.tb00553.x

Полный текст CrossRef | Google Scholar

Чиксентмихайи М. и Шнайдер Б. (2000). Становление взрослым . Нью-Йорк, штат Нью-Йорк: Основные книги.

Google Scholar

Дениссен, Дж. Дж. А., Зарретт, Н. Р., и Экклс, Дж. С. (2007). Мне нравится это делать, я умею и знаю, что умею: продольные связи между достижениями в предметной области, самооценкой и интересом. Ребенок Дев. 78, 430–447. doi: 10.1111/j.1467-8624.2007.01007.x

PubMed Abstract | Полный текст перекрестной ссылки | Google Scholar

Эндерс, К.К., и Тофиги, Д. (2007). Центрирование предикторных переменных в кросс-секционных многоуровневых моделях: новый взгляд на старую проблему. Психолог. Методы 12, 121–138. doi: 10.1037/1082-989X.12.2.121

PubMed Abstract | Полный текст перекрестной ссылки | Google Scholar

Фишер Р. и Милфонт Т. Л. (2010). Стандартизация в психологических исследованиях. Междунар. Дж. Психол. Рез. 3, 88–96.

Реферат PubMed | Google Scholar

Гейзер, К., и Локхарт, Г. (2012). Сравнение четырех подходов к учету эффектов метода в анализе скрытых признаков состояния. Психолог. Методы 17, 255–283. doi: 10.1037/a0026977

PubMed Abstract | Полный текст перекрестной ссылки | Google Scholar

Лейте, В.Л., и Купер, Л.А. (2010). Выявление предвзятости социальной желательности с использованием моделей сочетания факторов. Многомерное поведение. Рез. 45, 271–293. doi: 10.1080/00273171003680245

CrossRef Full Text | Google Scholar

Литтл, Т. Д. (2013). Моделирование продольных структурных уравнений (методология социальных наук) . Нью-Йорк, штат Нью-Йорк: GuilfordPress.

Любке, Г. Х., и Мутен, Б. (2005). Исследование неоднородности населения с помощью моделей смеси факторов. Психолог. Методы 10, 21–39. doi: 10.1037/1082-989X.10.1.21

PubMed Abstract | Полный текст перекрестной ссылки | Академия Google

Меллер, Дж. (2015). SPSS-синтаксис для POMS- и POMP-преобразования . Доступно в Интернете по адресу: https://osf.io/eaxgb

Moeller, J., Keiner, M., and Grassinger, R. (в печати). Две стороны одной медали: описывают ли двойственные типы страсти отдельные подгруппы людей? J. Личностно-ориентированный Res. 2 .

Росси, П.Е., Алленби, Г.М., и Маккалох, Р. (2005). Байесовская статистика и маркетинг Чичестер: John Wiley & Sons, Ltd.

Google Scholar

Росси П.Е., Гилула З. и Алленби Г.М. (2001). Преодоление неоднородности использования масштаба: байесовский иерархический подход. Дж. Ам. Стат. доц. 96, 20–31. doi: 10.1198/016214501750332668

CrossRef Full Text | Google Scholar

Rounds, J. and Tracey, TJ (1993). Размерное представление Предигера циркумплекса Холланда RIASEC. J. Appl. Психол. 78, 875–890. doi: 10.1037/0021-9010.78.6.875

Полный текст CrossRef | Академия Google

Ровецци Кэрролл С. и Кэрролл Д.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *