Стандартизация — Psy-Testology
Психометрика > Стандартизация
|
Стандартизация психодиагностических методик
Диагностическая методика отличается от любой исследовательской тем, что она стандартизирована.
Стандартизация (по Анастази) – это единообразие процедуры проведения и оценки выполнения теста. Таким образом, стандартизация рассматривается в двух планах: как выработка единых требований к процедуре эксперимента и как определение единого критерия оценки результатов диагностических испытаний.
Стандартизация процедуры эксперимента подразумевает унификацию инструкций, бланков обследования, способов регистрации результатов, условий проведения обследования.
Требования к проведению эксперимента:
- инструкции следует сообщать испытуемым одинаковым образом, как правило, письменно; в случае устных указаний они даются в разных группах одними и теми же сло-вами, понятными для всех, в одинаковой манере;
- ни одному испытуемому не следует давать никаких преимуществ перед другими;
- в процессе эксперимента не следует давать отдельным испытуемым дополнительные пояснения;
- эксперимент с разными группами следует проводить в одинаковое по возможности время дня, в сходных условиях;
- временные ограничения в выполнении заданий для всех испытуемых должны быть одинаковыми и так далее.
Другим наиболее важным этапом в стандартизации методики является выбор критерия, по которому следует проводить сравнение результатов диагностических испытаний, поскольку диагностические методики не имеют заранее определённых стандартов успешности или неудачи в их выполнении.
Стандартизация методики осуществляется путем ее проведения на большой репрезентативной выборке такого типа, для которого методика предназначена. Относительно этой группы испытуемых вырабатываются нормы, указывающие не только средний уровень выполнения, но и относительную вариативность выше и ниже среднего уровня.
Для выполнения статистической нормы применяются приемы математической статистики х ± σ (х – среднее арифметическое, σ — станд. отклонения). x ± 5 σ
Процентиль – это процентная доля индивидов из выборки стандартизации.
Под руководством Гуревича разрабатываются тесты, в которых в качестве точки отсчета выступает независимый от результатов испытания, объективно заданный социально-психологический норматив. Он реализуется в совокупности заданий составляющих тест. Сам тест в полном его объеме и является таким нормативом.
При разработке и применении любой точки отсчета следует обратить внимание на выборку испытуемых. В математической статистике различают генеральную совокупность (популяция) и выборку. Всякая большая совокупность людей относительно которой мы собираемся делать выводы называется генеральной совокупностью.
Выборка – это часть, или подмножество, совокупности. Проводить исследования для популяции не принято. Обычно из нее выделяется группа людей – выборка стандартизации, которая реально подвергается тестированию, и с ее помощью оценивается генеральная совокупность. Чтобы оценки носили достоверный характер выборка должна быть репрезентативна, представительна для рассматриваемой популяции, то есть ее вероятные свойства должны совпадать или быть близкими к свойствам генеральной совокупности.
Один из способов обеспечения репрезентативности выборки является ограничение популяции (пол, возраст, профессия, здоровье, социально-эконом. статус и др.). Такая популяция определяется как специфическая.
- Отбор испытуемых в выборку стандартизации
- Определение популяции с выделением в ее структуре переменных значимых, малозначимых (возраст, пол)
- Популяция делится на части в зависимости от значимых переменных.
- Испытуемые отбираются в случайном порядке и пропорционально численности каждой значимой части совокупности. Минимальный порог выборки – 200 человек.
Статистическая норма – критерий, по которому проводят сравнение результатов диагностических методик.
Возрастная норма – как показатель, который появляется в тестах Бене-Симона (норма – сделать все задания).
Внешний критерий – критерий выполнения.
Процентиль – это процентная доля индивидов из выборки стандартизации, первичный результат которому ниже данного первичного показателя. Процентили указывают на относительное положение индивида в выборке стандартизации. Чем ниже процентиль, тем хуже позиция индивида. Процентили нельзя смешивать с обычными процентными показателями, которые являются первичными показателями и представляют собой процент правильно выполненных заданий, тогда как процентиль – это производный показатель, указывающий на долю от общего числа членов группы.
Стандартизация и нормы: процесс и примеры
Если вы сейчас посещаете курс психологии AP, вы, вероятно, сдадите комплексный экзамен в конце курса. Этот тест даст вашему учителю представление о том, как много вы узнали на уроке AP, но это еще не все. Стандартные тесты , такие как экзамен по психологии AP, имеют средние баллы, которые можно сравнить с баллами вашего класса. Ваш учитель сможет сравнить ваши оценки в классе с оценками других студентов-психологов!
- Что такое стандартизация и нормы в психологии?
- Что такое нормы психологического тестирования?
- Каков процесс стандартизации психологических тестов?
- Каковы некоторые примеры стандартизации и норм в психологическом тестировании?
- Почему важна стандартизация психологических тестов?
Стандартизация и нормы в психологии
Знаете ли вы, что многие психологические исследования включают тесты или оценки? Они измеряют личность, психические расстройства, интеллект, способности и интересы. Когда психолог использует тест в научном исследовании, тест должен быть надежным и достоверным. Результаты испытаний должны быть последовательными и точными.
Есть еще одна вещь, которой должен быть тест, чтобы психолог мог использовать его в исследованиях: тест должен быть стандартизирован .
Стандартизированный тест включает в себя надежные методы, точное содержание, инструкции по применению и средние баллы популяции для сравнения с баллами выборки.
Стандартные тесты включают в себя все, что нужно психологу. Если тест или лечение стандартизированы, к ним прилагается подробная инструкция по применению. Это также означает, что он прошел множество исследований и изменений, прежде чем был стандартизирован.
Стандартизация — это процесс опробования нового теста или лечения, получения отзывов и внесения изменений для его улучшения.
Некоторые психологи специализируются на разработке, испытании и пересмотре тестов. Их называют психометристами . Они изучают область психометрии , которая посвящена тому, как измерять такие вещи, как интеллект, личность или индивидуальные способности. Эти вещи могут быть сложнее оценить, чем вы думаете!
Фг. 1 Стандартизированные тесты, pixabay.com
Вы капитан своей спортивной команды. Вы несете ответственность за наблюдение за пробами и выбор новых членов для вашей команды. Вам нужно знать, какие игроки лучше всего подходят для команды и какие позиции лучше всего подходят для каждого игрока. Вы придумываете серию упражнений и ходов, чтобы оценить способности каждого человека, который пытается это сделать. В конце проб вы сравниваете выступления каждого человека и выбираете тех, кто лучше всех выступил, чтобы они стали частью команды.
Процесс стандартизации психологического теста
Стандартизация теста или лечения может занять много времени. Стандартизация преследует две большие цели: сбор средних баллов населения и принятие решения по административным деталям теста . Популяция — это все люди, которым вы хотите пройти тест или пройти курс лечения. Как вы понимаете, это может быть большая группа людей.
Некоторыми примерами групп населения являются все третьеклассники в Америке, все пациенты психиатрических больниц, все клиенты, проходящие индивидуальную терапию депрессии, все люди старше 80 лет в определенном состоянии или все студенты средней школы AP психологии.
введение теста просто означает инструкции, которые сопровождают тест. Они сообщают учителю, терапевту или психологу, как проводить тест, сколько времени дать испытуемому, как оценивать ответы, какие оценки ожидать и что может означать каждая оценка. Предоставление информации о ожидаемых результатах требует знания оценок других людей, сдавших тот же тест. Психометристы выясняют это, заставляя сотни или тысячи людей попробовать новый тест.
Фг. 2 Администрирование онлайн-тестов, pixabay.com
Этапы процесса стандартизации тестов | |
Шаг 1 | Выберите, что измерять и как это определять. |
Шаг 2 | Решите, кто будет проходить тест (население). |
Шаг 3 | Выберите, какие вопросы задавать, как их формулировать и сколько включить. |
Шаг 4 | Выберите формат ответа для каждого вопроса. |
Шаг 5 | Попросите большое количество людей пройти новый тест и получить от них отзывы. |
Шаг 6 | Внесите изменения в тест на основе отзывов. |
Шаг 7 | Повторите шаги 5 и 6 столько раз, сколько необходимо. |
Шаг 8 | Сравните тест с другими тестами, которые измеряют аналогичные или противоположные понятия. |
Шаг 9 | Выполняйте статистический анализ в течение всего процесса, чтобы убедиться в надежности и достоверности теста. |
Этап 10 | Соберите инструкции по применению. |
Шаги 1 и 2 являются наиболее важными во всем процессе. Стандартизация теста очень похожа на любое другое исследование. Вы должны знать цель или цель теста, прежде чем вы сможете начать. Вам также нужен хороший рабочее определение для всего, что вы хотите измерить.
Тест, который вы найдете в Интернете, должен сказать вам, счастливы вы или нет. Результаты теста зависят от того, как испытуемые определяют счастье. Возможно, они считают, что счастье заключается в том, чтобы иметь много друзей, поэтому задают вопросы о ваших отношениях. Может быть, они определяют счастье как удовлетворение всех ваших потребностей и чувство расслабления, поэтому вместо этого они задают вопросы об этих вещах. Рабочее определение определяет содержание теста.
Шаг 4 посвящен тому, как испытуемые могут отвечать на каждый вопрос. Заполняют ли они пропуск, выбирают один из нескольких вариантов ответа, оценивают свой ответ по шкале, указывают «да» или «нет» (правда или ложь) или предоставляют целый абзац? Лучший формат ответа для теста зависит от того, какие данные собирают исследователи и какие вопросы они задают.
Вопрос в тесте звучит так: «По шкале от 1 до 10, насколько вам сегодня понравилось?» Под вопросом есть 10 точек, со словами «совсем нет» рядом с первой точкой и «очень сильно» рядом с последней точкой. Вы ставите галочку на 8-й точке, потому что хорошо провели время, но чувствуете, что организация могла бы улучшить часть тура.
Представьте, что вы проходите тест, и первый вопрос спрашивает: «Что ты ел сегодня на обед?» Варианты ответов «верно» или «ложно». Что-то здесь не так!
Шаги 5 и 6 могут занять очень много времени. Создатели теста могут повторять эти шаги много раз. Опробование теста на популяции может показать, что все вопросы теста слишком сложны или слишком просты. Это может указывать на то, что вопросы слишком похожи или сформулированы странно. Это может даже сказать исследователям, что они разработали хороший тест, но он не измеряет то, что они хотят измерить!
Вся эта обратная связь от людей, желающих попробовать тест, помогает специалистам по психометрии пересматривать и редактировать тест. Иногда исследователи отбрасывают тест и начинают с нуля. Шаги 8 и 9 происходят на протяжении всего процесса. Шаг 8 помогает разработчикам определить, какие вопросы задавать, а шаг 9 помогает решить, нужно ли им больше, меньше или другие вопросы.
Тест, предназначенный для измерения тревожности, сравнивают с другим тестом на тревожность и с тестом, измеряющим расслабление. Результаты двух тестов на тревогу должны быть одинаковыми, но результаты тестов на тревогу и релаксацию должны быть противоположны друг другу. Если кто-то набирает высокие баллы по тревожности, он также должен набирать низкие баллы по релаксации. Если они набрали высокие баллы по релаксации, они должны получить низкие баллы по тревожности.
Шаг 10 может показаться незначительным, но он очень важен. Руководства по администрированию тестов сообщают исследователям, где проводить тест, как его проводить (на бумаге или в Интернете), сколько времени он должен занимать, как оценивать его и как понимать результаты. Вы проходите онлайн-тест и получаете 35 баллов. Что это значит? Это хороший или плохой результат? Каков он по сравнению с другими людьми, сдавшими тот же тест?
Примеры стандартизации и нормы в психологическом тестировании
Тест, предназначенный для определения самого популярного вкуса мороженого в Америке, прошел процесс стандартизации. Вариант, который чаще всего выбирали те, кто попробовал тест, был шоколадным. Если люди, опробовавшие тест, точно представляют население (все американцы), мы можем сказать, что популяционная норма для лучшего вкуса мороженого – шоколадное.
Вы и ваш лучший друг решаете пройти тест. Ваш лучший друг выбирает ваниль. Вы ищете в списке вариантов свой любимый вкус, но его нет в тесте. Вы понимаете, что в тесте всего 3 варианта ответа: клубничный, ванильный и шоколадный. Подождите минутку: существует гораздо больше, чем 3 вкуса мороженого! Является ли этот тест точным?
Что, если в одном и том же тесте перечисляются все существующие вкусы мороженого. Что бы означал ваш ответ? Если вы выбираете шоколад, вы знаете, что ваш любимый вкус такой же, как у большинства людей в Америке. Если вы выберете что-то другое, вы знаете, что ваш любимый вкус менее популярен. Это простой пример, но он иллюстрирует, как популяционная норма помогает исследователям понять результат теста.
Популяционная норма – это предполагаемый средний балл члена определенной популяции. Он включает в себя то, какие оценки считаются чрезвычайно высокими или низкими среди этой группы населения.
Нормы в психологическом тестировании
В целом в психологии существует 4 типа популяционных норм. Это нормы возраста, нормы оценок, нормы процентилей и нормы стандартных баллов . Возрастные нормы используются при тестировании интеллекта и измерении роста и веса у детей. Нормы оценок в основном используются в образовательных учреждениях. Экзамены на уровне класса, такие как SAT, сравнивают результаты учащихся с результатами других учеников того же класса и других классов.
Процентильные оценки более детализированы. Они сообщают вам, где находится ваша оценка в большом наборе оценок. Если вы наберете 50-й процентиль, половина людей, сдавших экзамен, набрали таких же , как и вы. Если вы наберете 75-й процентиль, 75% людей, сдавших экзамен, набрали на балла меньше вашего балла. Если вы наберете 25-й процентиль, 25% людей, сдавших экзамен, набрали баллов ниже вашего балла. Вы также можете выяснить, какой процент испытуемых набрал 9 баллов.0003 выше на основе вашего процентиля.
Стандартные оценки содержат еще больше нюансов, чем процентные оценки. Они говорят вам, насколько близко вы набрали средних всех результатов. Если ваш стандартный балл выше 0, это означает, что вы набрали больше среднего. Если это отрицательное число (ниже 0), это означает, что вы набрали меньше среднего. В психологии их обычно называют z-показателями.
В StudySmarter есть полное объяснение z-показателей!
Важность стандартизации в психологическом тестировании
Каждый день мы принимаем решения на основе тестов. Учителя планируют, какой материал преподавать, врачи решают, правильно ли растет ребенок, а терапевты пытаются определить, работает ли метод лечения. Колледжи решают, каких новых студентов принимать. Все эти решения частично основаны на результатах испытаний. Если решение основано на стандартизированном тесте, психологи назвали бы это решением, основанным на фактических данных .
Стандартизированные тесты и методы лечения являются важными научными инструментами. Длительный и сложный процесс стандартизации помогает исследователям гарантировать точность используемых тестов и стабильные результаты. Этот процесс также сообщает разработчикам тестов, какие изменения нужно внести в тест. Как только тест стандартизирован, он продолжает проходить процесс стандартизации для каждого нового населения, языка, формата и культуры.
Фг. 3 Вступительные экзамены в колледж, pixabay.com
Стандартизация и нормы — основные выводы
- Стандартизированный тест включает в себя надежные методы, точное содержание, административные инструкции и средние баллы популяции для сравнения с баллами выборки.
- Стандартизация — это процесс опробования нового теста или лечения, получения отзывов и внесения изменений для его улучшения.
- Популяционная норма – это предполагаемый средний балл члена определенной популяции. Он включает в себя то, какие оценки считаются чрезвычайно высокими или низкими среди этой группы населения.
- Вам нужно хорошее рабочее определение для всего, что вы хотите измерить в тесте.
- Стандартизация преследует две большие цели: сбор средних баллов населения и принятие решения по административным деталям теста .
Стандартизация и нормы — GL Education
Точный Узнать большеТехнически «стандартизация» — это процесс, используемый при разработке психометрических тестов для создания норм , чтобы успеваемость учащихся разного возраста можно было представить с помощью баллов, не зависящих от возраста.
Наиболее распространенными нормативными оценками являются стандартные оценки и процентные оценки. Стандартные баллы имеют среднее значение (среднее) 100 и стандартное отклонение 6 15. Процентильные баллы помещают людей на «лестницу» достижений от 1 до 100 по сравнению с населением того же возраста; например процентиль 70 означает, что 70% людей будут иметь более низкие исходные баллы, а 30% — более высокие исходные баллы. (Для получения дополнительной информации о стандартных оценках и процентильных оценках см. Типы оценок).
Выборка для стандартизации Exact включала 1171 учащегося в возрасте от 11:00 до 18:11. Учащиеся были отобраны из 17 школ по всей Великобритании, выбранных для предоставления репрезентативного распределения типов школ и социально-экономических профилей. Основные результаты приведены в таблице 1. Точные результаты испытаний стандартного образца.
В Таблице 1. Точные результаты тестов для стандартизированной выборки видно, что формы А и В очень похожи во всех тестах, за исключением понимания прочитанного, где форма А имеет немного более высокий средний балл и, таким образом, кажется немного проще чем форма Б. Однако эта разница учитывается в нормах, поэтому две формы все же психометрически эквивалентны.
Все необработанные данные, кроме данных для теста распознавания слов, аппроксимированы нормальным распределением (симметричные колоколообразные кривые), с асимметрией (степень асимметричности распределения) и эксцессом (степень плоскостности и остроконечности распределения) ниже критического порога 1,0. Распределение необработанных баллов для теста на распознавание слов было смещено в отрицательную сторону, т. е. было обнаружено, что баллы сгруппированы ближе к верхнему краю шкалы. Таким образом, для этого конкретного теста исходная оценка была преобразована для получения нормального распределения, необходимого для получения удовлетворительных стандартных оценок. Это статистическое преобразование, которое учитывало скорость ответа, оказало минимальное влияние на результаты студентов с исходным баллом ниже среднего, но, как и предполагалось, оказало несколько большее влияние на баллы выше среднего. Для учащихся, которые распознают слова ниже среднего, более 70% дисперсии в преобразованном балле предсказывается исходным баллом, т. е. для этих учащихся стандартный балл, полученный этим тестом, в значительной степени зависит от их точности чтения, а не от скорости. Однако для учащихся с высоким уровнем распознавания слов различия в большей степени зависят от скорости, чем от точности.
Таблица 1.