Стандартизация теста это: СТАНДАРТИЗАЦИЯ ТЕСТА — Гипертекстовый словарь методических терминов

Стандартизация теста (test standardization) | это… Что такое Стандартизация теста (test standardization)?

Толкование

Стандартизация теста (test standardization)

С. т. — это установление унифицированных процедур для а) его проведения и б) подсчета получаемых с его помощью показателей. Первые стандартизированные тесты появились в начале XX столетия, когда Э. Л. Торндайк, занимающийся эксперим. психологией, наряду с др. учеными, распространили принципы, полученные в лабораториях, на психол. измерения.

«Стандарты для образовательных и психологических тестов» (Standards for educational and psychological tests, American Educational Research Association, 1985) лают общие рекомендации относительно процедуры, к-рым должны следовать издатели и пользователи тестов, для того, чтобы гарантировать применение стандартизированных процедур. Контроль за процедурой проведения тестов в значительной степени достигается за счет инструкций, приведенных в руководствах по тестам. Что касается процедуры оценки, то в «Стандартах» указано, что желательно, чтобы детальные инструкции как для субъективных, так и объективных тестов были помещены в руководстве по тесту, и, в случае субъективно градуированных тестов, следует указать результаты исслед. степени согласия лиц, проводящих оценку. С. т. тж должна давать детальную информ. по поводу того, кто имеет квалификацию, достаточную для применения и оценки результатов теста.

Заключительным моментом С. т. яв-ся разработка норм теста. Эти величины, в сочетании с данными о надежности и валидности, позволяют психологам надлежащим образом интерпретировать результаты, полученные в результате тестирования. Тесты можно приравнять к др. аналогичным тестам, так, чтобы сравнивать их результаты друг с другом.

Очевидны три потенциальных преимущества стандартизированных психол. тестов. Во-первых, стандартизированные тесты часто имеют более высокое качество, чем составленные для проведения в конкретных местах.

Во-вторых, проведение стандартизированных обследований может освободить психологов и др. специалистов от траты времени на конструирование тестов, личное проведение тестирования и других оценочных мероприятий, и дает им возможность заняться более важными вещами — терапией, обучением, и интерпретацией результатов, например. Наконец, использование стандартизированных измерений облегчает общение психологов друг с другом. Следует отметить и один важный недостаток стандартизированных процедур: из-за своей доступности, стандартизированные тесты иногда используют в неподходящих ситуациях.

См. также Измерение

К. Ф. Гейзингер

.

Игры ⚽ Поможем написать реферат

  • Стадии развития поведения ребенка (children’s behavioral stages)
  • Старение и интеллект (aging and intelligence)

Полезное


Тестовые нормы. Большая российская энциклопедия

Термины

Те́стовые но́рмы, стандарты для оценки результатов тестирования, позволяющие определить наличие и/или степень выраженности измеряемого психического свойства у конкретного испытуемого.

Анализ и интерпретация результатов тестирования конкретного испытуемого осуществляется на основе стандартизированных баллов, поэтому одним из важных условий практического использования психодиагностических методик является перевод сырых тестовых баллов в нормированные. Это позволяет сравнить результаты данного тестируемого по разным шкалам и методикам, а также с результатами других испытуемых.

Перевод сырых баллов в нормированные производится путём сравнения сырых баллов тестируемого с показателями выборки стандартизации. Тестовым результатам конкретного испытуемого присваивается заданный для определённой выборки стандартизации нормированный балл. Для определения стандартизированного балла необходимо выбрать ту нормативную группу, которая соответствует социально-демографическим характеристикам тестируемого и цели тестирования.

Тестовые нормы представляют собой пороговые значения, «точки отсечения» (cut score) или интервалы (уровни) с различной интерпретацией на стандартной шкале, которые разделяют статистически различающиеся группы тестируемых.

Согласно определению А. Г. Шмелева, тестовые нормы – это границы на шкале тестовых баллов, которые разделяют интервалы (области шкалы), связанные с определёнными диагностическими выводами или управленческими решениями (Шмелев. 2013. С. 66).

Нормированные шкалы. Архив БРЭ.Нормированные шкалы. Архив БРЭ.Наиболее простые «точки отсечения» на тестовых шкалах могут быть определены границами интервала М ± \pm ± σ (среднее значение плюс / минус стандартное отклонение: М – σ, М + σ). Группа испытуемых, которые попадают в этот интервал, называется средней, выше интервала – высокой, ниже интервала – низкой. Правила определения «точек отсечения» могут исходить не только из закона нормального распределения, средних величин и отклонений в выборке стандартизации (при нормативно-статистическом подходе), но и из объективированных требований к уровню подготовленности или пригодности испытуемых к определённому виду деятельности (при критериально-ориентированном подходе).

Нормативно-ориентированное тестирование предполагает формирование тестовых норм на основе статистического распределения тестовых баллов в репрезентативной выборке стандартизации. Такие нормы называют относительными в связи с тем, что они демонстрируют статус испытуемого относительно группы, рассматриваемой в качестве нормативной. В таких случаях используются нормированные шкалы, прежде всего Z-шкала и её производные (шкала стэнов, Т-шкала, IQ-шкала и др.) (см. рис. Нормированные шкалы).

Критериально-ориентированное тестирование предполагает формирование тестовых норм на основе экспертных критериев (некоторых внешних по отношению к тесту явлений или признаков). Наборы признаков для критериальных тестовых норм могут быть упорядочены в номинативные или порядковые шкалы. Экспертно задаются абсолютные пороговые значения отбора по количеству успешно выполненных критериальных показателей.

Критериальные нормы отражают вероятность того, что испытуемые, получившие некоторый балл по тесту, достигнут критериального показателя. Критериальные нормы устанавливают посредством эмпирического соотнесения тестовых баллов с оценками по критерию и обычно представляют в виде «таблиц ожидания». В таблицах ожидания приводятся вероятности различных критериальных исходов для лиц, получивших тот или иной тестовый балл. Таблицы ожиданий могут дополняться указанием критериального балла – тестового показателя, относительно которого прогнозируется успешность деятельности не ниже заданной вероятности (например, на уровне «выше среднего» с вероятностью 95 %). Основная сфера применения таких норм связана с практическими задачами отбора и прогнозирования.

Для реализации практических целей используются и предметно-ориентированные нормы (domain-referenced), призванные оценить уровень выполнения теста с точки зрения его содержания (количество знаний, качество освоения конкретных навыков и т. д.). Во многих областях практики для задач готовности или безопасности требуется не определение статуса тестируемого относительно общей выборки, а установление критических точек, отражающих минимальный уровень освоения деятельности (например, тест на вождение автомобиля). Для установления таких норм необходим «стандарт выполнения», который выражается либо в проценте выполненных заданий, либо через «точку отсечения», которая разделяет протестированных претендентов на группы по принципу «зачёт / незачёт». При использовании нескольких «точек отсечения» могут определяться несколько категорий (например, начальный уровень, базовый, продвинутый). К установлению предметно-ориентированных норм также привлекаются эксперты. Предметно-ориентированные нормы широко используются в системе образования, а также для целей лицензирования и сертификации, когда в качестве интерпретационной схемы используется чётко определённая содержательная область.

В отечественных исследованиях при интерпретации диагностических данных применялся особый критерий – социально-психологический норматив; критерий предложил К. М. Гуревич как психологический информационно-действенный комплекс знаний, умений и навыков (Гуревич. 2008. С. 280). Социально-психологический норматив – система требований, которые предъявляет общество и которым необходимо соответствовать, чтобы получить санкционированную обществом квалификацию. Оценка результатов тестирования в этом случае основывается на степени их близости к социально-психологическому нормативу для определённой образовательно-возрастной группы.

Также существует классификация тестовых норм в зависимости от широты охвата контингента. Выделяются:

Универсальные нормы определяются для широкого контингента лиц. Они мало зависят от таких социально-демографических признаков, как пол, возраст, уровень образования и т. п., различия в соответствии с этими признаками считаются статистически незначимыми (например, тестовые нормы для лиц обоих полов в возрасте от 16 до 60 лет).

Однако большинство психодиагностических методик по своему содержанию и назначению не претендуют на универсальность и не используют нормы, полученные на масштабных выборках. Во многих случаях более полезными бывают групповые нормы, соответствующие области практического применения методики.

Групповые нормы разрабатываются для групп людей, объединённых по какому-либо групповому статусу (полу, возрасту, уровню образования, профессиональной направленности и т. п.). К их числу относятся прежде всего:

  • возрастные нормы;

  • профессиональные;

  • национальные.

Самым распространённым вариантом групповых норм являются возрастные нормы, устанавливаемые для различных возрастных групп. Деление на группы по возрасту зависит от специфики возрастной динамики измеряемого психического свойства. Такие нормы рассчитываются отдельно для каждой возрастной группы тестируемых, что является фактически обязательным условием для тестов интеллекта – закономерное изменение нормативных показателей с возрастом служит одним из критериев валидности этих тестов.

Профессиональные нормы разрабатываются для представителей различных профессий и видов деятельности. Например, узкопрофильный тест может быть стандартизирован специально для таких групп, как «студенты медицинских вузов» или «руководители среднего звена». Минимальная выборка стандартизации для малочисленных профессиональных групп должна составлять около 100 человек. Использование нормативных групп менее 100 человек нежелательно из-за невозможности обеспечить статистически достоверные результаты и выводы.

Необходимость определения национальных норм более актуальна для многонациональных стран и связана с теми социальными (этническими, языковыми, религиозными и др.) традициями, под влиянием которых происходит развитие и формирование личности представителя конкретной народности, нации или культуры.

Для методик, применяющихся в клинической психодиагностике, иногда разрабатываются групповые нормы для отдельных контингентов больных (например, для детей с отклонениями в умственном развитии, депрессивных, неврастеничных пациентов).

Локальные нормы устанавливаются и применяются для узких категорий лиц в соответствии с конкретными целями тестирования. Например, нормы для отбора претендентов на конкретную работу в конкретной организации могут включать минимальное пороговое значение IQ или максимально допустимый уровень профессионального выгорания.

В практике тестирования персонала в крупных организациях могут использоваться корпоративные тесты и корпоративные нормативные группы. Корпоративную нормативную выборку формируют из числа протестированных работников или кандидатов и рассчитывают локальные тестовые нормы. Корпоративная нормативная группа должна включать не менее 100 сотрудников. Преимуществом использования корпоративной нормативной группы является бо́льшая простота и зачастую точность принятия решений по итогам тестирования (кандидат на должность сравнивается с результатами сотрудников, работающих на этой должности в данной организации). Основным недостатком использования корпоративных норм является риск неверной интерпретации абсолютного уровня результатов. Например, сотрудник, получивший высокий балл по шкале «конформность» относительно корпоративной нормативной выборки, может быть не столь конформным по сравнению с нормой для генеральной выборки, и его стандартизированный балл оказывается завышен из-за заниженности базы сравнения. Поэтому переход на корпоративные и иные локальные нормы рекомендуется производить путём сравнения с нормами, полученными разработчиком теста.

Помимо сравнения показателей с выборкой стандартизации тестовые баллы испытуемого могут сопоставляться с индивидуальной нормой. Такие ипсативные оценки нацелены на определение внутрииндивидуальных соотношений и не затрагивают различия межиндивидуальные. Ипсативные нормы предполагают сравнение выраженности тех или иных свойств относительно самого испытуемого. Например, в качестве меры мотивации к какому-либо виду деятельности могут рассматриваться временны́е и финансовые затраты. С точки зрения нормативного подхода приобретение дорогостоящего музыкального инструмента двумя индивидами означает равенство их мотивации, что может быть не так, поскольку при этом не учтён уровень их способностей и доходов. Одинаковые финансовые затраты состоятельного человека и студента музыкального учебного заведения могут трактоваться как свидетельство бо́льшей степени мотивации последнего. Во избежание такого рода ошибок показатель ипсатируется и мерой мотивации считается отклонение от среднего значения финансовых затрат данного индивида в различных видах деятельности.

Перечисленные виды норм не противоречат друг другу, а наоборот, взаимодополняют и обогащают интерпретацию результатов. Если методика сопровождается разными видами норм, это повышает её практическую ценность. Например, при использовании теста знаний можно установить позицию конкретного студента относительно других студентов (групповые нормы), уровень усвоения им знаний по данному предмету (предметно-ориентированные нормы), а также вероятность того, что он будет успешен в определённых видах профессиональной деятельности (критериальные нормы).

Алгоритм построения тестовых норм независимо от их вида включает следующие этапы: 1) формирование выборки стандартизации; 2) эмпирические процедуры установления стандартов; 3) фиксацию способов перехода (формулы или таблицы) к нормам. Формирование выборки стандартизации осуществляется из той популяции, на которой предполагается применение теста. Согласно существующим стандартам, нормативная выборка для любых тестов должна быть не менее 200 человек. При одинаковых объёмах стратифицированная (схожая по основным признакам с генеральной совокупностью) выборка более эффективна, чем рандомизированная. Переход к нормированным показателям основан на преобразовании сырых баллов в стандартную шкалу, ориентированную на эмпирически полученное при массовом тестировании распределение баллов в репрезентативной выборке стандартизации.

Тестовые нормы необходимы прежде всего для практического использования теста в диагностических целях, т. к. они определяют правила принятия практических решений. При применении теста для исследовательских целей корректнее использовать сырые показатели, не подвергнутые никаким преобразованиям.

При сравнении тестовых баллов с нормами следует учитывать относительность нормативных показателей. В различных выборках стандартизации человек может занимать разные позиции. Например, высокий балл испытуемого по показателю эмпатийности в возрастной нормативной выборке может быть эквивалентен среднему баллу при сравнении его с профессиональными психологами.

Нормативные данные могут варьироваться вследствие социальных, экономических и других факторов. Рестандартизация и построение тестовых норм для новой социокультурной или этнической популяции является одним из обязательных этапов адаптации теста.

Тестовые нормы должны периодически проверяться и в случае существенных изменений корректироваться. Рекомендуется обновлять нормы для тестовых методик каждые 5–7 лет, а для тестов интеллекта – каждые 3–5 лет.

Трухан Елена Антоновна Дата публикации:  20 октября 2022 г. в 17:27 (GMT+3)

Определение стандартизированного теста

Стандартизированный тест — это любая форма теста, которая (1) требует, чтобы все испытуемые ответили на одни и те же вопросы или на выбор вопросов из общего банка вопросов одинаковым образом, и что (2 ) оценивается «стандартно» или последовательно, что позволяет сравнивать относительную успеваемость отдельных учащихся или групп учащихся. Хотя различные типы тестов и оценок могут быть «стандартизированы» таким образом, этот термин в первую очередь связан с крупномасштабными тестами, проводимыми для больших групп учащихся, такими как тест с несколькими вариантами ответов, который проводится для всех восьмиклассников государственных школ. студенты в определенном государстве, например.

В дополнение к знакомому формату с несколькими вариантами ответов стандартизированные тесты могут включать вопросы типа «верно-неверно», вопросы с кратким ответом, вопросы-эссе или смешанные типы вопросов. Хотя стандартизированные тесты традиционно представлялись на бумаге и выполнялись с помощью карандашей, а многие до сих пор таковыми и являются, их все чаще проводят на компьютерах, подключенных к онлайн-программам (для соответствующего обсуждения см. Компьютерно-адаптивный тест). Хотя стандартизированные тесты могут иметь различные формы, форматы множественного выбора и «верно-ложно» широко используются для крупномасштабных ситуаций тестирования, поскольку компьютеры могут оценивать их быстро, последовательно и недорого. Напротив, открытые вопросы для эссе должны оцениваться людьми с использованием общего набора рекомендаций или критериев, чтобы обеспечить последовательную оценку от эссе к эссе — менее эффективный, более трудоемкий и дорогостоящий вариант, который также считается более субъективным.

. (Компьютерные системы, предназначенные для замены человека, в настоящее время разрабатываются различными компаниями; хотя эти системы все еще находятся в зачаточном состоянии, они, тем не менее, становятся предметом растущих национальных дебатов.)

В то время как стандартизированные тесты являются основным источником дебатов в Соединенных Штатах, многие эксперты по тестированию и преподаватели считают их справедливым и объективным методом оценки академических достижений учащихся, главным образом потому, что стандартизированный формат в сочетании с компьютеризированным подсчетом баллов снижает возможность фаворитизма, предвзятости или субъективных оценок. С другой стороны, субъективное человеческое суждение вступает в процесс тестирования на различных стадиях, например, при выборе и представлении вопросов или в предмете и формулировке как вопросов, так и ответов. Субъективность также вступает в процесс, когда разработчики тестов устанавливают проходные баллы — решение, которое может повлиять на то, сколько студентов сдали или не сдали экзамен, или на то, сколько из них достигли уровня успеваемости, который считается «высоким».

Более подробное обсуждение этих проблем см. в разделе Ошибка измерения, адаптация теста, систематическая ошибка теста и завышение оценок.

Стандартные тесты могут использоваться в самых разных образовательных целях. Например, они могут использоваться для определения готовности маленького ребенка к детскому саду, выявления учащихся, нуждающихся в услугах специального образования или специализированной академической поддержке, распределения учащихся по различным академическим программам или уровням курса, а также для выдачи дипломов и других сертификатов об образовании. Ниже приведены несколько репрезентативных примеров наиболее распространенных форм стандартизированных тестов:

  • Тесты достижений предназначены для измерения знаний и навыков, полученных учащимися в школе, или для определения академического прогресса, которого они добились за определенный период времени. Тесты также могут использоваться для оценки эффективности школ и учителей или для определения подходящего места в академической среде для учащегося, т. Е. Какие курсы или программы могут считаться наиболее подходящими или какие формы академической поддержки им могут понадобиться. Тесты достижений «обратны в прошлое» в том смысле, что они измеряют, насколько хорошо учащиеся усвоили то, что от них ожидалось.
  • Тесты способностей пытаются предсказать способность учащегося преуспеть в интеллектуальной или физической деятельности, например, оценивая математические способности, знание языка, абстрактное мышление, координацию движений или музыкальные способности. Тесты на способности являются «дальновидными» в том смысле, что они обычно пытаются спрогнозировать или предсказать, насколько хорошо учащиеся преуспеют в будущей образовательной или профессиональной среде. Тесты на способности часто вызывают споры, поскольку многие сомневаются в их прогностической точности и ценности.
  • Вступительные экзамены в колледж используются в процессе принятия решения о том, какие студенты будут допущены к университетской программе. Несмотря на то, что ведется много споров о точности и полезности вступительных тестов в колледжи, и многие высшие учебные заведения больше не требуют от абитуриентов их прохождения, тесты используются как индикаторы интеллектуального и академического потенциала, и некоторые могут считать их прогнозирование того, насколько хорошо кандидат будет учиться в программе послесреднего образования.
  • Международные сравнительные тесты периодически проводятся среди репрезентативных выборок учащихся в ряде стран, включая Соединенные Штаты, с целью мониторинга тенденций успеваемости в отдельных странах и сравнения успеваемости по странам. Несколько широко используемых примеров международных сравнительных тестов включают Программу международной оценки учащихся (PISA), Прогресс в международном исследовании грамотности чтения (PIRLS) и Тенденции в международном исследовании математики и естественных наук (TIMSS).
  • Психологические тесты , включая тесты IQ, используются для измерения когнитивных способностей человека и его умственных, эмоциональных, связанных с развитием и социальных характеристик. Подготовленные специалисты, такие как школьные психологи, обычно проводят тесты, которые могут потребовать от учащихся выполнения ряда задач или решения ряда проблем. Психологические тесты часто используются для выявления учащихся с ограниченными возможностями обучения или другими особыми потребностями, которые позволяют им получить специализированные услуги.

Реформа

В соответствии с целым рядом законов штатов и федеральных законов, политик и постановлений, направленных на повышение успеваемости школ и учителей, стандартизированные тесты успеваемости становятся все более заметной частью государственного школьного образования в Соединенных Штатах. Когда основное внимание уделяется реформированию школ и повышению успеваемости учащихся, стандартизированные тесты используются несколькими основными способами:

  • Для привлечения школ и преподавателей к ответственности за результаты обучения и успеваемость учащихся. В этом случае тестовые баллы используются как мера эффективности, а низкие баллы могут вызвать различные последствия для школ и учителей.
    Для более подробного обсуждения см. тест с высокими ставками.
  • Чтобы оценить, усвоили ли учащиеся то, что от них ожидается , например, соответствуют ли они государственным стандартам обучения. В этом случае результаты тестов рассматриваются как репрезентативный показатель успеваемости учащихся.
  • Для выявления пробелов в обучении и успеваемости учащихся. В этом случае результаты тестов могут использоваться вместе с другой информацией об учащихся для диагностики потребностей в обучении, чтобы преподаватели могли предоставить соответствующие услуги, инструкции или академическую поддержку.
  • Для выявления пробелов в успеваемости среди различных групп учащихся , включая цветных учащихся, учащихся, не владеющих английским языком, учащихся из малообеспеченных семей и учащихся с физическими недостатками или нарушениями обучаемости. В этом случае выявление и выявление пробелов в успеваемости можно рассматривать как важный первый шаг в усилиях по обеспечению хорошего образования всех учащихся, что может привести к повышению осведомленности общественности и изменениям в политике и программах в области образования.
  • Чтобы определить, работают ли образовательные политики должным образом. В этом случае выборные должностные лица и лица, определяющие политику в области образования, могут полагаться на результаты стандартизированных тестов, чтобы определить, работают ли их законы и политика, или сравнить результаты обучения в разных школах или от штата к штату. Они также могут использовать результаты, чтобы убедить общественность и других выборных должностных лиц в том, что их политика отвечает интересам детей и общества.

Дебаты

В то время как дебаты о стандартизированном тестировании носят широкий спектр, нюансированный и иногда эмоциональный характер, многие дебаты, как правило, сосредоточены на способах использования тестов и на том, представляют ли они надежные или ненадежные оценки обучения учащихся, а не чем о том, является ли стандартизированное тестирование хорошим или плохим по своей сути (хотя, безусловно, на эту тему также ведутся споры). Большинство разработчиков тестов и экспертов по тестированию, например, предостерегают от использования результатов стандартизированных тестов в качестве исключительного показателя успеваемости, хотя многие также утверждают, что результаты тестов могут быть ценным показателем успеваемости, если их использовать надлежащим образом и разумно. Вообще говоря, стандартизированное тестирование с большей вероятностью станет предметом дискуссий и споров, когда результаты тестов используются для принятия последовательных решений об образовательной политике, школах, учителях и учениках. Тесты с меньшей вероятностью будут спорными, когда они используются для диагностики потребностей в обучении и предоставления учащимся более качественных услуг, хотя линия, разделяющая эти две цели, на практике, как известно, нечеткая (поэтому продолжаются дебаты).

Хотя исчерпывающее обсуждение дебатов о стандартизированном тестировании выходит за рамки этого ресурса, следующие вопросы иллюстрируют некоторые из основных вопросов, обычно обсуждаемых и обсуждаемых в Соединенных Штатах: показатели обучения учащихся, поскольку стандартизированные тесты могут оценивать только узкий диапазон достижений с использованием изначально ограниченных методов? Или баллы предоставляют точные, объективные и полезные доказательства успеваемости школы, учителя или ученика? (Стандартные тесты не измеряют все, что учащиеся должны изучить в школе. Например, тест с 50 вопросами с несколькими вариантами ответов не может измерить все знания и навыки, которые учащийся получил или должен освоить в школе. конкретной предметной области, что является одной из причин, по которой некоторые педагоги и эксперты предостерегают от использования результатов стандартизированных тестов в качестве единственного показателя успеваемости и успеха в учебе.)

  • Являются ли стандартизированные тесты справедливыми по отношению ко всем учащимся, потому что каждый учащийся сдает один и тот же тест и оценивается одинаково? Имеют ли тесты врожденные предубеждения, которые могут поставить в невыгодное положение определенные группы, такие как цветные учащиеся, учащиеся, незнакомые с американскими культурными традициями, учащиеся, не владеющие английским языком, или учащиеся с ограниченными возможностями, которые могут повлиять на их успеваемость?
  • Дает ли использование стандартизированных тестов ценную информацию, которую преподаватели и школьные руководители могут использовать для повышения качества обучения? Действительно ли повсеместное чрезмерное использование тестирования отнимает ценное учебное время, которое можно было бы лучше потратить на обучение студентов большему содержанию и навыкам?
  • Превышают ли преимущества стандартизированного тестирования — согласованные данные об успеваемости учащихся и школ, которые можно использовать для информирования об усилиях по улучшению школ и преподавания — затраты — деньги, потраченные на разработку тестов и анализ результатов, учебное время, которое учителя тратят на подготовку? студенты или время, которое студенты тратят на сдачу теста?
  • Дают ли, например, результаты тестов по математике и чтению полную и точную картину успеваемости школы, учителей и учеников? Стандартизированные тесты слишком узко фокусируются на нескольких академических предметах?
  • Не приводит ли узкий диапазон академического содержания, оцениваемого стандартизированными тестами, к тому, что учителя слишком много внимания уделяют подготовке к экзаменам и нескольким учебным предметам (практика, известная как «преподавание перед тестом») в ущерб другим полезным образовательным занятиям, таким как искусство , музыка, здоровье, физкультура или 21 век навыков, например?
  • Удерживают ли стандартизированные тесты и последствия низких результатов школы, преподавателей и учащихся более высокие стандарты и улучшают ли они качество государственного образования? Создают ли тесты условия, которые подрывают эффективное образование, такие как мошенничество, нездоровые формы конкуренции или несправедливо негативное восприятие государственного школьного образования?
  • Должны ли некоторые из наиболее важных решений в сфере государственного образования — например, сократить или увеличить финансирование школы или уволить учителей и директоров — полностью или преимущественно на основе результатов тестов? Являются ли баллы стандартизированных тестов, которые потенциально могут вводить в заблуждение или быть неточными, слишком ограниченной мерой, чтобы использовать ее в качестве основы для таких последовательных решений?
  • Глоссарий образовательной реформы Great Schools Partnership находится под лицензией Creative Commons Attribution-NonCommercial-ShareAlike 4. 0 International License.

    Что такое стандартизированные тесты и зачем они нужны?

    Немногие образовательные темы так раздражают родителей, учителей и руководителей школ, как дискуссии об использовании результатов тестов учащихся для измерения качества государственных систем образования, округов, школ, а иногда даже учителей. Но что такое стандартизированные тесты , для чего они используются и почему их так много?


    Что делает тест «стандартизированным»?

    Тест стандартизирован, когда все учащиеся, сдающие тест, должны ответить на один и тот же набор тщательно отобранных вопросов. Это позволяет людям, которые смотрят на результаты, сравнивать группы студентов. Вопросы в этих тестах, как правило, представляют собой множественный выбор или ответы «верно-ложно», потому что это повышает шансы на то, что результаты будут честными и объективными, с меньшей вероятностью предвзятости или фаворитизма при оценке ответов.

    Процесс создания стандартизированного теста и интерпретации результатов требует большого количества различных знаний в области учебной программы, развития ребенка, культурных и языковых различий, статистики и области исследования, называемой психометрией.


    Почему учащиеся должны сдавать так много тестов?

    Если подумать, стандартные тесты уже давно стали частью нашей жизни. Когда вы ведете ребенка к врачу, он оценивает его здоровье, используя «стандартизированный» контрольный список: каков вес ребенка по сравнению с другими людьми того же возраста и соответствуют ли они основным этапам развития? Когда вы подаете заявление на получение водительских прав, ваше государственное бюро транспортных средств требует, чтобы вы прошли стандартный тест, чтобы проверить, знаете ли вы правила дорожного движения. Когда вы подаете заявление на получение гражданства, вы проходите стандартный тест, чтобы узнать, понимаете ли вы основы американского управления.

    Точно так же стандартизированные тесты чрезвычайно полезны для преподавателей и их учебных заведений для оценки успеваемости и удовлетворения потребностей учащихся. Например, в половине штатов США требуется тест на готовность к детскому саду. Когда студенты подают заявление в колледж, они обычно сдают ACT или SAT (хотя некоторые колледжи в настоящее время отказываются от этого требования, чтобы сделать прием более справедливым). Если вы хотите поступить в юридическую школу, вы сдаете LSAT. Если вы хотите поступить в медицинскую школу, вы сдаете MCAT. Есть даже тест под названием PISA, которым пользуются 79 человек.странах, что позволяет сравнивать национальные системы образования. (В 2018 году США заняли 13-е место по чтению и 36-е по математике.)

    Однако хорошего может быть слишком много, включая слишком много тестов. Это потому, что оценки, которые ваш ребенок получает в течение учебного года, служат разным целям. Например, учитель может провести тест по обществознанию, чтобы узнать, усвоили ли ученики материал, который он преподает в этом разделе; это позволяет ему проверить, есть ли необходимость в обзоре. Директор может решить протестировать всех учеников в классе, если у них наблюдается более низкий уровень знаний по математике; это позволяет ей убедиться, что учебные материалы работают или учителям требуется дополнительная подготовка. Некоторые школьные округа несколько раз в год используют стандартные диагностические тесты, чтобы узнать, что изучают отдельные учащиеся, например тесты MAP NWEA или тесты iReady Curriculum Associates. Кроме того, федеральный закон требует, чтобы штаты раз в год проводили тестирование учащихся 3–8 классов по чтению и математике, а также один раз в средней школе.


    Почему федеральное правительство участвует в стандартизированных тестах?

    Хотя в Америке есть несколько замечательных школ, мы долгое время боролись за повышение уровня успеваемости. В 1983 году двухпартийная группа педагогов и чиновников написала отчет под названием «Нация в опасности», в котором отмечалось: «Если бы недружественная иностранная держава попыталась навязать Америке посредственные образовательные показатели, существующие сегодня, мы вполне могли бы рассматривать это как акт войны».

    Мало что изменилось. Том Лавлесс, эксперт в области образования, говорит: «Что меня удивляет, так это то, насколько стабильны результаты США [в PISA]. Оценки всегда были посредственными».

    Еще один стандартизированный тест, проводимый для репрезентативных групп учащихся (называемый Национальной оценкой успеваемости или «Национальным табелем успеваемости»), показал, что две трети детей не умеют читать.

    Отставание Америки от других стран первого мира побудило федеральное правительство ввести обязательные стандартизированные тесты для улучшения преподавания и обучения. Закон 1965 года под названием «Закон о начальном и среднем образовании» (ESEA), который связывал дополнительное финансирование учащихся из неблагополучных семей с соблюдением требований государства, был повторно утвержден в 2003 году как Закон «Ни одного отстающего ребенка» (NCLB). Чтобы штаты имели право на это дополнительное федеральное финансирование, они должны были ежегодно оценивать обучение учащихся с помощью стандартизированных тестов (3-8 классы и один раз в средней школе). Они также должны были сообщать результаты тестов исторически игнорируемых групп, таких как учащиеся с ограниченными возможностями, изучающие английский язык и дети с низким доходом. Каждая группа, а также школы, округа и штаты должны были соответствовать критерию под названием «Адекватный годовой прогресс» или AYP.


    Почему стандартные тесты вызывают такие споры?

    Раньше они не вызывали споров! Но они стали таковыми, когда вмешалось федеральное правительство, и американские педагоги и лидеры стали беспокоиться о колледже и готовности выпускников средней школы к карьере.

    Многие указывают на то, что программа «Ни один ребенок не останется без внимания» стала моментом, когда стандартизированные тесты стали спорными. Иногда прозрачность причиняет боль — например, результаты тестов быстро показали огромный разрыв в уровне владения языком между цветными учащимися и их белыми сверстниками.

    В ответ мы стали более серьезно относиться к успеваемости учащихся и разрыву в успеваемости между богатыми и бедными детьми, черными и белыми детьми. Вместо того, чтобы просто хранить результаты, штаты начали использовать результаты тестов для оценки качества школ, округов, государственных департаментов образования и даже учителей. Это привело к ряду вопросов:

    • Почему эта школа выпускает детей, которые плохо успевают по математике, в то время как ученики этой другой школы являются математическими волшебниками?
    • Виноваты учебники?
    • Это директор?
    • Поддерживает ли одна школа учителей лучше, чем другая?
    • Есть ли в одной школе больше бездомных учеников, больше учеников с ограниченными возможностями или больше изучающих английский язык?

    В некоторых случаях учителя и администраторы чувствовали себя несправедливо атакованными. Иногда родители были к несчастью удивлены, увидев, что их дети не учатся так много, как они думали. Может сложиться мнение — иногда верное, — что стандартные тесты используются для несправедливого наказания любимых учителей или администраторов или что результаты тестов лишают учащихся желанных возможностей, таких как поступление в специализированные школы или программы.

    Примером чрезмерно навязчивого характера NCLB была абсурдно амбициозная цель достичь 100% успеваемости к 2013-2014 учебному году. В ответ штаты снизили стандарты и упростили сдачу тестов, чтобы они по-прежнему получали федеральное финансирование. Кроме того, NCLB предъявлял нереалистичные требования к школам, обслуживающим сообщества с высокими потребностями, и привел к тому, что многие педагоги назвали токсичной культурой подготовки к экзаменам по принципу «тренируй и убивай», которая лишала школу и обучение большей части удовольствия.

    По этим и другим причинам в 2015 году закон был повторно принят, и закон «Ни одного отстающего ребенка» стал Законом об успехах каждого учащегося, который упростил роль федерального правительства, убрав ежегодные контрольные показатели и предоставив штатам гибкость в принятии решений о том, как нести ответственность. .

    Но штаты по-прежнему должны делиться с общественностью результатами тестов отдельных округов и школ, чтобы пролить свет на то, в каких школах учащиеся учатся правильно, а в каких школах не хватает результатов. Есть надежда, что с помощью этой информации мы сможем повысить уровень успеваемости по всей стране, особенно для учащихся, которые исторически плохо обслуживались.


    Являются ли стандартные тесты расистскими?

    Америка страдает от структурного неравенства, и одним из самых опасных и распространенных неравенств является расизм, который просачивается во все аспекты жизни, от плохо обслуживаемых домов до некачественного медицинского обслуживания, отсутствия продовольственной безопасности и сокращения ресурсов для школ, обслуживающих учащихся. цвета. Стандартные тесты ничем не отличаются: например, сто лет назад американский психолог по имени Льюис Терман ошибочно и оскорбительно утверждал, что I.Q. тесты показали, что афроамериканцы, испано-индейцы и мексиканцы не так умны, как белые.

    Есть и другие причины, по которым тесты могут быть необъективными. В 1990-х годах был известный пример, когда в вопросе SAT предлагалась лучшая аналогия между «бегуном» и «марафонцем». Ответом были слова «гребец» и «регата» — лексика, знакомая только богатым подросткам. Это был яркий пример социально-экономической предвзятости.

    Но стандартизированные тесты также могут помочь преодолеть врожденную предвзятость. Когда восприятие учителя является единственным критерием доступа учащихся к программам для одаренных и талантливых, чернокожих и коричневых учеников можно не заметить. Исследования показывают, что, когда вместо этого используется стандартизированное тестирование, для ускоренного обучения отбирается больше цветных учащихся.

    Тем временем тестирующие компании инициировали программы по созданию тестов и учебных материалов, учитывающих культурные, расовые и социально-экономические особенности. Например, в 2021 году компания Pearson, крупный издатель учебников и поставщик стандартизированного тестирования, опубликовала редакционные правила, касающиеся расы, этнической принадлежности, равенства и инклюзивности.

    Стандартизированные тесты действительно могут увековечить расовое неравенство и системные расовые предубеждения. Но без них мы во власти субъективных оценок. Вот почему Национальная городская лига возглавила коалицию групп защиты гражданских прав, социальной справедливости, прав инвалидов и образования, чтобы призвать министра образования США Мигеля Кардону требовать от штатов соблюдения своих графиков стандартизированного тестирования во время пандемии коронавируса. Они написали,

    Чтобы понять последствия кризиса COVID-19 и гарантировать, что эта пандемия не подорвет будущее учащихся по всей стране, мы должны собрать точные, объективные и сопоставимые данные, которые говорят о качестве образования в данный момент, включая данные из общегосударственных оценок.


    Какое отношение стандартные тесты имеют к гражданским правам?

    Гражданские права уже давно сосредоточены на вопросах справедливости и равенства. В мире образования равенство означает, что существуют системы, гарантирующие каждому ребенку равные шансы на успех, независимо от дохода его семьи или цвета кожи.

    Есть много способов убедиться, что эти стремления остаются нереализованными. Но стандартизированные результаты тестов являются одним из самых четких и убедительных индикаторов, которые защитники гражданских прав могут использовать, чтобы показать вопиющее неравенство в нашей нынешней системе образования.

    Один пример: Отчет Brightbeam показал, что в Сан-Франциско 70% белых учащихся хорошо разбираются в математике, по сравнению с 12% чернокожих учащихся, то есть разрыв в 58 баллов. Эта модель — белые учащиеся значительно превосходят чернокожих — широко распространена во многих частях страны и подчеркивает стоящую перед Америкой задачу повышения успеваемости и обеспечения справедливости в наших школах.

    Если вы хотите увидеть пробелы в том, как ваш штат и/или город обслуживает учащихся разных рас, посетите веб-сайт Why Proficiency Matters, простой онлайн-инструмент для выявления расовых пробелов в знаниях (иногда называемых «пробелами в достижениях»).

    Чтобы сузить эти огромные различия, нам нужны стандартизированные оценки. Они обеспечивают четкий способ измерения того, насколько хорошо наши школьные системы обслуживают детей, подвергающихся наибольшему риску. Информация, которую мы получаем из этих тестов, дает штатам и школьным округам данные, необходимые им для создания более справедливых систем.

    Эта практика соответствует целям движения за гражданские права: предоставить всем учащимся равные возможности для получения образования и защиту в соответствии с законом, независимо от расы, религии или уровня дохода. Вот почему все, от этой учительницы из Кентукки до Мишель Обамы и президентов Буша, Обамы и Трампа, называют образование самым важным вопросом гражданских прав нашего времени.


    Почему федеральное правительство хочет, чтобы мы тестировали каждые ребенок? Разве мы не можем просто протестировать выборку детей, чтобы посмотреть, как дела в школьном округе?

    Мы уже делаем это с помощью так называемой «Национальной табели успеваемости», которая раз в два года выдается выборке учащихся в каждом штате. Это очень полезно! Но дети, не прошедшие тестирование в NAEP, могут провалиться, а NAEP не дает нам подробной информации об уровне знаний отдельного учащегося, которую можно получить из более целенаправленных и инклюзивных тестов.

    Важно отметить, что NAEP не имеет последствий для плохой работы. Он предназначен для измерения общего академического здоровья нашей страны, от штата к штату. Это гарантирует, что результаты являются подлинными и сопоставимыми.

    Итак, как мы можем убедиться, что штаты и округа действительно работают над улучшением образования, которое они предоставляют учащимся с недостаточным уровнем обслуживания? Вот где в дело вступает федеральное правительство. В конце концов, наш действующий национальный закон об образовании называется «Закон об успехе каждого учащегося», а не «Закон об успехе некоторых учащихся». Согласно этому закону, если в штате слишком много учащихся, не отвечающих ожиданиям по математике или чтению, то федеральное правительство требует от этого штата определить округа, школы и определенные группы учащихся, которым требуется дополнительная поддержка.

    Если бы штаты тестировали только часть детей, не было бы надежного способа определить, какие школы и районы нуждаются в улучшении. Что еще более важно, не было бы надежного способа определить, какие маргинализированные группы учащихся не получают того уровня поддержки и обучения, который необходим им для процветания. Вот почему каждый штат должен ставить перед учащимися амбициозные цели для академического роста — даже для самых отстающих — и сообщать о прогрессе, достигнутом в достижении этих результатов, с разбивкой по расе, доходу и инвалидности.

    И как идентифицируются эти школы, районы или группы учащихся? С помощью стандартных тестов. Конечно, ни один тест не идеален. Но при взгляде на огромную систему можно увидеть только общие тенденции. Легко сказать: «Все наши дети в порядке», даже если некоторые из них — нет.


    Можем ли мы действительно доверять этим тестам, чтобы дать точную оценку обучения учащихся?

    Ни один тест не может измерить уровень знаний одного учащегося по математике и чтению. Это никогда не было претензией, и именно поэтому мы, например, не используем стандартизированные оценки штата для оценок в табелях успеваемости вашего ребенка. Но эти тесты могут рассматривать различные группы учащихся в школе и помочь школьным руководителям узнать, какие учащиеся испытывают трудности или необходимо внести изменения в обучение.

    В мире образовательной политики эта идея требовать от школ вносить улучшения, когда данные стандартизированного тестирования показывают, что они неэффективны, называется «подотчетностью». И это жизненно важный компонент гражданских прав. Мы должны признать проблему, а затем принять меры, говорите ли вы о Розе Паркс, сидящей в автобусе только для белых, или об активистах образования в Нэшвилле, которые решают проблему неграмотности, когда семь из десяти третьеклассников не умеют читать. на уровне класса.

    Допустим, начальная школа вашего ребенка сдает всем пятиклассникам государственный тест по чтению и обнаруживает, что эта группа успевает хуже, чем пятиклассники прошлого года. Это потому, что в этом году больше учеников с ограниченными возможностями обучения? Было ли слишком много снежных дней? Разве школьный округ только что внедрил новую программу чтения, которая, возможно, замедляет успеваемость? Учителя не получают столько рекомендаций, сколько в предыдущие годы? Увеличила ли школа размер классов в прошлом году, чтобы учащиеся не получали больше внимания?

    Результаты стандартизированных тестов могут сузить круг причин и, таким образом, указать педагогам на правильные решения. Без теста учителя и родители не узнали бы о наличии проблемы. Если вы не можете распознать проблему, вы не можете ее решить.

    Как объясняет Катрина Миллер из Educational Partnerships,

    Мы должны преодолеть страх перед данными в образовании. Наличие как можно большего количества надежных данных только помогает нам лучше понять потребности учащихся. Врачи назначают полный анализ крови для проверки, чтобы иметь представление о том, как работает вся человеческая система. Нам нужно такое же мышление в образовании.


    Я доверяю учителю моего ребенка знать, когда у моего ребенка проблемы. Зачем напрягать его тестом?

    Наши преподаватели определенно хорошо чувствуют прогресс учащихся. Но преподавателям приходится работать в гораздо более крупной системе, которую они не могут контролировать. Очень трудно заставить крупные учреждения, такие как школьные округа или даже отделы образования штатов, внести изменения, особенно когда эти же учреждения на протяжении поколений недостаточно обслуживали одни и те же группы детей. Для изменения этих систем требуются достоверные статистические данные, предоставляемые стандартизированными тестами.

    Улучшение систем требует тяжелой работы. И даже несмотря на то, что с вашим ребенком может быть все в порядке, многое зависит от наших национальных усилий по повышению уровня академической успеваемости учащихся, которые долгое время не удавались в наших школах.


    Какое влияние оказала пандемия COVID-19 на стандартизированное тестирование?

    Многие согласны с тем, что заставлять детей сдавать анализы в чумной год было бы бессмысленно и даже жестоко. Действительно, в начале пандемии администрация Трампа разрешила штатам отказаться от всех весенних стандартизированных тестов на 2020 год. 

    В следующем году многие ожидали, что администрация Байдена сделает то же самое, поскольку большое количество учеников по-прежнему обучалось дистанционно, а школы весь год с трудом успевали за темпами обучения. Однако администрация Байдена прислушалась к опасениям групп по гражданским правам и образовательной справедливости, потребовав, чтобы штаты продолжали тестирование, именно потому, что это был такой сложный год, и так много детей отстали бы.

    Однако штаты получили огромную гибкость в том, как и кого они тестируют в 2021 году, так что, по правде говоря, мы теряем данные за два года. Это, без сомнения, создает огромные препятствия для округов, стремящихся диагностировать эффективность своих школ и учебных программ, и удаляет важнейший инструмент из набора инструментов защиты интересов сектора гражданских прав.


    Какие есть возможности для активности?

    • ПОНИМАЙТЕ, какие тесты сдают дети и почему.

    Станьте информированным потребителем. Информация – это сила. Для эффективной защиты вы должны понимать цель конкретных тестов и то, как ваша школа будет использовать их результаты. Это обучение вождению? Это для измерения тенденций состояния? Это для выполнения федеральных норм?

    В соответствии с Американским планом спасения администрации Байдена штаты разделят 125 миллиардов долларов на школы K-12, чтобы помочь учащимся наверстать упущенное после года закрытия школ. Одним из обязательных условий является то, что ваш штат должен разработать план оценки успеваемости учащихся в течение этого пандемического года. Не скрыться от потери обучения! Нам нужны данные для создания планов, которые помогут справиться с кризисом. Так что идите на собрания школьного совета и пишите или звоните своим законодателям, требуя, чтобы план оценки вашего штата на 2021 год — будь то использование замещающих тестов, отсрочка обычных государственных тестов или использование сокращенных версий тестов — выполнялся добросовестно, с акцентом на обслуживание студентов и семей, а также бесстрашный поиск точной информации.

    • ПОДЕЛИТЕСЬ сообщением о том, что стандартизированное тестирование помогает защищать гражданские права.

    Даже если вас не волнует успеваемость вашего ребенка, помните, что без стандартизированного тестирования мы не смогли бы измерить пробелы в знаниях, которые выявляют огромное неравенство в нашей системе государственного образования. Наши школы не в состоянии справедливо обслуживать большие группы детей; в этом смысле поддержка стандартизированного тестирования является частью работы по обеспечению справедливости в отношении детей. Предпримите инициативы, чтобы повысить уровень комфорта вашего сообщества с тестированием и их пониманием его важной роли в продвижении образовательной справедливости.

    • ПОДДЕРЖИВАЙТЕ свой штат, округ или школу, чтобы сделать стандартизированное тестирование лучше.

    Нынешние стандартизированные тесты, жизненно важные для устранения пробелов в обучении, застряли в каменном веке.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *