Надёжность психологического теста — Психологос
Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям измерения. Различают два вида надёжности — надёжность как устойчивость и надёжность как внутреннюю согласованность.
Надёжность как устойчивость
Устойчивость результатов теста – возможность получения одинаковых результатов у испытуемых в различных случаях.
Устойчивость определяется с помощью повторного тестирования (ретеста):
В данном методе предлагается провести несколько замеров с некоторым промежутком времени (от недели до года) одним и тем же тестом. Если корреляция между результатами различных замеров будет высокой, следовательно, тест достаточно надежный. Однако надежность не всех тестов можно проверять этим методом, так как оцениваемое качество, явление или эффект могут быть сами по себе нестабильны (например, наше настроение, которое может меняться от одного замера к следующему). Еще один недостаток МР – это эффект привыкания. Испытуемые уже знакомы с этим тестом, а может быть, даже помнят большую часть своих ответов после предыдущего заполнения.
Надёжность как внутренняя согласованность
Внутренняя согласованность определяется связью каждого конкретного элемента теста с общим результатом, тем, насколько каждый элемент входит в противоречие с остальными, насколько каждый отдельный вопрос измеряет признак, на который направлен весь тест.
Для проверки внутренней согласованности применяются:
- Метод расщепления или метод автономных частей
- Метод эквивалентных бланков
- Альфа Кронбаха
Метод расщепления (Split-half reliability)
Этот метод заключается в расщеплении/разделении теста на две равные части (например, четные и нечетные вопросы, первая и вторая половина), а затем находится корреляция между ними. Если корреляция высокая, тест можно считать надежным.
Метод эквивалентных бланков
МЭБ состоит в применении двух сопоставимых друг с другом форм теста для большой выборки (например, формы L и M для измерения в шкале интеллекта Стэнфорда-Бине)
Результаты, полученные при выполнении двух форм, сравнивают и высчитывают корреляцию. Если коэффициент корреляции высокий, следовательно, тест надежен. Недостаток этого метода в том, что он подразумевает такой длительный и трудоемкий процесс, как создание двух эквивалентных форм.
Альфа Кронбаха
В этом методе, предложенном Ли Кронбахом, сравнивается разброс каждого элемента с общим разбросом всей шкалы. Если разброс результатов теста меньше, чем разброс результатов для каждого отдельного вопроса, следовательно, каждый отдельный вопрос направлен на исследование одного и того же признака, свойства или явления. Они вырабатывают значение, которое можно считать истинным. Если такое значение выработать нельзя, то есть получается случайный разброс при ответе на вопросы, тест не надежен и коэффициент альфа Кронбаха будет равен 0. Если же все вопросы измеряют один и тот же признак, то тест надежен и коэффициент альфа Кронбаха в этом случае будет равен 1.
Помимо надежности тестов, есть также надежность наблюдения – межнаблюдательская надежность. МН – это процент совпадения результатов наблюдения экспертов друг с другом.
Надежность и валидность
Надежность показывает, что результаты проводимого исследования близки к истине, а валидность показывает, что результаты действительно относятся к тому явлению, которое изучается исследователем. Валидное исследование автоматически является надежным, однако обратное следствие не обязательно. Надежное исследование может и не быть валидным.
Что такое надежность в психологии и почему это важно? • BUOM
1 июля 2021 г.
Исследователи используют множество методов для оценки и повышения надежности своей работы и постоянно переоценивают свои процессы для обеспечения эффективности. Надежность в психологии помогает исследователям последовательно проводить тесты и исследования. Если вы хотите, чтобы результаты ваших исследований и психологических тестов были более надежными, вы можете узнать больше о надежности в психологии. В этой статье мы обсудим, что такое надежность в психологии, почему это важно, методы, которые исследователи используют для оценки надежности тестов и исследований, а также советы по повышению надежности в вашей собственной работе.
Что такое надежность в психологии?
Надежность в психологии — это последовательность выводов или результатов психологического исследования. Если выводы или результаты остаются одинаковыми или похожими при нескольких попытках, исследователь часто считает их надежными. Поскольку обстоятельства и участники могут меняться в ходе исследования, при проведении оценок исследователи обычно учитывают корреляцию, а не точность. Они считают тест или исследование надежным, если замечают высокую положительную корреляцию между результатами и выводами.
Надежность отличается от валидности, аналогичная концепция часто сочетается с надежностью, когда исследователи оценивают свою работу. В то время как надежность относится к способности повторять тест или исследование и каждый раз получать почти одинаковые результаты, валидность включает в себя то, насколько хорошо метод исследования измеряет поведение, которое, как утверждает исследователь, он делает. Надежность и валидность играют важную и взаимосвязанную роль в получении точных ресурсов, но они требуют отдельных оценок, поскольку одно может быть очевидным без другого.
Программы для Windows, мобильные приложения, игры — ВСЁ БЕСПЛАТНО, в нашем закрытом телеграмм канале — Подписывайтесь:)
Пример: Доктор Джонс оценил разработанный им тест, применяя его к новой группе участников. Он отметил высокую положительную корреляцию между результатами первой тестовой группы и результатами второй, поэтому сделал вывод о достоверности теста. Он также точно измерил, как поведенческая психология влияет на людей на рабочем месте, как он и предполагал при ее создании. Это также делает тест действительным.
Почему надежность важна в психологии?
Надежность важна, потому что она определяет ценность психологического теста или исследования. Если результаты теста остаются стабильными, когда исследователи проводят исследование, его надежность обеспечивает ценность для области психологии и других областей, в которых он имеет значение, таких как образование или бизнес. Низкая надежность предупреждает исследователей о том, что они должны изменить определенные аспекты своего текущего теста или исследования или провести новый тест, чтобы повысить его ценность.
Способы оценки надежности в психологических исследованиях и тестировании
Вот несколько методов, которые исследователи используют для оценки надежности своих исследований и тестов:
Внутренняя надежность
Внутренняя надежность относится к тому, насколько хорошо ресурс поддерживает согласованность внутри себя. Для измерения внутренней надежности, которая применяется конкретно к тестам, исследователи часто используют метод разделения пополам. Этот процесс включает в себя разделение теста пополам перед его проведением участнику и сравнение результатов каждой половины. Если исследователь обнаруживает, что каждая часть теста дает одинаковые результаты, тест имеет внутреннюю надежность. Исследователи могут разделить тест пополам, используя несколько методов, таких как разделение первой и второй половины, группировка случайных вопросов или разделение вопросов с четными и нечетными номерами.
Пример. Доктор Смит создал экзамен по определенной психологической концепции для студентов своего колледжа. Тест содержал 100 вопросов по одной и той же теме. Чтобы оценить надежность теста, он разделил его на две части и дал половине студентов первую половину теста, а другой половине студентов вторую половину теста. Обе группы студентов показали одинаковые результаты, что подтверждает надежность экзамена.
Внешняя надежность
Внешняя надежность — это способность теста давать одинаковые результаты как с течением времени, так и от каждого человека, который его проходит. Он включает в себя два метода: тест-ретест и межрейтинговый. Тест-ретест измеряет, насколько хорошо тест остается стабильным после многократного использования. Если тест остается стабильным, он сохраняет свою надежность. Надежность между оценщиками, известная как надежность между наблюдателями при измерении надежности научных исследований, проверяет, записывают ли разные оценщики или наблюдатели одни и те же данные на основе протокола определенного теста или исследования.
Пример: Бетти, Рон и Джейн — судьи по гимнастике. Поскольку мнения о выступлениях гимнасток различаются, они используют стандартизированную систему подсчета очков, чтобы гарантировать, что они выносят оценки, используя один и тот же протокол. Если система показывает, что судьи используют и интерпретируют данные сходным образом, система подсчета баллов имеет межэкспертную надежность.
Советы по повышению надежности психологических исследований и тестов
Исследователи используют результаты оценок для повышения надежности своих тестов и исследований. Вот несколько советов, которые вы можете использовать, чтобы повысить надежность ваших собственных ресурсов по психологии:
Определитесь с методом измерения
Тест требует определенной методики измерения, чтобы оценить его надежность. При выборе типа измерения вы можете рассмотреть существующие методы или создать свои собственные. Исследователи часто выбирают существующие методы, которые использовали другие исследователи, потому что это экономит их время и усилия, необходимые для разработки собственных. Другие, однако, предпочитают создавать собственные методики измерений, более точно отражающие цель и задачу их работы, или тестировать новый процесс. Например, определите, хотите ли вы использовать такие методы, как межрейтинговый, тест-ретест или другие методы.
Постоянно измеряйте свои исследования
Исследователи-психологи, которые вносят продолжительный вклад в эту область, часто разрабатывают исследования и процедуры тестирования, которые подвергаются строгой и последовательной оценке, прежде чем их коллеги признают их ценными. Рассмотрите возможность создания процедуры для оценки надежности ваших ресурсов. Например, оценка ваших исследований после каждого использования в разных средах может помочь вам найти любые потенциальные недостатки и быстро устранить их для повышения надежности.
Будьте внимательны к среде тестирования
Внешние факторы, такие как среда тестирования или исследования, могут повлиять на результаты, что также может повлиять на надежность. Например, работа или тестирование в местах с отвлекающими факторами или высокой или низкой температурой могут повлиять на способность человека концентрироваться и использовать учебные ресурсы по назначению. Стрессовые ситуации также могут исказить данные. Отметив эти обстоятельства, вы сможете определить, как они влияют на надежность вашего психологического теста или исследования.
Что такое надежность в психологии и почему это важно?
Обновлено 10 марта 2023 г.
Исследователи используют множество методов для оценки и повышения надежности своей работы и постоянно переоценивают свои процессы для обеспечения эффективности. Надежность в психологии помогает исследователям последовательно проводить тесты и исследования. Если вы хотите, чтобы результаты ваших исследований и психологических тестов были более надежными, вы можете узнать больше о надежности в психологии. В этой статье мы обсудим, что такое надежность в психологии, почему это важно, методы, которые исследователи используют для оценки надежности тестов и исследований, а также советы по повышению надежности в вашей собственной работе.
Связанный: 22 различных типа психологии
Что такое надежность в психологии?
Надежность в психологии — это согласованность выводов или результатов психологического исследования. Если выводы или результаты остаются одинаковыми или похожими при нескольких попытках, исследователь часто считает их надежными. Поскольку обстоятельства и участники могут меняться в ходе исследования, исследователи обычно учитывают корреляцию, а не точность при проведении оценок. Они считают тест или исследование надежным, если замечают высокую положительную корреляцию между результатами и выводами.
Надежность отличается от валидности, аналогичная концепция часто сочетается с надежностью, когда исследователи оценивают свою работу. В то время как надежность относится к способности повторять тест или исследование и каждый раз получать почти одинаковые результаты, валидность включает в себя то, насколько хорошо метод исследования измеряет поведение, о котором заявляет исследователь. Надежность и валидность играют важную и взаимосвязанную роль в получении точных ресурсов, но они требуют отдельных оценок, поскольку одно может быть очевидным без другого.
Пример: Доктор Джонс оценил разработанный им тест, применив его к новой группе участников. Он отметил высокую положительную корреляцию между результатами первой тестовой группы и результатами второй, поэтому сделал вывод о достоверности теста. Он также точно измерил, как поведенческая психология влияет на людей на рабочем месте, как он и предполагал при ее создании. Это также делает тест действительным.
Связанный: 10 вариантов карьеры в поведенческой психологии
Почему надежность важна в психологии?
Надежность важна, поскольку она определяет ценность психологического теста или исследования. Если результаты теста остаются неизменными, когда исследователи проводят исследование, его надежность обеспечивает ценность для области психологии и других областей, в которых он имеет значение, таких как образование или бизнес. Низкая надежность предупреждает исследователей о том, что они должны изменить определенные аспекты своего текущего теста или исследования или провести новый тест, чтобы повысить его ценность.
Связанный: 8 профессий, которые следует учитывать психологам-исследователям
Способы оценки надежности психологических исследований и тестов
Вот несколько методов, которые исследователи используют для оценки надежности своих исследований и тестов:
Внутренняя надежность
Внутренняя надежность относится к тому, насколько хорошо ресурс поддерживает внутреннюю согласованность. Для измерения внутренней надежности, которая применяется конкретно к тестам, исследователи часто используют метод разделения пополам. Этот процесс включает в себя разделение теста пополам перед его проведением участнику и сравнение результатов каждой половины. Если исследователь обнаруживает, что каждая часть теста дает одинаковые результаты, тест имеет внутреннюю надежность. Исследователи могут разделить тест пополам, используя несколько методов, таких как разделение первой и второй половины, группировка случайных вопросов или разделение вопросов с четными и нечетными номерами.
Пример: Доктор Смит создал экзамен по определенной психологической концепции для студентов своего колледжа. Тест содержал 100 вопросов по одной и той же теме. Чтобы оценить надежность теста, он разделил его на две части и дал половине студентов первую половину теста, а другой половине студентов вторую половину теста. Обе группы студентов показали одинаковые результаты, что подтверждает надежность экзамена.
Внешняя надежность
Внешняя надежность — это способность теста давать одинаковые результаты как с течением времени, так и от каждого человека, который его проходит. Он включает в себя два метода: тест-ретест и межрейтинговый. Тест-ретест измеряет, насколько хорошо тест остается стабильным после многократного использования. Если тест остается стабильным, он сохраняет свою надежность. Надежность между оценщиками, известная как надежность между наблюдателями при измерении надежности научных исследований, проверяет, записывают ли разные оценщики или наблюдатели одни и те же данные на основе протокола определенного теста или исследования.
Пример: Бетти, Рон и Джейн — судьи по гимнастике. Поскольку мнения о выступлениях гимнасток различаются, они используют стандартизированную систему подсчета очков, чтобы гарантировать, что они выносят оценки, используя один и тот же протокол. Если система показывает, что судьи используют и интерпретируют данные сходным образом, система подсчета баллов имеет межэкспертную надежность.
Связано: 8 лучших личностных тестов, используемых в психологии (и работодателями)
Советы по повышению надежности психологических исследований и тестов
Исследователи используют результаты оценок для повышения надежности своих тестов и исследований. Вот несколько советов, которые вы можете использовать для повышения надежности ваших собственных ресурсов по психологии:
Выберите метод измерения
Для оценки надежности теста требуется определенный метод измерения. При выборе типа измерения вы можете рассмотреть существующие методы или создать свои собственные. Исследователи часто выбирают существующие методы, которые использовали другие исследователи, потому что это экономит их время и усилия, необходимые для разработки собственных. Другие, однако, предпочитают создавать собственные методики измерений, более точно отражающие цель и задачу их работы, или тестировать новый процесс. Например, определите, хотите ли вы использовать такие методы, как межрейтинговый, тест-ретест или другие методы.
Постоянно оценивайте свои исследования
Исследователи-психологи, которые вносят значительный вклад в эту область, часто разрабатывают исследования и процедуры тестирования, которые проходят тщательную и последовательную оценку, прежде чем их коллеги признают их ценными. Рассмотрите возможность создания процедуры для оценки надежности ваших ресурсов. Например, оценка ваших исследований после каждого использования в разных средах может помочь вам найти любые потенциальные недостатки и быстро устранить их для повышения надежности.
Будьте внимательны к среде тестирования
Внешние факторы, такие как среда тестирования или исследования, могут повлиять на результаты, что также может сказаться на надежности. Например, работа или тестирование в местах с отвлекающими факторами или высокой или низкой температурой могут повлиять на способность человека концентрироваться и использовать учебные ресурсы по назначению. Стрессовые ситуации также могут исказить данные. Отметив эти обстоятельства, вы сможете определить, как они влияют на надежность вашего психологического теста или исследования.
Надежность исследований: определения, измерения и примеры
Автор:
Сол Маклеод, доктор философии 023
Обновлено
Сол Маклеод, доктор философии
Преподаватель, исследователь
Бакалавр (с отличием) психологии, магистр, доктор философии, Манчестерский университет
Сол Маклеод, доктор философии, является квалифицированным преподавателем психологии с более чем 18-летним дополнительное и высшее образование. Он был опубликован в рецензируемых журналах, в том числе в Журнале клинической психологии.
Узнайте о нашем редакционном процессе. 4 Заместитель главного редактора журнала Simply Psychology
Бакалавр (с отличием), психология, магистр психологии образования
Оливия Гай-Эванс — писатель и помощник редактора журнала Simply Psychology. Ранее она работала в сфере здравоохранения и образования.
Узнайте о нашем редакционном процессе
Узнайте о нашем редакционном процессе
Термин «надежность» в психологических исследованиях относится к последовательности количественного исследования или измерительного теста.
Например, если человек взвешивается в течение дня, он ожидает увидеть аналогичные показания. Весы, которые каждый раз измеряли вес по-разному, были бы мало полезны.
Ту же аналогию можно применить к рулетке, которая каждый раз измеряет дюймы по-разному. Это не будет считаться надежным.
Если результаты исследований последовательно воспроизводятся, они надежны. Для оценки степени надежности можно использовать коэффициент корреляции. Если тест надежен, он должен показывать высокую положительную корреляцию.
Конечно, маловероятно, что каждый раз будут получены одни и те же результаты, так как участники и ситуации меняются. Тем не менее, сильная положительная корреляция между одними и теми же результатами испытаний указывает на надежность.
Существует два типа надежности – внутренняя и внешняя надежность.
- Внутренняя надежность оценивает согласованность результатов по элементам теста.
- Внешняя надежность относится к степени, в которой мера варьируется от одного использования к другому.
Оценка надежности
Метод разделения пополам
Метод разделения пополам позволяет оценить внутреннюю согласованность теста, такого как психометрические тесты и опросники. Там он измеряет степень, в которой все части теста в равной степени влияют на то, что измеряется.
Это делается путем сравнения результатов одной половины теста с результатами другой половины. Тест можно разделить пополам несколькими способами, например, на первую половину и вторую половину или по нечетным и четным числам. Если две половины теста дают одинаковые результаты, это означает, что тест обладает внутренней надежностью.
С помощью этого метода можно повысить надежность теста. Например, любые вопросы в отдельных частях теста с низкой корреляцией (например, r = 0,25) должны быть либо удалены, либо переписаны.
Метод разделения пополам — это быстрый и простой способ установить надежность. Однако он может быть эффективен только с большими анкетами, в которых все вопросы измеряют один и тот же конструкт. Это означает, что он не подходит для тестов, измеряющих различные конструкции.
Например, Миннесотский многоэтапный личностный опросник имеет дополнительные шкалы, измеряющие различные виды поведения, такие как депрессия, шизофрения, социальная интроверсия. Поэтому метод разделения пополам не был подходящим методом для оценки надежности этого личностного теста.
Повторное тестирование
Метод повторного тестирования оценивает внешнюю согласованность теста. Примеры соответствующих тестов включают анкеты и психометрические тесты. Он измеряет стабильность теста во времени.
Типичная оценка включает проведение одного и того же теста для участников в двух разных случаях. Если получаются такие же или похожие результаты, то устанавливается внешняя достоверность. Недостатки метода повторного тестирования заключаются в том, что получение результатов занимает много времени.
Бек и др. (1996) изучили ответы 26 амбулаторных пациентов на два отдельных сеанса терапии с интервалом в одну неделю, они обнаружили корреляцию 0,93, что свидетельствует о высокой надежности теста-покоя в опроснике депрессии.
Это пример того, почему необходима надежность в психологических исследованиях. Если бы не надежность таких тестов, у некоторых людей не могли бы быть успешно диагностированы такие расстройства, как депрессия, и, следовательно, им не была бы назначена соответствующая терапия.
Время проведения теста важно; если продолжительность слишком короткая, то участники могут вспомнить информацию из первого теста, что может привести к искажению результатов.
В качестве альтернативы, если продолжительность слишком велика, вполне возможно, что участники могли каким-то важным образом измениться, что также может привести к искажению результатов.
Межэкспертная надежность
Метод повторного тестирования оценивает внешнюю согласованность теста. Это относится к степени, в которой разные оценщики дают согласованные оценки одного и того же поведения. Межэкспертная надежность может быть использована для интервью.
Обратите внимание, что это также можно назвать надежностью между наблюдателями, когда речь идет об наблюдательных исследованиях. Здесь исследователи независимо наблюдают за одним и тем же поведением (во избежание предвзятости) и сравнивают свои данные. Если данные схожи, то они надежны.
Если оценки наблюдателей существенно не коррелируют, надежность можно повысить следующим образом:
- Обучение наблюдателей методам наблюдения и обеспечение того, чтобы все с ними соглашались.
- Обеспечение работы категорий поведения. Это означает, что они были объективно определены.
Например, если два исследователя наблюдают за «агрессивным поведением» детей в детском саду, у них обоих будет свое субъективное мнение относительно того, что включает в себя агрессия.
В этом сценарии маловероятно, что они зафиксируют такое же агрессивное поведение, и данные будут ненадежными.
Однако, если бы они операционализировали категорию поведения агрессии, это было бы более объективно и облегчило бы идентификацию того, когда происходит конкретное поведение.
Например, в то время как «агрессивное поведение» субъективно и не операционализировано, «навязывание» объективно и операционализировано. Таким образом, исследователи могли просто подсчитать, сколько раз дети толкают друг друга в течение определенного промежутка времени.
Ссылки
Бек, А.Т., Стир, Р.А., и Браун, Г.К. (1996). Руководство по инвентаризации депрессии Бека The Psychological Corporation.