Валидность данных это: Валидность — это… Что такое Валидность?

Содержание

Валидность — это… Что такое Валидность?

  • валидность — одна из важнейших характеристик психодиагностических методик и тестов, один из основных критериев их качества. Это понятие близко к понятию достоверности, но не вполне тождественно. Проблема валидности возникает в ходе разработки и практического… …   Большая психологическая энциклопедия

  • валидность — достоверность Словарь русских синонимов. валидность сущ., кол во синонимов: 8 • адекватность (18) • …   Словарь синонимов

  • Валидность —  Валидность  ♦ Validité    Употребляемый в логике синоним истины, точнее говоря, ее формальный эквивалент. Вывод считается валидным (верным), если представляет собой переход от истинного к истинному (от истинности посылок к истинности заключения) …   Философский словарь Спонвиля

  • ВАЛИДНОСТЬ — [Словарь иностранных слов русского языка

  • ВАЛИДНОСТЬ — (от лат.

    validus сильный, крепкий) англ. validity; нем. Validitat/Gulltigkeit. Обоснованность и адекватность исследовательских инструментов (операционализированных понятий, измерительных операций и экспериментов). Antinazi. Энциклопедия… …   Энциклопедия социологии

  • Валидность — Надежность информации, отсутствие в ней ошибок из за неточности выбранной методики сбора данных. Терминологический словарь банковских и финансовых терминов. 2011 …   Финансовый словарь

  • ВАЛИДНОСТЬ — (от франц. valide законный, действительный) применительно к исходной статистической информации, используемой в экономических исследованиях: надежность информации, отсутствие в ней ошибок из за неточности выбранной методики сбора данных. Райзберг… …   Экономический словарь

  • валидность — и, ж. validité f. <лат. validus. Действительность, законность, весомость, обоснованность; обладание юридической силой. Комлев 1992. || Способность образовать связную знаковую систему.

    Барт Что такое критика? // Б. 272. Качество исходной… …   Исторический словарь галлицизмов русского языка

  • Валидность — (англ. validity) мера соответствия того, насколько методика и результаты исследования соответствуют поставленным задачам. В частности, валидность считается фундаментальным понятием экспериментальной психологии и психодиагностики. Как в… …   Википедия

  • Валидность — качество метода психологического исследования, выражающееся в его соответствии тому, для изучения и оценки чего он изначально был предназначен. * * * (лат. validus крепкий, здоровый) надёжность в плане соответствия истине, действительности,… …   Энциклопедический словарь по психологии и педагогике

  • Валидность информации — это… Что такое Валидность информации?

    Валидность информации

    надежность информации, отсутствие в ней ошибок, связанных прежде всего с определением исходных теоретических предпосылок при разработке методики исследования.

    Исследовательская деятельность. Словарь.— М.: УЦ «Перспектива». Е.А. Шашенкова. 2010.

    • Библиотечно-библиографическая классификация
    • Валидность эксперимента

    Смотреть что такое «Валидность информации» в других словарях:

    • ВАЛИДНОСТЬ ИНФОРМАЦИИ — надежность информации, отсутствие в ней ошибок, связанных прежде всего с определением исходных теоретических предпосылок при разработке методики исследований. Термин используется в экономических и социологических исследованиях применительно к… …   Профессиональное образование. Словарь

    • ВАЛИДНОСТЬ — (от франц. valide законный, действительный) применительно к исходной статистической информации, используемой в экономических исследованиях: надежность информации, отсутствие в ней ошибок из за неточности выбранной методики сбора данных. Райзберг… …   Экономический словарь

    • валидность — и, ж. validité f. <лат. validus. Действительность, законность, весомость, обоснованность; обладание юридической силой. Комлев 1992. || Способность образовать связную знаковую систему. Барт Что такое критика? // Б. 272. Качество исходной… …   Исторический словарь галлицизмов русского языка

    • Валидность — от фр. valide в статистике законность и достоверность исходной информации, надежность методики сбора, получения данных, в том числе и для экономических исследований. Словарь бизнес терминов. Академик.ру. 2001 …   Словарь бизнес-терминов

    • Валидность — Надежность информации, отсутствие в ней ошибок из за неточности выбранной методики сбора данных. Терминологический словарь банковских и финансовых терминов. 2011 …   Финансовый словарь

    • ВАЛИДНОСТЬ МЕТОДИК В СОЦИАЛЬНЫХ НАУКАХ — (от лат. valeo быть в состоянии сделать что то) мера пригодности методики для решения определенных исследовательских задач, для того, чему она предназначалась. Высокая валидность свидетельствует о том, что выявленные методикой индивидуальные… …   Российская социологическая энциклопедия

    • ВАЛИДНОСТЬ — (от фр. valide законный, действительный) применительно к исходной статистической информации, используемой в экономических исследованиях: надежность информации, отсутствие в ней ошибок из за неточности выбранной методики сбора данных …   Энциклопедический словарь экономики и права

    • ВАЛИДНОСТЬ — применительно к исходной статистической информации, используемой в экономических исследованиях: надежность информации, отсутствие в ней ошибок из за неточности выбранной методики сбора данных …   Большой экономический словарь

    • валидность — (от франц. valide законный, действительный)    применительно к исходной статистической информации, используемой в экономических исследованиях: надежность информации, отсутствие в ней ошибок из за неточности выбранной методики сбора данных …   Словарь экономических терминов

    • валидность — ж. Отсутствие ошибок, связанных с определением исходных посылок при разработке методики исследований; надежность информации (в социологии). Толковый словарь Ефремовой. Т. Ф. Ефремова. 2000 …   Современный толковый словарь русского языка Ефремовой

    Что не так с валидацией данных и при чем тут принцип подстановки Лисков? / Хабр

    Если вы иногда задаете себе вопрос: «а всё ли хорошо мне в этот метод приходит?» и выбираете между «а вдруг пронесет» и «лучше на всякий случай проверить», то добро пожаловать под кат…

    Поправка: Как заметили lorc и 0xd34df00d, то, о чем ниже идет речь, называется зависимыми типами. Почитать о них можно тут. Ну а ниже исходный текст с моими соображениями по этому поводу.

    При разработке часто возникает потребность проверки валидности данных для некоторого алгоритма. Формально это можно описать следующим образом: пусть мы получаем некоторую структуру данных, проверяем ее значение на соответствие некоторой области допустимых значений (ОДЗ) и передаем ее дальше. Впоследствии эта же структура данных может быть подвергнута такой же проверке. В случае неизменяемости структуры, повторная проверка ее валидности – очевидно лишнее действие.

    Хотя валидация может действительно быть долгой, проблема тут не только в производительности. Гораздо неприятнее лишняя ответственность. У разработчика нет уверенности нужно ли проверять структуру на валидность еще раз. Кроме лишней проверки, можно наоборот допустить отсутствие всякой проверки, неверно предполагая, что структура была проверена ранее.

    Таким образом, допускаются неисправности в методах, которые ожидают проверенную структуру и работают некорректно со структурой, чье значение выходит за некоторую область допустимых значений.

    В этом таится неочевидная более глубокая проблема. На самом деле, валидная структура данных представляет собой подтип исходной структуры. С этой точки зрения, проблема с методом, принимающим только валидные объекты, эквивалентна следующему коду на вымышленном языке:

    class Parent { . .. }
    class Child : Parent { ... }
    
    ...
    
    void processValidObject(Parent parent) {
        if (parent is Child) {
            // process
        } else {
            // error
        }
    }
    

    Согласитесь, что теперь проблема гораздо яснее. Перед нами каноничное нарушение принципа подстановки Лисков. Почитать почему нарушать принцип подстановки плохо можно, например,

    тут

    .

    Решить проблему передачи невалидных объектов можно с помощью создания подтипа для исходной структуры данных. Например, можно создавать объекты через фабрику, которая по исходной структуре возвращает либо валидный объект подтипа, либо null. Если мы изменим сигнатуру методов, ожидающих валидную структуру так, что они станут принимать только подтип, то проблема исчезнет. Так же помимо уверенности в том, что система точно работает, уменьшится количество валидаций на квадратный сантиметр кода. Еще одним плюсом является то, что такими действиями мы перекладываем ответственность валидации данных с разработчика на компилятор.

    В Swift’е, на уровне синтаксиса, решается проблема проверки на null. Идея состоит в том, чтобы разделить типы на допускающие значение null и не допускающие. При этом сделано это в виде сахара таким образом, что программисту не требуется объявлять новый тип. При объявлении типа переменной ClassName гарантируется, что в переменной ненулевое значение, а при объявлении ClassName? переменная допускает значение null. При этом между типами существует коваринтность, то есть в методы, принимающие ClassName?, можно передать и объект типа ClassName.

    Эту идею можно расширить до задаваемых пользователем ОДЗ. Снабжение объектов метаданными, содержащими ОДЗ, хранящимися в типе, устранит описанные выше проблемы. Хорошо бы получить поддержку такого средства в языке, но такое поведение реализуемо и в «обычных» ОО-языках, таких как Java или C# с помощью наследования и фабрики.

    Ситуация с валидацией данных это очередное подтверждение того, что в ООП сущности берутся не из реального мира, а из инженерных потребностей.

    UPD: Как правильно подметили в комментариях, подтипы создавать стоит только в том случае, если мы получим дополнительную надежность и уменьшим количество одинаковых валидаций.

    Так же в статье не хватает примера. Пусть на вход к нам поступают некоторые пути файлов. Наша система в некоторых случаях работает со всеми файлами, а в некоторых случаях только с файлами, к которым мы имеем доступ. Далее мы хотим передать их в разные подсистемы, которые так же работают как с доступными, так и с недоступными файлами. Далее эти подсистемы передают файлы еще дальше, где опять не понятно файл доступен или нет. Таким образом во всяком сомнительном месте появится проверка доступа или может напротив забудется. Из-за этого система усложнится в силу повсеместной неоднозначности и проверок. А проверки эти грузят диск и вообще тяжелые. Можно эту проверку кешировать в булевом поле, но это нас не избавит от самого факта необходимости проверки. Я предлагаю ответственность проверки переложить с разработчика на компилятор.

    Эссе о валидации данных / Хабр

    В заметке

    «Можно ли делить на 0,01 ?»

    на сайте тестировщиков я написал, что при тестировании нужно проверять согласованность валидаторов входных данных с логикой обработки этих данных приложением. Но из комментариев к этой заметке я понял, что для понимания того, как надо тестировать валидацию данных, надо понимать, как она должна работать, что можно считать правильным, а что нет. Поэтому я написал об этом отдельную статью. В ней рассматривается три вопроса: 1) зачем вообще нужна валидация данных, и 2) где и когда может выполняться валидация данных, 3) какие бывают разновидности проверок. Ну и конечно продемонстрировано, как всё это выглядит на живых примерах. А может быть мои рассуждения окажутся интересны не только тестировщикам, но и разработчикам.



    Зачем нужна валидация данных?

    Казалось бы, «невалидные» данные, не удовлетворяющие определённым ограничениям, могут вызвать сбой в работе программы. Но что это означает? Предположим, в каком-то месте программы возникает исключение при попытке преобразовать строку в число, если строка имеет некорректный формат. Разумеется, если исключение не будет нигде перехвачено, это может привести к аварийному завершению программы. Но это маловероятный сценарий развития событий. Скорее всего в каком-то месте сработает перехватчик, который либо выдаст пользователю какое-то сообщение об ошибке в программе, либо сделает запись в журнал ошибок, после чего программа постарается восстановиться от сбоя и продолжить работу. То есть даже если валидацию не выполнять, вполне вероятно, что ничего страшного не случится.

    Но определённые негативные последствия у отсутствия валидации всё таки могут быть, давайте чуть подробнее рассмотрим, какие проблемы при этом могут возникнуть.

    1. Невозможность восстановиться после сбоя. Не всегда программа способна «вернуть всё назад». Возможно, в процессе работы программа выполнила какие-то необратимые действия — удалила файл, отправила данные по сети, напечатала что-то на принтер, запустила резец станка и он частично произвёл обработку заготовки детали. Но даже если восстановление в принципе возможно, алгоритм восстановления может тоже содержать ошибки, и это иногда приводит к совсем печальным последствиям.
    2. Дополнительная нагрузка на систему. Восстановление после сбоя — это лишняя работа. Вся работа, которая была выполнена до момента сбоя — тоже лишняя. А это означает дополнительную нагрузку на систему, которой можно избежать, если заранее проверить данные. С другой стороны, валидация — это тоже дополнительная нагрузка, причём восстановление приходится делать лишь изредка, а проверку надо выполнять каждый раз, так что ещё неизвестно, что выгоднее.
    3. Инъекции не вызывают сбоев. Один из основных способов эксплуатации уязвимостей в программах заключается в том, чтобы «обмануть» валидаторы, то есть передать данные, которые валидатор признаёт корректными, но при этом они интерпретируются непредусмотренным образом, так что злоумышленник может получить несанкционированный доступ к данным или некоторым возможностям программы, либо способен разрушить данные или программу. Если валидации нет вообще, задача злоумышленника максимально упрощается.
    4. Сложность идентификации причины проблемы. Если исключение вылетело откуда-то из глубины программы, определить причины его возникновения не так-то просто. И даже если это возможно, может оказаться нелегко объяснить пользователю, что сбой вызван данными, которые он ввёл некоторое время назад в каком-то совершенно другом месте программы. А если проверка выполнена немедленно после ввода данных, никаких сложностей с идентификацией источника проблемы не возникает.

    Короче говоря, отсутствие валидации может приводить к вышеописанным (а может быть и ещё каким-то другим) проблемам. Соответственно, наличие валидации позволяет предотвратить серьёзные сбои, упрощает идентификацию проблем, но за это приходится расплачиваться производительностью, поскольку дополнительные проверки увеличивают нагрузку на систему. И тут мы переходим ко второму вопросу — как уменьшить эту дополнительную нагрузку.

    Где и когда выполнять валидацию данных?

    Как уже было сказано выше, с точки зрения уменьшения нагрузки лучше всего вообще не выполнять валидацию данных.

    Но если всё-таки проверка нужна, логика подсказывает, что удобно проверять данные в том месте, где они попадают в программу из внешнего мира. После такой проверки можно быть уверенным, что в программу попадают правильные данные и в дальнейшем они могут использоваться без дополнительных проверок.Это может быть пользовательский интерфейс, через который человек вводит данные. Это может быть файл, содержащий настройки программы или данные, которые программа должна обработать. Это может быть база данных, в которую информация может попадать из других программ. Это может быть сетевой протокол обмена данными с другими программами. Наконец, это может быть программный интерфейс, который использует другая программа, вызывая некоторые функции/процедуры и передавая в них параметры.

    Увы, здравый смысл иногда вынужден отступить перед натиском действительности. «Фейс-контроль» данных на входе иногда не просто нецелесообразен, но вообще невозможен. Ниже приведены некоторые причины этого.

    1. Для валидации требуется доступ к недоступной части состояния системы. Это особенно характерно для проверки данных, вводимых человеком через графический интерфейс пользователя. Современные приложения часто построены с использованием многоуровневой архитектуры, которая предполагает, что реализация пользовательского интерфейса выделена в презентационный слой, а для проверки требуется доступ к другим слоям, вплоть до слоя базы данных.

      Особенно хорошо это заметно для веб-приложений, где пользовательский интерфейс реализуется в браузере и выполняется на стороне клиента, а для проверки ввода требуется сравнение с тем, что хранится в базе данных. В этой ситуации проверку приходится выполнять уже после отправки данных на сервер. (Впрочем, сейчас с появлением AJAX-технологии эта проблема частично решена).

    2. Валидация требует полностью повторить логику обработки. Как уже отмечено двумя абзацами выше, при многослойной архитектуре приложения пользовательский интерфейс обычно выделяется в специальный презентационный слой, а логика обработки данных находится на другом слое. И бывают такие ситуации, когда для валидации нужно практически полностью выполнить эту обработку, потому не существует более короткого способа понять, завершится она успехом или нет.

    Как выполнять валидацию данных?

    Впрочем, где бы ни выполнялась валидация, можно это делать несколькими различными способами, в зависимости от того, какие ограничения накладываются на данные.


    1. Посимвольная проверка. Как правило такие проверки выполняются в пользовательском интерфейсе, по мере ввода данных. Но не только. Например, лексический анализатор компилятора тоже выявляет недопустимые символы непосредственно в процессе чтения компилируемого файла. Поэтому такие проверки можно условно назвать «лексическими».
    2. Проверка отдельных значений. Для пользовательского интерфейса это проверка значения в отдельном поле, причём выполняться она может как по мере ввода (проверяется то неполное значение, которое введено к настоящему моменту), так и после завершения ввода, когда поле теряет фокус. Для программного интерфейса (API) это проверка одного из параметров, переданных в вызываемую процедуру. Для данных, получаемых из файла, это проверка какого-то прочитанного фрагмента файла. Такие проверки, опять-таки по аналогии с компиляторной терминологией, можно назвать «синтаксическими».
    3. Совокупность входных значений. Можно предположить, что в программу сначала передаются какие-то данные, после чего подаётся некоторый сигнал, который инициирует их обработку. Например, пользователь ввёл данные в форму или в несколько форм (в так называемом «визарде») и наконец нажал кнопку «OK». В этот момент можно выполнить так называемые «семантические» проверки, нацеленные на валидацию не только отдельных значений, но и взаимосвязей между ними, взаимных ограничений.

      Вполне возможна ситуация, когда каждое отдельное значение «синтаксически» корректно, но вместе они образуют несогласованный набор. Для программного интерфейса эта разновидность валидации предполагает проверку набора входных параметров вызываемой процедуры, для случая получения данных из файла это проверка всех прочитанных данных.

    4. Проверка состояния системы после обработки данных. Наконец, есть последний способ, к которому можно прибегнуть, если валидацию непосредственно входных данных выполнить не удаётся — можно попытаться их обработать, но оставить возможность вернуть всё к исходному состоянию. Такой механизм часто называется транзакционным.

    Транзакция — это последовательность действий, которые либо все завершаются успешно, либо происходит какой-то сбой при выполнении отдельного действия, и тогда отменяются результаты всех предыдущих действий этой цепочки. Так вот, валидацию можно выполнять в процессе выполнения транзакции, а последняя проверка может быть выполнена в самом конце транзакции по обработке данных. При этом мы валидируем уже не сами данные, а то состояние, которое получилось после их полной обработки, и если это состояние не удовлетворяет каким-то ограничениям, тогда мы признаём входные данные невалидными и возвращаем всё к исходному состоянию.

    Какой способ валидации следует применять на практике в том или ином случае? Чаще всего одним способом ограничиться не удаётся, да и не нужно. Валидацию данных можно и нужно выполнять в несколько этапов, усложняя проверки.

    Сначала, по мере ввода, следим за тем, чтобы данные не содержали недопустимых символов. Например, для числового поля пользователю может быть запрещён ввод нецифровых символов.

    После того, как ввод завершён, можно проверить всё значение целиком. Для введённого числа могут быть какие-то ограничения, например, оно не должно превышать определённого максимального допустимого значения. Если наше числовое поле представляет собой возраст, оно должно находиться в пределах от 0 до, скажем, 120.

    Когда заполнены все поля, можно проверить, согласованы ли введённые значения друг с другом. Например, если в форме кроме поля для указания возраста есть поле для ввода номера паспорта, приложение может проверить, что при заполнении номера паспорта возраст должен быть не менее 14 лет.

    Наконец, если всё введено корректно, можно попытаться начать обработку, выполняя проверки по ходу дела, а также в самом конце, и если что-то пошло не так, выполнить откат к исходному состоянию.

    Ну и, конечно же, проверки на следующем уровне могут подстраховывать проверки предыдущих уровней. Скажем, для веб-приложений обязательной является проверка данных, пришедших на сервер в HTTP-запросе, независимо от того, выполнялась ли перед этим предварительная валидация в браузере или нет. Причина этого в том, что проверку на клиентской стороне можно обойти. Для других видов приложений обойти проверки не так просто, но иногда тоже вполне возможно, как показано в примере чуть ниже.

    Тестирование валидаторов

    Завершим статью демонстрацией различных видов валидаторов, а также некоторыми рекомендациями относительно того, как при тестировании проверять правильность их работы.

    Начнём с посимвольной проверки. Графический редактор Paint, диалог изменения размеров рисунка, ширина рисунка. В это поле допускается вводить только цифры, при попытке ввести другие символы выдаётся сообщение об ошибке:

    Однако, проявив смекалку, можно обойти эту валидацию вводимых символов: через буфер обмена удаётся вставить в это поле отрицательное число, несмотря на то, что минус является недопустимым символом:

    Впрочем, это не приводит к негативным последствиям, потому что на следующем уровне стоит ещё одна проверка, которая срабатывает при нажатии кнопки OK:

    Есть и другие ограничения для этого поля, которые тоже проверяются после нажатия кнопки OK:

    А вот находящееся совсем рядом в том же диалоге поле для ввода наклона рисунка не содержит валидации символов, несмотря на то, что это тоже числовое поле. Более того, при вводе недопустимых символов после нажатия OK можно увидеть вот такое странное сообщение, практически не поддающееся расшифровке:

    Все вышеописанные примеры связаны с проверкой отдельно взятого поля. Пример валидации комбинации полей можно найти в том же приложении, но в другом месте — в диалоге настройки параметров страницы для печати. Если указать размеры полей страницы так, чтобы в сумме они превосходили ширину страницы, получим вот такое сообщение:

    Ну и, наконец, в заметке «Почему не хватает памяти, чтобы уменьшить размеры рисунка?» описана ошибка, связанная с тем, что в этом графическом редакторе отсутствует корректная обработка сбоев и откат транзакции при слишком сильном увеличении размера рисунка.

    Тестировщику необходимо все эти ситуации отрабатывать. Во-первых, нужно проверять валидацию на всех уровнях. Во-вторых, нужно проверять согласованность валидаторов на разных уровнях. В-третьих, надо искать пути обхода валидаторов, пытаясь добраться до следующего уровня без предварительных проверок.

    Заключение

    Большая часть этой статьи посвящена не способам тестирования валидаторов, а описанию их устройства. Почему? Потому что врага надо знать в лицо. Чтобы найти дефект валидации данных, надо понимать, где искать и на что обращать внимание.

    P.S. Кросспост

    Что нужно знать о валидности заказчику оценки — FORMATTA

    На осенней конференции «Оценка персонала» журнала «Штат» генеральный директор Formatta Евгений Куприянов выступал с докладом о валидности оценки. Мы публикуем текст его выступления. Это не научный доклад, а статья-обзор для заказчиков оценки: на простых и понятных примерах вы узнаете, что такое валидность и при каком показателе валидности оценка экономически оправдана.

    Тема валидности становится всё популярнее в HR-сообществе. В 90-е, когда российские компании только начинали привлекать оценку персонала для решения бизнес-задач, акцент делали на разработке инструментов и методов, а их валидность интересовала далеко не всех заказчиков. Затем стало модно говорить о валидности, и многие провайдеры, пользуясь тем, что заказчики недостаточно разбирались в теме, предъявляли мифические 0,95 как показатель валидности своих инструментов.
    Сегодня мы наблюдаем другую тенденцию: академический подход к измерению валидности проник в бизнес. Всё меньше компаний доверяют мифическим показателям и всё чаще требуют от провайдера результатов исследования валидности оценочного инструмента.

    Какие значения может принимать валидность

    Валидность — это коэффициент корреляции между результатами оценки и независимым критерием: мы выбираем внешний критерий и смотрим,
    насколько результаты оценки ему соответствуют и насколько мы можем доверять прогнозу, который делаем по итогам оценки.

    Этот коэффициент принимает значения от минус единицы до единицы. Чем выше валидность, тем выше точность прогноза. Если валидность равна нулю, значит, взаимосвязи между результатами оценки и выбранным критерием нет: количество ошибок и точных прогнозов примерно одинаково. Бывает отрицательная валидность: в этом случае прогноз по итогам оценки будет оправдываться «наоборот».

    Валидность бывает нескольких видов — это зависит от внешнего критерия,
    с которым сравнивают результаты проведённой оценки. Остановимся подробнее на каждом виде валидности и критериях её измерения.

    Виды валидности и критерии


    для её измерения

    Конструктная валидность — внешним критерием становятся результаты другого инструмента оценки, который измеряет те же характеристики. К примеру, мы хотим измерить конструктную валидность мотивационного опросника: находим инструмент, которые оценивает те же факторы мотивации, и сравниваем результаты двух инструментов. Конструктная валидность показывает, насколько они соотносятся между собой.

    Конкурентная валидность — сравниваем результаты оценки выбранного инструмента с показателями текущей или прошлой эффективности. Это может быть балл в системе performance management, результаты обучения, показатели продаж, коэффициент удовлетворённости клиента сервисом.

    Прогностическая валидность показывает, насколько соотносятся результаты оценки и показатели будущей эффективности сотрудника. Это самые интересные для компании данные: они говорят, насколько себя оправдает прогноз по результатам оценки. Но прогностическую валидность труднее всего измерить
    из-за ограничения выборки. К примеру, мы оценили 100 продавцов, у 15 из них показатели продаж оказались низкие, скорее всего, мы не сможем оценить их в следующем цикле: их уволят.

    Инкрементная валидность — сравниваем, насколько повысилась корреляция
    при добавлении нового инструмента в уже существующую оценочную процедуру.

    Провайдеры, как правило, считают валидность так, как им удобно и выгодно.
    Если из всех видов валидности инструмента самые высокие показатели у конструктной, в маркетинговых материалах укажут именно эту цифру.
    Поэтому всегда уточняйте, о каком виде валидности говорит провайдер,
    когда приводит показатель валидности.

    Что означают показатели валидности на практике

    На практике почти не встречается валидность выше 0,7. Если провайдер заявляет
    эту цифру, уточните, о каком виде валидности идёт речь и как она рассчитывалась. Показатель 0,7 может быть только в том случае, если провайдер измерял валидность комбинацией разных оценочных инструментов.

    ВалидностьЕсли выбрать 20% лучших сотрудников по итогам оценки
    Нет валидности04 из 20 будут в числе лучших
    Средняя валидность0,37 из 20 будут в числе лучших
    Высокая валидность0,610 из 20 будут в числе лучших

     

    ВалидностьЕсли выбрать 20% лучших сотрудников по итогам оценки
    Нет валидности01 из 5 будет в числе худших
    Средняя валидность0,31 из 10 будет в числе худших
    Высокая валидность0,61 из 50 будет в числе худших

    Посмотрим, что означают эти цифры на практике: к примеру, вы оценили 100 сотрудников и выбрали 20 лучших по итогам оценки. Если вы использовали инструмент со средней валидностью, то из выбранных 20 участников только семеро будут в числе лучших 20%.

    Если же вы оценивали 100 сотрудников инструментом с высокой валидностью, то в числе 20% лучших окажутся десять из выбранных двадцати по итогам оценки. При этом результаты выше среднего покажут 17 из этих 20 сотрудников.

    Если вы знаете валидность инструмента, вы можете посчитать точность прогноза, который сделаете по результатам оценки. К примеру, вы используете инструмент с валидностью 0,3. Разделите этот показатель на 2 и прибавьте 50% — получится 65%. С такой вероятностью прогноз по итогам оценки окажется достоверным,
    если за 50% принять случайное угадывание.

    3 уровня проверки валидности

    Если вы используете инструмент оценки, у вас есть три уровня проверки
    его валидности:

    Во-первых, вы можете посмотреть, насколько велика валидность метода оценки. К примеру, вы покупаете у провайдера тесты способностей. Чтобы оценить их валидность, используйте мета-анализы — эта процедура объединяет показатели валидности, полученные на разных инструментах и выборках от нескольких исследователей. С их помощью вы определите среднюю валидность тестов
    как метода оценки. Классическим считается мета-анализ Шмидта и Хантера 1998 года.

    Во-вторых, вы можете узнать валидность инструмента — тех конкретных тестов способностей, которые вы покупаете. Эти данные вам должен предоставить провайдер.

    Наконец, вы можете посмотреть, насколько конкретный инструмент валиден
    для ваших задач.
    Чтобы посчитать валидность инструмента на ваших данных:

    1. Оцените при помощи инструмента не менее 200 сотрудников одной группы должностей — это минимальная выборка. Чем больше человек вы оцените,
    тем более надёжные цифры получите.

    2. Выберите критерий, относительно которого будете проверять валидность. Например, оценка результативности руководителем.

    3. Оцените надёжность этого критерия. Критерием могут быть объективные данные — например, показатели производительности. В этом случае его можно считать надёжным. Оценка эффективности руководителем — субъективные данные, надёжность этого критерия будет низкой.

    4. Посмотрите, нет ли у вас ограничения выборки. Например, если вы используете тесты при подборе, кандидаты с низкими результатами обычно просто не попадают на работу.

    5. Проверьте свои данные: насколько они полные, корректные и однородные. Если в качестве внешнего критерия вы выбрали показатели продаж, проверьте, что все данные по продажам соответствуют тому менеджеру, который продавал. Это поможет избавиться от некорректных данных: к примеру, сотрудник в отпуске, а на него записаны продажи другого.

    6. Посчитайте сам показатель валидности: обычно это коэффициент корреляции или регрессии, с учётом тех поправок, которые мы упомянули выше. Для начала можно воспользоваться самыми простыми показателями. Например, коэффициентом корреляции Спирмена — его можно посчитать даже в MS Excel.

    У вас получился показатель валидности конкретного инструмента на ваших данных. Он показывает, насколько достоверным будет прогноз, который вы сделаете по результатам оценки при помощи этого инструмента.

    Качество информации

    Вышла книга автора сайта!

    Теоретическая валидизация в социологическом исследовании: Методология и методы

    Качество получаемой информации: валидность и надежность

    Построение выборки >> Качество информации

    Для ученого-практика рассуждать о проблемах качества информации — высший пилотаж. Тебе тоже не помешает кое-что знать об этом.

    0 Нажми, если пригодилось =ъ

    Ссылка на эту страницу для научных и учебных работ

    Дембицкий С. Качество получаемой информации: валидность и надежность [Электронный ресурс]. — Режим доступа: http://soc-research.info/principles/7.html

    Традиционно «валидность» является одной из ключевых категорий в анализе эмпирических данных как психологических, так и социологических исследований. В дальнейшем под валидностью будет пониматься степень соответствия результатов исследовательского процесса действительности [Johnston, 1980: р.190-191].
    В рамках количественных исследований принято выделять конструктную, внешнюю и внутреннюю валидность. Первая связана с обеспечением правильности измерения, вторая и третья – с выявлением причинно следственных связей в рамках экспериментальных исследований [Lahm, 2007: р. 5173-5175]. Несмотря на то, что Дональд Кэмпбелл в свое время уделил немало внимания всем трем типам валидности [Кэмпбелл, 1996; Campbell and Fiske, 1959], сегодня все еще часто встречаются случаи «межурментизации» понятия валидность, во время которых в ранг ключевой возводится конструктная валидность, интегрирующая в себе очевидную, содержательную, внешнюю и другие виды валидности валидности [Messick, 1995: р. 745]. С точки зрения разработки тестов и других измерительных методик это может звучать логично. Однако в более широком контексте эмпирических исследований «межурментизация» является классическим примером косности, догматизма и нежелания признать очевидное. Такая позиция «оставляет за бортом» даже количественную экспериментальную традицию, не говоря уже о широком спектре подходов качественного толка.
    Что касается качественных исследований, то проблема валидности не получила здесь однозначного решения. Вместе с тем, ее состояние полностью отвечает принципу пролиферации, предложенному в ранних работах Феерабента – каждый сможет найти то, что будет отвечать его личной методологической позиции.
    Наибольшей известностью пользуется концепция Губы и Линкольн, впервые представленная еще в 1985 году [Miles and Hernandez Jozefowicz-Simbeni, 2010: p. 421-422]. В своей работе они говорят даже не о валидности, а о критериях оценки качества или строгости (rigor) качественных исследований. По мнению Губы и Линкольн, в качественных исследованиях необходимо говорить не о внутренней валидности, а о достоверности (credibility), не о внешней валидности, а о переносимости (transferability), не о надежности, а о функциональной надежности (dependability), наконец не об объективности, а о подтверждаемости (confirmability). Все они характеризуют достоверность (trustworthiness) исследования. Правдоподобие основывается на согласии участников исследования с формулировками, интерпретацией и вообще результатами анализа исследователя. Переносимость относится к способности концептов или конструктов, полученных в ходе исследования, быть применимыми к более широкому социальному контексту. Функциональная надежность имеет отношение к тому насколько правильно выбран тип данных и соответствующие методы их сбора в рамках того или иного качественного проекта. Подтверждаемость переносит «бремя» объективности с исследования на данные. Поэтому исследователь должен сделать все возможное для подтверждения полученных данных.
    В еще одной известной работе [Patton, 2002: p. 552] интегральной характеристикой является уже достоверность (credibility), основывающаяся на строгости использования методов (rigorous methods), достоверности самого исследователя (credibility of the researcher) и его философских взглядах относительно особенностей качественного исследования (philosophical belief in the value of qualitative inquiry). Строгость использования методов необходима для получения высококачественных данных, открывающих возможность проведения систематического анализа. Достоверность исследователя основывается на его тренировках, опыте, достижениях и самопрезентации. А его философские взгляды должны включать признание натуралистичного исследования, качественных методов, индуктивного анализа, целенаправленной выборки и целостного мышления.

    И даже в таких подходах, где одной из центральных категорией остается валидность, она сопоставляется с другими, центральными с точки зрения качественных исследований, понятиями. Так, в своей работе Максвелл [Maxwell, 1992: p. 285-293] указывает на то, что понимание является более важным понятием, чем валидность. Поэтому типы последней выводятся именно из специфики понимания, присущего качественным исследованиям (типы валидности характеризуют типы понимания). При этом он не считает, что качественный и количественный подходы к валидности являются несопоставимыми. Главное же условие соответствующей интеграции – их правильное понимание в их собственных терминах.
    Максвелл выделяет три типа валидности – описательную, интерпретативную и теоретическую. Описательная валидность связана с тем правильно ли исследователь излагает в своей работе то, что он увидел и услышал во время исследования. Это первый и важнейший аспект валидности – неправильное описание поступков и слов людей перечеркнет дальнейшие попытки в достижении понимания изучаемого феномена. Вместе с тем, исследователь не только описывает слова и поступки людей, но объясняет их значение – интерпретирует данные. Отсюда понимание исследователем того, что принято называть перспективой участников исследования (особенности их интенции, восприятия, чувств, убеждений, оценок и т.д.), напрямую связано с интерпретативной валидностью. После того как исследователь достиг понимания на описательном и интерпретативном уровне, он готов перейти к построению теории, позволяющей подняться на более высокий уровень абстракции как в смысле выводов, так и в смысле терминологии. Если на предыдущих этапах исследователь фокусируется на понимании, то здесь он переходит к объяснению, являющемуся его завершающей фазой. Теоретическая валидность, имеющая решающее значение на этом этапе, должна давать оценку двум главным составляющим любой теории – используемым понятиям и взаимоотношениям, существующим между ними. В соответствии с этими двумя аспектами теории можно выделить и два аспекта теоретической валидности – валидность используемых понятий и валидность постулируемых взаимосвязей между ними.
    Подход Максвелла представляется наиболее приемлемым в решении проблемы совместной валидизации в рамках качественных и количественных исследований. В этом случае в состав валидности входят такие ее типы: теоретическая, конструктная, внешняя, внутренняя и предсказательная. Теоретическая валидность указывает насколько теоретический конструкт, положенный в основу исследования, соответствует реальному социальному феномену. Конструктная валидность демонстрирует насколько измерительная методика и полученные на ее основе результаты соответствуют теоретическому конструкту. Внешняя валидность связана с тем насколько выборочная совокупность может выступать основой для обобщений в отношении других людей, контекстов и периодов. Внутренняя валидность показывает насколько измерения исследования подтверждают существование связей между переменными, а также насколько такие связи могут быть подтверждением причинно-следственной зависимости между ними. Предсказательная валидность связана с тем насколько теоретическая, внешняя и внутренняя валидности обеспечивают предсказательный потенциал исследования [Дембицкий, 2010].
    По большей части достижение теоретической валидности является прерогативой качественного исследования, так как теория, построенная на основе тщательного изучения эмпирического мира, будет гораздо обоснованней, чем теория, основывающаяся на изучении литературы и, тем более, на здравом смысле исследователя. После достижения теоретической валидности можно переходить к решению других задач валидизации в рамках количественной парадигмы.

    Категория «надежность» имеет отношение к устойчивости и согласованности полученных результатов. Остановимся на трех основных видах надежности:
    А. Ретестовая надежность является характеристикой, показывающей, насколько результаты опроса с помощью конкретной методики меняются с течением времени. Определение ретестовой надежности приемлемо в случаях измерения устойчивых свойст, слабо подверженных изменениям в долгосрочной перспективе. Если соответствующая методика является надежной, то результаты первого и второго опросов должны показать устойчивые результаты. Если же первый и второй опрос согласованы слабо, то методика является ненадежной и не может использоваться в исследованиях. Величина ретестовой надежности определяется с помощью коэффициентов корреляции.
    Важно помнить, что использование ретестовой надежности не подходит для тех методик, которые предназначены для измерения характеристик, находящихся в постоянном изменении. В данном случае низкая устойчивость укажет не на недостатки опросного инструмента, а на изменение социальной/психологической ситуации.
    Б. Внутренняя надежность показывает, насколько согласованны результаты, полученные с помощью разных индикаторов, измеряющих один признак. Таким образом, этот вид надежности подходит для сложных составных шкал, опирающихся на группу показателей. Высокая внутренняя надежность будет продемонстрирована в том случае, когда результаты показателей изменяются в одном направлении. Одним из главных способов определения внутренней надежности является использование коэффициента Альфа Кронбаха.
    Проверка внутренней согласованности необходима, прежде всего, для того, чтобы удостовериться измеряют ли индикаторы методики одно и то же свойство.

    В. Надежность кодировки определяется в исследованиях с применением контент-анализа или же в других исследованиях, требующих кодировки текстового материала. Этот вид надежности показывает качество инструкций, служащих руководством при кодировке различных частей текста. Высокая согласованность работы различных кодировщиков говорит о том, что соответствующая инструкция составлена правильно.
    Коэффициенты, используемые для определения надежности кодировки, зависят от характера свойств, подлежащих кодировки. Если свойство является количественным, можно использовать один из коэффициентов корреляции. Если же свойство является качественным, то подойдет, например, коэффициент Каппа Кохена.
    В зависимости от особенностей исследования необходима проверка тех или иных видов валидности и надежности. В противном случае исследователь рискует получить результаты-артефакты, то есть результаты, порожденные особенностями проведения исследования, а не свойствами изучаемых объектов.

    Список использованной литературы
    • default_titleJohnston J., Pennypacker H. Strategies and tactics of human behavioral research. – New Jersey: Erlbaum, 1980. – 210 p.
    • default_titleLahm K. Quantitative validity // The Blackwell Encyclopedia of Sociology / ed. by George Ritzer. — Malden, Oxford, Carlton: Blackwell Publishing, 2007. — P. 5173-5175.
    • default_titleКэмпбелл Д. Модели экспериментов в социальной психологии и прикладных исследованиях. – М.: Социально-психологический центр, 1996. – 392 с.
    • default_titleCampbell D., Fiske D. Convergent and Diskriminant Validation by the Multitrait-multimethod Matrix // Psychological Bulletin. – 1959. – № 2. – Р. 81–105.
    • default_titleMessick S. Validity of Psychological Assessment // American Psychologist. — 1995. — №9. — P. 741-749.
    • default_titleMiles B., Hernandez Jozefowicz-Simbeni D. Naturalistic Inuiry // The Handbook of Social Work Research Methods / ed. by B. Thyer. – Los Angeles; London; New Delhi; Singapore; Washington DC: Sage, 2010. — P. 415-424.
    • default_titlePatton M. Qualitative evaluation and research methods. – Thousand Oaks: Sage, 2002.
    • default_titleMaxwell J. Understanding and Validity in Qualitative Research // Harvard Educational Review. — 1992. — №3. — P. 279-300.
    • default_titleДембицкий С. Теоретическая валидность и смещение данных в социологическом исследовании [Электронный ресурс]. – Режим доступа: http://www.ecsocman.edu.ru/soc-ua/msg/337817.html (обновленный вариант статьи)
    • Show More

    Проверка данных на валидность | htmlbook.ru

    Для проверки веб-страниц на наличие ошибок и замечаний существует множество путей и способов. Условно они делятся на онлайновые и локальные. Онлайновые предназначены для проверки страниц с помощью браузера через Интернет, а локальные используются для проверки документов на текущем компьютере. Далее рассмотрим популярные методы валидации документов.

    validator.w3.org

    По адресу http://validator.w3.org располагается, пожалуй, самый распространенный инструмент для проверки отдельных страниц на валидность. Этот сайт предлагает три способа проверки: по адресу, локального файла и введенного в форму кода.

    Проверка по адресу

    Если ваш сайт уже опубликован в Интернете, то любую страницу можно проверить, вводя в текстовое поле ее адрес (рис. 14.1).

    Рис. 14.1. Форма для ввода адреса документа

    Так, вводя http://htmlbook.ru в форме «Validate by URI» (валидация по адресу) и нажав кнопку (проверить) получим сообщение о том, валидный документ или нет.

    Хотя в текстовом поле вводится адрес сайта, проверяется не сайт целиком, а только одна главная страница. Учтите, что, к примеру, адрес http://htmlbook.ru равнозначен вводу http://htmlbook.ru/index.php.

    Валидатор проверяет HTML-код страницы и в случае отсутствия ошибок докладывает о валидности документа (рис. 14.2).

    Рис. 14.2. Отчет о проверке и валидности веб-страницы

    При обнаружении ошибок выводится уведомление о том, что страница не валидна и список ошибок с указанием строк, где встречаются ошибки (рис. 14.3).

    Рис. 14.3. Отчет о проверке и вывод ошибок

    Проверка локальных файлов

    Документы, еще не выставленные в Интернете, можно проверить с помощью формы, озаглавленной «Validate by File Upload» (валидация загруженных файлов), как показано на рис. 14.4.

    Рис. 14.4. Форма ввода пути к локальному файлу для его проверки

    Вначале следует указать путь к HTML-файлу, после чего нажать кнопку . Файл будет загружен на сервер и проверен на ошибки.

    Использование формы для ввода кода

    В некоторых случаях требуется проверить код без сохранения его в отдельный файл. В этом случае пригодится форма для прямого набора текста и отправки его на сервер для валидации (рис. 14.5).

    Рис. 14.5. Форма для ввода HTML-кода

    Расширение HTML Validator для браузера Firefox

    Популярность браузера Firefox обусловлена наличием для него большого количества разнообразных расширений — программ, которые добавляют новые возможности в браузер. Расширения построены по открытой технологии и написать их может любой разработчик. Не оставлены без внимания и веб-разрабочики — для их удобства создано множество расширений, в том числе и для валидации документа прямо в браузере. В данном случае нас интересует HTML Validator. Эта программа построена по той же технологии, что и валидатор W3C, но не требует подключения к Интернету и работает прямо «на лету».

    Где скачать
    http://users.skynet.be/mgueury/mozilla/

    Установка расширения

    После скачивания файла установить расширение можно несколькими способами.

    1. Через менеджер расширений

    Запустите Firefox и откройте меню . Перетащите мышью загруженный файл (он имеет расширение xpi) в открывшееся окно. Далее расширение будет установлено автоматически.

    2. С помощью открытия файла

    Выберите в меню Firefox пункт и укажите путь к файлу с расширением, дальнейшие действия браузер выполнит сам.

    3. Копирование файла в папку extension

    Откройте папку на диске, где установлен Firefox (к примеру c:\Program Files\Mozilla Firefox) и найдите в ней подпапку extension, в которую скопируйте расширение. После запуска браузера дальнейшая установка пройдет самостоятельно.

    Все приведенные методы установки требуют перезагрузки браузера после установки расширения. Работа HTML Validator начинается сразу же после повторного запуска Firefox.

    Если указанные способы по каким-либо причинам не помогли, вы можете обратиться на сайт поддержки браузера Mozilla Firefox и прочитать обо всех возможных методах установки расширений по адресу
    http://forum.mozilla-russia.org/doku.php?id=general:extensions_installing

    Использование HTML Validator

    При открытии веб-страницы HTML Validator начинает сразу же свою работу, и результат проверки отображается в строке состояния, в ее правом нижнем углу в виде небольшой картинки. Изображение зависит от статуса проверки и показано на рис. 14.6.

    Рис. 14.6. Виды картинок, отображаемых при проверке документа

    Кружок с галочкой (рис. 14.6а) показывает, что документ валидный, желтый треугольник с восклицательным знаком (рис. 14.6б) — по коду имеются замечания, которые могут быть исправлены автоматически. А красный кружок с крестиком (рис. 14.6в) предупреждает, что есть серьезные ошибки.

    Просмотреть все ошибки можно двояко. Во-первых, заглянуть в HTML-код документа через меню или щелкнуть правой кнопкой и в контекстном меню выбрать (рис. 14.7).

    Рис. 14.7. Контекстное меню с пунктом выбора исходного кода

    Окно исходного кода веб-страницы разделено на три части (рис. 14.8), где верхний блок содержит собственно HTML-код. В левом нижнем блоке отображается список ошибок и замечаний или информационные сообщения в случае валидного документа. Правый нижний блок предназначен для подробных подсказок о текущих замечаниях.

    Рис. 14.8. Результат работы расширения HTML Validator

    Надежность и достоверность измерения — Методы исследования в психологии — 2-е канадское издание

    1. Определите надежность, включая различные типы и способы их оценки.
    2. Определите срок действия, включая различные типы и способы их оценки.
    3. Опишите виды доказательств, которые могут иметь отношение к оценке надежности и действительности той или иной меры.

    Опять же, измерение включает в себя присвоение баллов отдельным лицам, чтобы они отражали некоторые характеристики людей.Но как исследователи узнают, что оценки на самом деле представляют характеристику, особенно если это такие конструкты, как интеллект, самооценка, депрессия или объем рабочей памяти? Ответ заключается в том, что они проводят исследование, используя эту меру, чтобы подтвердить, что оценки имеют смысл, исходя из их понимания измеряемой конструкции. Это очень важный момент. Психологи не просто предполагают , что их меры работают. Вместо этого они собирают данные, чтобы продемонстрировать , что они работают.Если их исследование не демонстрирует, что мера работает, они прекращают ее использовать.

    В качестве неформального примера представьте, что вы сидите на диете в течение месяца. Ваша одежда кажется более свободной, и несколько друзей спросили, похудели ли вы. Если в этот момент ваши весы для ванной показывают, что вы потеряли 10 фунтов, это имело бы смысл, и вы продолжили бы пользоваться весами. Но если бы это указывало на то, что вы набрали 10 фунтов, вы бы справедливо пришли к выводу, что он сломался, и либо почините его, либо избавьтесь от него.Оценивая метод измерения, психологи принимают во внимание два основных аспекта: надежность и валидность.

    Надежность означает постоянство меры. Психологи рассматривают три типа согласованности: во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между разными исследователями (надежность между экспертами).

    Тестирование-повторное тестирование надежности

    Когда исследователи измеряют конструкт, который, по их мнению, является непротиворечивым во времени, полученные ими оценки также должны быть согласованными во времени.Надежность повторного тестирования — это степень, в которой это действительно так. Например, обычно считается, что интеллект постоянен во времени. Человек, который сегодня очень умный, на следующей неделе станет очень умным. Это означает, что любой хороший показатель интеллекта должен дать этому человеку примерно такие же оценки на следующей неделе, что и сегодня. Ясно, что мера, которая дает очень непоследовательные оценки с течением времени, не может быть очень хорошей мерой конструкции, которая должна быть согласованной.

    Оценка надежности повторного тестирования требует одновременного использования этого показателя на группе людей, его повторного использования на той же группе людей в более позднее время, а затем изучения корреляции между тестами и повторными тестами между двумя наборами оценок. Обычно это делается путем построения графика данных в виде диаграммы рассеяния и вычисления значений r Пирсона. На рис. 5.2 показана корреляция между двумя наборами оценок нескольких студентов университетов по шкале самооценки Розенберга, введенной два раза с интервалом в неделю.Коэффициент Пирсона для этих данных равен +,95. Обычно считается, что корреляция между тестами и повторными тестами +80 или выше указывает на хорошую надежность.

    Рисунок 5.2 Корреляция между тестами и повторными тестами между двумя наборами оценок нескольких студентов колледжа по шкале самооценки Розенберга, полученными два раза в неделю с разницей

    . время, которое относится к интеллекту, самооценке и измерениям личности Большой пятерки.Но другие конструкции не считаются стабильными с течением времени. Например, сама природа настроения такова, что оно меняется. Таким образом, показатель настроения, который дает низкую корреляцию между тестами и повторными тестами в течение месяца, не будет поводом для беспокойства.

    Внутренняя согласованность

    Второй вид надежности — это внутренняя согласованность, которая представляет собой согласованность ответов людей по всем пунктам при измерении, состоящем из нескольких пунктов. В целом предполагается, что все элементы таких показателей отражают одну и ту же основную конструкцию, поэтому оценки людей по этим вопросам должны коррелировать друг с другом.По шкале самооценки Розенберга люди, которые согласны с тем, что они достойные люди, должны соглашаться с тем, что у них есть ряд хороших качеств. Если ответы людей на разные вопросы не коррелируют друг с другом, то больше не имеет смысла утверждать, что все они измеряют одну и ту же основную конструкцию. Это верно как для поведенческих и физиологических показателей, так и для показателей самооценки. Например, люди могут сделать серию ставок в имитируемой игре в рулетку, чтобы измерить свой уровень стремления к риску.Этот показатель будет внутренне согласованным в той степени, в которой ставки отдельных участников будут постоянно высокими или низкими в ходе испытаний.

    Как и надежность повторного тестирования, внутреннюю согласованность можно оценить только путем сбора и анализа данных. Один из подходов — посмотреть на корреляцию разделенных половин. Это включает в себя разделение элементов на два набора, таких как первая и вторая половины элементов или элементы с четным и нечетным номерами. Затем для каждого набора элементов вычисляется оценка и исследуется взаимосвязь между двумя наборами оценок.Например, на рис. 5.3 показана корреляция между двумя частицами между оценками нескольких студентов университетов по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга. Значение r Пирсона для этих данных составляет +,88. Корреляция разделенных половин, равная +80 или больше, обычно считается хорошей внутренней согласованностью.

    Рис. 5.3. Корреляция между разделами и половинками между оценками нескольких студентов колледжей по четным пунктам и их оценками по нечетным пунктам шкалы самооценки Розенберга

    . статистика называется α Кронбаха (греческая буква альфа).Концептуально α — это среднее значение всех возможных корреляций разделенных половин для набора элементов. Например, существует 252 способа разделить набор из 10 элементов на два набора по пять. Α Кронбаха будет средним из 252 корреляций разделенных половин. Обратите внимание, что на самом деле α вычисляется не так, но это правильный способ интерпретации значения этой статистики. Опять же, обычно используется значение +80 или больше, чтобы указать на хорошую внутреннюю согласованность.

    Надежность Interrater

    Многие поведенческие меры требуют значительного суждения со стороны наблюдателя или оценщика.Межэкспертная надежность — это степень, в которой разные наблюдатели едины в своих суждениях. Например, если вы хотите измерить социальные навыки студентов университета, вы можете сделать видеозаписи их взаимодействия с другим студентом, с которым они встречаются впервые. Затем вы можете попросить двух или более наблюдателей посмотреть видео и оценить уровень социальных навыков каждого учащегося. В той степени, в которой каждый участник действительно обладает определенным уровнем социальных навыков, который может быть обнаружен внимательным наблюдателем, оценки разных наблюдателей должны сильно коррелировать друг с другом.Надежность между экспертами также могла быть измерена в исследовании куклы Бобо Бандуры. В этом случае оценки наблюдателей того, сколько актов агрессии совершил конкретный ребенок во время игры с куклой Бобо, должны были иметь очень положительную корреляцию. Надежность между экспертами часто оценивается с помощью α Кронбаха, когда суждения являются количественными, или аналогичной статистики, называемой κ Коэна (греческая буква каппа), когда они категоричны.

    Валидность — это степень, в которой баллы меры представляют переменную, для которой они предназначены.Но как исследователи делают такое суждение? Мы уже учли один фактор, который они учитывают, — надежность. Если показатель имеет хорошую надежность повторного тестирования и внутреннюю согласованность, исследователи должны быть более уверены в том, что оценки соответствуют тому, что им положено. Однако здесь должно быть что-то еще, потому что мера может быть чрезвычайно надежной, но совершенно бесполезной. В качестве абсурдного примера представьте человека, который считает, что длина указательного пальца человека отражает его самооценку, и поэтому пытается измерить самооценку, поднося линейку к указательным пальцам.Хотя эта мера имела бы чрезвычайно хорошую надежность повторного тестирования, она не имела бы абсолютно никакой ценности. Тот факт, что указательный палец одного человека на сантиметр длиннее, чем у другого, ничего не говорит о том, у кого из них выше самооценка.

    Обсуждения валидности обычно делят ее на несколько различных «типов». Но хороший способ интерпретировать эти типы состоит в том, что они представляют собой другие виды свидетельств, помимо надежности, которые следует принимать во внимание при оценке достоверности меры.Здесь мы рассматриваем три основных типа: валидность лица, валидность содержания и валидность критерия.

    Лицевая достоверность

    Лицевая достоверность — это степень, в которой метод измерения проявляется «на лице» для измерения интересующей конструкции. Большинство людей ожидают, что в анкету для самооценки будут включены вопросы о том, считают ли они себя достойным человеком и считают ли они себя хорошими. Таким образом, анкета, включающая такие вопросы, будет иметь хорошую внешнюю валидность.С другой стороны, метод измерения самооценки длиной пальца, похоже, не имеет ничего общего с самооценкой и, следовательно, имеет низкую достоверность. Хотя фактическая валидность может быть оценена количественно — например, с помощью большой выборки людей, оценивающих меру с точки зрения того, действительно ли она измеряет то, для чего она предназначена, — обычно она оценивается неформально.

    Фактическая достоверность — это в лучшем случае очень слабое свидетельство того, что метод измерения измеряет то, что должен.Одна из причин заключается в том, что это основано на интуиции людей о человеческом поведении, которые часто ошибочны. Также верно и то, что многие общепринятые меры в психологии работают довольно хорошо, несмотря на недостаточную достоверность. Миннесотский многофазный опросник личности-2 (MMPI-2) измеряет многие личностные характеристики и расстройства, предлагая людям решить, применимо ли к ним каждое из более чем 567 различных утверждений, при этом многие из утверждений не имеют очевидного отношения к конструкции, которую они измеряют. .Например, пункты «Мне нравятся детективы или детективы» и «Вид крови не пугает меня и не вызывает тошноту», оба измеряют подавление агрессии. В данном случае интерес представляют не буквальные ответы участников на эти вопросы, а, скорее, соответствие модели ответов участников на серию вопросов ответам людей, которые склонны подавлять свою агрессию.

    Срок действия содержимого

    Достоверность содержания — это степень, в которой мера «покрывает» интересующий конструкт.Например, если исследователь концептуально определяет тестовую тревогу как связанную как с активацией симпатической нервной системы (ведущей к нервным переживаниям), так и с негативными мыслями, то его мера тестовой тревожности должна включать как нервные переживания, так и негативные мысли. Или подумайте, что отношения обычно определяются как связанные с мыслями, чувствами и действиями по отношению к чему-либо. Согласно этому концептуальному определению, человек положительно относится к упражнениям в той мере, в какой он или она думает о тренировках положительно, чувствует себя хорошо во время тренировок и фактически занимается спортом.Таким образом, чтобы иметь хорошую достоверность содержания, показатель отношения людей к упражнениям должен отражать все три этих аспекта. Как и фактическая достоверность, достоверность содержания обычно не оценивается количественно. Вместо этого он оценивается путем тщательной проверки метода измерения на соответствие концептуальному определению конструкции.

    Срок действия критерия

    Достоверность критерия — это степень, в которой оценки людей по критерию коррелируют с другими переменными (известными как критерии), с которыми можно было бы ожидать их корреляции.Например, оценки людей по новому критерию тревожности при тестировании должны иметь отрицательную корреляцию с их успеваемостью на важном школьном экзамене. Если бы было обнаружено, что оценки людей на самом деле отрицательно коррелировали с их успеваемостью на экзамене, то это было бы доказательством того, что эти оценки действительно отражают тревогу людей перед тестированием. Но если бы выяснилось, что люди одинаково хорошо сдавали экзамен, независимо от их тестовой тревожности, это поставило бы под сомнение достоверность этой меры.

    Критерием может быть любая переменная, которая, как есть основания полагать, должна коррелировать с измеряемым конструктом, и обычно их много. Например, можно было бы ожидать, что результаты теста на тревожность будут отрицательно коррелировать с успеваемостью на экзамене и оценками по курсу и положительно коррелироваться с общим беспокойством и артериальным давлением во время экзамена. Или представьте, что исследователь разрабатывает новую меру принятия физического риска. Баллы людей по этому показателю должны соотноситься с их участием в «экстремальных» видах деятельности, таких как сноубординг и скалолазание, количеством полученных штрафов за превышение скорости и даже количеством переломов костей, которые они получили за эти годы.Когда критерий измеряется одновременно с построением, достоверность критерия упоминается как одновременная достоверность ; однако, когда критерий измеряется в какой-то момент в будущем (после того, как конструкция была измерена), он упоминается как прогностическая достоверность (поскольку оценки по этому показателю «предсказали» будущий результат).

    Критерии могут также включать другие меры той же конструкции. Например, можно было бы ожидать, что новые показатели тестовой тревожности или принятия физического риска будут положительно коррелированы с существующими показателями тех же конструктов.Это известно как конвергентная достоверность .

    Для оценки конвергентной достоверности требуется сбор данных с помощью меры. Исследователи Джон Качиоппо и Ричард Петти сделали это, когда создали свою шкалу самоотчета «Потребность в познании», чтобы измерить, насколько люди ценят и вовлечены в мышление (Cacioppo & Petty, 1982). В серии исследований они показали, что оценки людей положительно коррелировали с их оценками по стандартизированному тесту академических достижений, и что их оценки отрицательно коррелировали с их оценками по показателю догматизма (который представляет собой тенденцию к послушанию).За годы, прошедшие с момента создания, шкала потребности в познании использовалась буквально в сотнях исследований, и было показано, что она коррелирует с широким спектром других переменных, включая эффективность рекламы, интерес к политике и решения присяжных. (Петти, Бриньоль, Лёрш и МакКаслин, 2009 г.).

    Дискриминантная валидность

    Дискриминантная валидность, с другой стороны, — это степень, в которой баллы по показателю , а не коррелируют с мерами переменных, которые концептуально различны.Например, самооценка — это общее отношение к себе, которое довольно стабильно во времени. Это не то же самое, что настроение, которое бывает хорошим или плохим в данный момент. Таким образом, оценки людей по новому показателю самооценки не должны сильно коррелировать с их настроением. Если бы новый показатель самооценки был сильно коррелирован с показателем настроения, можно было бы утверждать, что новый показатель на самом деле не измеряет самооценку; вместо этого он измеряет настроение.

    При создании шкалы потребности в познании Качиоппо и Петти также предоставили доказательства дискриминантной валидности, показав, что оценки людей не коррелировали с некоторыми другими переменными.Например, они обнаружили лишь слабую корреляцию между потребностью людей в познании и мерой их когнитивного стиля — степенью, в которой они склонны мыслить аналитически, разбивая идеи на более мелкие части, или целостным образом в терминах «большой картины». Они также не обнаружили корреляции между потребностью людей в познании и показателями их тестовой тревожности и их склонностью реагировать социально желательными способами. Все эти низкие корреляции свидетельствуют о том, что показатель отражает концептуально отличную конструкцию.

    • Психологические исследователи не просто предполагают, что их меры работают. Вместо этого они проводят исследования, чтобы показать, что они работают. Если они не могут показать, что работают, они прекращают их использовать.
    • Есть два различных критерия, по которым исследователи оценивают свои измерения: надежность и валидность. Надежность — это постоянство во времени (надежность повторного тестирования), между элементами (внутренняя согласованность) и между исследователями (надежность между экспертами). Достоверность — это степень, в которой оценки фактически представляют переменную, для которой они предназначены.
    • Действительность — это решение, основанное на различных типах доказательств. Соответствующие свидетельства включают надежность меры, то, покрывает ли она интересующий конструкт и коррелируют ли полученные оценки с другими переменными, с которыми они, как ожидается, коррелируют, а не коррелируют ли с переменными, которые концептуально различны.
    • Надежность и валидность меры устанавливаются не одним исследованием, а результатами нескольких исследований.Оценка надежности и достоверности — непрерывный процесс.
    1. Практика: попросите нескольких друзей заполнить шкалу самооценки Розенберга. Затем оцените его внутреннюю согласованность, построив диаграмму рассеяния, чтобы показать корреляцию разделенных половин (элементы с четным и нечетным номерами). Вы также можете вычислить r Пирсона, если знаете как.
    2. Обсуждение. Вспомните последний экзамен в колледже, который вы сдавали, и думайте об этом как о психологической мере. Как вы думаете, для измерения какой конструкции она предназначалась? Прокомментируйте его лицо и достоверность содержания.Какие данные вы могли бы собрать, чтобы оценить их надежность и валидность критериев?

    МЕТОДЫ ИССЛЕДОВАНИЯ: ПЛАНИРОВАНИЕ: ДЕЙСТВИТЕЛЬНОСТЬ

    МЕТОДЫ ИССЛЕДОВАНИЙ: ПЛАНИРОВАНИЕ: ДЕЙСТВИТЕЛЬНОСТЬ
    ДЕЙСТВИТЕЛЬНОСТЬ

    В целом ДЕЙСТВИТЕЛЬНОСТЬ является показателем вашего исследования. В частности, обоснованность применима как к дизайну, так и к методам вашего исследования. Достоверность сбора данных означает, что ваши выводы действительно отражают явление, которое вы пытаетесь измерить.Действительные претензии являются твердыми претензиями.

    Достоверность — одна из основных проблем исследования. «На любое исследование могут влиять различные факторы, которые, хотя и не имеют отношения к интересам исследования, могут сделать выводы недействительными» (Селигер и Шохами 1989, 95). Контроль всех возможных факторов, угрожающих достоверности исследования, является основной обязанностью каждого хорошего исследователя.

    ВНУТРЕННЯЯ ДЕЙСТВИТЕЛЬНОСТЬ На влияют недостатки в самом исследовании, такие как отсутствие контроля некоторых основных переменных (проблема дизайна) или проблемы с инструментом исследования (проблема сбора данных).

    «Результаты могут считаться внутренне недействительными, потому что на них могли повлиять факторы, отличные от тех, которые, как считается, стали их причиной, или потому, что интерпретация данных исследователем явно не подтверждается» (Селигер и Шохами 1989, 95 ).

    Вот некоторые факторы, которые влияют на внутреннюю валидность:

    • Изменчивость субъектов
    • Размер исследуемой популяции
    • Время, отведенное на сбор данных или экспериментальную обработку
    • История
    • Истощение
    • Созревание
    • Чувствительность инструмента / задачи

    ВНЕШНЯЯ ДЕЙСТВИТЕЛЬНОСТЬ — это степень, в которой вы можете обобщить свои выводы на большую группу или другие контексты.Если вашему исследованию не хватает внешней достоверности, его результаты нельзя будет применить к контексту, отличному от того, в котором вы проводили свое исследование. Например, если все испытуемые — мужчины одной этнической группы, ваши выводы могут не применяться к женщинам или другим этническим группам. Или, если вы проводили свое исследование в строго контролируемой лабораторной среде, ваши результаты могут не точно отражать то, что может происходить в реальном мире.

    «Результаты можно назвать внешне недействительными, потому что [они] не могут быть расширены или применены к контекстам, выходящим за рамки тех, в которых проводилось исследование» (Селигер и Шохами 1989, 95).

    Вот семь важных факторов, влияющих на внешнюю валидность:

    • Характеристики населения (субъекты)
    • Взаимодействие выбора субъектов и исследования
    • Описательная явность независимой переменной
    • Влияние исследовательской среды
    • Исследователь или экспериментатор эффекты
    • Методология сбора данных
    • Эффект времени

    В чем разница между целостностью данных и достоверностью данных?

    ЦЕЛОСТНОСТЬ ДАННЫХ по сравнению сДЕЙСТВИТЕЛЬНОСТЬ ДАННЫХ

    == Чтобы быть точными в нашем суждении о большой разнице между «Проверка данных» и «Целостность данных», мы должны подчеркнуть, что сравнение этих терминов может быть подчеркнуто в следующих параметрах:

    1- Определения:

    — Целостность данных — это гарантия того, что информация не изменилась из ее источника и не была случайной (например,грамм. из-за ошибок программирования) или злонамеренно (например, посредством взлома или взлома) модифицированы, изменены или уничтожены. Другими словами, это касается полноты, достоверности и целостности данных, которые соответствуют намерениям создателей данных.

    — Проверка данных — это тесты и оценки, используемые для определения соответствия спецификациям и требованиям безопасности, чтобы гарантировать правильность и обоснованность данных.

    2- Но у них одно и то же назначение:

    — Целостность и проверка данных снижают риск для системы агентства от вредоносного программного обеспечения и вторжений, а также от случайного изменения или уничтожения.

    — Целостность данных — это мера достоверности и точности объекта данных.

    — Несмотря на это, ошибки достоверности данных встречаются чаще, чем ошибки целостности данных.

    3- Преимущества:

    — Адреса целостности данных:

    (i) — Защита информации от случайного или злонамеренного изменения или уничтожения.

    (ii) — Обеспечение уверенности в том, что информация соответствует ожиданиям в отношении ее качества, i.е. обеспечение целостности данных обеспечивает качество данных в базе данных.

    (iii) — Например, если сотрудник введен со значением идентификатора сотрудника 123, база данных не должна позволять другому сотруднику иметь идентификатор с тем же значением. Или, если в таблице есть столбец идентификатора отдела, в котором хранится номер отдела для сотрудника, база данных должна разрешать только значения, действительные для номеров отделов в компании.

    (iv) — Как функция, связанная с безопасностью, служба целостности данных поддерживает информацию точно в том виде, в каком она была введена, и подлежит аудиту для подтверждения ее надежности.Данные подвергаются любому количеству операций в поддержку принятия решений, таких как захват, хранение, извлечение, обновление и передача. Целостность данных также может быть мерой производительности во время этих операций на основе обнаруженной частоты ошибок.

    — Проверка данных:

    a) -Устанавливает соответствие спецификациям и требованиям безопасности.

    b) -Гарантирует вашему приложению, что каждое значение данных является правильным и точным.

    4- Типы и категории:

    — Целостность данных попадает в следующие категории:

    · Целостность объекта — Он определяет строку как уникальный объект для конкретной таблицы с помощью индексов, ограничений UNIQUE, ограничений PRIMARY KEY или свойств IDENTITY.

    · Целостность домена — Это действительность записей для данного столбца; путем ограничения типа (с помощью типов данных), формата (с помощью ограничений и правил CHECK) или диапазона возможных значений (с помощью ограничений FOREIGN KEY, определений DEFAULT, определений NOT NULL и правил).

    · Ссылочная целостность — Обеспечивает согласованность значений ключей во всех таблицах, чтобы сохранить определенные отношения между таблицами при вводе или удалении записей.В Microsoft® SQL Server ™ 2000 ссылочная целостность основана на отношениях между внешними ключами и первичными ключами или между внешними ключами и уникальными ключами (через ограничения FOREIGN KEY и CHECK).

    · Целостность, определяемая пользователем — Позволяет определять конкретные бизнес-правила, которые не попадают ни в одну из других категорий целостности. Все категории целостности поддерживают определяемую пользователем целостность (все ограничения на уровне столбцов и таблиц в CREATE TABLE, хранимых процедурах и триггерах).

    — Data Validity имеет несколько типов:

    · Проверка типа данных — для проверки типа данных с пользовательским интерфейсом вашего приложения, чтобы узнать, является ли строка буквенной? или «число числовое?»

    · Проверка диапазона — Как расширение проверки простого типа, чтобы гарантировать, что предоставленное значение находится в пределах допустимых минимумов и максимумов.Как и в случае проверки типа данных, интерфейс вашего приложения обычно может обеспечивать необходимую проверку диапазона, хотя в качестве альтернативы конструкции вы можете создать бизнес-правило для обработки проверок диапазона.

    · Проверка кода — для которых обычно требуется таблица поиска в качестве таблицы проверки для хранения авторизованных кодов, и эта таблица может быть частью бизнес-правила или может быть реализована непосредственно в базе данных для поиска запроса.

    · Комплексная проверка — Это применимо, когда иногда простого поля и проверки подстановки недостаточно, а проверка данных выходит за рамки экрана непосредственного ввода данных до сложной проверки данных с несколькими файлами, которую лучше всего обрабатывать с помощью бизнес-правил на основе процедур. , чтобы ограничить начисления за год до текущей даты и за весь срок действия.

    5- Рисунок дизайна:

    — Дизайн проверки данных в вашем приложении может быть выполнен с использованием нескольких различных подходов: кода пользовательского интерфейса, кода приложения или ограничений базы данных.

    — Дизайн таблиц целостности данных может быть спланирован путем определения допустимых значений для столбца и принятия решения о том, как обеспечить целостность данных в столбце.

    6- Государственные нормы, стандарты или законодательство:

    — Люди не всегда могут сканировать информацию, чтобы определить, были ли данные удалены, добавлены или изменены.Даже если бы сканирование было возможно, у человека не было возможности узнать достоверность данных. Поэтому желательно иметь автоматизированные средства обнаружения как международных, так и непреднамеренных модификаций данных.

    — Целостность данных — Процедура согласования (например, контрольные суммы, хеш-итоги, счетчики записей) должна использоваться, чтобы гарантировать, что программное обеспечение или данные не были изменены. Этот процесс очень важен, потому что ошибки целостности данных вызваны ошибками в компьютерных программах, которые, например, вызывают перезапись некоторых данных в базе данных, когда кто-то пытается получить пустое значение из базы данных.

    — Проверка данных — Программы проверки целостности (например, проверки разумности согласованности, проверка во время ввода и обработки данных) должны использоваться для поиска доказательств фальсификации данных, ошибок и пропусков, в которых ошибки достоверности данных обычно вызваны людьми — обычно персонал по вводу данных — кто ошибочно вводит эти данные.

    — Ошибки достоверности данных, вызванные неправильным вводом данных, называемые ошибками достоверности данных, вероятно, являются наиболее распространенными ошибками, связанными с данными.Эти ошибки также труднее всего обнаружить в системе, и обычно они возникают, когда за короткий промежуток времени вводится большой объем данных.

    4 типа валидности в дизайне исследования (+3 еще для рассмотрения)

    Выводы, которые вы делаете на основе своего исследования (будь то анализ опроса, фокус-группы, экспериментальный план или другие методы исследования), полезны только в том случае, если они верны .

    Насколько «верны» эти результаты? Насколько хорошо они представляют то, что вы на самом деле пытаетесь изучить? Валидность используется, чтобы определить, измеряет ли исследование то, что оно намеревалось измерить, и приблизить правдивость результатов.

    К сожалению, исследователи иногда создают свои собственные определения того, что считается достоверным.

    • В количественных исследованиях проверка достоверности и надежности является данностью.
    • Однако некоторые качественные исследователи зашли так далеко, что предположили, что валидность неприменима к их исследованиям, даже если они признают необходимость некоторых квалификационных проверок или мер в своей работе.

    Это неправильно. Валидность всегда важна, даже если ее сложнее определить при качественном исследовании.

    Игнорирование действительности — значит поставить под сомнение надежность вашей работы и поставить под сомнение уверенность других в ее результатах. Даже когда в исследованиях используются качественные показатели, их необходимо рассматривать с использованием показателей надежности и валидности, чтобы поддерживать достоверность результатов.

    Что такое обоснованность в исследовании?

    Достоверность — это то, как исследователи говорят о степени соответствия результатов действительности. Методы исследования, количественные или качественные, — это методы изучения реального явления — валидность означает, какую часть этого явления они измеряют по сравнению ссколько «шума» или несвязанной информации зафиксировано результатами.

    Валидность и надежность определяют разницу между «хорошими» и «плохими» исследовательскими отчетами. Качественное исследование зависит от приверженности тестированию и повышению достоверности, а также надежности результатов ваших исследований.

    Любое ценное исследование касается того, является ли то, что измеряется, тем, что должно быть измерено, и рассматривает способы, которыми на наблюдения влияют обстоятельства, в которых они проводятся.

    Основа того, как мы делаем наши выводы, играет важную роль в рассмотрении более широких вопросов существа любого данного исследования.

    По этой причине мы собираемся рассмотреть различные типы валидности, которые были сформулированы как часть законной исследовательской методологии.

    Вот 7 основных типов достоверности исследования:

    1. Срок действия
    2. Срок действия
    3. Срок действия конструкции
    4. Внутренний срок действия
    5. Внешнее действие
    6. Срок действия статистического заключения
    7. Срок действия по критерию

    1.Срок действия

    Правильность лица — это то, насколько достоверными кажутся ваши результаты в зависимости от того, как они выглядят. Это наименее научный метод достоверности, поскольку он не определяется количественно с помощью статистических методов.

    Лицевая действительность не является действительностью в техническом смысле этого слова. Его интересует, кажется ли, что мы измеряем то, что заявляем.

    Здесь мы смотрим, насколько достоверная мера кажется на первый взгляд, и на основании этого делаем субъективные суждения.

    Например,

    • Представьте, что вы проводите опрос, который респонденту кажется действительным, а вопросы выбираются, потому что администратору они кажутся действительными.
    • Администратор спрашивает группу случайных людей, неподготовленных наблюдателей, кажутся ли им эти вопросы верными

    В исследованиях никогда не бывает достаточно полагаться только на суждения о лицах — и необходимы более поддающиеся количественной оценке методы проверки достоверности, чтобы сделать приемлемые выводы. Есть много инструментов измерения, которые следует учитывать, поэтому фактическая достоверность полезна в тех случаях, когда вам нужно отличать один подход от другого.

    Лицевая валидность никогда не следует доверять самой по себе.

    2. Срок действия

    Достоверность содержания — это то, охватывает ли мера, используемая в исследовании, все содержание базовой конструкции (то, что вы пытаетесь измерить).

    Это также субъективная мера, но в отличие от фактической достоверности мы спрашиваем, охватывает ли содержание меры всю область содержания. Если исследователь хотел бы измерить интроверсию, ему сначала нужно было бы решить, что составляет релевантную область контента для этой черты.

    Достоверность контента считается субъективной формой измерения, потому что она по-прежнему полагается на восприятие людей для измерения конструкций, которые в противном случае было бы трудно измерить.

    Где достоверность контента отличает себя (и становится полезной), так это за счет привлечения экспертов в данной области или лиц, принадлежащих к целевой группе. Это исследование можно сделать более объективным с помощью строгих статистических тестов.

    Например, у вас может быть исследование валидности контента, которое информирует исследователей о том, как элементы, используемые в опросе, представляют их предметную область, насколько они ясны и в какой степени они поддерживают теоретическую структуру факторов, оцененную с помощью факторного анализа.

    3. Срок действия конструкции

    Конструкция представляет собой набор моделей поведения, которые связаны значимым образом для создания образа или идеи, придуманной для исследовательских целей. Валидность конструкции — это степень, в которой ваше исследование измеряет конструкт (по сравнению с вещами вне конструкции).

    Депрессия — это конструкция, которая представляет собой черту личности, которая проявляется в таком поведении, как чрезмерный сон, потеря аппетита, трудности с концентрацией внимания и т. Д.

    Существование конструкции подтверждается наблюдением за набором связанных индикаторов. Любой один знак может быть связан с несколькими конструкциями. Человек с трудностями в концентрации может иметь A.D.D. но не депрессия.

    Конструктивная валидность — это степень, в которой могут быть сделаны выводы из операционализаций (соединения концепций с наблюдениями) в вашем исследовании к конструкциям, на которых эти операционализации основаны. Чтобы установить достоверность конструкции, вы должны сначала предоставить доказательства того, что ваши данные поддерживают теоретическую структуру.

    Вы также должны показать, что управляете операционализацией конструкции, другими словами, показать, что ваша теория имеет некоторое соответствие с реальностью.

    • Конвергентная достоверность — степень, в которой операция похожа на другие операции, на которую она теоретически должна быть похожей.
    • Дискриминационная валидность -– если шкала адекватно дифференцирует себя или не различает группы, которые должны различаться или не различаться на основании теоретических соображений или предыдущих исследований.
    • Номологическая сеть — представление конструктов, представляющих интерес в исследовании, их наблюдаемых проявлений и взаимосвязей между ними и между ними. Согласно Кронбаху и Милу, номологическая сеть должна быть разработана для меры, чтобы она имела конструктивную валидность
    • .
    • Multitrait-Multimethod Matrix — Шесть основных соображений при проверке достоверности конструкции в соответствии с Кэмпбеллом и Фиске. Это включает в себя оценки конвергентной достоверности и дискриминативной достоверности.Остальные — это единица метода черты, несколько методов / черт, действительно другая методология и характеристики черт.

    4. Внутренняя действительность

    Внутренняя достоверность относится к степени, в которой независимая переменная может быть точно указана для получения наблюдаемого эффекта.

    Если эффект зависимой переменной обусловлен только независимой (ыми) переменной (ами), то внутренняя достоверность достигается. Это степень, в которой можно манипулировать результатом.

    Другими словами, внутренняя валидность — это то, как вы можете сказать, что ваше исследование «работает» в исследовательской среде.Влияет ли изменяемая вами переменная на изучаемую вами в рамках данного исследования?

    Никогда не пропустите запись в блоге

    Подпишитесь на блог ActiveCampaign, чтобы получать последние новости о продуктах.

    5. Внешнее действие

    Внешняя валидность — это степень, в которой результаты исследования могут быть обобщены за пределами выборки. То есть вы можете применить свои выводы к другим людям и окружающим условиям.

    Подумайте об этом как о степени обобщения результата.Насколько хорошо результаты исследования применимы к остальному миру?

    Лаборатория (или другое место исследования) — это контролируемая среда с меньшим количеством переменных. Внешняя валидность относится к тому, насколько хорошо результаты сохраняются, даже при наличии всех этих других переменных.

    6. Срок действия статистического заключения

    Достоверность статистического заключения — это определение наличия взаимосвязи или совместной вариации между причинно-следственными переменными.

    Этот тип действительности требует:

    • Обеспечение надлежащих процедур отбора проб
    • Соответствующие статистические тесты
    • Надежные методы измерения

    Это степень достоверности вывода.

    7. Срок действия по критерию

    Критериальная валидность (также называемая инструментальной валидностью) — это мера качества ваших методов измерения. Точность меры демонстрируется путем сравнения ее с уже заведомо действительной мерой.

    Другими словами — если ваша мера имеет высокую корреляцию с другими мерами, которые, как известно, действительны из-за предыдущих исследований.

    Для того, чтобы это сработало, вы должны знать, что критерий был хорошо измерен.И имейте в виду, что соответствующие критерии существуют не всегда.

    Что вы делаете, так это проверяете эффективность вашего ввода в эксплуатацию по критериям.

    Критерии, которые вы используете в качестве стандарта суждения, учитывают различные подходы, которые вы бы использовали:

    • Predictive Validity — способность операционализации предсказать то, что она теоретически способна предсказать. Степень, в которой мера предсказывает ожидаемые результаты.
    • Concurrent Validity — способность операционализации различать группы, которые она теоретически должна уметь.Здесь тест хорошо коррелирует с показателем, который был ранее проверен.

    Когда мы смотрим на достоверность данных опроса, мы спрашиваем, представляют ли данные то, что, по нашему мнению, они должны представлять.

    Мы зависим от мышления и отношения респондента, чтобы предоставить нам достоверные данные.

    Другими словами, мы зависим от них, чтобы они ответили на все вопросы честно и добросовестно. Мы также зависим от того, смогут ли они ответить на вопросы, которые мы задаем.Когда задаются вопросы, которые респондент не может понять или понять, тогда данные не говорят нам, что, по нашему мнению, они делают.

    Надежность и валидность? Они взаимозаменяемы?

    Explorance занимается защитой данных, которые доверяют нам наши клиенты. В настоящей Политике конфиденциальности ясно и просто изложен наш подход к информационной безопасности и защите данных. Недавно он был расширен, чтобы соответствовать и превосходить требования Общего регламента ЕС по защите данных (GDPR) и продолжает соблюдать правила других стран и штатов.

    Наша политика конфиденциальности регулирует как наши методы продаж и маркетинга, так и продукты и услуги. Мы разделили эти две темы на этом сайте, чтобы вам было легче находить нужную информацию. В обоих случаях мы описываем, какую информацию мы собираем, как она используется, наши законные основания для этого использования, как мы обеспечиваем ее безопасность, а также ваши права и права всех пользователей наших продуктов и услуг.

    Продажи и маркетинг

    Какую информацию мы собираем?

    Мы собираем информацию от вас, когда вы регистрируетесь на нашем сайте, подписываетесь на нашу рассылку новостей, отвечаете на опрос или заполняете форму.При запросе информации или регистрации на нашем сайте вам будет предложено ввести свое имя, адрес электронной почты и / или номер телефона. Однако вы можете просматривать наш сайт анонимно. Кроме того, мы используем Google Analytics для отслеживания показателей использования веб-сайта. Пожалуйста, ознакомьтесь с нашей политикой в ​​отношении файлов cookie для получения более подробной информации.

    Как мы используем эту информацию?

    Информация, которую мы получаем от вас, может быть использована для ответа на запрос о дополнительной информации, персонализации вашего опыта, улучшения нашего веб-сайта и обслуживания клиентов, а также для периодической отправки вам электронных писем, таких как информационные бюллетени, новости компании и сопутствующая информация о продуктах.Во всех таких электронных сообщениях от Explorance будет предложена возможность отказаться от любых подобных уведомлений.

    Каковы законные основания для использования этой информации?

    Основная причина известна как «законные интересы», то есть у нас есть веская и справедливая причина использовать ваши данные, и мы делаем это таким образом, чтобы не нарушать ваши права и интересы. Вторая основа — это поддержка наших договорных обязательств с нашими клиентами.

    Как ваши данные хранятся в безопасности?

    Мы используем программные системы мирового класса для безопасного хранения всей информации, собранной с нашего веб-сайта и других источников, связанных с продажами и маркетингом.Кроме того, Explorance имеет несколько внутренних политик и программ безопасности данных, в том числе политику прямого маркетинга, политику информационной безопасности и защиты данных, политику уведомления о нарушениях и программу обучения безопасности в масштабах всей компании. Эти политики регулярно проверяются нашей командой по управлению защитой данных.

    Передаются ли ваши данные третьим лицам?

    Никакая информация, собранная через наш веб-сайт, не продается и не передается для использования третьим лицам. Информация, собранная на нашем веб-сайте, хранится в защищенных системах и доступна только уполномоченному персоналу.Тем не менее, мы можем раскрыть вашу информацию, когда мы считаем, что это уместно для соблюдения закона, обеспечения соблюдения политики нашего сайта или защиты наших или других прав, собственности или безопасности.

    Каковы ваши права?

    В дополнение к праву знать, как используются ваши данные и кому они передаются (которое описано выше), ваши права включают право знать, какую личную информацию мы собрали, право на получение копии этих данных, право вносить исправления и требовать его удаления.По всем таким запросам обращайтесь к менеджеру своего аккаунта или отправляйте электронное письмо по адресу [email protected] Мы будем рады ответить на любые ваши вопросы и помочь любым возможным способом.

    Продукты и услуги

    Какую информацию мы собираем?

    Набор информации, позволяющей установить личность, определяется нашими клиентами (также известными как «контролеры») и обычно представляет собой демографические данные, связанные с получателями оценок и опросов, предоставляемых нашими продуктами.

    Кроме того, мы собираем и храним определенные типы информации с помощью пассивных инструментов сбора, таких как файлы cookie и зашифрованные токены аутентификации.Файлы cookie — это небольшие текстовые файлы, размещаемые на вашем компьютере, которые наши продукты могут извлекать позже. Если аналитика включена, может собираться дополнительная информация, такая как канал заполнения, тип браузера и устройства, IP-адрес и операционная система. Наши продукты предоставляют возможность использовать сторонние инструменты аналитики, такие как Google Analytics.

    Как мы используем эту информацию?

    Информация обрабатывается по запросу клиента, который обычно представляет результаты оценок и опросов.Файлы cookie и аналитические данные помогают нам понять, как вы используете наши продукты, чтобы мы могли улучшить ваше взаимодействие с пользователем.

    Каковы законные основания для использования этой информации?

    Мы обрабатываем данные по запросу наших клиентов в соответствии с договорными обязательствами, соответствующими местному, государственному, провинциальному и федеральному законодательству. Сюда входят FERPA (Закон о семейных правах на образование и неприкосновенность частной жизни), PIPEDA (Закон о защите личной информации и электронных документов), GDPR (Общие правила защиты данных), APP (Австралийские принципы конфиденциальности) и PDPA (Закон о защите личных данных).

    Как ваши данные хранятся в безопасности?

    Контроль доступа конечных пользователей обычно осуществляется через службу аутентификации клиента. Наш центр обработки данных, размещенный в Blue, расположенный в Канаде, имеет сертификат SOC 2 Type 2, а Bluepulse, BlueX и MTM используют региональные центры обработки данных Microsoft Azure. Для передачи данных используются защищенные протоколы ftp и https. Кроме того, Explorance имеет несколько внутренних политик и программ безопасности данных, в том числе политику информационной безопасности и защиты данных, политику уведомления о нарушениях и программу обучения безопасности в масштабах всей компании.Эти политики регулярно проверяются нашей командой по управлению защитой данных.

    Передаются ли ваши данные третьим лицам?

    Никакая информация, собранная с помощью наших продуктов, не передается третьим лицам без явного согласия уполномоченного представителя клиента.

    Каковы права конечных пользователей наших продуктов?

    Заказчик несет ответственность за информирование своих конечных пользователей об их правах и соблюдение этих прав в соответствии с их местными нормативными актами.При этом продукты и услуги Explorance стремятся соблюдать принципы конфиденциальности, изложенные в таких нормативных актах, как GDPR , PIPEDA , FERPA , APP , PDPC , и мы будем поддерживать вас и ваших конечных пользователей в каждом возможен способ, в том числе:

    • Право на получение информации — Наши продукты поддерживают индивидуализированный обмен сообщениями, который можно использовать для информирования ваших конечных пользователей.
    • Право на доступ и переносимость данных — Уполномоченные администраторы могут извлекать запрошенные данные из наших продуктов.
    • Право на исправление — Уполномоченные администраторы могут обновлять данные по мере необходимости во всех наших продуктах.
    • Право на удаление. По запросу личные данные могут быть анонимными.
    • Право ограничивать обработку — Уполномоченные администраторы могут отключить обработку, закрывая задачи или обновляя информацию профиля.
    • Право на возражение — этот процесс определяется отдельными клиентами в соответствии с требованиями местного законодательства.
    • Права, связанные с автоматическим принятием решений, включая профилирование — Наши продукты не обрабатывают данные таким образом.

    Положения и условия

    Наши Условия и положения устанавливают использование, отказ от ответственности и ограничения ответственности, регулирующие использование нашего веб-сайта. Используя наш сайт, вы соглашаетесь с этими условиями и нашей политикой конфиденциальности в Интернете.

    Наши условия использования SMS устанавливают использование, отказ от ответственности и ограничения ответственности, регулирующие использование функций службы коротких сообщений («SMS» или «текстовое сообщение») наших продуктов и услуг.

    Explorance привержена мировым стандартам информационной безопасности и будет обновлять свои политики и продукты по мере развития международных правил.

    Для получения дополнительной информации, а также для подачи жалобы или запроса отправьте электронное письмо по адресу [email protected]

    Эта политика конфиденциальности может время от времени обновляться. Пожалуйста, периодически посещайте эту страницу, чтобы быть в курсе любых изменений.

    Эта политика конфиденциальности последний раз обновлялась 2 июня 2021 г.

    Как вы оцениваете? (+ Free Scorecard)

    К настоящему времени вы слышали, насколько ценными могут быть данные, как они могут способствовать развитию вашей компании, как вы можете использовать их для принятия более эффективных решений.Конечно, здесь есть нюанс. Информация имеет ценность только в том случае, если она качественная.

    Как вы можете оценить качество ваших данных? Качество данных соответствует шести параметрам: точность, полнота, согласованность, своевременность, достоверность и уникальность. Прочтите, чтобы узнать об определениях этих параметров качества данных.

    • Точность
    • Полнота
    • Согласованность
    • Своевременность
    • Достоверность
    • Уникальность

    Шесть измерений качества данных для оценки

    Измерение 9011 9011 9011 9011 9011 9011 9011 9011 9011 9011 9011 9011 отражает ли информация реальность?
    Полнота Соответствует ли он вашим ожиданиям в отношении того, что является всеобъемлющим?
    Согласованность Соответствует ли информация, хранящаяся в одном месте, релевантным данным, хранящимся в другом месте?
    Своевременность Доступна ли ваша информация, когда она вам нужна?
    Срок действия Имеется ли информация в определенном формате, соответствует ли она бизнес-правилам или используется в непригодном для использования формате?
    Уникальность Является ли это единственным случаем, когда эта информация появляется в базе данных?

    Точность

    Термин «точность» относится к степени, в которой информация точно отражает описываемое событие или объект.Например, если возраст покупателя 32 года, но система говорит, что ей 34 года, эта информация неточна.

    Какие шаги вы можете предпринять, чтобы повысить точность? Спросите себя, отражает ли информация реальность ситуации. Есть неверные данные (которые нужно исправить)?

    Полнота

    Данные считаются «полными», если они соответствуют ожиданиям полноты. Допустим, вы просите клиента указать свое имя. Вы можете указать отчество клиента по желанию, но если у вас есть имя и фамилия, данные будут полными.

    Есть вещи, которые вы можете сделать, чтобы улучшить это измерение качества данных. Вам нужно будет оценить, доступна ли вся необходимая информация и отсутствуют ли какие-либо элементы.

    Согласованность

    Во многих компаниях одна и та же информация может храниться более чем в одном месте. Если эта информация совпадает, она считается «непротиворечивой». Например, если ваша информационная система отдела кадров сообщает, что сотрудник там больше не работает, а в платежной ведомости указано, что он все еще получает чек, это непоследовательно.

    Чтобы устранить проблемы с несогласованностью, просмотрите свои наборы данных, чтобы убедиться, что они одинаковы во всех случаях. Есть ли случаи, когда информация конфликтует сама с собой?

    Прочтите нашу электронную книгу

    Посмотрите, как оценка качества данных выглядит на практике. Просмотрите четыре ключевых показателя, которые организации могут использовать для измерения качества данных.

    Своевременность

    Доступна ли ваша информация именно тогда, когда она необходима? Этот параметр качества данных называется «своевременность».«Допустим, вам нужна финансовая информация каждый квартал; если данные готовы, когда они должны быть, это своевременно.

    Своевременность качества данных — это ожидание пользователя. Если ваша информация не готова именно тогда, когда она вам нужна, она не соответствует этому параметру.

    Действительность

    Действительность — это показатель качества данных, который относится к информации, которая не соответствует определенному формату или не соответствует бизнес-правилам. Популярный пример — дни рождения: многие системы просят вас ввести день рождения в определенном формате, и если вы этого не сделаете, это недействительно.

    Чтобы соответствовать этому параметру качества данных, вы должны проверить, соответствует ли вся ваша информация определенному формату или бизнес-правилам.

    Уникальность

    «Уникальная» информация означает, что в базе данных присутствует только один ее экземпляр. Как известно, дублирование данных — частое явление. «Дэниел А. Робертсон» и «Дэн А. Робертсон» вполне могут быть одним и тем же человеком.

    Соответствие этому параметру качества данных предполагает анализ вашей информации, чтобы убедиться, что она не дублируется.

    Как соотносятся ваши данные?

    Выполняете ли вы все возможные параметры качества данных? Загрузите бесплатную карту показателей, чтобы оценить свои собственные инициативы по обеспечению качества данных. Решения для обеспечения качества данных могут помочь улучшить вашу оценку и обеспечить точность, согласованность и полноту данных для принятия уверенных бизнес-решений.

    Чтобы узнать больше, прочтите нашу электронную книгу: 4 способа измерения качества данных

    Validity — Statistics Solutions

    Действительность относится к состоянию, в котором исследователь или исследователь может получить уверенность в том, что выводы, сделанные на основе данных, безошибочны или точны.Если в выборке есть достоверность, значит, она относится к той генеральной совокупности, из которой была взята эта выборка.

    Statistics Solutions — лидер страны в области статистики достоверности и диссертаций. Используйте календарь ниже, чтобы запланировать бесплатную 30-минутную консультацию.

    Узнайте, как мы помогаем редактировать главы вашей диссертации
    Выравнивание теоретической основы, сбор статей, синтез пробелов, формулирование четкой методологии и плана данных, а также написание теоретических и практических последствий вашего исследования являются частью наших комплексных услуг по редактированию диссертаций.

    • Своевременно вносить экспертизу по редактированию диссертаций на главы 1-5
    • Отслеживайте все изменения, а затем работайте с вами над научным письмом
    • Постоянная поддержка по обратной связи с комитетом, сокращение количества исправлений

    Существует четыре основных типа валидности. Это внутренние, внешние, статистически убедительные и построенные.

    Внутренняя достоверность относится к типу, в котором между переменными существует причинно-следственная связь.Это означает причинную связь между зависимым и независимым типом переменной. Внутренняя валидность относится к тем факторам, которые являются причиной влияния на зависимую переменную. Этот тип используется в случае планирования экспериментов, когда лечение назначается случайным образом.

    Внешняя действительность относится к типу, в котором существует причинная связь между причиной и следствием. Причина и следствие — это те, которые обобщаются или передаются либо разным людям, либо различным лечебным переменным и переменной измерения.

    Статистически убедительная достоверность относится к типу, при котором исследователь интересуется выводом о степени связи между двумя переменными. Например, при изучении связи между двумя переменными исследователь достигает статистически убедительной достоверности только в том случае, если он выполнил тесты на статистическую значимость гипотез, предсказанных им. Этот тип нарушается, когда исследователь достигает двух типов ошибок, а именно ошибки I типа и ошибки II типа.

    Ошибка

    типа I вызывает нарушение этого типа достоверности, потому что при этом типе ошибки исследователь отвергает гипотезу, которая действительно была верной.

    Ошибка

    типа II вызывает нарушение этого типа достоверности, потому что при этом типе ошибки исследователь принимает гипотезу, которая действительно была ложной.

    Construct Validity относится к типу, в котором конструкция теста участвует в прогнозировании отношения для зависимого типа переменной. Например, валидность конструкции может быть определена с помощью альфы Кронбаха.В альфе Кронбаха предполагается, что если его значение равно 0,80, то оно считается пригодным для подтверждения, а если его значение равно 0,70, то оно адекватно. Итак, если конструкция удовлетворяет таким условиям, то справедливость сохраняется. В противном случае это не так.

    Конвергентная / дивергентная проверка и факторный анализ также используются для проверки этого типа достоверности.

    Между достоверностью и надежностью существует тесная взаимосвязь. Тест считается ненадежным, если он не соответствует условиям действительности.Надежность — необходимое свойство теста, но не достаточное условие.

    Таким образом, достоверность играет важную роль в создании точных выводов о данных.

    Есть определенные вещи, которые действуют как угроза действительности. Это следующие:

    Если исследователь собирает недостаточно данных для того, чтобы сделать это заключение, это невозможно, потому что недостаточные данные не будут представлять популяцию в целом.

    Добавить комментарий

    Ваш адрес email не будет опубликован. Обязательные поля помечены *