Внутренняя и внешняя валидность
Внешняя и внутренняя валидность.
Боровкова Виктория И-01
ВАЛИДНОСТЬ (validity)—достоверность (или степень достоверности) вывода, которую обеспечивают результаты реального эксперимента по сравнению с результатами безупречного эксперимента. “В.”—центральное понятие словаря экспериментатора: оно объединяет основные цели исследования с идеальными эталонами их достижения и реальными процедурами проведения экспериментах
Глобальной целью любого экспериментального исследования является обобщение полученных результатов и вывода об экспериментальной гипотезе. Однако полное достижение этой цели возможно лишь в мысленном, безупречном эксперименте, невыполнимом на практике. Реальный эксперимент в той или иной мере репрезентирует (представляет) безупречный, и чем лучше эта репрезентативность, тем выше В. эксперимента. Таким образом, повышение В., т. е. планирование проведения эксперимента в соответствии с его безупречным образцом, является конкретной задачей исследователя, успешность решения которой зависит, во-первых, от характера, реальных условий и, во-вторых, от адекватности выбора средств.
В соответствии с различными типами безупречного эксперимента различают внутреннюю и внешнюю В.:
— внутренняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами идеального бесконечного экспериментов. Повышение внутренней В. связано с устранением результатов действия побочных переменных и с усреднением их изменчивости и нестабильности. Внутренняя В. — первое и необходимое требование к экспериментальным выводам: эксперимент, не обладающий внутренней В., названы автором просто неудачным.
При обладающем внутренней валидностью исследовании исследователь уверен, что результаты, полученные измерением зависимой переменой, непосредственно связаны с независимой переменной, а не с каким-нибудь другим неконтролируемым фактором[2].
Однако, фактически, в науке (особенно в психологии) невозможно со стопроцентной уверенностью утверждать, что внутренняя валидность соблюдена. Например, невозможно изучить какой-то психический процесс отдельно от психики в целом. Поэтому всегда при любом психологическом эксперименте учёный может лишь максимально (но не абсолютно) удалить или минимизировать разнообразные факторы, угрожающие внутренней валидности.
Пример нарушения внутренней валидности
Допустим, мы хотим проверить лекарство, от которого люди будут становиться выше. Допустим, для своих исследований мы отбираем в качестве испытуемых 13-летних подростков, измеряем их рост, и даём им лекарство. Два года спустя мы возвращаемся к теперь уже 15-летним детям и фиксируем их текущий рост. Несомненно то, что они стали выше, но без сомнения и то, что мы не можем сделать из этого вывод, что эффект роста был вызван лекарством, так как мы не учли в своём теоретическом эксперименте естественных процессов взросления. Здесь внутренняя валидность нарушена следующим образом: мы не учли побочного для нашего исследования влияния других (в данном случае — очевидных) факторов, тогда как надо было их учитывать.
— внешняя В. — достоверность выводов, которую обеспечивают результаты реального эксперимента по сравнению с результатами эксперимента полного соответствия. Повышение внешней В. обеспечивается достижением соответствия уровней дополнительных переменных в эксперименте уровням этих переменных в изучаемой реальности. Эксперимент, не обладающий внешней В., является неверным, не соответствующим поставленной гипотезе (но, быть может, пригодным для проверки, другой гипотезы).
Внешняя валидность определяет то, в какой мере результаты, полученные в эксперименте, могут соответствовать тому типу жизненной ситуации, которая была исследована, и то, насколько возможно обобщить эти результаты на все подобные жизненные ситуации[1]. Например, критику психологов-экспериментаторов в том, что о студентах-второкурсниках и белых крысах они знают очень много, а обо всём остальном — очень мало, можно рассматривать как критику внешней валидности.
Как и в отношении любой другой валидности, о внешней валидности в исследовании, вероятно, невозможно сказать, что она абсолютно соблюдена, можно указать только на её нарушение. Абсолютным соблюдение внешней валидности считалось бы тогда, когда результаты исследования можно обобщить на любые популяции при любых условиях и в любое время, поэтому учёные говорят не о соблюдении либо несоблюдении внешней валидности, а о степени её соблюдения.
Критерии внешней валидности
Чтобы исследование обладало наивысшей степенью валидности, должна существовать возможность генерализации его результатов на:
-другие популяции,
-другие условия,
-другое время.
Пример нарушения внешней валидности
Исследование Лоренса Колберга, посвящённое изучению нравственного развития детей, было подвергнуто критике за низкую степень внешней валидности. В 1963 году Колберг предложил мальчикам-подросткам разрешить различные коротко сформулированные дилеммы. На основании полученных ответов он разработал теорию о шести стадиях морального развития.
Критика внешней валидности этого исследования в частности состояла в том, что учёный не учитывал половых различий в особенностях мышления способах принятия моральных решений и, следовательно, неправомерно обобщил свою модель на представителей обоих полов.
Колберг также исходил из предпосылки о том, что существуют некие «универсальные принципы справедливости и соблюдения прав личности», однако он не учёл межкультурных различий, следовательно, выводы, которые он сделал, не могут восприниматься как универсальные.
Соблюдение внешней валидности
Чтобы увеличить степень внешней валидности, в исследованиях могут не ограничиваться лишь экспериментальным методом, но также использовать и другие — например, наблюдение, межкультурные исследования и т. д.
При современном научном подходе в психологии соблюдение внешней валидности в исследованиях играет ведущую роль, так как наиболее ценным считается создание общих теорий, моделей и алгоритмов, применимых к психике в целом, независимо от контекста, — то есть моделей, обладающих крайне широкими предсказательными возможностями; поэтому исследования, результаты, которых можно применить только к какой-то определённой ограниченной ситуации, обладают нисходящей ценностью.
Следует отметить, что любую переменную (фактор), отличную от независимой, также оказывающую влияние на зависимую переменную, автор называет просто “ other ” — другая. При переводе для обозначения таких переменных используются два разных термина: “побочная” — применительно к переменной, нарушающей внутреннюю В., и “дополнительная” — переменная, уровень которой входит в экспериментальную гипотезу и должен быть адекватно представлен с целью достижения внешней В. Иногда одни и те же факторы могут выступать в эксперименте и как побочные (нарушающие внутреннюю В.), и как дополнительные (влияющие на внешнюю В.). Устранение и унификация побочных факторов, повышающая внутреннюю В., может приводить к несоответствию уровней дополнительных переменных, что снижает внешнюю В. (см. Соответствие).
-операциональная В.—разновидность внешней В. для лабораторного эксперимента; соответствие (или степень соответствия) применяемых методических процедур тем теоретическим понятиям, которые входят в экспериментальную гипотезу.
Угрозы внутренней валидности
«Угрозы внутренней валидности» — выражение, относящееся к плану исслед., к-рое интерпретаторы данных используют для описания ряда вопросов, возникающих в связи с возможными неточностями при интерпретации причинно-следственных связей между изучаемыми переменными. Некоторые из этих угроз уже упоминались, в частности, при описании квазиэкспериментов. Выражение регрессия к среднему показателю используется для описания эффекта неточного измерения текущего и будущих наблюдений, и она представляет собой серьезную угрозу для внутренней валидности плана психол. исслед.
Другой угрозой является естественное развитие, поскольку испытуемые подвержены естественным процессам созревания и развития с течением времени независимо от манипуляций, которые совершает над ними исследователь. Эта последняя гипотеза, в частности, объясняет необходимость использования в исслед. контрольных групп, позволяющих осуществлять сравнения с естественно развивающимися испытуемыми.
Еще одной угрозой является отсев. Систематическое сокращение количественного состава групп вследствие выбывания, неявок, переезда людей в другой город, незаполненных критериальных опросников, и т. д. может делать менее заметной в результатах исслед. роль тех оставшихся участников, к-рые оказываются в меньшей степени подвержены эксперим. воздействию. А ведь чем более заметны улучшения по критерию, тем лучше выглядит эффективность самого изучаемого воздействия.
Угроза отбора возникает на этапе формирования исслед. состава групп участников. Систематический отбор или пассивный отбор (собственное желание) участников для изучаемого воздействия или условия может приводить к возникновению различий среди некоторых групп перед началом исслед. Эти группы будут по-прежнему отличаться от других и после реализации воздействия — даже когда они сами не подвергались воздействию. Поэтому, для достижения высокой внутренней валидности (причинно-следственных) утверждений в отношении взаимосвязей переменных, необходима формулировка и проверка альтернативной гипотезы о том, какими могли бы быть эти эффекты в отсутствие такого воздействия или условия.
Фон относится к тем изменениям контекста проводящегося исслед., которые могут смешиваться с самими изучаемыми воздействиями. Подобное смешение делает невозможным отнесение изменений в испытуемых на счет исследуемого воздействия или внешних изменений.
Инструментальная погрешность являются угрозой внутренней валидности, почти исключительно присущей психологии, поскольку она возникает в результате происходящих со временем изменений стандартов наблюдателя или условий наблюдения. Эти изменения вызывают различия в оценках. Проблема состоит в том, что подобные расхождения в стандартах измерения могут приводить к ошибочным оценкам тех изменений, которые являются следствием изучаемых воздействий.
Эффект тестирования являются примером другой, почти исключительно присущей психологии, угрозы внутренней валидности. Она связана с эффектом улучшения показателей испытуемых просто в результате предыдущего прохождения теста.
Нестабильность, как было указано выше, вытекает из попыток интерпретировать происходящие непосредственно после эксперимента воздействия или спустя к. -л. время естественные изменения испытуемых и измерений.
Существуют также четыре аффективных угрозы внутренней валидности: подражание, компенсаторное соперничество, компенсаторное уравнивание, и деморализация. Они также присущи исключительно психол. науке, поскольку возникают в результате эмоциональных изменений у испытуемых и проводящего измерения персонала как формы адаптации к тому факту, что они не попали в число «избранных» участников исследования, получающих и осуществляющих эксперимент
Внешняя валидность и метаанализ
Наконец, существует понятие внешней валидности — суммы характеристик исследований, к-рая позволяет осуществлять обобщение или распространение получаемых в исследованиях (как результат высокой внутренней валидности) причинно-следственных утверждений на сходные категории людей, воздействий и критериев за пределами данного исследования.
Метаанализ. Внешняя валидность результатов исследования, существенно усиливается, когда объединяется и обобщается целый ряд исследований одной и той же воздействующей переменной. Такая процедура называется метаанализом. В метаанализе определяются величина эффекта, оказываемого эксперимента, воздействием и основными условиями исследования на критериальные переменные. Последние выбираются в зависимости от теоретических интересов проводящего метаанализ исследователя. Т. о., если основной анализ предполагает сравнение связей всех пар переменных, то набор интересующих метааналитика связей является набором из переменных-условий и критериальных переменных, который позволяет судить о величине эффекта изучаемого воздействия на эти критериальные переменные. Величина эффекта для каждого исследования определяется простым делением разности между средними показателями по критериальной переменной в эксперименты группах и контрольной группе на меру изменчивости индивидуальных показателей в этих группах. В результате такого анализа можно продемонстрировать, что целый ряд изучавшихся переменных условий не оказывают влияния на набор критериев, что позволяет исследователям обобщать результаты своих исследований, не оглядываясь на эти, как было установлено в ходе метаанализа, посторонние условия.
Наконец, можно определить степень влияния каждой переменной-воздействия и их различных сочетаний на критерии. Это представляет особый интерес для прикладных областей, где важно знать не только о том, что одна переменная влияет на другую, но и насколько велико такое влияние.
Что такое внутренняя валидность в статистике? (с примером) • BUOM
29 июля 2021 г.
Внутренняя валидность — важный термин в статистике и исследованиях. Он измеряет, насколько надежным является исследование, что может помочь вам определить точность и надежность его данных и выводов. Если ваша работа связана со статистикой или проведением исследований, важно понимать внутреннюю валидность. В этой статье мы объясним, что такое внутренняя валидность в статистике, что может на нее повлиять, как узнать, имеет ли ваше исследование внутреннюю валидность, и чем отличаются внутренняя и внешняя валидность, на примере.
Что такое внутренняя валидность в статистике?
Внутренняя валидность является мерой надежности и обоснованности исследования. По сути, внутренняя валидность может выражать, было ли исследование проведено надлежащим образом и существует ли реальная причинно-следственная связь между переменными исследования. Чем выше внутренняя валидность, тем точнее исследование. Внутренняя валидность основана на количестве смешанных переменных эксперимента, которые являются посторонними переменными, которые искажают результаты исследования. Чтобы результаты исследования имели внутреннюю валидность, вы должны быть в состоянии убедиться, что никакие другие факторы не повлияли на ваши результаты.
Внутренняя валидность важна, потому что ее понимание может сказать вам, насколько вы можете доверять своему исследованию и быть уверенным в его результатах. Это может помочь вам подтвердить отношения между переменными и определить причины и следствия. Это делает внутреннюю валидность важным термином в статистике и исследованиях.
Что может повлиять на внутреннюю валидность?
Чтобы понять внутреннюю валидность вашего исследования, важно знать, какие различные элементы исследовательского процесса могут на него повлиять. Некоторые факторы, которые могут повлиять на внутреннюю валидность, включают:
Предвзятость
Предвзятость может принимать форму чувств, мнений или предвзятых суждений. Когда в исследовании присутствует предвзятость, она может исказить результаты исследования в определенном направлении. Это может сделать исследование менее надежным, а также повлиять на внутреннюю достоверность.
Изменения метода исследования
Изменения в методах исследования также могут повлиять на внутреннюю валидность. Это может включать изменения в инструментах исследования, инструментах, показателях и других факторах. Внесение любых изменений в исследовательский процесс может изменить результаты исследования и изменить внутреннюю валидность. Чтобы максимизировать надежность вашего исследования, важно, чтобы ваш метод оставался постоянным на протяжении всего процесса исследования.
Изменение популяции выборки исследования
Поскольку разные группы выборки могут изменить результаты исследования, что может привести к ложной интерпретации причины и следствия, используемая вами выборка может повлиять на внутреннюю проверку вашего исследования. Использование различных выборочных совокупностей может значительно снизить внутреннюю валидность, поэтому важно свести к минимуму изменения выборочной совокупности во время исследования.
Регрессия к среднему
Регрессия к среднему происходит, когда данные интерпретируются неправильно из-за выбросов. Феномен гласит, что если точка выборки является экстремальной или резко выделяющейся, другая точка выборки кажется ближе к среднему значению. Это может исказить результаты исследования, изменяя внутреннюю валидность.
Распространение лечения
Распространение лечения — это когда участники исследования проходят лечение, отличное от того, которое им назначил исследователь. Поскольку это может привести к ложным результатам и заставить исследователей неверно интерпретировать причинно-следственные связи, это может повлиять на внутреннюю валидность. Чтобы избежать этого, постарайтесь обеспечить, чтобы ваши участники проходили одно и то же лечение на протяжении всего исследования.
Социальное взаимодействие
Еще одним исследовательским фактором, который может повлиять на внутреннюю валидность, является социальное взаимодействие. Когда субъекты исследования взаимодействуют с другими людьми, это может изменить их работу и исказить результаты исследования, что ослабит внутреннюю валидность. Из-за этого вам может потребоваться быстро завершить исследование.
Когда исследование имеет внутреннюю валидность?
Чтобы проверить, есть ли в вашем исследовании внутренняя валидность, вы можете проверить три конкретных фактора:
Отсутствие посторонних факторов. Одним из важных условий внутренней валидности является отсутствие в вашем исследовании посторонних факторов или искажающих факторов. Это факторы, которые могут быть альтернативными причинами результатов вашего исследования.
Независимые переменные предшествуют зависимым переменным: еще одним важным условием внутренней достоверности является то, что переменные, с которыми вы работаете, изменяются раньше, чем зависимые переменные. Это может помочь вам определить причину и следствие.
Изменения в ваших переменных коррелируют: еще одно условие, которое вы можете проверить, чтобы подтвердить внутреннюю достоверность, заключается в том, что изменения в ваших переменных коррелируют. Это также может помочь вам определить причинно-следственные связи между переменными.
Внутренняя и внешняя валидность
Внутренняя и внешняя валидность являются мерами надежности и достоверности исследования, но эти два термина различны. Если вы занимаетесь исследованиями, важно понимать значение этих двух факторов и различия между ними. Внутренняя валидность просто выражает силу методов, используемых для проведения исследования. Однако внешняя валидность измеряет, какие исследования применимы к реальным ситуациям. Внешняя валидность высока, когда вы можете обобщить и воспроизвести свое исследование в реальных ситуациях.
Важно знать, что внутренняя и внешняя валидность не всегда совпадают. Как правило, если вы устраняете или контролируете посторонние переменные в своем исследовании для повышения внутренней достоверности, вероятность того, что вы сможете воспроизвести свое исследование в реальных ситуациях, снижается, что снижает внешнюю достоверность. И наоборот, если ваше исследование имеет высокую внешнюю валидность и вы можете обобщить свои результаты, оно может содержать много посторонних переменных, что снижает его внутреннюю валидность.
Пример внутренней валидности
Представьте, что вы хотите проверить свою гипотезу о том, что употребление чая перед занятиями в колледже помогает вам запоминать больше информации. Чтобы проверить свою гипотезу, вы собираете группу студентов колледжа. Половина группы пьет чай перед уроком, а другая половина не пьет чай перед уроком. После урока вы даете всей группе студентов контрольную работу по материалу из класса. Вы оцениваете все тесты и определяете, что учащиеся, которые пили чай, дали больше правильных ответов и усвоили больше информации из класса.
Однако, даже несмотря на то, что ваше исследование подтвердило вашу гипотезу, вы не можете исключить все другие возможные причины — или посторонние переменные, — которые могли привести к тому, что ваша экспериментальная группа показала хорошие результаты в своих тестах. Внешней переменной может быть размер чашки чая, марка или содержание кофеина в чае, который каждый отдельный ученик выпил перед уроком, или количество сна, которое каждый ученик получил предыдущей ночью. Наличие множества посторонних переменных означает, что ваш эксперимент имеет низкую внутреннюю достоверность. Чтобы повысить внутреннюю достоверность, вам нужно исключить посторонние переменные.
Внутренняя валидность в исследованиях: определение, угрозы, примеры
Как исследователь, вы можете узнать точность своего исследования только в том случае, если нет факторов, оспаривающих ваши выводы. Уверенность в результате — это то, что называется внутренней валидностью. В этом посте мы рассмотрим концепцию внутренней валидности, ее важность и способы ее проверки.
Что такое внутренняя валидностьВнутренняя валидность — это концепция того, насколько вы уверены в результатах своего исследования. Это связано с тем, что чем меньше вероятность смешения переменных в исследовании, тем выше внутренняя валидность и тем более уверен исследователь может быть в исследовании.
Это означает, что внутренняя валидность — это степень, в которой вы можете установить причинно-следственную связь между состоянием вашего лечения и результатом вашего исследования. Это поможет вам избежать ловушек, которые могут изменить ваш результат как исследователя.
Внутренняя валидность также показывает, что знание нормативных данных помогает исследователю вынести из исследования незначительные результаты. При точном подборе групп проб и правильном измерении результат связи между данными будет достоверным.
Типы внутренней достоверностиЧитать: 21 Расширение хрома для академических исследователей
Существует 4 первичные типы достоверности, которые составляют
- КОНСТРУКЦИЯ.
В этом типе валидности основное внимание уделяется тому, измерял ли тест то, для чего он был предназначен. Он хочет проверить, была ли достигнута цель проведения теста.
- Действительность содержимого
Валидность содержимого проверяет, действительно ли тест поддерживает то, что он хочет протестировать. Это относится к используемому методу тестирования. Валидность содержания проверяет, является ли это наиболее подходящим методом для исследования.
- Действительность лица
Лицевая валидность объясняет, действительно ли содержание или данные исследования могут отражать цели теста. Это проверяет, достаточно ли собранные данные для проведения теста.
- Действительность критерия
Проверка правильности критерия определяет, совпадает ли результат теста с результатом другого теста с теми же данными. Это означает, что когда вы завершаете свой тест, он сравнивает результат со стандартным результатом.
Важность внутренней валидностиВнутренняя валидность делает выводы исследователя достоверными. Это делается, когда эксперимент показывает тесную связь между двумя данными. Высокая внутренняя валидность устраняет дальнейшие сомнения, которые могут возникнуть в связи с исследованием.
Например, вы решили провести проверку гипотезы о том, улучшает ли здоровье одно яблоко в день. Затем вы приглашаете добровольцев для участия в вашем исследовании. Вы выбрали четное количество людей среднего возраста, сгруппировали их, распределили по утренним и вечерним группам участия. Утренняя группа – это лечебная группа, а вечерняя – контрольная.
Чтобы подтвердить свою гипотезу, вы даете каждому по яблоку в экспериментальной группе и по морковке в контрольной группе. Также обе группы были протестированы для определения состояния их здоровья. Собрав результаты теста и проанализировав их, вы понимаете, что экспериментальная группа показала лучшие результаты, чем контрольная группа. Достаточно ли этого, чтобы сделать вывод, что одно яблоко в день улучшает здоровье?
Чтобы сделать такой вывод, вы должны сначала исключить другие причины, которые могли бы объяснить результат вашего исследования.
Внутренняя валидность важна для подтверждения достоверности результатов вашего исследования.
Как проверить внутреннюю валидностьПрочитано: Отчет об исследовании: определение, типы + [Руководство по написанию]
Мы можем установить внутреннюю валидность, если присутствуют три необходимых условия. Чтобы определить внутреннюю валидность в исследовании, должны присутствовать эти три условия, чтобы определить, существует ли связь между вашим лечением (независимые переменные) и вашими мерами контроля (зависимые переменные).
- Если ваши переменные лечения и ваши контрольные переменные реагируют вместе
- Если ваше лечение вызывает реакцию в ваших контрольных переменных.
- Если никакое запутывающее значение (смешивающая переменная) не может объяснить результаты вашего исследования.
Теперь, если вы посмотрите на приведенный выше пример исследования, два условия из трех заявленных условий, которые должны быть установлены во внутренней валидности, были выполнены. Давайте посмотрим, как они применяются на примере.
- Одно яблоко в день и улучшение здоровья произошло вместе.
- Употребление яблока произошло до улучшения состояния здоровья испытуемой группы.
Условие номер три, которое не было выполнено в примере, — это время, когда яблоко было съедено.
Поскольку яблоко съедается утром, возможно, на улучшение повлиял ночной сон и утренний покой.
Таким образом, вы не можете быть уверены, что употребление яблока по утрам является единственной причиной улучшения здоровья, зарегистрированного в экспериментальной группе.
Отсутствие этого окончательного заключения означает, что ваше исследование не имеет высокой внутренней достоверности. Следовательно, нельзя с уверенностью делать вывод о причинно-следственной связи между яблоком и хорошим здоровьем.
Угрозы внутренней действительностиЧтение: Допустимая погрешность – определение, формула + применение
Существует три категории угроз внутренней действительности. Три категории;
- Одногрупповые угрозы
Угрозы внутренней валидности для одной группы относятся к угрозам, которые могут возникнуть, когда ваше исследование направлено на одну группу. Это относится к критике или запутанной переменной, которая может возникнуть, когда ваше исследование сосредоточено на одной выборочной группе.
- Несколько групповых угроз
Несколько групповых угроз внутренней валидности относятся к угрозам и критике, которые могут возникнуть, когда ваше исследование сосредоточено на нескольких группах.
- Социальные угрозы
Социальные угрозы внутренней действительности подразумевают угрозы, возникающие из-за реакции людей на то, что затрагивает их и других.
Важно выявить угрозы внутренней валидности в научном исследовании. Это поможет исследователям разработать меры контроля для исследования.
Рассмотрим эти 12 угроз внутренней действительности;
1. Истощение: Истощение вредно для вашего исследования, поскольку приводит к предвзятости. Когда ваши участники покидают ваше исследование, ваши выводы будут зависеть от тех участников, которые приняли иное решение о выходе из исследования. Это, безусловно, повлияет на достоверность вашего исследования, потому что у вас будет меньше выводов, из которых можно сделать выводы.
2. Вмешивающиеся переменные: Когда в вашем исследовании есть дополнительная переменная, связанная с обработкой, которую вы применили к своей группе выборки, которая влияет на ваши результаты, это приводит к путанице. Вмешивающиеся переменные снижают внутреннюю валидность вашего исследования.
3. Распространение: Это сложный вопрос. Распространение — это когда лечение в исследовании распространяется от группы, которую вы лечите, к контрольной группе. Это происходит, когда между двумя группами есть взаимодействие и наблюдение.
Распространение представляет угрозу для ваших исследований, потому что может привести к тому, что исследователи называют деморализацией обиды. Это когда контрольная группа менее мотивирована, потому что они обижаются на группу, в которой они находятся. (Это может быть в пользу группы или резко против группы). Эта предвзятость исследователя может повлиять на результаты исследования.
5. Исторические события : Прошедшее событие может прямо или косвенно повлиять на результат исследования через участников. Некоторые вещи, такие как стихийные бедствия или политика, могут повлиять на координацию участников исследования и их работу.
6. Инструментарий: Вы можете направлять участников вашего исследования к действиям определенным образом с помощью используемого метода исследования. Это может привести к тому, что ваши участники будут вести себя иначе, чем изначально.
7. Созревание: Это означает, что время следует рассматривать как важную переменную в исследованиях. Если ваши участники стали старше или претерпели биологические (временные) изменения по причине вашего исследования, может быть трудно доказать, что на результаты исследования не повлияло время.
8. Статистическая регрессия: Это угроза внутренней валидности, поскольку участники, находящиеся на крайних этапах лечения, могут естественным образом выбрать направление, потому что проходит время, а не из-за назначенного лечения.
9. Повторное тестирование: Повторное тестирование участников исследования повлияет на результаты вашего исследования. Вполне естественно, что когда вы неоднократно даете кому-то определенный тест, они привыкают к этому тесту.
10. Выбор субъектов: Это систематическая ошибка, которая может возникнуть в результате выбора групп исследования. Если размер вашей выборки мал, это может вызвать парадокс Симпсона
11. Взаимодействие отбор-созревание: Когда вы выбираете группу исследования, разница во времени между назначением лечения группам может привести к искажению результатов, и исследователь может сделать вывод, что назначенное лечение повлияло на результат. Это может быть неверным выводом.
12. Эффект Джона Генри: Эффект Джона Генри относится к случаю, когда человек по имени Джон Генри превзошел машину в эксперименте, потому что он знал, что эксперимент был между ним и машиной.
Как противостоять угрозам внутренней действительностиМанипуляции с планом эксперимента могут изменить или уменьшить многие угрозы внутренней валидности. Вот несколько способов, которыми это можно сделать:
- Включите сопоставимую контрольную группу, чтобы противодействовать всем угрозам из экспериментальной группы. противостоит всем угрозам одногрупповым исследованиям. Если экспериментальная группа и контрольная группа вашего исследования сталкиваются с одинаковыми угрозами, угрозы не должны влиять на результаты вашего исследования.
- Используйте большой размер выборки, чтобы устранить угрозы в тесте. Это гарантирует, что результаты вашего исследования будут чувствительны к другим переменным, которые могут появиться в тесте.
- Вы также можете устранить угрозы в своих тестах, используя дополнительные задачи в своих исследованиях. Это потому, что задачи-наполнители будут скрывать истинную цель вашего исследования.
- Случайным образом распределите участников по группам выборки, чтобы исключить регрессию и систематическую ошибку при отборе. Это сделает группы сопоставимыми до того, как вы начнете тест.
- Еще один способ эффективно устранить угрозы внутренней валидности в вашем исследовании — сделать участников слепыми к цели вашего исследования. Это будет препятствовать взаимодействию между вашими учебными группами.
- Экспериментальная манипуляция: когда исследователь манипулирует независимой переменной в исследовании. Исследователь применяет вмешательство для лечебной группы в течение периода исследования.
Вот три примера внутренней валидности. Мы рассмотрим их одну за другой. Эти примеры показывают, как надлежащие процедуры повышают вероятность внутренней валидности.
Пример 1Исследователь выдвинул гипотезу о том, что приложения-головоломки способны противостоять негативным мыслям. Чтобы проверить гипотезу, исследователь случайным образом отобрал участников и поровну распределил участников на две группы. Лечебная группа (те, кто будет использовать приложение) и контрольная группа.
Помимо случайного распределения участников, исследователь гарантировал, что участники не знали о целях исследования и другой тестовой группе.
Пример 2Страховая компания хочет выяснить, приведет ли гибкий график работы к удовлетворению ее сотрудников.
Чтобы узнать это, они выбрали две группы из своих сотрудников для участия в эксперименте.
Первая группа – лечебная группа с гибким рабочим днем и контрольная группа с фиксированным рабочим днем.
Эксперимент продлится 9 месяцев. Чтобы получить точный результат для целей исследования, все участвующие сотрудники заполнили анкету, описывающую их удовлетворенность рабочим временем перед тестом, представляющим предварительный тест. Они также заполнили форму опроса, чтобы описать свои впечатления после теста. Что такое пост-тест.
Пример 3Исследователь должен провести исследование. Цель исследования — проверить, повышает ли наличие мяча для снятия стресса на офисном столе продуктивность маркетинговой команды ИТ-фирмы. Исследователь вручил стресс-мяч всем сотрудникам, участвующим в исследовании, которое продлится 3 месяца. Всем участникам было предложено заполнить форму опроса с указанием уровня их продуктивности до применения стресс-мяча и после исследования.
Приведенные примеры описывают, как можно уменьшить смешение и угрозы внутренней действительности, если соблюдаются надлежащие процедуры.
ЗаключениеВ этом посте мы смогли установить, что внутренняя валидность показывает достоверность результатов исследования, исключая другие объяснения, которые могут повлиять на результат теста.
Соберите достоверные данные для Исследование
Внутренняя валидность — Уверенность в причинно-следственной связи
Внутренняя валидность является важнейшей мерой в количественных исследованиях, где она гарантирует, что план эксперимента исследователя строго соответствует принципу причины и следствия.
Discover 21 еще статья по этой теме
Не пропустите эти связанные статьи:
- Достоверность и надежность
- Типы достоверности
- Определение надежности
- Содержание Валидности
- Достоверность конструкции
Что такое внутренняя валидность?
Самый простой способ описать внутреннюю валидность — это уверенность, которую мы можем выразить в причинно-следственной связи в исследовании. Ключевой вопрос, который вы должны задавать в любом эксперименте:
«Может ли существовать альтернативная причина или причины, объясняющие мои наблюдения и результаты?»
Глядя на некоторые экстремальные примеры, физический эксперимент по влиянию тепла на проводимость металла имеет высокую внутреннюю достоверность.
Исследователь может устранить почти все потенциальные мешающие переменные и установить строгий контроль, чтобы изолировать другие факторы.
На другом конце шкалы исследование корреляции между уровнем дохода и вероятностью курения имеет гораздо более низкую внутреннюю достоверность.
Исследователь может обнаружить связь между малообеспеченными группами населения и курением, но не может быть уверен, что одно вызывает другое.
Социальный статус, профессия, этническая принадлежность, образование, курение родителей и воздействие целевой рекламы — все это переменные, которые могут оказывать влияние. Их трудно устранить, а социальные исследования могут стать статистическим минным полем для неосторожных.
Внутренняя валидность против конструктивной валидности
Для ученых-физиков конструктная валидность редко требуется, но для социальных наук и психологии конструктивная валидность является самой основой исследования.
Еще более важно понимать разницу между конструктной валидностью и внутренней валидностью, которая может быть очень тонкой.
Тонкие различия между ними не всегда очевидны, но важно уметь различать их, особенно если вы хотите заниматься социальными науками, психологией и медициной.
Внутренняя валидность показывает только то, что у вас есть доказательства того, что программа или исследование оказали некоторое влияние на наблюдения и результаты.
Действительность конструкции определяет, измеряла ли программа предполагаемый атрибут.
Внутренняя достоверность ничего не говорит о том, были ли результаты такими, как вы ожидали, или возможно ли обобщение.
Например, представьте, что некоторые исследователи хотят изучить влияние компьютерной программы на традиционные методы обучения греческому языку в классе.
Результаты показали, что дети, использующие компьютерную программу, учились намного быстрее и значительно улучшили свои оценки.
Однако дальнейшее расследование показало, что результаты были получены не из-за самой программы, а из-за эффекта Хоторна; дети, использующие компьютерную программу, чувствовали, что к ним было обращено особое внимание. В результате они старались чуть больше, вместо того, чтобы смотреть в окно.
Этот эксперимент по-прежнему показал высокую внутреннюю достоверность, потому что исследовательская манипуляция имела эффект.
Однако исследование имело низкую конструктивную валидность, поскольку причина была неправильно обозначена. В конечном итоге эксперимент измерял эффекты повышенного внимания, а не предполагаемые достоинства компьютерной программы.
Как поддерживать высокую уверенность во внутренней валидности?
Невозможно быть на 100% уверенным в любом экспериментальном проекте, и всегда есть вероятность ошибки.
Однако существует ряд инструментов, которые помогают исследователю контролировать внутреннюю валидность и устанавливать причинно-следственную связь.
Временной приоритет
Временной приоритет — единственный наиболее важный инструмент для определения силы причинно-следственной связи. Это процесс установления того, что причина действительно возникла раньше, чем следствие, обеспечивая решение проблемы курицы и яйца.
Чтобы установить внутреннюю валидность посредством временного приоритета, исследователь должен установить, какая переменная появилась первой.
Одним из примеров может быть экологическое исследование, целью которого является установление того, следует ли за увеличением популяции леммингов во фьорде в Норвегии увеличение числа хищников.
Лемминги демонстрируют очень предсказуемый цикл популяции, который неуклонно растет и падает в течение 3-5-летнего цикла. Оценки популяции показывают, что численность леммингов возрастает из-за увеличения обилия пищи.
За этой тенденцией через пару месяцев следует увеличение числа хищников, так как выживает больше их детенышей. Это кажется довольно ярким примером временного приоритета; наличие пищи для леммингов диктует количество. В свою очередь, это диктует популяция хищников.
СТОП!
Не так быстро!
На самом деле отношения хищник/жертва гораздо сложнее. Экосистемы редко содержат простые линейные зависимости, и доступность пищи является лишь одним из определяющих факторов.
Перевернув все это, увеличение числа хищников может также контролировать популяцию леммингов. Хищники могут быть настолько успешными, что популяция леммингов резко сокращается, а хищники голодают из-за ограничения собственных запасов пищи.
Что, если хищники обратятся к альтернативному источнику пищи, когда количество леммингов невелико? Лемминги, как и многие грызуны, демонстрируют более низкие успехи в размножении в периоды высокой популяции.
Это действительно сложный вопрос, и единственный ответ — изучить предыдущие исследования. Внутренняя валидность, возможно, является единственной наиболее важной причиной для проведения серьезного и тщательного обзора литературы.
Даже при этом часто бывает трудно показать, что причина предшествует следствию, и этот факт слишком хорошо известен биологам-бихевиористам и экологам.
В отличие от этого, физический эксперимент довольно прост — я нагреваю металл, и проводимость увеличивается/уменьшается, обеспечивая более простое представление о причине и следствии и высокую внутреннюю достоверность.
Пример исследования леммингов
Ковариация причины и следствия
Ковариация причины и следствия — это процесс установления причинно-следственной связи между переменными. Он устанавливает, что эксперимент или программа имели некоторый измеримый эффект, каким бы он ни был.
Например, при изучении греческого языка результаты показали, что группа с компьютерным пакетом показала лучшие результаты, чем те, у кого его не было.
Это можно резюмировать как:
Если вы используете программу, есть результат.Без программы нет результата.
Это не обязательно должно быть отношение «или/или», это может быть:
Больше программы — больше результата.Чем меньше программа, тем меньше результат.
Это кажется довольно очевидным, но вы должны помнить основное правило внутренней валидности. Ковариация причины и следствия не может объяснить, что вызывает следствие, или установить, связано ли оно с ожидаемой управляемой переменной или с искажающей переменной.
Однако это усиливает внутреннюю валидность исследования.
Установление причинно-следственной связи методом исключения
Установление причинно-следственной связи методом исключения — самый простой способ доказать, что эксперимент имеет высокую внутреннюю достоверность.
Как и в случае с леммингом, может быть много других правдоподобных объяснений очевидной причинно-следственной связи между добычей и хищником.
Исследователи часто называют любую такую смешанную переменную «отсутствующей переменной» — неизвестным фактором, который может лежать в основе очевидной взаимосвязи.
Проблема, как следует из названия, в том, что переменная отсутствует, и найти ее практически невозможно. Единственный способ свести его на нет — это строгий экспериментальный план, исключающий смешанные переменные и гарантирующий, что они не будут иметь никакого влияния.
Рандомизация, контрольные группы и повторные эксперименты — лучший способ исключить эти переменные и сохранить высокую достоверность.
В примере с леммингом исследователи проводят целую серию экспериментов, измеряя уровни хищничества, альтернативные источники пищи и коэффициенты размножения леммингов, пытаясь установить исходный уровень.
Внутренняя валидность — последнее слово
Просто чтобы оставить вам пример того, насколько сложным может быть измерение внутренней валидности:
В ходе эксперимента, в котором исследователи сравнивали компьютерную программу для обучения греческому языку с традиционными методами, существует ряд угроз. к внутренней валидности.
- Группа с компьютерами чувствует себя особенной, поэтому они стараются изо всех сил, эффект Хоторна.
- Группа без компьютеров начинает завидовать и изо всех сил пытается доказать, что им нужно было дать шанс использовать новую блестящую технологию.
- В качестве альтернативы, группа без компьютеров деморализована, и их производительность снижается.
- Родители детей из группы без компьютеров считают, что их дети многое упускают, и жалуются, что всем детям нужно дать такую возможность.