Понятие валидности. Способы определения валидности

Автор: Пользователь скрыл имя, 19 Декабря 2011 в 15:15, контрольная работа

Краткое описание

Для того чтобы психолого-педагогический эксперимент был достаточно надежным средством исследования и позволял получать вполне достоверные результаты, которым можно доверять и на основе которых можно делать правильные практические выводы, необходимо, чтобы используемые в нем психодиагностические методы были научно обоснованы. Такими считают методы, отвечающие следующим требованиям: валидность, надежность, достоверность и репрезентативность. Рассмотрим наиболее широко понятие валидности.

Скачать в ZIP (16.32 Кб) Сколько стоит заказать работу?

Файлы: 1 файл

понятие валидности.doc

— 71.50 Кб (Скачать)

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ

ОТКРЫТЫЙ ПЕДАГОГИЧЕСКИЙ УНИВЕРСИТЕТ

им. М.А. Шолохова

Кафедра практической психологии

Контрольная работа

по психодиагностике

ТЕМА: ПОНЯТИЕ ВАЛИДНОСТИ.

СПОСОБЫ

ОПРЕДЕЛЕНИЯ ВАЛИДНОСТИ.

Выполнила:

Студентка 4/3 курса

5 группа з/о (укп)

Москва

2005 г

Термин «валидность» - евро-язычного происхождения. Он буквально означает: «полноценный», «пригодный», «соответствующий». Характеристика психодиагностической методики как валидной свидетельствует о ее соответствии и пригодности для оценивания именно того психологического качества, для которого она предназначается.

Характеристика валидности методики включает в себя не только сведения о том, что данная методика на самом деле измеряет, но также информацию об условиях, о сфере ее применения. Есть несколько разновидностей валидности, каждую из которых следует рассматривать и оценивать отдельно, когда стоит вопрос о выяснении валидности психодиагностической методики.

ВАЛИДНОСТЬ

Теоретическая

Практическая (эмпирическая)

Внутренняя

Внешняя

Валидность теоретическая определяется по соответствию показателей

исследуемого качества, получаемых с помощью данной методики, показателям, получаемым с помощью других методик – таких, с показателями которых должна существовать теоретически обоснованная зависимость. Теоретическую валидность проверяют по корреляциям показателей одного и того же свойства, получаемым при помощи различных методик, опирающихся или исходящих из одной и той же теории.

Валидность эмпирическая (практическая) – проверяется по соответствию диагностических показателей реальному поведению, наблюдаемым действиям и реакциям испытуемого. Если, например, с помощью некоторой

методики мы оцениваем черты характера у данного испытуемого, то применяемая методика будет считаться практически или эмпирически валидной тогда, когда мы установим, что данный человек ведет себя в жизни именно так, как предсказывает методика, т.е. в соответствии с имеющейся у него чертой характера.

По критерию эмпирической валидности методику проверяют путем сравнения ее показателей с реальным жизненным поведением или результатами практической деятельности людей.

Валидность внутренняя означает соответствие содержащихся в методике заданий, субтестов, суждений и т. п. общей цели и замыслу методики в целом. Она считается внутренне невалидной или недостаточно внутренне валидной тогда, когда все или часть включенных в нее вопросов, заданий или субтестов измеряют не то, что требуется от данной методики.

Валидность внешняя – примерно то же, что и эмпирическая валидность, но с той же разницей, что в данном случае речь идет о связи между показателями методики и наиболее важными, ключевыми внешними признаками, относящимися к поведению испытуемого.

Проблемы валидизации психологических тестов являются центральными для дифференциальной психометрики, но, к сожалению, до сих пор решенными не до конца. Решение этой проблемы зависит не от статистического аппарата, а от уровня развития теоретического аппарата дифференциальной психологии.

Валидность и надежность. Валидность (или обоснованность) всякой процедуры измерения состоит в однозначности (устойчивости) получаемых результатов относительно измеряемых свойств объектов, т.е. относительно предмета измерения. Отличие понятия валидности от надежности измерения удобно раскрывать с помощью различения «объекта» и «предмета» измерения. Надежность – это устойчивость процедуры относительно объектов. Надежность не обязательно предполагает валидность. В психологии довольно часто возникает такая ситуация, когда исследователь вначале предполагает определенную процедуру измерения, показывает ее надежность – способность устойчиво различать объекты, но вопрос о валидности остается открытым.

Устойчивость теста относительно объектов (испытуемых) является необходимым, но не достаточным условием его устойчивости относительно измеряемых атрибутов (свойств) объектов. Надежность является необходимым, но не достаточным условием валидности. Отсюда вытекает основное соотношение психометрики: валидность ≤ надежность. Это означает, что валидность теста не может превышать его надежности.

Данное соотношение, однако, неверно трактовать как указание на прямую пропорциональную связь валидности и надежности. Повышение надежности отнюдь не обязательно приводит к повышению валидности. В терминах А. Анастази валидность определяется репрезентативностью теста относительно измеряемой области поведения. Если эта область поведения складывается из разнообразных феноменов, то содержательная валидность теста автоматически требует представленности в нем моделей всех этих разнообразных феноменов.

Эмпирическая валидность. Если в случае с содержательной валидностью оценка теста производится за счет экспертов, то эмпирическая валидность измеряется всегда с помощью статистического коррелирования: подсчитывается корреляция двух рядов значений – баллов по тесту и показателей по внешнему параметру, избранному в качестве критерия валидности.

Прагматические традиции западной тестологии привязывали эмпирическую валидность теста к внешним для психологии социально-прагмитическим критериям. Эти критерии являются показателями, обладающими непосредственной ценностью для определенных областей практики. Практика всегда имеет целью либо повысить, либо понизить эти показатели. Например, в области педагогической психологии это «успеваемость» (которую надо повысить), в психологии труда это «производительность труда» и «текучесть кадров»…

Ориентируясь непосредственно на эти категории, психолог, пытающийся скоррелировать результаты теста с этими показателями, фактически решает сразу две задачи: задачу измерения валидности и задачу измерения практической эффективности своей психодиагностической программы. Если получен значимый коэффициент корреляции, то можно считать, что решены с позитивным результатом сразу обе эти задачи. Но если корреляции не обнаружено, то остается неопределенность: либо невалидна сама процедура, либо неверна гипотеза о наличии причинно-следственной связи между психическим свойством и социально значимым показателем. Таким образом, социально-прагматические критерии являются комплексными: они позволяют измерить валидность-эффективность, но не каждое из этих двух свойств теста отдельно.

Конструктная валидность. В отличие от прагматической валидности собственно психологическую валидизацию порой оказывается провести гораздо труднее в силу отсутствия какого-либо более объективного внутрипсихологического критерия, чем сам тест. Представления о конструктной валидности тестов постоянно развиваются с пополнением репертуара методик. Эмпирические исследования взаимосвязей результатов, получаемых с помощью разных методик, обогащают теоретические представления об измеряемых свойствах. С другой стороны, понятие конструктной валидности указывает на высокую зависимость эмпирических связей теста от теоретических представлений его автора об измеряемом свойстве.

Конвергентная и дискриминантная валидность. На рис. 11 постоянным для всех показателей является релевантный фактор А, но каждый раз он оказывается сопряжен с иррелевантными факторами – Х, Y и Z.

рис.11. Связь эмпирических показателей П₁,П₂,П₃ с релевантным (измеряемым) фактором А и с иррелевантными («шумовыми») факторами X, Y, Z, обусловливающими невалидность показателей.

Задача состоит в таком подборе пунктов, чтобы все потенциальные иррелевантные факторы были уравновешены, т.е. чтобы ни один из них не встречался бы чаще других на множестве показателей (пунктов), включенных в тест. Соответствие пунктов измеряемому фактору обеспечивает конвергентную валидность теста. Сбалансированность пунктов относительно иррелевантных факторов обеспечивает дискриминантную валидность. Эмпирически она выражается в отсутствии значимой корреляции с тестом, измеряющим концептуально независимое свойство.

Экспертная эмпирическая валидизация.

В отсутствии какого-либо уже валидизированного теста, параллельно измеряющего изучаемое свойство, а также в отсутствии разработанного теоретического контекста, позволяющего проверять конструктную валидность, психодиагност оказывается перед необходимостью привлечения экспертов к валидизации теста. В отличие от экспертного анализа содержания теста, эмпирическая экспертная валидизация предполагает работу экспертов не с тестом, а с испытуемыми из выборки стандартизации.

Необходимо экспертам обеспечить стандартные условия для наблюдения за испытуемыми. Но не всегда такое стандартизированное наблюдение удается организовать. Даже если предприняты серьезные усилия по организации наблюдения за поведением испытуемых в какой-либо искусственной лабораторной ситуации, такое наблюдение все равно будет значительно уступать по информативности полевому наблюдению – в естественных условиях. Поэтому на практике часто прибегают к оценкам особого типа – к субъективным оценкам, которые выносят испытуемому люди из его круга, имеющие опыт реального общения с ним. На психолога падает большая нагрузка по составлению детальной инструкции оценщикам, однозначно задающей смысл оцениваемой характеристики. Лучшие условия для такой процедуры возникают при наличии группы испытуемых, тесно общающихся между собой; тех, которые могут одновременно побывать и испытуемыми по отношению к тесту, и оценщиками по отношению друг к другу. В отечественной литературе эта процедура получила сокращенное обозначение ГОЛ – «групповая оценка личности» (Кузьмин Н.В., Семенов В.С., 1977).

Для того чтобы групповая оценка личности была источником действительно валидной информации, оценщики должны согласованно оценивать испытуемых. Если в оценках разных оценщиков нет согласованности, то это означает, что либо оцениваемое свойство не проявилось у объекта оценивания, либо оценщики по-разному проинтерпретировали инструкцию. Для измерения согласованности должна быть составлена таблица с оценками, суммы, по строкам которой дают суммарные баллы, полученные каждым испытуемым у всех оценщиков. Оценщики в данном случае оказываются формально в роли пунктов теста. Рассчитывая попарные корреляции между различными столбцами этой таблицы, можно получить коэффициенты согласованности для отдельных пар оценщиков. Глобальной мерой согласованности оценщиков может служить коэффициент надежности α Кронбаха. Если же групповая оценка не обнаруживает надежности, то она не может использоваться в качестве критерия валидизации при проверке валидности теста

Эмпирическое значение коэффициента валидности рассчитывается как линейная или ранговая корреляция между двумя рядами значений: тестовыми баллами и суммарными баллами экспертной оценки. Это эмпирическое значение при наличии невысокого коэффициента надежности критерия корректируют по формуле: r_tx = r_cx/ √α_c,

где r_cx - эмпирическая корреляция с критерием;

α_c – надежность критерия;

r_tx – корреляция с «истинным» критерием («истинная» валидность теста).

Анализ пунктов по критерию валидности. Анализ всего теста целиком зависит от валидности входящих в него пунктов. Максимальная валидность достигается за счет отбора таких пунктов из пилотажной батареи, которые, обладая значимой корреляцией с критерием, минимально коррелируют между собой. Отбор пунктов именно по критерию валидности обеспечивает максимальную прагматическую эффективность теста. После отбора валидных пунктов должна быть произведена перекрестная валидизация. Простой метод реализации принципа перекрестной валидизации состоит в том, что вся выборка делится на две случайные половины и производится раздельный расчет корреляций пунктов с критерием для каждой половины выборки. Если выделенные (значимые) пункты совпадают, то перекрестную валидизацию можно считать удачной.

Следует еще раз подчеркнуть, что анализ валидности отдельных пунктов служит не только прагматическим целям, но может и должен служить целям углубления представлений о содержательно-теоретическом смысле измеряемого свойства: на основании содержательного анализа пунктов, отобранных по критерию, психолог уточняет и корректирует свою первоначальную теоретическую схему, свое понимание измеряемого свойства.

Информация о работе Понятие валидности. Способы определения валидности