Концепции тестирования и измерения
Существует множество важных концепций тестирования, и мы будем их приводить в ходе
обсуждения оценки персонологами тех или иных характеристик людей. До того, как тот или иной
способ тестирования получит право считаться научно приемлемым методом измерения
индивидуальных различий, он должен пройти проверку по четырем специальным критериям. Эти
критерии стандартизация, нормы, надежность и валидность.
Стандартизация. Ключевым аспектом измерения личностных характеристик является
стандартизация.
Стандартизация подразумевает единообразие процедур проведения теста и подсчета
результатов. Например, в случае применения шкал самооценки экспериментатор должен приложить
максимальные усилия и убедиться, что все испытуемые читают и понимают отпечатанные инструкции,
все отвечают на одни и те же вопросы, а также укладываются в заданные временные интервалы.
Стандартизация также предполагает наличие следующей информации (обычно содержащейся в
прилагаемом руководстве): при каких условиях тест можно или нельзя проводить, кто должен или не
должен подвергаться тестированию (контрольная группа), процедуры обсчета теста, а также
интерпретация полученных результатов.
Нормы. Стандартизация личностного теста включает также информацию о том, является ли
данная конкретная «сырая (первичная) оценка» низкой, высокой или средней относительно других
«сырых оценок» теста. Такая информация, называемая тестовыми нормами, служит стандартом, с
которым сравниваются оценки испытуемых. Обычно сырые тестовые оценки переводятся в
процентильные показатели, которые обозначают процентную долю испытуемых из выборки
стандартизации, первичная оценка которых ниже или равна первичной оценке данного испытуемого.
Например, вы можете использовать шкалу депрессии из тридцати вопросов и получить первичный
тестовый результат 18 (то есть ваши ответы в 18 случаях совпали с признаками депрессии,
перечисленными на листке с правильными ответами).
Сам по себе показатель 18 ничего не значит до
тех пор, пока вы не обратитесь к тестовым нормам и не убедитесь, что ваш результат соответствует 75
процентилям. Эта информация говорит о том, что вы в большей степени подавлены, чем 75 % из
выборки ранее обследованных людей, образующих нормативную группу. Таким образом, тестовые
нормы позволяют сравнивать оценки отдельных индивидуумов с оценками группы стандартизации, что
в результате дает количественную оценку положения испытуемого относительно нормативной группы.
Надежность. Другое требование ко всем методам оценки личности заключается в том, что они
должны быть надежными.
Это означает, что повторное проведение того же самого теста или другой
формы этого теста должно давать приемлемо сходные результаты или оценки. Таким образом,
надежность имеет отношение к постоянству или стабильности метода оценки, которая обнаруживается
при повторном обследовании данной группы людей. Количественно постоянство метода оценки
определяется коэффициентом ретестовой надежности (Anastasi, 1988). Коэффициент ретестовой
надежности равен обычной корреляции между результатами, полученными на одних и тех же
испытуемых в каждом из двух случаев проведения теста. Ретестовая надежность дает нам оценку
постоянства теста во времени. Хотя не существует каких-либо фиксированных величин приемлемого
уровня надежности, коэффициенты надежности для большинства стандартизованных психологических
тестов выше +0,70. Чем ближе величина коэффициента надежности к +1, тем более надежным является
тест (то есть оценки испытуемых при повторном тестировании вплотную приближаются к оценкам при
первом тестировании). Второй вид надежности определяют путем коррелирования параллельных форм
теста. Для этого чаще всего тест делят на две сопоставимые части (например, на четные и нечетные
пункты), потом по каждой половине рассчитывают суммарные баллы и между двумя рядами баллов по
испытуемым рассчитывают допустимые коэффициенты корреляции. Полученный таким образом
коэффициент называют коэффициентом внутренней согласованности.
Внутренняя согласованность
отражает внутреннее постоянство теста. Если обе части теста измеряют одно и то же свойство
личности, то испытуемые, получившие высокие оценки по нечетным пунктам, должны также получить
высокие оценки и по четным; а те, кто получил низкие оценки по нечетным пунктам, должны получить
низкие оценки и по четным пунктам (что снова выразится в высокой положительной корреляции).
Третий тип надежности основывается на корреляции между двумя сопоставимыми вариантами
одного и того же теста (состоящими из аналогичных вопросов), проведенного на одной и той же группе
испытуемых. Если по этим разным формам теста получены примерно одинаковые оценки, тест обладает
надежностью параллельных форм.
В таком случае положительная корреляция между двумя
взаимозаменяемыми формами будет означать, что пункты обоих вариантов теста измеряют одно и то
|