изучаемого поведения. Чем в большей степени коррелирует тест с таким стандартом, тем выше
критериальная валидность (criterion-related validity)
данного теста. Критериальная валидность
подразделяется на текущую (диагностическую) и прогностическую валидности. Текущая валидность
(concurrent validity)
определяется на основе корреляции показателей теста с замерами критерия,
проводимыми примерно в одно время с тестированием. Прогностическая валидность (predictive validity)
определяется на основе корреляции показателей теста с замерами критерия, полученными спустя какое-
то время после тестирования.
Проблема мер критерия заключается в том, чтобы найти такие меры, которые можно было бы
принять в качестве общепризнанных стандартов. Эта проблема легче решается в том случае, когда
имеется возможность получить выборочные замеры деятельности (work samples),
например, работы
продавца. Хотя работа хорошего продавца может характеризоваться несколькими важными
показателями уровнем удовлетворенности покупателей, числом и объемом повторных продаж и
числом покупателей за М. к. чаще всего принимаются показатели общего объема продаж. Можно
также сконструировать составную М. к., используя весовые коэффициенты, рассчитываемые путем
усреднения оценок важности отдельных критериев, полученных на соответствующей выборке
менеджеров по продажам.
Стандартизация вызывает большую проблему в ситуации, когда критерий представляет собой
конструкт. Эта проблема начинается с принятия решения о том, что включать в «умение продавать».
Чем более многозначен такой конструкт, тем больше возникает затруднений. Сначала необходимо
определиться с тем, что должно входить в данный конструкт, затем найти способы оценки таких
многозначных понятий как «социальная успешность», затем прийти к согласию в отношении того, как
взвешивать эти аспекты при использовании их в сочетании весьма непростая задача.
Чтобы использование М. к. в роли стандартов не вызывало сомнений, их следует тщательно
проанализировать на предмет того, что они измеряют именно то, что должны, по предположению,
измерять. К примеру, Рой Голдмен и Роберт Слотер указывают на то, что средний балл успеваемости
является ненадежным критерием успешности обучения в колледже, потому что студенты с низкими
способностями тяготеют к выбору легких курсов, в которых они могут добиться успеха, в то время как
студенты с более высокими способностями выбирают для себя более трудные курсы, где они могут не
получить высоких отметок.
Богден и Тейлор подробно рассматривают источники смещения критерия (criterion bias). Они
выделяют четыре класса причин, приводящих к систематическим ошибкам: а) недостаточность
критерия (criterion insufficiency), или упущение релевантных элементов; б) дефектность критерия
(criterion deficiency), или включение в его состав посторонних элементов; в) смещение единиц
критериальной шкалы (criterion scale unit bias), или неравномерность шкалы (напр., шкала дает
слишком большое число благоприятных оценок, вместо их малого числа, к-рое бы получилось в случае
их колоколообразного распределения); г) деформация критерия (criterion distortion), или неправильное
взвешивание элементов в составном критерии.
К числу факторов, могущих приводить к систематическим ошибкам при измерении критерия,
относят ошибку благоприятной возможности, эффект ореола и вмешательство опыта. Ошибка
благоприятной возможности (opportunity bias) происходит, когда некоторые из работников, в отличие от
других, имеют больше возможностей проявлять критериальное поведение, что приводит к их более
высоким оценкам по критерию, хотя при равных возможностях эти другие могли бы реализовывать это
поведение с неменьшим успехом. Эффект ореола (halo effect) обнаруживается при работе с оценочными
шкалами, когда на оценки отдельных черт влияет общее впечатление оценивающего об оцениваемом им
чел. Вмешательство жизненного опыта (experience contamination)
имеет место в ситуации, когда
критериальное поведение изменяется вместе с неконтролируемым фактором жизненного опыта.
См. также Тестирование способностей, Методы эмпирического исследования, Измерение
Д. Крэсвул
Меры речи и слуха (speech and hearing measures)
Измерение речи и слуха может осуществляться в клинических, промышленных и
исследовательских целях. Характер используемых при этом тестов и методов зависит от целей
тестирования.
Меры речиязыка
Системы речевой коммуникации. Для таких целей, как разработка высококачественной
|