[Разумеется, риск ошибиться будет еще меньше, если окажется, что эта вероятность составляет 1
на 100 или, еще лучше, 1 на 1000.]
Так, для количественных данных (см. дополнение Б.1) при распределениях, близких к
нормальным, используют параметрические методы, основанные на таких показателях, как средняя и
стандартное отклонение. В частности, для определения достоверности разницы средних для двух
выборок применяют метод Стьюдента, а для того чтобы судить о различиях между тремя или большим
числом выборок, тест F, или дисперсионный анализ.
Если же мы имеем дело с неколичественными данными или выборки слишком малы для
уверенности в том, что популяции, из которых они взяты, подчиняются нормальному распределению,
тогда используют непараметрические методы критерий ?² (хи-квадрат) для качественных данных и
критерии знаков, рангов, МаннаУитни, Вилкоксона и др. для порядковых данных.
Кроме того, выбор статистического метода зависит от того, являются ли те выборки, средние
которых сравниваются, независимыми (т. е., например, взятыми из двух разных групп испытуемых) или
зависимыми (т. е. отражающими результаты одной и той же группы испытуемых до и после воздействия
или после двух различных воздействий).
Дополнение Б.3. Уровни достоверности (значимости)
Тот или иной вывод с некоторой вероятностью может оказаться ошибочным, причем эта
вероятность тем меньше, чем больше имеется данных для обоснования этого вывода. Таким образом,
чем больше получено результатов, тем в большей степени по различиям между двумя выборками
можно судить о том, что действительно имеет место в той популяции, из которой взяты эти выборки.
Однако обычно используемые выборки относительно невелики, и в этих случаях вероятность
ошибки может быть значительной. В гуманитарных науках принято считать, что разница между двумя
выборками отражает действительную разницу между соответствующими популяциями лишь в том
случае, если вероятность ошибки для этого утверждения не превышает 5%, т. е. имеется лишь 5 шансов
из 100 ошибиться, выдвигая такое утверждение. Это так называемый уровень достоверности (уровень
надежности, доверительный уровень) различия. Если этот уровень не превышен, то можно считать
вероятным, что выявленная нами разница действительно отражает положение дел в популяции (отсюда
еще одно название этого критерия порог вероятности).
Для каждого статистического метода этот уровень можно узнать из таблиц распределения
критических значений соответствующих критериев (t, ?² и т. д.); в этих таблицах приведены цифры для
уровней 5% (0,05), 1% (0,01) или еще более высоких. Если значение критерия для данного числа
степеней свободы (см. дополнение Б.4) оказывается ниже критического уровня, соответствующего
порогу вероятности 5%, то нулевая гипотеза не может считаться опровергнутой, и это означает, что
выявленная разница недостоверна.
Дополнение Б.4. Степени свободы
Для того чтобы свести к минимуму ошибки, в таблицах критических значений статистических
критериев в общем количестве данных не учитывают те, которые можно вывести методом дедукции.
Оставшиеся данные составляют так называемое число степеней свободы,
т. е. то число данных из
выборки, значения которых могут быть случайными.
Так, если сумма трех данных равна 8, то первые два из них могут принимать любые значения, но
если они определены, то третье значение становится автоматически известным. Если, например,
значение первого данного равно 3,
а второго 1, то третье может быть равным только 4. Таким
образом, в такой выборке имеются только две степени свободы. В общем случае для выборки в n
данных существует n - 1 степень свободы.
Если у нас имеются две независимые выборки, то число степеней свободы для первой из них
составляет n1 - 1,
а для второй
n2 - 1. А поскольку при определении достоверности разницы между
ними опираются на анализ каждой выборки, число степеней свободы, по которому нужно будет
находить критерий t в таблице, будет составлять (n1 + n2) - 2.
Если же речь идет о двух зависимых выборках, то в основе расчета лежит вычисление суммы
разностей, полученных для каждой пары результатов (т. е., например, разностей между результатами до
и после воздействия на одного и того же испытуемого). Поскольку одну (любую) из этих разностей
можно вычислить, зная остальные разности и их сумму, число степеней свободы для определения
|