обобщение или вычислять степень корреляции. Первая разновидность это наиболее широко
применяемые параметрические методы,
в которых используются такие параметры,
как среднее
значение или дисперсия данных. Вторая разновидность это непараметрические методы,
оказывающие неоценимую услугу в том случае, когда исследователь имеет дело с очень малыми
выборками или с качественными данными (см. документ Б.1); эти методы очень просты с точки зрения
как расчетов, так и применения. Когда мы познакомимся с различными способами описания данных и
перейдем к их статистическому анализу, мы рассмотрим обе эти разновидности.
Как уже говорилось, для того чтобы попытаться разобраться в этих различных областях
статистики, мы попробуем ответить на те вопросы, которые возникают в связи с результатами того или
иного исследования. В качестве примера мы возьмем тот эксперимент, который приведен в главе 3, а
именно изучение влияния потребления марихуаны на глазодвигательную координацию и на время
реакции. Методика, используемая в этом гипотетическом эксперименте, а также результаты, которые
мы могли бы в нем получить, представлены в дополнении Б.2 [*].
[Важное примечание.
В разделах, посвященных описательной и индуктивной статистике, мы
будем рассматривать только те данные эксперимента, которые имеют отношение к зависимой
переменной «поражаемые мишени». Что касается такого показателя, как время реакции, то мы
обратимся к нему только в разделе о вычислении корреляции. Однако само собой разумеется, что уже с
самого начала значения этого показателя надо обрабатывать так же, как и переменную «поражаемые
мишени». Мы предоставляем читателю заняться этим самостоятельно с помощью карандаша и бумаги.]
При желании вы можете заменить какие-то конкретные детали этого эксперимента на другие
например, потребление марихуаны на потребление алкоголя или лишение сна, или, что еще лучше,
подставить вместо этих гипотетических данных те, которые вы действительно получили в вашем
собственном исследовании. В любом случае вам придется принять «правила нашей игры» и выполнять
те расчеты, которые здесь от вас потребуются; только при этом условии до вас «дойдет» существо
предмета, если это уже не случилось с вами раньше [*].
[Для того чтобы облегчить задачу, мы советуем вам снять фотокопии таблиц Б.1 и Б.2: тогда на
всех этапах рассуждений и расчетов данные будут у вас перед глазами.]
Дополнение Б.1. Некоторые основные понятия
Популяция и выборка [*]
[В отечественной литературе приняты термины соответственно «генеральная совокупность» и
«выборочная совокупность». Прим. перев.]
Одна из задач статистики состоит в том, чтобы анализировать данные, полученные на части
популяции, с целью сделать выводы относительно популяции в целом.
Популяция в статистике не обязательно означает какую-либо группу людей или естественное
сообщество; этот термин относится ко всем существам или предметам, образующим общую изучаемую
совокупность, будь то атомы или студенты, посещающие то или иное кафе.
Выборка это небольшое количество элементов, отобранных с помощью научных методов так,
чтобы она была репрезентативной, т. е. отражала популяцию в целом.
Данные и их разновидности
Данные в статистике это основные элементы, подлежащие анализу. Данными могут быть
какие-то количественные результаты, свойства, присущие определенным членам популяции, место в
той или иной последовательности в общем любая информация, которая может быть
классифицирована или разбита на категории с целью обработки [*].
[Не следует смешивать «данные» с теми «значениями», которые эти данные могут принимать.
Для того чтобы всегда различать их, Шатийон (Chatillon, 1977) рекомендует запомнить следующую
фразу: «Данные часто принимают одни и те же значения» (так, если мы возьмем, например, шесть
данных 8, 13, 10, 8, 10 и 5, то они принимают лишь четыре разных значения 5, 8, 10 и 13).]
Построение распределения это разделение первичных данных, полученных на выборке, на
классы или категории с целью получить обобщенную упорядоченную картину, позволяющую их
анализировать.
Существуют три типа данных:
|