Электронная онлайн библиотека

 
 Психология

Математические методы обработки материалов психологических исследований


Статистическое группировки. Данные, полученные в процессе психологического исследования, могут быть систематизированы по помощью простого или перекрестного группировки. Простое группировка состоит в упорядочении или классификации по одному признаку. В зависимости от гипотезы, всех испытуемых, которые вошли в выборочной совокупности, можно сгруппировать по определенным признакам: полу, возрасту, типу темперамента, уровнем развития способностей и т.д.

Результат группировку единиц наблюдения за будь-какому признаку называют статистическим рядом. Признак, по которому группа, обозначим х.

Пример 1. Предположим, что х - это объем внимания каждого студента в академической группе. Получим неупорядоченный ряд отдельных наблюдений:

6,8,4,7,8,5,9,6,7,7,8,7,7,6,9,5,7,8 (объектов).

Если отдельные наблюдения записать в порядке увеличения указанных выше значений признака, то получим вариационный ряд:

4,5,5,6, б, 6,7,7,7,7,7,7,8,8,8,8,9,9 (объектов).

Далее можно подсчитать, как часто каждое значение этого признака встречается в совокупности. В результате получим частотное распределение для данной признаки. Иногда его называют эмпирическим или статистическим распределением. Для примера 1 частотное распределение имеет вид, приведенный в таблице 1.

 

Таблица 1
Объем внимания
xi
Частота
fi
Накопленная частота
fн i
4
5
6
7
8
9
1
2
3
6
4
2
1
3
6
12
16
18
Количество значений k=6 Количество студентов n=18 -

 

Каждое отдельное значение признака обозначают х1, х2, х3,..., хk. В приведенном примере это 4,5,6,7,8,9 (объектов), а количество значений k = 6.

Абсолютные числа, которые показывают, сколько раз встречается то или иное значение атрибута х, называют частотами и обозначают соответственно f1, f2, f3,..., fk.

Относительной частотой называют судьбу значений признака в общем числе наблюдений и обозначают ω1, ω2, ω3, ..., ωk.

Например, для приведенного в таблице 1 частотного распределения частота наибольшего значения признаки 9 объектов равна 2, а относительная частота

ω6=f6/n=2/18=0,11.      (1)

Относительную частоту обычно выражают в процентах: ω6=11%.

Сгруппированные данные. Как правило, для последующего статистического проработки или более наглядного представления данных отдельные значения признаков объединяют в группы (интервалы). В таком случае частоты соотносят уже не с каждым отдельным значением признака, а с рядом значений, которые попадают в определенный интервал. Распределение объема внимания для вышеприведенного примера представлен в виде интервального ряда в таблице 2.

 

Таблица 2
Интервалы
объема внимания
m
Частота
f
Относительная
частота
ω, %
Накопленная
частота
fн
Накопленная
относительная
частота
ωн, %
4-5
6-7
8-9
3
9
6
16,7
50,0
33,3
3
12
18
16,7
66,7
100,0
m=3 18 100 - -

В отличие от простого группировки, которое выполняется по одному признаку, перекрестное группировки представляет собой связку фактов по ряду признаков, которые были выделены в гипотезах. Перекрестное группировка позволяет определить тесноту связей, а в некоторых случаях - и направление взаимодействия.

Вариационный анализ. Группировка - это лишь первый этап статистического анализа полученных данных. Следующий шаг обработки заключается в получении некоторых обобщающих характеристик, которые позволяют глубже понять особенности единицы наблюдения. Сюда прежде всего относятся среднее значение признаки, вокруг которого варьируют другие ее значения, а также мере рассеивания признаки. В средних величин в математической статистике относят среднее арифметическое, моду, медиану, к показателей меры рассеяния - вариационный размах, дисперсию, среднее квадратическое отклонение и т.д.

Среднее арифметическое значение является частным от деления суммы всех значений признака на количество измерений. Сказывается оно x. Формула для вычисления имеет вид:

x=(x1+x2+x3+...+xn) /n=(1/n)*Σxi ,      (2)

где x1,..., хn - значение признака; n - количество измерений (или испытуемых).

Следовательно, среднее значение объема внимания, характерное для группы студентов (пример 1) будет таким:

x=(6+8+4+7+8+5+9+6+7+7+8+7+7+6+9+5+7+8)/18=6,9(объектов).

Необходимость определения среднего значения признака особенно часто возникает по результатам группировки. В этом случае пользуются взвешенным средним арифметическим значением признака, которое определяется по формуле:

x=(x1f1+x2f2+x3f3+...+xkfk) /(f1+f2+f3+...+fk)      (3)

где x1, x2, x3,..., xk - варианты значений признака; f1, f2, f3,..., fk - частоты вариантов значений признака.

Для примера 1 среднее взвешенное значение объема внимания будет таким:

x=(4*1+5*2+6*3+7*6+8*4+9*2)/(1+2+3+6+4+2)=124/18=6,9 (объектов).

Медианой (Me) называют значение признака, которое находится внутри вариационного ряда и разделяет его строго пополам. Чтобы найти медиану, сначала определяют ее порядковый номер. Для этого при нечетном числе единиц наблюдения до суммы всех частот добавляется единица и все делят на два. При четном числе единиц наблюдения в ряду будут две средние единицы и по всем правилам медиана должна определяться как средняя из значений этих двух единиц. Однако на практике при четном числе единиц наблюдения медиана определяется как значение атрибута той единицы, порядковый номер которого равен общей сумме частот, разделенной на 2. Зная порядковый номер медианы, легко с накопленными частотами найти ее значение.

Вычислим значения медианы для примера 1 (таблица 1), Поделив сумму частот на 2, определяем порядковый номер медианы. Он равен 18:2=9. По накопленной частоте fн=12 определяем, что все отдельные наблюдения с 7 по 12 имеют значение 7. Следовательно, средняя Me - 7.

В интервальных рядах с различными значениями частот; вычисления медианы состоит из двух этапов: сначала находят медианный интервал, которому соответствует первая из накопленных частот, что превышает половину всего объема совокупности, а потом находят значение медианы по формуле

Me=x0+h/ωMe(1/2*Σωiн (Me-1))      (4)

где х0 - начало (нижняя граница) медианного интервала; h - величина медианного интервала;

Σωi - сумма относительных частот;

ωн (Me-1) - относительная частота, накопленная к медианного интервала;

ωMe - относительная частота медианного интервала.

Проведем расчет по данным таблицы 2, где в последнем столбце приведены относительные накопленные частоты. Первая из них, что превышает половину совокупности, равна 66,7%, Следовательно, медиана принадлежит интервалу 6-7 объектов. Назад

Me=6+1/50 (1/2*100-16, 7)=6,7 (объектов).

Мода. Модой (Mo) в математической статистике называют значение признака, которое чаще всего встречается в данной совокупности. Так, в примере 1 модой будет объем внимания 7 объектов, поскольку именно это значение встречается у избиратели чаще.

Вариационный размах - это разница между максимальным и минимальным значениями признака в данной совокупности. Для приведенного выше примера вариационный размах равна 9-4=5 (объектов).

Дисперсия. Дисперсией называется величина, равная среднему значению квадрата отклонений отдельных значений признаков от средней арифметической.

Проверка статистических гипотез заключается в проверке предположений о характере распределения случайных величин и о связи между ними, о принадлежность данных к одной генеральной совокупности, о значимости различий.

Корреляционный анализ предназначен для оценивания формы, знака и тесноты связи между несколькими признаками или факторами, которые исследуются. При определении формы связи рассматривается ее линейность и нелинейность.

Регрессионный анализ позволяет изучать зависимости одной или нескольких средних величин от других. Понятие регрессионного анализа ввел Ф. Гальтон, который установил факт определенного соотношения между ростом родителей и их взрослых детей. Он заметил, что у родителей самого низкого роста дети оказывались чуть выше, а у родителей наивысшего роста - чуть ниже. Такого рода закономерность он назвал регрессией. Регрессионный анализ применяется преимущественно в эмпирических психологических исследованиях при решении задач, связанных с оценкой любого воздействия (например, влияния мотивов на поведение), при конструировании психологических тестов и т.д.

Факторный анализ - метод многофакторной математической статистики, который применяется при исследовании статистически связанных признаков с целью выявления определенного количества скрытых от непосредственного наблюдения факторов. Разработанный для нужд психологии, факторный анализ впоследствии получил широкого распространения в экономике, медицине, социологии и других науках, которые имеют огромное количество; переменных, из которых необходимо выделить ведущие.

Основные идеи факторного анализа были заложены в трудах известного английского психолога и антрополога Ф. Гальтона (1822-1911), который сделал значительный вклад в исследования индивидуальных различий. В дальнейшем продолжали развивать факторный анализ много ученых, но дальнейшем его внедрению в психологию мы более всего обязаны Ч. Спірмену, Л. Терстоуну, Г. Кеттелу, Г. Айзенку. Необходимость применения факторного анализа в психологии в первую очередь вытекает из многомерности объектов, которые изучает эта дисциплина. С помощью факторного анализа не просто устанавливается связь изменение одной переменной в зависимости от другой переменной, а определяется мера этой связи и устанавливаются основные факторы, лежащие в основе указанных изменений.

Основными целями применения факторного анализа в психологии есть такие:

1. Снижение количества переменных, которые используются, за счет их объяснения меньшим числом факторов, обобщение полученных данных.

2. Группирование, структурирование и компактная визуализация полученных данных.

3. Опосредованное косвенное оценки переменных, изучаемых в случае невозможности или неудобства их прямого измерения.

4. Генерирование новых идей на этапе прогностического анализа. Оценка соответствия эмпирических данных теории, что используется на этапе ее подтверждения.

В процессе исследования с применением факторного анализа можно выделить три основных этапа:

I этап - сбор эмпирических данных. Следует отметить, что использование на этом этапе различных вариантов бальных оценок (шкал порядке) приводит к ограничений применения факторного анализа, поскольку его вычислительные алгоритмы требуют, чтобы измерение переменных, которые наблюдаются, были проведены не ниже, чем по шкале интервалов. Количество переменных, которые приходятся на один фактор, должно быть не менее трех. Завершается первый этап исчислением корреляционной матрицы (матрицы попарных корреляций).

II этап - собственно факторизация матрицы корреляций или выделения первобытных (ортогональных) факторов. Сегодня - это полностью компьютеризирована процедура, которую можно найти почти во всех современных статистических программах, в частности, «Stadia» и «SPSS».

III этап - содержательная интерпретация результатов факторного анализа.

Факторный анализ особенно продуктивным на начальных этапах научных исследований, когда необходимо выделить любые предыдущие закономерности в отрасли, что исследуется. Это позволяет предстоящий эксперимент сделать более совершенным по сравнению с экспериментом на переменных, которые выбраны произвольно или случайно.



Назад