Помощь в написании студенческих работ
Антистрессовый сервис

Выбор числа общих факторов

РефератПомощь в написанииУзнать стоимостьмоей работы

Вернемся к проверке гипотезы о числе факторов. В нашем случае, в качестве выступает случайный вектор признаков. Неизвестный параметр распределения этого случайного вектора — его ковариационная матрица. Тогда множество — все симметричные положительно определенные матрицы размера. — множество матриц, которые могут быть представлены виде суммы диагональной матрицы с положительными элементами… Читать ещё >

Выбор числа общих факторов (реферат, курсовая, диплом, контрольная)

В предыдущих главах предполагалось, что число общих факторов заранее известно исследователю. Тем не менее, на практике это обычно не так. Таким образом, одной из задач факторного анализа является определение этого числа.

На сегодняшний день существует множество как теоретически обоснованных, так чисто эмпирических методов решения этой задачи. К первым относится, например, критерий значимости, основанный на методе отношения правдоподобия. Согласно этому критерию, сначала принимается некое начальное значение. При отсутствии каких-либо априорных предположений относительно числа факторов за начальное значение берется. Затем необходимо проверить гипотезу: «число общих факторов меньше либо равно «против альтернативы: «число общих факторов строго больше «. Если будет отвергнута в пользу альтернативы, то следует увеличить на единицу и заново проверить гипотезу, но уже с новым значением. Алгоритм останавливается, когда основная гипотеза будет принята в первый раз. Текущее значение и следует считать числом общих факторов.

Теперь о том, как именно необходимо проверять гипотезу можно переформулировать более формально: «ковариационная матрица признаков размером может быть представлена в виде суммы диагональной матрицы с положительными элементами на диагонали и матрицы ранга «. (Соответственно,: «не может»). Потребуем, чтобы выполнялось неравенство:. По сути, это требование того, чтобы было мало по сравнению с .

Для проверки против воспользуемся методом отношения правдоподобия.

Пусть некоторая случайная величина имеет распределение, причем вид функции нам известен, а о параметре известно лишь то, что он принадлежит некому допустимому множеству: .

Выбор числа общих факторов.

Пусть проверяется гипотеза против альтернативы .

Согласно методу отношения правдоподобия, для проверки против на уровне значимости необходимо вычислить значение статистики.

Выбор числа общих факторов.

.

где — выборка, порождаемая случайной величиной, а — функция правдоподобия этой выборки.

Выбор числа общих факторов.

Если это значение попадает в критическую область, тогда гипотеза отвергается в пользу альтернативы. Значение параметра выбирается так, чтобы критерий имел заданный уровень значимости, т. е. вероятность попадания значения статистики в критическую область при условии верности гипотезы была меньше либо равна .

При выполнении некоторых условий, (которые выполняются в том числе тогда, когда наблюдения независимы и имеют нормальное распределение, т. е. в нашем случае), если объем выборки стремится к бесконечности, то, при верности гипотезы, статистика сходится по распределению к случайной величине, распределенной согласно закону хи-квадрат, где. Точные формулировки этих условий приведены в: (Roger R. Davidson, William E. Lever, 1967).

Выбор числа общих факторов.
Выбор числа общих факторов.
Выбор числа общих факторов.
Выбор числа общих факторов.

Вернемся к проверке гипотезы о числе факторов. В нашем случае, в качестве выступает случайный вектор признаков. Неизвестный параметр распределения этого случайного вектора — его ковариационная матрица. Тогда множество — все симметричные положительно определенные матрицы размера. — множество матриц, которые могут быть представлены виде суммы диагональной матрицы с положительными элементами на диагонали и матрицы ранга. Тогда достигается при значении параметра равном, где и — оценки нагрузочной матрицы и матрицы остаточных дисперсий, полученные методом максимального правдоподобия. Очевидно также, что достигается при значении, равном выборочной ковариационной матрице .

Подставляя эти значения в нашу функцию правдоподобия (формула (1) пункт 1.2.5), получаем:

Выбор числа общих факторов.
Выбор числа общих факторов.

Здесь под имеется ввиду след матрицы .

Логарифмируя это выражение и умножая на, получаем.

Выбор числа общих факторов.

.

Выбор числа общих факторов.
Выбор числа общих факторов.

Асимптотическое распределение этой величины —, где. Вычислим значение степеней свободы. Размерность множества всех симметричных положительно определенных матриц размера равно. Число всех параметров в выражении равно. Более того, в пункте 2.2.5 на нагрузочную матрицу было наложено дополнительное условие, обеспечивающее ее однозначность. А именно, было потребовано, чтобы матрица была диагональной, причем ее диагональные элементы были расположены в порядке убывания. Это условие накладывает дополнительных ограничений на матрицы и .

Таким образом,.

Выбор числа общих факторов.

.

Тогда.

Выбор числа общих факторов.

.

Заметим, что условие, наложенное в начале этого пункта, обеспечивает положительность числа .

Выбор числа общих факторов.

В качестве границы критической области выступает квантиль .

Таким образом, если значение статистики оказывается больше, чем квантиль, то гипотеза отвергается в пользу альтернативы .

Среди более эмпирических методов определения числа факторов хотелось бы выделить критерий, основанный на величине доли объясняемой дисперсии. Суть этого критерия состоит в том, что факторы ранжируются по величине доли объясняемой суммарной дисперсии признаков. А затем, те факторы, которые не объясняют долю дисперсии, превышающую некоторый заранее заданный порог, исключаются из рассмотрения.

Выводы по главе

Итак, в этой главе был дан краткий обзор теоретических основ факторного анализа и, в частности, его метода максимального правдоподобия. В том числе были рассмотрены такие важные задачи, как выбор метода вращения факторного пространства и определение числа общих факторов.

Помимо прочего, было проведено сравнение факторного анализа с родственной ему техникой — методом главных компонент, что способствует лучшему пониманию принципа работы первого.

Показать весь текст
Заполнить форму текущей работой