Помощь в написании студенческих работ
Антистрессовый сервис

Корреляция рангов для качественных признаков

РефератПомощь в написанииУзнать стоимостьмоей работы

Коэффициенты ранговой корреляции могут использоваться и при определении силы связи между ранговым и количесгвенным признаками. В этом случае значения количественного признака упорядочиваются и им присваиваются соответствующие ранги. Недостатком этих коэффициентов является то, что при анализе взаимосвязи количественных признаков одинаковым разностям рангов могут соответствовать различные разности… Читать ещё >

Корреляция рангов для качественных признаков (реферат, курсовая, диплом, контрольная)

Основой такого оценивания связи признаков является принцип нумерации индивидуальных значений статистического ряда. Под рангами понимаются порядковые номера единиц совокупности в проранжированном по возрастанию (или убыванию) ряду. Для получения количественных оценок степени тесноты корреляционной связи признаков на основе их рангов наибольшее применение нашли коэффициенты Ч. Спирмена и М. Кендалла.

Коэффициент корреляции рангов Ч. Спирмена рассчитывается следующим образом. Элементы наблюдаемой совокупности ранжируются дважды — по отдельности по двум признакам. Сначала элементы располагаются по возрастанию (убыванию) значения первого признака. Каждой единице такого ряда присваивается порядковый номер (ранг). Первый номер получает наименьшая (наибольшая) варианта, второй номер — следующая по величине варианта и т. д. Затем аналогичная процедура повторяется для этой же совокупности по второму признаку. Для повторяющихся индивидуальных значений признака ранг определяется как средняя арифметическая соответствующих номеров. Ранжировать по обоим признакам необходимо одинаково (либо по возрастанию, либо по убыванию). Далее сравниваются ранги каждого элемента совокупности, полученные в результате двух ранжирований. Если с возрастанием величины рангов факторного признака соответствующие им величины рангов результативного признака увеличиваются, делается вывод о наличии прямой связи. Если с увеличением рангов факторного признака ранги результативного признака уменьшаются, то — об обратной связи. Совпадение рангов одних и тех же элементов по двум признакам свидетельствует о тесной прямой связи, «противоположность» рангов — о тесной обратной связи. На основе такого ранжирования рассчитывается коэффициент Ч. Спирмена:

Корреляция рангов для качественных признаков.

где (ы)х. — ту.) — разность рангов г-го элемента; п — количество элементов совокупности (наблюдений).

Его значение меняется в пределах от -1 до +1. Чем ближе модуль значения коэффициента к единице, тем теснее связь между признаками.

Коэффициент корреляции рангов М. Кендалла строится несколько по-другому. Его расчет также начинается с ранжирования значений признаков х и у. Исходные данные представляют собой две выборки, каждая из которых содержит п последовательных и несвязанных рангов — чисел от 1 до п. Для некоторой пары объектов констатируется совпадение, если направления изменения их рангов как по переменной х, так и по переменной у одинаковы, или несовпадение, если направления изменения рангов по переменным х и у различны. Тогда коэффициент М. Кендалла может быть вычислен по формуле Корреляция рангов для качественных признаков.

где С и Н — определяются для неупорядоченного ряда (результативного признака!/); С — сумма рангов, больших выбранного ранга (со знаком плюс); Я — сумма рангов, меньших выбранного ранга (со знаком минус).

Значение этого коэффициента может быть пояснено следующим образом. Например, если он равен 0,80, то у 90% пар порядок совпадает, а у 10% не совпадает (90% + 10% = 100%; 0,90% - - 0,10% = 0,80%). Иными словами, это разность вероятностей совпадения и несовпадения порядков по обоим признакам для наугад выбранной пары объектов. Расчет значения коэффициента М. Кендалла часто достаточно громоздок.

При ранжировании могут возникнуть ситуации, когда два или более объектов имеют одинаковые ранги. Такие объекты называют связанными. Ранг таких объектов принимается равным среднему значению рангов, которые имели бы эти объекты, если бы они были различны. При расчете коэффициента М. Кендалла, если данные повторяются, то соответствующие им равные ранги не учитываются, и для расчетов должен использоваться скорректированный коэффициент корреляции М. Кендалла:

Корреляция рангов для качественных признаков.

где т — число связанных рангов в рядах х и у соответственно.

Однако на практике отличие значений скорректированного коэффициента от классического незначительно, и это правило часто игнорируется. Формулы для коэффициентов Ч. Спирмена и М. Кендалла различаются, но дают достаточно близкие значения, хотя коэффициент М. Кендалла обычно дает более низкую оценку корреляции, чем коэффициент Ч. Спирмена.

Если совокупность объектов характеризуется не двумя, а несколькими последовательностями рангов, и необходимо установить статистическую связь между несколькими переменными, может быть применен множественный коэффициент корреляции рангов М. Кендалла:

Корреляция рангов для качественных признаков.

где С — сумма квадратов отклонений сумм по строкам от их общего среднего значения; п — количество столбцов таблицы; т — число строк таблицы; - ранг /-го факторау-й единицы.

Значения этого коэффициента изменяются в пределах от О до +1. Увеличение коэффициента означает проявление большей согласованности рангов. Если все ранги совпадают, то он равен единице.

Пример 11.2.

Имеются результаты наблюдений за совместной повторяемостью значений качественных признаков Р3 и Р4, представленные в табл. 11.3. Значения признака Р3 представляют собой один из грех цветов оптического спектра (красный, зеленый, фиолетовый), значения признака Р4 — массу объекта (небольшая, средняя, большая). Необходимо оценить силу связи между этими признаками с помощью коэффициента корреляции рангов Ч. Спирмена.

Таблица 113

Номер объекта.

Значения признака Р3

Значения признака Р4

Красный.

Большая.

Зеленый.

Средняя.

Фиолетовый.

Небольшая.

Фиолетовый.

Небольшая.

Зеленый.

Средняя.

Красный.

Большая.

Зеленый.

Средняя.

Красный.

Большая.

Фиолетовый.

Небольшая.

Фиолетовый.

Средняя.

Зеленый.

Средняя.

Фиолетовый.

Небольшая.

Красный.

Большая.

Зеленый.

Средняя.

Красный.

Средняя.

Общее количество наблюдений равно 15. Выполним ранжирование объектов по возрастанию значений признака Р3(табл. 11.4).

Таблица 11.4

Номер объекта.

Значения признака Р3

Порядковый номер при ранжировании.

Ранг.

Красный.

Красный.

Красный.

Красный.

Красный.

Зеленый.

Зеленый.

Зеленый.

Зеленый.

Зеленый.

Фиолетовый.

Фиолетовый.

Фиолетовый.

Фиолетовый.

Фиолетовый.

Выполним ранжирование объектов по возрастанию значений признака РА (табл. 11.5).

Таблица 11.5

Номер объекта.

Значения признака РА

Порядковый номер при ранжировании.

Ранг.

Небольшая.

2,5.

Небольшая.

2,5.

Небольшая.

2,5.

Небольшая.

2,5.

Средняя.

Средняя.

Средняя.

Средняя.

Средняя.

Окончание табл. 11.5

Номер объекта.

Значения признака РА

Порядковый номер при ранжировании.

Ранг.

Средняя.

Средняя.

И.

Большая.

13,5.

Большая.

13,5.

Большая.

13,5.

Большая.

13,5.

Преобразуем исходную табл. 11.3 следующим образом (табл. 11.6):

Таблица 11.6

11омер объекта.

Ранг по РА

Ранг по Р3

13,5.

2,5.

2,5.

13,5.

13,5.

2,5.

И.

2,5.

13,5.

Рассчитаем коэффициент Ч. Спирмена по указанной выше формуле:

Корреляция рангов для качественных признаков.

Можно сделать вывод, что связь между признаками Р3 и РА существует. Она обратная, средней силы.

Коэффициенты ранговой корреляции могут использоваться и при определении силы связи между ранговым и количесгвенным признаками. В этом случае значения количественного признака упорядочиваются и им присваиваются соответствующие ранги. Недостатком этих коэффициентов является то, что при анализе взаимосвязи количественных признаков одинаковым разностям рангов могут соответствовать различные разности значений признаков. В этом случае дополнительно рассчитываются другие коэффициенты корреляции и решение о тесноте связи принимается по совокупности значений нескольких показателей.

На практике применяется проверка коэффициента корреляции рангов на предмет статистической значимости. При этом используется ?-распределение Стыодента:

Корреляция рангов для качественных признаков.

где Кк — проверяемый коэффициент корреляции рангов.

Полученное таким образом расчетное значение ?-критерия сравнивается с табличным ?табл, чаще всего для уровня значимости 0,05 и числа степеней свободы (п — 2). Если оказывается, что ?расч > ?табл, то коэффициент корреляции рангов считается значимым.

Показать весь текст
Заполнить форму текущей работой