Помощь в написании студенческих работ
Антистрессовый сервис

Согласованность экспертных оценок

РефератПомощь в написанииУзнать стоимостьмоей работы

Очевидно, что надежность измерений является следствием тех ошибок, которые совершает каждый из экспертов. Можно попытаться скорректировать их оценки, исходя из разности средних значений для каждого эксперта и общего среднего. Для этого вычтем из каждой оценки эксперта эти разности. Результат этих вычислений представлен в табл. 8.13. Нам необходимы значения дисперсии оценок по каждому пункту… Читать ещё >

Согласованность экспертных оценок (реферат, курсовая, диплом, контрольная)

В качестве примера того, как можно оценить согласованность оценок разных экспертов, рассмотрим в несколько упрощенном виде результаты, представленные в учебном пособии по психометрике Дж. Гилфорда [23]. На русском языке описание этого примера в более широком контексте можно найти в учебном пособии по общей психометрике Ч. Л. Измайлова и М. Б. Михалевской [9].

В одной научной организации три эксперта, старшие научные сотрудники этой организации, оценивали своих коллег по ряду характеристик. Всего оценивалось семь человек по восьми характеристикам. В табл. 8.9 приведены полученные результаты по одной из оцениваемых характеристик. Даны также средние оценки по всем экспертам и всем стимулам.

Таблица 8.9

Балльные оценки семи стимулов (ученых) по одной из характеристик, сделанные тремя экспертами (адаптировано из работы Ч. А. Измайлова, М. Б. Михалевской [9])

Стимулы.

(ученые).

Эксперт.

Средняя оценка.

X

Y

Z

5,33.

8,00.

3,33.

5,67.

6,67.

3,33.

5,67.

Среднее.

6,14.

4,57.

5,57.

5,43.

Отклонение от общего среднего.

0,71.

— 0,86.

0,14.

;

Очевидно, что результаты первого и третьего экспертов оказываются весьма схожими. Действительно, коэффициент корреляции между ними равен 0,92. Результаты второго эксперта явно отличаются как от результатов первого, так и особенно от результатов третьего эксперта. Если корреляция второго эксперта с первым оказывается равной 0,11, то с третьим экспертом корреляция и вовсе оказывается отрицательной — ее значение равно -0,16. Среднее значение корреляции по всем трем экспертам составляет тем не менее 0,29.

Для начала оценим различия средних оценок трех экспертов. Для этого воспользуемся стандартными процедурами дисперсионного анализа с повторными измерениями по фактору эксперта. Результаты такого анализа представлены в табл. 8.10. Видно, что стандартная модель дисперсионного анализа с повторными измерениями не выявляет эффекта испытуемого — F(2, 12) = 1,29; р > 0,10. Однако, как мы уже отметили, у нас имеет место неоднородность корреляционных связей между оценками экспертов. Это же подтверждает статистическая оценка однородности ковариационно-вариационной матрицы по тесту Моучли — ?2(2) = 6,92; р < 0,05. Внесение соответствующих поправок тем не менее не дает возможности выявить эффект экспертов. Их оценки можно считать достаточно однородными.

Таблица 8.10

Результаты оценки согласованности оценок трех экспертов Проверка внутригрупповых эффектов

Измерение: ИЗМЕРЕНИЕ-1.

Источник.

Сумма квадратов типа III.

ст.св.

Средний квадрат.

F

Знч.

Эксперты.

Предполагая сферичность.

8,857.

4,429.

1,292.

0,310.

Гринхауз — Гайссер

8,857.

1,143.

7,747.

1,292.

0,303.

Юнха — Фельдта.

8,857.

1,236.

7,166.

1,292.

0,305.

Ограниченный снизу.

8,857.

1,000.

8,857.

1,292.

0,299.

Ошибка (Эксперт).

Предполагая сферичность.

41,143.

3,429.

Гринхауз — Гайссер

41,143.

6,860.

5,998.

Юнха — Фельдта.

41,143.

7,416.

5,548.

Ограниченный снизу.

41,143.

6,000.

6,857.

Теперь оценим надежность измерений трех экспертов. Для этого воспользуемся формулой (8.15):

Согласованность экспертных оценок.

Как очевидно, для такой оценки нам нужны значения среднего квадрата между испытуемыми и среднего квадрата внутри испытуемых. Их можно найти по тем результатам, которые предоставляет нам окно вывода IBM SPSS Statistics. Так, средний внутригрупповой квадрат может быть найден на основе суммарных квадратов для экспертов и для ошибки и соответствующих им значений числа степеней свободы. Эти данные легко найти в табл. 8.10.

Согласованность экспертных оценок.

Средний квадрат между испытуемыми можно найти в таблице оценки эффектов межгрупповых факторов (табл. 8.11), где он обозначен как «Ошибка». Его значение оказывается равным 8,52.

Таблица 8.11

Оценка различий между стимулами (учеными)

Опенка эффектов межгрупповых факторов Измерение: ИЗМЕРЕНИЕ-1 Преобразуемая переменная: Среднее.

Источник.

Сумма квадратов типа III.

ст. св.

Средний квадрат.

F

Знч.

Свободный член.

618,857.

618,857.

72,603.

0,000.

Ошибка.

51,143.

8,524.

Подставляя имеющиеся у нас данные в формулу оценки надежности измерений, получаем:

Согласованность экспертных оценок.

Этот результат показывает, что если мы повторим процедуру оценивания данной группы испытуемых по исследуемой характеристике с помощью случайной выборки новых трех экспертов, то коэффициент корреляции между ними окажется равным 0,59.

Другим способом оценки надежности проведенных измерений может стать формула Кронбаха (8.19).

Нам необходимы значения дисперсии оценок по каждому пункту теста, в данном случае — но каждому эксперту. Кроме того, нам понадобится значение дисперсии суммарных баллов всех трех испытуемых. Результаты проведенных расчетов представлены в табл. 8.12. Подставляя эти данные в формулу Кронбаха, снова имеем значение надежности? = 0,59.

Таблица 8.12

Дисперсия оценок трех экспертов и их суммарных показателей

Эксперты.

Оценка дисперсии.

X

5,55.

Y

3,39.

Z

4,24.

Суммарные значения.

21,92.

Очевидно, что надежность измерений является следствием тех ошибок, которые совершает каждый из экспертов. Можно попытаться скорректировать их оценки, исходя из разности средних значений для каждого эксперта и общего среднего. Для этого вычтем из каждой оценки эксперта эти разности. Результат этих вычислений представлен в табл. 8.13.

Таблица 8.13

Скорректированные оценки трех экспертов

Стимулы (ученые).

Эксперт.

Средняя оценка.

X

Y

Z

4,29.

6,86.

4,86.

5,33.

8,29.

8,86.

6,86.

8,00.

2,29.

4,86.

2,86.

3,33.

6,29.

5,86.

4,86.

5,67.

8,29.

2,86.

8,86.

6,67.

2,29.

4,86.

2,86.

3,33.

6,29.

3,86.

6,86.

5,67.

Среднее.

5,43.

5,43.

5,43.

5,43.

Как видно, в результате проведенной коррекции средние оценки экспертов оказались уравненными. Однако такая коррекция не изменила средних оценок для оцениваемых стимулов (ученых). Таким образом, средний квадрат между испытуемыми остается тем же, а средний квадрат внутри испытуемых уменьшился на величину эффекта экспертов:

Согласованность экспертных оценок.

Тогда значение коэффициента надежности для средних оценок трех экспертов оказывается равным.

Согласованность экспертных оценок.

Показать весь текст
Заполнить форму текущей работой