Помощь в написании студенческих работ
Антистрессовый сервис

Этапы развития тестирования в России и за рубежом

РефератПомощь в написанииУзнать стоимостьмоей работы

Таким образом, в современной России прерванное в силу известных исторических причин тестовое движение возродилось и набирает потенциал в общенациональном масштабе. В создание и применение тестовых технологий вовлекаются все новые и новые силы. Масштабы этого явления столь значимы, что уже обозначились четкие признаки существования в стране научного сообщества тестологов, организованного… Читать ещё >

Этапы развития тестирования в России и за рубежом (реферат, курсовая, диплом, контрольная)

Развитие тестирования за рубежом.

Условно в развитии теории педагогических измерений можно выделить четыре этапа, первый из которых приходится на конец XIX — начало XX в., когда в центре внимания ученых находились в основном философские и методологические проблемы измерений, получавшие свое решение сообразно достигнутому уровню развития науки.

В 1905 г. французский врач и психолог Альфред Вине представил первую теорию градации интеллектуальных способностей человека. Эта теория впоследствии приобрела весьма широкую известность и нашла отражение в трудах многих специалистов в области теории педагогических измерений.

Французское правительство поставило перед Вине задачу — разработать тесты, которые смогли бы выявить детей, неспособных к обучению в массовой школе. В тестах Вине содержались задания, предназначенные для детей определенного возраста и диагностирующие способности к пониманию, рассуждению, говорению, счету, письму и построению умозаключений. К заданиям предлагались ответы, каждый из которых оценивался в баллах. Суммарный результат соотносился с возрастом ребенка.

Вопреки широко распространенному мнению о приоритете Вине в области психологических измерений, его работа по созданию тестов была не первой. Видимо, первенство здесь принадлежит британским исследователям Ф. Гальтону и его ученику Дж. Кэтеллу, которые уже в 1890 г. использовали термин «тест на интеллект». Но поскольку результаты исследований и экспериментов британских ученых не оправдали всех ожиданий, разработанные ими тесты не получили дальнейшего применения и были признаны неудачными.

Появление первых тестов для контроля учебных достижений принято связывать с именем Дж. Раиса, опубликовавшего результаты своих исследований в 1897 г.

Но именно Вине впервые предложил объективный метод сравнения детей по степени умственного развития и количественную шкалу для оценки детского интеллекта. Эти тесты оказались наиболее значительной работой Вине в сфере измерений, о чем нередко упоминается в трудах наших современников. Основанная на результатах применения его тестов шкала получила название «метрическая шкала интеллектуальности», а сама методика тестирования была описана в книге А. Вине и Т. Симона «Ненормальные дети», изданной в России в 1911 г.

Идеи Вине впоследствии были использованы немецким психологом и философом Вильямом Штерном. Штерн предложил ввести новую величину, названную им «коэффициент интеллекта». Благодаря предложению Штерна в научный оборот и в практику измерений вошел широко используемый показатель — «коэффициент интеллектуальности», или IQ. Он применяется до сих пор, правда, в новой интерпретации, опирающейся на современные методы тестирования интеллекта.

В 1904 г. британским ученым Чарльзом Спирменом был опубликован фундаментальный теоретический труд об исследовании общих интеллектуальных способностей. Концепция, выдвинутая в работе Спирмена, несомненно, удачно перекликалась с прикладным исследованием Бине и восполняла его теоретические пробелы, отмеченные современниками.

Используя школьные оценки по различным предметам, Спирмен показал, что способности детей по каждому предмету — это совокупность устойчивых для каждого ребенка характеристик, лишь незначительно изменяющихся под влиянием изучения предмета. Тем самым Спирмен дал импульс становлению теории педагогических измерений, соединив в своем исследовании элементы теории физических измерений, корреляционные методы и накопленный его предшественникамипсихологами опыт оценивания способностей детей.

Одновременно с развитием науки об измерениях в психологии и педагогике возникла потребность в измерителях — стандартизированных тестах. Эта задача нашла свое решение в годы Первой мировой войны.

Дело в том, что военное командование США после вступления в мировую войну в беспрецедентных для того времени масштабах столкнулось с проблемой отбора, оценки и распределения большого количества призывников по различным родам войск и организовало «мозговой центр» из специалистов по составлению тестов, статистиков и экспертов по измерениям. Результатом совместной работы таких добившихся в дальнейшем широкой известности специалистов, как Торндайк, Годдард, Йеркс и Терман, стала батарея альфаи бетатестов для вооруженных сил.

Успехи тестирования нашли отклик и в сфере образования. Тестирование сделало гигантский скачок в своем развитии. Были разработаны тесты интеллекта для лиц всех возрастов и категорий — от дошкольников до аспирантов. Массовые программы тестирования затевались с завидным оптимизмом. Тесты на развитие интеллекта стали проводить на уроках в школах. Перед зачислением в колледжи в США ввели стандартную проверку. Для упорядочения отбора поступающих был создан специальный Совет колледжей, использовавший в качестве экзаменационных материалов батареи тестов по истории, математике, химии, физике, английскому, немецкому, французскому и другим языкам.

Этапы развития тестирования в России и за рубежом.

А. Вине Ф. Гальтон Э. Торндайк Р. Йорк В рассматриваемый период, характеризуемый преимущественно эмпирическим подходом, масштабы применения тестов значительно обгоняли теоретическое осмысление результатов их использования и совершенствование методики тестирования. Во многом это было связано с отсутствием адекватного научного аппарата, необходимого для развития теории тестов. Данные, полученные на основе анализа качества измерений в психологии и образовании, исследования характеристик тестов с учетом накопленного эмпирического материала, выявили многие просчеты их разработчиков. Соответственно, как в научных кругах, так и среди общественности возродились сомнения в оправданности применения тестов в образовании.

Стало очевидно, что в теоретических воззрениях и в практике тестирования назрели существенные перемены. Именно они определили суть нового, по нашей классификации второго периода развития рассматриваемой научно-практической области.

В этот период, охвативший 1920—1945 гг., и была, по сути, создана классическая теория педагогических измерений, определившая методы создания тестов и статистического анализа качества педагогических измерений. Для обоснования характеристик качества педагогических измерений, их надежности и валидности стала использоваться теория корреляции; сформировались концепции параллельных и эквивалентных измерений; были введены основные аксиомы классической теории тестов. Эти аксиомы, принципы педагогического тестирования, критерии качества педагогических измерений и статистические методы создания тестов стали главным итогом развития классического периода теории тестов.

В 1920;е гг. начали появляться первые стандартизированные тесты для измерения результатов обучения в общеобразовательных школах. Под влиянием работ известного американского психолога, профессора Колумбийского университета Э. Торндайка для их разработки использовались те же принципы, которые ранее легли в основу создания психологических тестов. В качестве примера первых стандартизированных измерений в образовании можно назвать шкалы оценки качества почерка и письменных сочинений, тесты на правописание, выполнение арифметических действий и др. Несколько позднее появились батареи тестов достижений, реализующие идеи многомерных измерений и обеспечивающие сопоставимость полученных результатов по разным предметам.

На фоне прогресса в теории измерений развернулись исследования по выявлению качества измерителей и измерительных процедур, в том числе на эмпирической основе — путем соотнесения результатов тестирования с фактическими и экспертными данными.

Во второй половине 1920;х гг. по инициативе Совета колледжей США создается известная батарея тестов SAT, предназначенная для отбора поступающих в колледжи. В 1929 г. SAT включал только два теста: для оценивания вербальных способностей и математических способностей поступающих в колледжи. Но уже к 1941 г. число предметов, входящих в батарею SAT, значительно возросло, а сдавали их десятки тысяч молодых людей.

Новый, третий период в развитии теории измерений охватывает 1946—1980 гг. На развитие научной мысли тогда оказали влияние в первую очередь работы С. Стивенса, среди которых следует особо выделить его статью «О теории шкал измерений» (1946). Характерной чертой этого периода можно считать значительное расширение сферы приложения теории измерений, когда центр тяжести прикладных исследований переместился в психологию, экономику, социологию и педагогику.

С начала 1950;х гг. XX в. и в США, и в Великобритании в научную и педагогическую среду пришло осознание того, что измерения в сфере психологии и образовании — это не только инструменты получения новых знаний и их использования для отбора обучаемых или улучшения учебного процесса. Это также основания для принятия разного рода административных мер, от которых нередко страдают живые люди, коверкаются детские судьбы, нарушаются планы семей и целых сообществ. Иная ошибка в оценивании, связанная с недостаточной объективностью результатов тестирования, может привести к необратимым последствиям при принятии управленческих решений. В связи с этим в теории педагогических измерений активизировался поиск эффективных методов повышения надежности тестов.

С середины 1950;х гг. основное внимание стало уделяться математико-статистическому аппарату классической, или традиционной, как ее иногда называют, теории тестов, который окончательно сформировался к концу 1970;х гг.

Дальнейшее развитие получили также теоретическое определение умственных способностей и, соответственно, базирующиеся на таком подходе методики тестирования. Были накоплены специальные знания о теории педагогического контроля, аттестации обучаемых в сочетании с педагогическими измерениями и стандартизированными тестами.

Крупным событием третьего периода развития измерений в образовании стала организация в 1947 г. в США Службы образовательного тестирования — Educational Testing Service (ETS). Сфера деятельности ETS постепенно охватывала различные страны, а к концу 1980;х гг. представительства ETS были созданы в большинстве стран мира. В связи с расширением программ международных обменов в области образования была разработана батарея тестов TOEFL, выявляющая уровни владения различными видами речевой деятельности для обучения в англоязычных странах, в первую очередь в США. Появились тесты по программам углубленного изучения предметов (Advenced Placement Tests').

Таким образом, третий период развития педагогических измерений за рубежом проходил в условиях развития теории создания и практики применения педагогических тестов. Потребность в повышении эффективности тестирования и качества тестов привела к конструктивной критике классической теории тестов, сводящейся не к запрету или ограничению роли тестов в педагогических измерениях, а к построению новой теории, преодолевавшей ряд недостатков классической теории тестов. В частности, в современной теории удалось исключить зависимость оценок параметров испытуемых от трудности заданий теста и оценок параметра трудности от уровня подготовленности выборки. Благодаря последнему свойству речь идет об инвариантности — появилась возможность создания банков калиброванных тестовых заданий с устойчивыми оценками параметров их трудности. Соответственно, стали развиваться высокоэффективные методы компьютерного моделирования тестов, технологии адаптивного тестирования, позволяющие без применения многочисленных методик выравнивания сопоставлять результаты испытуемых по различным адаптивным тестам.

Благодаря достижениям теории педагогических измерений главенствующая классическая теория тестов постепенно уступила место новой теории, получившей в зарубежной научной литературе название Item Response Theory (IRT), или современной теории конструирования педагогических тестов.

Под IRT понимается теория, нацеленная на оценивание латентных (скрытых) параметров испытуемых и заданий тестов на основе математико-статистических моделей измерения. И, хотя IRT — часть более общей теории латентно-структурного анализа (LSA), каждая из них имеет свои характерные особенности и свою сферу применения. В частности, в LSA оцениваемые значения параметров рассматриваются как некоторые дискретные точки на оси латентной переменной, в то время как в IRT распределения переменных предполагаются непрерывными. Область использования LSA — социально-психологические исследования, a IRT — конструирование и интерпретация результатов выполнения педагогических тестов.

Теоретические основы IRT были заложены в исследованиях Ричардсона, (1936), Лоули (1944) и Такера (1946), разработавших технологические основы процедур параметрического оценивания скрытых латентных качеств испытуемых и трудности заданий теста, исходя из традиционных статистик.

Существенный вклад в развитие IRT был сделан в работах Лорда (1952), Бирнбаума (1958), Раша (1960), в которых исследовались различные математические модели, описывающие связь между оцениваемыми латентными качествами испытуемых и наблюдаемыми результатами выполнения теста.

С конца 1960;х до начала 1980;х гг. методы IRT широко внедрялись в практику измерений путем создания различных оценочных технологий и алгоритмов, реализованных в виде компьютерных программ. Результаты, полученные на протяжении этого периода такими исследователями, как Лорд, Новик, Самеджим, Вэйс, Райт, Ури и другими, позволили вплотную подойти к внедрению методов IRT в процесс конструирования тестов.

Важное значение в развитии прикладных аспектов IRT с начала 1980;х гг. по настоящее время сыграло развитие персональных электронно-вычислительных машин до уровня высокопроизводительных компьютеров с мощными операционными и изобразительными возможностями, позволяющими компактно хранить, быстро извлекать, оперативно и всесторонне анализировать, наглядно изображать эмпирическую информацию, собранную по результатам выполнения теста.

Новые возможности компьютеров повлекли за собой интенсивное развитие программно-инструментальных и программно-педагогических продуктов, реализующих алгоритмы IRT для оценки результатов испытуемых и конструирования новых тестов. К числу наиболее интересных, созданных мировым лидером в компьютерном тестировании корпорацией Assesment Systems Corporetion (ASC), можно отнести такие программы, как RASH, RASCAL, Quest, ConQuest, а также программы XCALIBRE, ASCAL, LOGIMO, MSP, PARELLA и мн. др. Некоторые из разработок ASC, например, MieroCAT и CAT, позволяют реализовывать адаптивные варьирующие алгоритмы с переменным шагом и осуществлять процессы генерации адаптивных тестов. Таким образом, к началу 1980;х гг. за рубежом теория IRT заняла лидирующее положение в сфере конструирования и применения педагогических тестов.

Первой работой, четко разграничивающей измерения в психологии и в образовании, была книга профессора психологии А. Анастази «Психологическое тестирование», написанная в середине 1950;х гг., но переведенная на русский язык лишь в 1982 г. В ней целый раздел был посвящен различиям между педагогическими и психологическими тестами.

Значительный вклад в понимание специфики педагогических измерений на уровне методологии был внесен работой Дж. Кивиса в более поздний, четвертый период развития теории педагогических измерений.

Четвертый период развития теории и практики педагогических измерений, начавшийся в 1980;х гг. и продолжающийся до наших дней, характеризуется интенсивным внедрением вычислительной техники и связанных с ней современных информационных технологий в образовательный процесс. Огромные возможности компьютеров, обеспечивающие обработку данных для качественной калибровки тестовых заданий и хранение их в виде банков, высокий уровень автоматизации предъявления заданий в процессе обучения и контроля, оперативное реагирование на ответы испытуемого, компьютерное моделирование тестов, сыграли решающую роль в дальнейшем широком внедрении основных теоретических положений IRT в массовое тестирование.

В 1990;е гг. на смену классическим подходам Стивенса пришла современная математическая аксиоматика теории измерений. Определения и понятия уточнялись путем перевода их формулировок на язык математических терминов. В этой связи появилась современная теория измерений, значительно расширившая многие традиционные представления и понятия.

Основные направления современных зарубежных исследований по проблемам измерения и тестирования. В современных зарубежных исследованиях в теории педагогических измерений к приоритетным направлениям исследовательских работ относятся:

  • — развитие методологии сочетания качественных и количественных методов при эвалюации в образовании;
  • — оптимизация методов интеграции данных педагогических измерений, полученных с помощью инновационных форм заданий тестов;
  • — развитие параметрических и непараметрических моделей IRT;
  • — разработка методик, алгоритмов и математико-статистического аппарата теории педагогических измерений для создания программного обеспечения и практического использования новых моделей IRT;
  • — исследования психологических и этических проблем в тестировании;
  • — разработка научно-методических подходов к построению уровневых шкал в образовании, разработка новых методов выравнивания;
  • — развитие специальных процедур и подходов для выявления размерности пространства измерений и ее адекватности поставленным целям тестирования и т. д.

Многие зарубежные исследования посвящены аппарату и методам теории IRT, которая широко используется в практике тестирования. Работу педагогов значительно облегчают многочисленные программно-инструментальные и программно-педагогические продукты, реализующие алгоритмы IRT для оценки результатов испытуемых и конструирования новых тестов.

Таким образом, в XXI в. за рубежом теория IRT заняла лидирующее положение в сфере конструирования и применения педагогических тестов, а результаты, полученные такими исследователями, как Ф. Лорд (F. М. Lord), М. Новик (М. Novick), Е. Самеджим (Е. Samejima), Д. Вэйс (D. Weiss), Б. Райт (В. Wright), Ури (Ur г у) и др., внедрены в практику разработки и применения тестов [133].

Тестирование в России.

В конце XIX — начале XX в. в России вопрос разработки тестов и их применения для оценки знаний не ставился и не обсуждался. Как свидетельствуют первые отчеты СанктПетербургского педагогического общества, еще в 1872—1875 гг. шли дискуссии лишь о полезности и вредности балльных оценок. Соответственно, не велась научная работа в этой области.

Но уделялось внимание улучшению качества контроля знаний. В конце XIX в. в печати обсуждался вопрос о введении экзаменов. В циркуляре по Санкт-Петербургскому учебному округу «О производстве испытаний зрелости без послаблений» сообщалось, что во многих гимназиях испытания зрелости производятся крайне снисходительно, с весьма большими послаблениями. А это обстоятельство, в свою очередь, весьма неблагоприятно отзывается на всем ходе учебного дела, приучая воспитанников поверхностно относиться к усвоению преподаваемых им наук в надежде на ожидаемые послабления на испытаниях.

Российская же научная элита в период зарождения и становления научного метода тестов была связана с мировым научным сообществом достаточно прочными и многосторонним видами сотрудничества. Под влиянием зарубежного опыта российские ученые начинали аналогичные исследования и добивались значимых успехов, в том числе и в тестологии. Вместе с тем, некоторые российские исследователи имели весьма значимые научные успехи, которые легли в основу изысканий в рамках нарождавшейся тестологии.

Эти исследования были в немалой степени простимулированны усилившимся вниманием ученых к проблемам детского возраста и появлением в конце XIX в. нового научного направления — педологии, в развитие которого внесли вклад и российские исследователи. Так, в конце XIX в. одним из крупнейших педагогов того времени П. Ф. Лесгафтом была разработана системная типология детей, которая стала существенным вкладом в науку. В основе разработанной им типологии — уровень умственного и нравственного развития ребенка. Он описал такие типы: лицемерный, честолюбивый, добродушный, мягко-забитый, злостно-забитый, угнетенный. Многие работы Лесгафта получили широкое признание специалистов («Семейное воспитание и его значение», «Школьные типы», «Основные проявления ребенка»).

На активизацию исследований педологического характера несомненное влияние оказали труды известных педагогов: К. Д. Ушинского («Педагогическая антропология: человек, как предмет воспитания» и др.), Н. И. Пирогова («Педагогические сочинения»), П. Ф. Каптерева («Педагогический процесс: из истории души» и др.).

В Российскую психологическую науку тесты пришли в начале XX в. Благодаря усилиям профессора А. П. Нечаева и его единомышленников они в короткий срок завоевали популярность и широкое признание. Российские ученые уже в первое десятилетие XX в. получили международное признание и стали полноправными участниками многих международных симпозиумов, конгрессов, конференций по проблемам экспериментальной педагогики и психологии. Их труды стали появляться в зарубежных периодических изданиях и отдельными книгами. Нечаевым была создана первая в России лаборатория экспериментальной педагогической психологии.

Потенциал, накопленный российской наукой и практикой в сфере разработки и применения тестовых технологий, был востребован Советской властью. Эта востребованность проявилась уже в первые месяцы существования новой власти и первоначально касалась экономики. Как свидетельствуют факты из истории науки и государственной практики 1920—1930;х гг. внедрение тестовых методов в систему профессионального отбора и образование получили широкое распространение.

Развитие тестового движения в РСФСР, а после 1922 г. — ив СССР пошло по нескольким направлениям.

Первым можно считать направление, которое уместно назвать «традиционным». Это направление развивалось в русле наработок специалистов в области экспериментальной психологии, экспериментальной педагогики и педологии. В российских лабораториях и крупных научных центрах на основе отечественного и зарубежного опыта проводились масштабные научные эксперименты, разрабатывались новые тестовые методики, совершенствовались уже широко апробированные. Уже в 1921—1922 гг. появляются работы известных российских специалистов.

Среди них — одна из работ А. П. Нечаева — методическое руководство «Простейшие измерения степени умственного развития детей» (Сызрань, 1921).

Второе направление в тестовом движении 1920;х гг. связано с производственными задачами, в первую очередь с задачами повышения производительности труда. Особенность развития этого направления, получившего еще в первые десятилетия XX в. название «психотехника», в отечественной науке сколько-нибудь заметных традиций не имело. Тестовые методики в системе профессионального отбора в силу объективных обстоятельств военного времени не были востребованы в России. Но уже в 1920—1921 гг. государство начинает интересоваться проблемами организации профессионального отбора и повышения производительности труда.

Третье направление исследований с применением тестовых методик можно назвать «педологическим». Это направление активно развивалось в России с начала XX в. и достигло заметных успехов.

Педагогическая общественность, как и общество в целом, осознали важность того факта, что школа должна быть устроена таким образом, чтобы дети себя чувствовали в ней комфортно. Краткая формула «школа для детей, а не дети для школы» нашла понимание, подвигла и властные структуры, и общественные организации, и отдельных энтузиастов на создание специальных учебных заведений для детей с ограниченными способностями. Для бурно развивавшейся промышленности эта задача стала первостепенной. Всевозрастающие потребности в грамотных рабочих также заставляли искать пути отделения детей с обычными способностями от их сверстников с ограниченными способностями.

К 1930 г. в СССР применяли 25 методов (систем) тестов, созданных отечественными тестологами. Сюда отнесены восемь методов Г. И. Россолимо («Профили»: индивидуальный и групповой, аналогичные по «краткому методу», «метод индивидуальных представлений», музыкальные тесты и тесты рисования); три метода моторной одаренности Н. И. Озерецкого (индивидуальный, по компонентам движения и групповой); два метода А. П. Нечаева (метод «10 тестов» и групповой); два метода группового испытания умственной одаренности МОНО (оригинальный и переработанный тест Отиса); четыре метода испытаний умственной одаренности, разработанные в ДОБИ; моторные тесты Дерновой-Ярмоленко; тесты испытаний эмоциональной сферы асоциальных подростков (Вельского); групповые тесты испытания умственной одаренности детей (Стычинского); три групповых метода испытаний умственной одаренности для взрослых (Рудика, Левитова-Толчинского).

В середине 1930;х гг. обнаружилась неадекватность системы оценки знаний задачам, поставленным партией перед советской школой. В Постановлении Совета народных комиссаров и ЦК ВКП (б) от 3 сентября 1935 г. утверждалось, что «установленная наркомпросами система оценки успеваемости не дает представления о фактических знаниях учащихся и ведет, на практике, к понижению уровня учебы».

В 1933 г. было принято решение о проведении первых в истории советского государства проверочных испытаний всех школьников. В руководящих документах по этому поводу специально отмечалась «недопустимость — как там было написано — нарочитого «срезывания» учащихся путем постановки особо трудных для них, «каверзных вопросов».

Введение

массового контроля знаний школьников совпало по времени с периодом укрепления режима личной власти И. В. Сталина, с его стремлением напрямую подчинить себе работу Наркомпросов. В связи с тем, что большинство его политических оппонентов благожелательно относились к педологии и к идее тестирования, Сталин развернул борьбу против педологов, считая их своими, если не явными, то потенциальными противниками.

Тесты запретили в 1936 г. как «буржуазные и вредные», но истинные причины запрета — расстановка сил в политической борьбе того периода. Воцарившаяся после запрета ситуация отрицательного отношения к тестам не давала практической возможности публиковать чтолибо в их защиту. И эта ситуация продолжалась в течение примерно сорока лет. В течение всего этого времени печатались в основном статьи о вредности тестов, о недопустимости использования последних в отечественной педагогической науке и практике.

Запрещение педологии, а вместе с нею и тестов, стало одним из первых фактов идеологического давления на неугодные науки, научные направления и на отдельных ученых. В числе пострадавших от такого давления, а временами просто наглой и подлой травли, оказались авторы выпускавшихся в конце 1920;х — начале 1930;х гг. сборников «Тесты: теория и практика». Это М. Я. Басов, М. С. Бернштейн, П. П. Блонский, А. П. Болтунов, С. М. Василейский. Воцарившаяся после запрета ситуация отрицательного отношения к тестам не давала практической возможности публиковать чтолибо в их защиту.

Всего в 1937 г. было репрессировано более 300 ученых-педагогов и педологов. Были репрессированы также наркомы просвещения Союза и всех республик, их заместители, начальники отделов и мн. др. В политической жизни страны резко усилился субъективизм.

Этапы развития тестирования в России и за рубежом.

П. П. Блонский А. П. Болтунов С. М. Василейский В. С. Аванесов Хотя в 1930;х гг. практическая работа по тестам затормозилась, научное изучение действительных возможностей этого метода в СССР полностью не прекращалось. Часть тестов применялась под видом контрольных заданий, испытаний. И наоборот, различные испытания нередко назывались тестами. Практика тестирования характеризовалась серьезными противоречиями, что привело к запрету применения тестов в сфере образования, профессионального отбора и профориентации.

С тех пор отношение к тестам стало неоднозначным. Одни видели в тестовом контроле средство принижения роли педагога, воспринимали тесты как средство выражения недоверия к традиционно выставляемым оценкам и потому проявляли определенную настороженность. Другие считали сами тесты виновными в различных нарушениях и потому отвергали идею тестового контроля знаний, как говорится, «с порога». И только немногие рассматривали их как средство радикального преобразования учебного процесса в сторону его объективизации — и становились энтузиастами этого метода. Как прозорливо отмечал П. П. Блонский, тесты — это больше, чем средство контроля; это средство рационализации школьного дела, и хочется добавить, образования в целом.

Поскольку тесты считались основным методом педологии, то, отказав в научности педологии, руководители педагогической науки тех лет отказались признать также и научность тестов. Здесь было допущено сразу несколько ошибок, возможно, преднамеренных. Одна — в отношении к педологии, которая имела ряд интересных научных достижений, не вписывавшихся в современную ей педагогику. Вторая ошибка — в признании тестов в качестве специфического метода педологии. Хотя известно, что абсолютно специфических частных методов (в которых бы не присутствовали элементы познания, применяемые в других методах) нет. И третья ошибка — отказ в признании научности тестового метода. Это сильно затормозило развитие самой педагогической науки, лишив ее предпосылок для разработки самого эффективного метода контроля знаний.

Тестирование в СССР и России периода 1950—1970;х гг. можно охарактеризовать как застой. Много писалось о вредности и буржуазности тестов, о недопустимости использования последних в педагогической науке и практике.

Анализ положения дел с тестовым контролем в СССР и в других странах показывал: многие страны опережали нас по масштабам практической работы, по финансированию научных исследований, по числу публикаций, по подготовке научных кадров, по уровню и качеству развития теории тестов, по технической и программно-вычислительной оснащенности тестового процесса. Наиболее развитые в тестовом отношении страны — Нидерланды, США, Англия, Япония, Дания, Франция, Израиль, Финляндия, Канада, Австралия, Новая Зеландия и др.

В последнее десятилетие существования СССР использование тестов в психодиагностике, системе профессионального отбора, в общеобразовательных учреждениях, вузах получило широкое распространение, хотя и осуществлялось точечными методами, во многих регионах страны. Там, где применение тестов велось на долгосрочной основе и с участием ученых или исследователей-практиков, появлялись статьи, методические пособия, монографии, организовывались научные конференции.

Появилась тенденция к наращиванию применения тестовых методов в СССР. От первых эпизодических экспериментов начала 1960;х гг. и первых статей о тестах, написанных порой эзоповым языком, в 1970;х и особенно в 1980;х гг. пришли к крупным научным трудам, выполненным советскими учеными. Эти положительные тенденции стали еще больше нарастать не только количественно, но и качественно в 1990;х гг. — уже в рамках государств СНГ.

В 1990;х гг. процесс внедрения тестов во многие сферы жизнедеятельности общества протекал очень интенсивно. При этом движение по нарастающей осуществлялось и вширь, и вглубь. В этот период стали проводить централизованное тестирование школьников и абитуриентов. Оно охватило большую часть регионов страны, возникли сотни и сотни психологических консультаций и служб, массовыми тиражами стали издаваться психологические тесты и тесты по различным предметам общеобразовательных учреждений, по некоторым дисциплинам высшей школы, появились фундаментальные труды российских ученых по проблемам тестологии, сформировались десятки научно-методических центров, занимающихся созданием тестов, их апробацией, подготовкой научных кадров, выпуском методической литературы.

В 1989 г. был создан Центр тестирования как одно из структурных подразделений Московского государственного педагогического университета.

В конце XX—начале XXI в. появились исследования по тестам и смежной проблематике В. С. Аванесова, Т. М. Балыхиной, Н. Ф. Ефремовой, И. И. Легостаева, А. А. Макарова, Е. А. Михайлычева, В. Г. Наводнова, В. П. Папасюка, В. Ю. Переверзева, И. Д. Рудинского, М. Б. Мельниковой и др.

С конца 1990;х гг. вплоть до настоящего времени из года в год растет число монографий, учебных пособий, статей и методических работ по вопросам измерений и тестирования в образовании.

Значительный вклад в возрождение и развитие отечественной педагогической тестологии внес В. С. Аванесов. В своих работах он затронул широкий круг проблем, связанных с тестологией. В их числе — история и теория тестов, проблемы тестового педагогического контроля знаний и др. Его труды остаются в числе наиболее востребованных современной практикой. Среди книг, написанных Аванесовым, постоянно пользуются читательским спросом «Тесты в социологическом исследовании» (1982 г.), «Основы научной организации педагогического контроля знаний в высшей школе» (1989 г.), «Научные проблемы тестового контроля знаний» (1994 г.), «Композиция тестовых заданий» (1996, 1997, 2002 гг.).

Развитие научных исследований по проблемам педагогических измерений в России тесно связано с расширением сферы их приложения, поэтому период активизации исследований по тестовой проблематике совпал с началом эксперимента по введению ЕГЭ и повсеместным созданием в вузах России систем менеджмента качества образования.

В целом современные исследования отечественных ученых по проблемам измерения и тестирования в образовании осуществляются по пяти направлениям.

К ним относятся:

  • 1) разработка научных подходов к совершенствованию содержания измерителей в контексте современных трактовок качества учебных достижений;
  • 2) разработка теоретико-методологического обоснования;
  • 3) разработка методического обеспечения процесса конструирования надежных и валидных тестов;
  • 4) научное обоснование процедур применения тестов;
  • 5) научное обоснование шкалирования данных тестирования и их интерпретация для применения результатов педагогических измерений в управлении качеством образования.

Несомненный интерес представляют также анализ и психологопедагогическая интерпретация латентных характеристик подготовленности выпускников, развитие моделей содержательной преемственности тестовых материалов для итогового контроля на различных ступенях обучения (предшкольное, начальное, основное, среднее, высшее), необходимость разработки которых резко возросла в наше время в связи с созданием Общероссийской системы оценки качества образования (ОСОКО).

К перечисленным направлениям исследований примыкает работа по формированию репрезентативных выборок учащихся для проведения мониторинговых исследований, для выравнивания шкал по параллельным вариантам тестов, разработке моделей и технологий информационного сопровождения тестирования, хранения и автоматического формирования тестов и др.

Проведение исследований по выделенным направлениям в нашей стране, безусловно, позволит значительно повысить качество используемых в образовании измерителей и тем самым будет способствовать повышению качества образования [Там же].

В 2002 г. Министерством образования создан Федеральный институт педагогических измерений (ФИПИ) для координации разработок по педагогическим тестовым материалам тех организаций, которые уже успешно работают на федеральном уровне. Этот институт занимается подготовкой контрольных измерительных материалов для единого государственного экзамена (ЕГЭ).

Таким образом, в современной России прерванное в силу известных исторических причин тестовое движение возродилось и набирает потенциал в общенациональном масштабе. В создание и применение тестовых технологий вовлекаются все новые и новые силы. Масштабы этого явления столь значимы, что уже обозначились четкие признаки существования в стране научного сообщества тестологов, организованного в локальные, региональные и общенациональные структуры. Процесс организации научного сообщества продолжается, возникают новые организационные структуры, в тестовое движение вовлекаются новые специалисты, образовательные учреждения. Год от года увеличивается и число потребителей тестовых технологий. Четко обозначилась и тенденция к тому, чтобы тестовые технологии стали обязательным атрибутом в системе образования. Использование мирового опыта позволило российскому образованию достичь значительных результатов в применении тестов.

Подобная работа ведется уже многие годы и по разным направлениям. Это не только перевод на русский язык и публикация работ зарубежных авторов, не только направление специалистов на стажировку в тестологические центры, но и полномасштабное участие России в крупных международных образовательных исследовательских проектах по оценке знаний и умений учащихся.

Россия, встав на путь восстановления в правах метода тестов как эффективного инструмента измерений в психодиагностике и педагогической диагностике, за короткий срок добилась существенных результатов. Массовыми тиражами издается переводная литература, появились оригинальные работы отечественных ученых, издаются пособия с тестами по учебным дисциплинам школьного и вузовского курсов, появились профессиональные журналы, организована система переподготовки кадров тестологов. Миллионы школьников, студентов, специалистов разных профессий от водителей до космонавтов за последние десятилетия прошли через тестовые испытания, что дает основание говорить о тестах как об обязательной процедуре, через которую каждый из нас прошел или будет проходить.

Показать весь текст
Заполнить форму текущей работой