СДЕЛАЙТЕ СВОИ УРОКИ ЕЩЁ ЭФФЕКТИВНЕЕ, А ЖИЗНЬ СВОБОДНЕЕ
Благодаря готовым учебным материалам для работы в классе и дистанционно
Скидки до 50 % на комплекты
только до 26.06.2025
Готовые ключевые этапы урока всегда будут у вас под рукой
Организационный момент
Проверка знаний
Объяснение материала
Закрепление изученного
Итоги урока
Тестирование как способ контроля. Научно-методическая работа
61
Управление образования Брянской городской администрации
Муниципальное бюджетное общеобразовательное учреждение
«Вечерняя (сменная) общеобразовательная школа №12»
при федеральном казённом учреждении
«Исправительная колония №1 УФСИН России по Брянской области»
НАУЧНО-МЕТОДИЧЕСКАЯ РАБОТА:
«ТЕСТИРОВАНИЕ
КАК СПОСОБ КОНТРОЛЯ»
| Разработал учитель: Королев Д.Г. |
Брянск, 2012
СОДЕРЖАНИЕ
Введение | 3 |
1. Тесты и их особенности | 7 |
1.1. Проблематика исследований и методологических разработок в области проверки знаний | 7 |
1.2. Тесты учебных достижений | 12 |
1.3. Классификация тестов | 19 |
1.4. Роль и функции фактора времени в тестировании | 31 |
2. Тестовые задания | 39 |
2.1. Состав, виды и типы тестовых заданий | 39 |
2.2. Задания закрытого типа | 46 |
2.3. Задания открытого типа | 52 |
2.4. Оценочные схемы тестовых заданий | 54 |
Литература | 57 |
ВВЕДЕНИЕ
В последние годы в российском обществе резко усилилось внимание к проблемам образования детей и молодежи. Родителей, учащихся и педагогов интересует не только срок обучения (сколько лет надо будет учиться), но и предлагаемые новации по повышению качества образования (чтобы не надо было думать о репетиторах и платных курсах), по изменению управления школой, по созданию нужного уклада жизни детей в школах (ибо практически все школы стали собирать средства с родителей) и т. п. В связи с этим появляется множество интерпретаций и домыслов о том, что предполагается изменять в жизни школы.
В этих условиях необходимо знать, что же на самом деле, каким образом и когда планируется изменить в нашем образовании.
Прежде всего хочется напомнить, что проект концепции модернизации российского образования рассмотрен и в основном одобрен 29 августа 2001 года на заседании Государственного Совета Российской Федерации под председательством Президента России В.В. Путина. В дальнейшем Концепция модернизации российского образования обсуждалась на заседании Правительства Российской Федерации и утверждена 29 декабря 2001 года Председателем Правительства М.М. Касьяновым. В этой концепции определены три основные цели модернизации российского образования:
1. Расширение доступности образования: необходимо реализовать комплекс мер, чтобы сделать доступным качественное школьное образование для всех учащихся (с учетом их способностей, а не с учетом финансовых возможностей их родителей), в частности, в гимназиях и лицеях. Это планируется обеспечить в том числе путем введения на старшей ступени школы профильного обучения — бесплатного, за счет бюджета.
Расширение доступности высшего образования — это и введение взамен выпускных экзаменов в школе и вступительных экзаменов в вузы системы единых государственных экзаменов, которые позволят выпускникам школы по более объективным критериям поступать в высшие учебные заведения. Процедуры единого государственного экзамена (ЕГЭ) обеспечивают организационно равные возможности поступления в вузы детей из семей с разными доходами, из разных регионов страны; ЕГЭ устраняет разрыв между школьной программой и требованиями вузов; при этом полностью ликвидируется возможность коррупции и необъективность работы приемных комиссий вузов.
2. Повышение качества образования. Планируется обеспечить повышение качества школьного образования, в частности, разработкой и введением новых стандартов и нового содержания школьного образования, путем введения профильного обучения в 9—11 классах средней школы.
Предстоит осуществить также комплекс мероприятий по повышению качества высшего образования, которое снизилось в последнее десятилетие в связи с появлением негосударственных (частных) вузов и введением платного образования в государственных вузах, в связи с созданием многочисленных филиалов вузов по всей стране с недостаточно квалифицированными педагогическими кадрами и отсутствием необходимой учебно-материальной базы.
3. Повышение эффективности образования. Это многомерная проблема. С одной стороны, образование — это не только обучение, но и (прежде всего) воспитание. Школа должна в большей мере, чем сейчас, готовить своих выпускников к жизни в семье, обществе. Школьные знания должны быть значительно более практико-ориентированными — нужно преодолеть сложившийся на сегодня односторонний, фактологический, подход в реализации школьной программы, когда от школьника требуется в основном запоминание фактов, правил, а не освоение возможностей их использования в жизни.
С другой стороны, повышение эффективности образования — это также более эффективное планирование структуры приема выпускников 9 и 11 классов школы в учреждения профессионального образования — начального (ПТУ, профлицеи), среднего (техникумы, колледжи), высшего (вузы). Нельзя допустить такое положение, когда 100% выпускников 11 класса школы смогут поступать (на платной или бюджетной основе) в высшие учебные заведения, а по окончании половина из них не найдет работы по специальности, ибо обществу по-прежнему будут нужны (и будут высокооплачиваемы) кадры квалифицированных рабочих, техников1.
В данной концепции нам следует обратить внимание на изменение формы контроля и учета знаний и навыков учащихся — тестировании.
Данное исследование состоит из двух частей: теоретической и практической.
В теоретической части мы ставим перед собой следующие цели:
— дать определение и выявить особенности тестов;
— проследить общие подходы в разработки тестов;
— подробно рассмотреть и выявить состав тестовых заданий, выделить виды и типы.
В практической части мы ставим перед собой следующие цели:
провести эксперимент по применению тестов на практике;
проанализировать и выявить тенденции в применении тестовых заданий;
выявить достоинства и недостатки данной формы контроля знаний и умений;
проанализировать полученные результаты и дать прогноз об эффективности применения тестирования при контроле и закреплении полученных знаний.
Гипотеза исследования: использование тестирования при проверке и контроле степени усвоения знаний и умений способствует более качественным результатам и направлена на личностно-ориентированное развитие, образование и воспитание учащегося, способствует раскрытию разными типами заданий творческого потенциала тестируемого, выявлению доминирующих черт личности, направленности и интересам ребенка.
Новизна исследования заключается в том, чтобы:
— теоретически обосновать системно-структурный подход в разработке и использовании тестового контроля в соответствии с требованиями государственных образовательных стандартов;
— разработать теоретические основы применения тестовых способов контроля с ведущей функцией обучения и развития, а не контроля;
— раскрыть организационно-педагогические и дидактические условия использования тестовых способов контроля в работе начальных специальных учебных заведений на основе их комплексного применения.
Практическая значимость исследования состоит в разработке рекомендаций, тестовых дидактических материалов и методики их применения с целью обучения и развития учащихся, которые могут быть использованы в работе учебных заведений различного типа для повышения эффективности учебно-воспитательного процесса и обеспечения требований государственных образовательных стандартов.
1. ТЕСТЫ И ИХ ОСОБЕННОСТИ
1.1. Проблематика исследований и методологических разработок
в области проверки знаний
Проблема проверки знаний и умений учащихся очень многогранна. От ее решения во многом зависит успех всего процесса обучения. Эта проблема решалась педагогической наукой в различных аспектах. Ее общедидактические вопросы (функции, принципы, методы, формы устной, письменной, практической, графической проверки знаний, текущего, тематического, итогового контроля) рассматривались в работах С.И. Архангельского, Ш.К.Бабанского, Б.П. Есипова, Т.И. Ильиной, И.И. Кулибабы, Е.И. Перовского, Л.С. Рысс, Г.И. Щукиной и других.
В исследованиях были отмечены контролирующая, обучающая, развивающая, воспитательная функции проверки. Особо выделялись повторительная, закрепляющая и обобщающая функции. Основным достижением дидактики по проблеме проверки знаний и умений учащихся следует считать всестороннее выяснение сущности каждой функции.
Проблеме проверки знаний применительно к методике преподавания общественных дисциплин уделяли внимание многие методисты: А.А. Вагин, Н.Г. Дайри, Б.Г. Карцов, Ф.П. Коровник, П.С. Лейбенгруб, А.И. Страхев, В.И. Ус и другие. Уже в этих работах есть упоминание о возможности применения стандартизированного контроля в процессе проверки знаний по истории. Авторы подчеркивают, что эффективность проверки зависит от использования в системе контроля всего многообразия его приемов. Из этого вытекает недопустимость преувеличения значимости какого-то одного приема проверки.
Вопросам проверки знаний и умений учащихся по обществоведению посвящены специальные главы в общих работах. Этим вопросам уделяли внимание А.В. Дружкова, М.П. Овчинникова, В.И. Загвязинский и другие. Большая роль в формировании и проверке различных умений учащихся по обществоведению в методической литературе придается проблемному обучению (Г.В. Артемьева) и урокам-семинарам (О.Е. Вайнер и В.И. Назуренко, Д.Й. Гурвич, И.Н. Канторович и В.А. Орлов, А.В. Дружкова и М.П. Овчинникова).
Таким образом, вопросам проверки знаний и умений учащихся посвящено значительное количество исследований как в дидактике, так и в методике преподавания истории и обществознания. Но, несмотря на большое число работ разных уровней, это звено процесса обучения имеет все еще нерешенные проблемы. Среди них следует отметить неопределенность в отборе содержания учебного материала, обязательного для контроля, отсутствие четкого определения его целей, структурных элементов знаний и умений учащихся, подлежащих проверке на различных этапах обучения. Требует дополнительных исследований, вопрос о взаимозависимости содержания и средств контроля и проблема сочетания различных приемов проверки.
Традиционные средства и приемы контроля в практике их применения страдают серьезными недостатками, среди которых субъективизм в оценке знаний и умений учащихся, большие затраты урочного времени на проверку в ущерб изучению нового материала и развитию учащихся, трудоемкость проверки. В числе слабых сторон этого звена учебного процесса отмечаются слабая реализация обучающей функции проверки, пассивность большинства учащихся, перегрузка школьников при подготовке к письменным контрольным работай, большой расход времени и сил учителя на их проверку, длительная задержка разбора ошибок после выполнения учащимися письменных работ. К недостаткам относится необходимость оценивать знания учащихся на основании небольшого количества отметок. Отсутствие полкой информации о степени усвоения учебного материала каждым учеником, наблюдающееся при обычной устной проверке, заставляет учителя вести урок, опираясь на выборочные данные, результаты общего наблюдения и свою интуицию.
В 80-90-е годы XX века внимание исследователей и учителей практиков вновь было привлечено к тестовой методике проверки знаний и умений, применявшейся в СССР в 20-30-х годах XX века и используемой широко в современной зарубежной школе.
Основоположником педагогических тестов принято считать Р.Торндайка, так как под его руководством были созданы первые настоящие школьные тесты.
В нашей стране начало составления и применения тестов относится к 1925 году. Первые тесты по обществоведению были выпущены весной 1926 года, тогда же вышла «Дополнительная инструкция к проведению теста обществоведения». Вопросы ставились самые простые, а ответы подбирались не всегда удачно. Вероятность простого угадывания правильного ответа была очень велика.
В этот период времени свои исследования по проблеме тестов стали проводить крупные советские психологи и педагоги М.С. Бернштейн, П.П.Блонский, А.П. Болтунов, Е.В. Гурьянов, Г.С. Костюк и другие. Характерной особенностью этого периода является высокая степень общности подходов к проведению тестовых исследований в психологии, педагогике и социологии. Появились первые работы, посвященные обзору зарубежной литературы о тестах (Н.А. Бухгольц, А.М. Шуберт).
В 1927 году вышла книга А.Н. Дурикина «Метод тестов в применении к обществоведению и современности», которая внесла существенный вклад в теорию тестов и методику их применения в преподавании общественных дисциплин. Автор классифицирует тесты по их форме, комментирует методические трудности, возникающие при составлении тестовых заданий по обществоведению, освещает преимущества тестов, их роль среди других средств контроля. А.Н. Дурикин предложил свою систему тестовых заданий.
Вместе с тем, в работах педагогов и методистов имелась существенная переоценка значения тестов. Чрезмерное увлечение ими в ряде школ привело к отрицанию других средств контроля. Некритически использовался американский опыт составления и применения тестов. Вследствие этого 4 июля 1936 года было принято постановление ЦК ВКП (б) «О педологических извращениях в системе Наркомпросов», в результате которого не только психологические тесты интеллекта, но и предметные надолго были полностью исключены из практики работы школы.
Наши экспериментальные задания ближе к понятию «задание в тестовой форме», чем к понятию «педагогический тест». Они в основном соответствуют требованиям, предъявляемым к заданиям в тестовой форме, но не предназначены для массового тестирования. Создание тестов относится к области высоких научных технологий и требует работы по нескольким направлениям научно-практической деятельности.
Большое внимание в литературе уделяется классификациям тестов, в основе которых лежат различные основания. Предложены классификации по уровню усвоения знаний (В.П. Беспалько); по характеру действий, которые учащиеся должны совершить при анализе вариантов ответов (Т.А. Ильина); по характеру ответа (В.С. Аванесов, И.А. Данилов, В.В. Хубулашвили) и другие.
Анализ имеющихся в литературе типологий, классификаций, в рамках которых создаются системы заданий в тестовой форме, позволяет соотнести их с возможностями и потребностями обществоведческого курса, преобразовать в соответствии с его целями и дидактическими задачами.
Актуальной проблемой является определение критериев качества тестов, главными из которых являются содержательная валидность, надежность, простота и однозначность (В.П. Беспалько, Н.М. Розенберг, В.Л. Рысс).
В конце 60-х - начале 70-х годов XX века в рамках теории программированного обучения появляются работы, которые затрагивали вопросы тестовой проверки знаний учащихся по истории (Г.М. Донской, Н.Ц. Драйцель, А.И. Купцов, М.С. Черный). Несколько позже тестовые задания стали использоваться не только в рамках программированного обучения, но и как самостоятельное средство проверки знаний и умений учащихся.
В 80-90-е годы XX века работа по проблеме составления тестовых заданий и их применения в практике преподавания общественных наук значительно активизировалась. Вышли переводные и отечественные сборники тестовых заданий для различных типов учебных заведений по многим общественным дисциплинам: истории, политологии, экономике. При соответствующей адаптации отдельные задания этих сборников могут использоваться в преподавании школьного обществоведения. Однако качественный уровень многих заданий требует серьезного совершенствования, так как при их использовании недостатки тестовой методики проверки проявляются особенно резко. Составление тестовых заданий в настоящее время носит, как правило, субъективный характер, их предварительная экспериментальная качественная проверка в большинстве случаев не проводится. Таким образом, школа, имея интерес и потребность в применении тестовых средств проверки, на практике часто сталкивается с определенными трудностями в использовании этого средства контроля. Наше исследование — определенный шаг на пути преодоления вышеуказанной проблемы.
1.2. Тесты учебных достижений
Предметом нашего рассмотрения будут тесты, на не все и не всякие, а в первую очередь тесты учебных достижений (другие названия: тесты школьных достижений, педагогические, дидактические и т.д.).
Попробуем определить, что же все-таки представляют собой тесты и тестирование. В одной из работ дается расширенное понимание тестирования, которое, вероятно, является попыткой перенесения прямого перевода с английского языка: «В узком смысле тестирование в педагогике означает использование стандартизованных педагогических тестов для измерения и оценки результатов обучения. В широком же смысле тестирование - это любое испытание с целью выявления и измерения школьных достижений. С этой точки зрения любой школьный экзамен или контрольная по предмету есть тестирование, а совокупность средств и методов, используемых в этом случае, можно охарактеризовать как «системы тестирования» или «тестовые системы». С такой трактовкой трудно согласиться, поскольку, когда разговор идет об устном или письменном традиционном способе аттестации учащихся, мы говорим: «Устный или письменный экзамен», спрашиваем: «Как ты сдал экзамен?» и даже в том случае, когда испытание проводилось с использованием тестов, мы говорим об экзамене как синониме испытания.
Лексические особенности отмечает B.C. Аванесов: «Понятие «педагогический тест» нужно рассматривать в двух существенных смыслах:
— как метод педагогического измерения;
— как результат применения теста, как метода измерения, состоящего из ограниченного множества заданий. Удивительно, что тексты на русском языке тяготеют к первому смыслу, в то время как в большинстве работ западных авторов понятие тест чаще рассматривается во втором смысле»2.
Приведем несколько современных словарных определений тестов для психолого-педагогической области:
Тест — это объективное и стандартизированное измерение, легко поддающееся количественной оценке, статистической обработке и сравнительному анализу.
Тест — стандартизированные задания, по результатам выполнения которых судят о психофизиологических и личностных характеристиках, а также знаниях, умениях и навыках испытуемого.
Тест — это система заданий, позволяющих измерить уровень развития определенного психологического качества (свойства) личности.
Тест — это специфический инструмент, состоящий из совокупности заданий или вопросов и проводимый в стандартных условиях, позволяющий выявить типы поведения, уровень владения какими-либо видами деятельности и т.п.
Тест – стандартизованное, часто ограниченное во времени испытание, предназначенное для установления количественных и качественных индивидуально-психологических особенностей3.
При кажущемся разнообразии эти определения близки между собой. Наиболее существенным для нас представляется то, что тест в психолого-педагогическом понимании этого слова означает проверку. испытание, но это не простое установление факта наличия или отсутствия какого-либо качества или свойства. Из приведенных определений следует, что в состав теста входят тестовые задания, что тест должен быть стандартизирован и что назначение теста — это выявление личностных особенностей или приращений.
По мнению B.C. Аванесова «Тест состоит из заданий, правил их применения, оценок за выполнение каждого задания и рекомендаций по интерпретации тестовых результатов».
Данное определение представляется вполне корректным, однако, несколько мелким и не совсем точным. Поскольку правила применения должны быть распространены не только на задания, но и на весь тест целиком. Если мы включаем в определение «рекомендации по интерпретации тестовых результатов», то мы должны включить и рекомендации по обработке тестовых результатов.
Мы будем придерживаться несколько иного определения, авторство которого принадлежит достаточно большой группе специалистов из различных регионов России, которые в 1997-98 гг. принимали участие в работах по согласованию понятийного аппарата тестологии:
Тест – это инструмент, состоящий из квалиметрически выверенной системы тестовых заданий, стандартизированной процедуры проведения и заранее спроектированной технологии обработки и анализа результатов, предназначенный для измерения качеств и свойств личности, изменение которых возможно в процессе систематического обучения.
Нам кажется, что данное определение достаточно кратко и вместе с тем полно отражает состав теста и его целевое назначение.
Вероятно, в начале целесообразно отделить тесты от не тестов. Тест не является аналогией отдельным заданиям, экзаменационным вопросам, анкетам, головоломкам и пр. В его основе лежит специально подготовленный и испытанный набор заданий, позволяющих объективно и надежно оценить исследуемые качества и свойства на основе использования статистических методов, но как это следует из определения не только это.
Формально отделить тесты от не тестов достаточно просто, используя приведенное определение: тест в качестве составляющих должен иметь, по крайней мере, три элемента – систему заданий, зафиксированную документально технологию предъявления и отработанную систему проверки обработки и анализа результатов, которые должны составлять единство.
Наше утверждение базируется на достаточно значительном количестве доводов, основные из которых мы приведем.
Тесты как измерительный инструмент используются в большинстве стран мира. Их разработка и использование основано на мощной теории и подтверждено многочисленными эмпирическими исследованиями. Тестология как теория и практика тестирования существует более 120 лет, и за это время накоплен громадный опыт использования тестов в различных сферах человеческой деятельности, включая образование. Тесты не являются универсальным средством, границы использования тестирования достаточно хорошо известны, и это знание дает уверенность в том, что качественно подготовленный и использованный тестовый инструмент даст качественную и надежную информацию, соответствующую реальному положению дел.
Критики недостатков традиционных способов аттестации учащихся приведено достаточно много. Основной недостаток — низкая объективность оценивания, о которой говориться уже много лет. Приведем еще несколько доводов. По сведениям А.Н. Кимберга в 1994 году в Москве из 50 тысяч выпускников получили золотые медали 110, а в Новосибирске из 8 тысяч - 55. Вполне резонно принять обучение и процедуру проверки работ как одинаковые, а разной только объективность оценивания. Коэффициент объективности, рассчитанный в этой работе для этих городов, составляет 1:0,3.4
Подтверждением низкой объективности служит и не уменьшающееся количество обращений родителей в апелляционную (медальную) комиссию. Основанием для этих обращений является необъективность и неоднозначность средств аттестации.
По результатам перепроверки письменных экзаменационных работ (Результаты итоговой аттестации учащихся образовательных учреждений Санкт-Петербурга. 1994/95 учебный год) отмечается, что в школе комиссия выставила 13 двоек, в то время как учитель не выставил ни одной... Средний балл учащихся по части образовательных учреждений был подтвержден, по части понижен максимально с 3,59 до 2,76. Эти факты дают основания говорить о крайней необъективности итоговой аттестации выпускников.
Тестирование позволяет сделать процедуру оценивания одинаковой для всех учащихся вне зависимости от места проживания, типа и вида образовательного учреждения, в котором занимаются учащиеся.
Во-первых, тесты оказываются значительно более качественным и объективным способом оценивания, объективность тестирования достигается путем стандартизации процедуры проведения (на всех этапах проведения тестирования невозможно внести субъективную составляющую в оценку) и путем стандартизации и проверки показателей качества заданий и тестов целиком.
Во вторых, тесты – более емкий инструмент — показатели тестов ориентированы на измерение степени, определение уровня усвоения ключевых понятий, тем и разделов учебной программы, умений, навыков и пр., а не на констатацию наличия у учащихся определенной совокупности усвоенных знаний. Стандартизированная форма оценки, используемая в тестах достижений, позволяет соотнести уровень достижений учащегося по предмету в целом и по отдельным разделам со средним уровнем достижений учащихся в классе и уровнями достижений каждого из них.
В-третьих, тесты – более объемный инструмент — выполняя тестовую работу, каждый ученик выполняет задания, используя знания по всем темам, изучение которых предусматривала программа. На устный экзамен обычно выносится 2-4 темы, на письменный несколько больше.
Четвертым существенным отличием тестов от традиционных методов аттестации работ является то, что это более мягкий инструмент, они ставят всех учащихся в равные условия, используя единую процедуру и единые критерии оценки, что приводит к снижению предэкзаменационных нервных напряжений.
Тест (и может быть это наиболее важно) — широкий инструмент — и с точки зрения интервала оценивания. Если провести аналогию с прыжками в высоту, то традиционная контрольная работа представит собой не линейку, а палочку, на которой нанесены три риски: 5, 4 и 3. В случае выполнения учеником всех заданий он получает отметку отлично. При этом совершенно не ясно, перепрыгнул он нашу палочку с запасом в два раза или пролетел прямо над ней. То же можно сказать и про нижнюю отметку. Сравнение тестирования и традиционного оценивания можно проиллюстрировать следующим рисунком.
Означает ли тот факт, что если ученик не выполнил ни одного задания, то он ничего не знает? Скорее всего, нет. А означает ли, что ученики, выполнившие верно все задания контрольной работы, имеют одинаковый уровень подготовки — вероятно, что то же нет.
Можно отметить и гуманизм тестирования, который заключается в том, что всем предоставляются равные возможности, а широта теста дает возможность ученику показать свои достижения на широком поле материала. Таким образом, ученик получает некоторое право на ошибку, которого он при традиционном способе оценивания не имеет.
Привлекательными оказываются тесты и с точки зрения задач управления. Они дают широкую возможность для варьирования сложности измерительного материала, широты охвата, целевой направленности, включения в тест нескольких компонентов структуры знаний, что позволяет создать инструмент, учитывающий самые взыскательные требования управленца. Система показателей качества теста дает возможность оценить то, насколько реально созданный инструмент соответствует этим требованиям, и использовать его строго в соответствии с этими требованиями.
Кроме этого, тесты эффективны с экономической точки зрения.
При тестировании основные затраты приходятся на составление качественного инструментария, то есть носят разовый характер. При увеличении количества аттестуемых эти затраты распределяются на них пропорционально, что приводит к снижению общих затрат.
В основе тестирования лежат достаточно простые, логичные, не противоречащие здравому смыслу правила и законы, которые позволяют найти полноценный непротиворечивый ответ на те «почему?», которые возникают у пользователей.
Однако тесты достижений не являются инструментом для определения всего спектра школьных достижений. Определение достижений, например, в социальной сфере необходимо проводить не тестами достижений, а специальным инструментом, на решение такой задачи рассчитанным и для этих целей разрабатываемым.
Одним из существенных ограничений применения тестирования школьных достижений являются ограничения, которые накладываются на ответы. В силу чего анализ способов решения задач, мыслительных операций, которые использует ученик при решении задач, в большинстве случаев оказываются затруднены, но не невозможны.
Однако в рамках существующих ограничений на сегодняшний день метод тестирования является как наиболее мощным, надежным и объективным при решении широкого спектра педагогических задач средством, так и наименее теоретически и практически разработанным в нашей стране.
Представляется так же целесообразным отделить инструмент педагогический от психологического. Сделать это можно с достаточной степенью условности. Можно считать, что педагогические тесты направлены на выявление тех личностных новообразований и приращений, которые получены в результате систематического обучения, в то время как близкие им психологические – на выявление особенностей, полученных в результате всей жизнедеятельности.
С другими подходами к разделению инструмента, заданий на тестовые и нетестовые мы поговорим, когда будем обсуждать типологию тестов и тестовых заданий.
Тесты многообразны, велики по номенклатуре и назначению. Какие из них нам подходят в большей мере? Чтобы ответить на этот вопрос, посмотрим, а какие тесты бывают вообще. Для этого рассмотрим классификации тестов.
1.3. Классификация тестов
Первое, на чем надо остановиться, рассматривая классификацию тестов — это два подхода, которые в настоящее время сложились в тестировании — тесты, ориентированные на критерий (критериально-ориетированные) и тесты, ориентированные на норму (нормативно-ориентированные). Появившись как разные подходы к анализу результатов тестирования, отражающие разные основания для сравнения, сейчас эти два подхода определяют, как мы увидим позже, разницу на большинстве этапов создания теста.
Понимание критериальный и нормативной ориентированности как разных подходов к интерпретации результатов мы находим у B.C. Аванесова.
С точки зрения интерпретации результатов: «Для критериально-ориентированной интерпретации вывод выстраивается вдоль логической цепочки: задания - ответы — выводы о соответствии испытуемого заданному критерию».
«Для нормативно-ориентированной ориентации вывод достраивается рейтингом: задания — ответы — выводы о знаниях испытуемого — рейтинг, понимаемый как вывод о месте или ранге испытуемого»5.
Описание этих двух подходов в своей схематичной форме вполне отражает смысл разницы в интерпретации.
Ранее автор вводит и третий подход. Предметно-педагогический подход к интерпретации, где вывод выстраивается вдоль логической цепочки: содержание учебной дисциплины — генеральная совокупность задания для измерения знаний — тест как выборка заданий из этой совокупности — ответы испытуемого — вероятностный вывод о его знаниях учебной дисциплины.
Представляется, что этот третий подход лежит в иных классификационных отношениях с первыми двумя. Сущностным основанием для выделения этого вида служит факт возможности оценки ученика по предъявлению части заданий генеральной совокупности тестов, в то время как у первых двух подходов сушностным основанием является способ интерпретации результатов. То есть вероятностный вывод о знаниях учебной дисциплины на основе ответов ученика на часть заданий теста из генеральной совокупности заданий может быть сделан как на основе соответствия заданному критерию, так и на основе ранга испытуемого.
Кроме этого непонятной является связь между языком описания, личностью интерпретатора и ориентацией анализа. Почему предметно-педагогический подход к интерпретации ведется «педагогами на языке учебной дисциплины», критериально-ориентированная интерпретация ведется «преимущественно работниками органов управления образованием на языке учебной дисциплины», а нормативно-ориентированная интерпретация «ведется на языке тестологии»? Вероятно, есть смысл говорить о разных языка описания для двух (критериально- и нормативно-ориентированных) подходах, когда один подразумевает использование статистики, а другой нет, или о преимущественных сферах использования результатов в одном случае более ценных для педагога, а в другом для управленца. Достаточно странно выглядит предположение о том, что анализ качества усвоения учебного материала и параметры достижения критериев в меньшей степени интересуют управленцев, нежели результаты, полученные учениками относительно места в группе.
Попытаемся разобраться в данном вопросе, основываясь на работе Н. Гронлунда.
В самом общем виде основанием для сравнения в тестах, ориентированных на норму, являются результаты, полученные при предварительном тестировании группы учащихся, репрезентативной для какой-то общности. Например, предположим, что тест по математике для итогового тестирования учащихся 8-го класса, занимающихся по программам углубленного изучения историко-краеведческих дисциплин, состоит из 70 заданий. Среднее количество заданий, с которыми справились учащиеся этой выборки, составило 33. Используя этот инструмент, мы провели тестирование учеников класса сходного профиля и выяснили, что ученик Петров справился с 33 заданиями. Оценивая этого ученика на основе нормы, мы можем сказать, что половина учеников справляется лучше, чем он, а другая половина – хуже. Аналогичную по подходу оценку можно дать и для остальных учащихся, которые выполнили другое количество заданий. Более подробно, каким образом даются эти оценки и как возможно выставление корректной оценки в школьных баллах, мы рассмотрим в разделе «Нормирование». Сейчас для нас важно, что оценка в рамках этого подхода дается на основе предварительно полученных статистически обоснованных норм. Возможен и еще один способ, когда оценка дается относительно места ученика в группе (пятый из 40 или 27 из 150 и т.д.), в этом случае нет необходимости получения предварительных норм, но и отсутствует возможность получения корректного сравнения для разных групп, поскольку результаты будут зависеть от состава группы.
Характеризуя подход, ориентированный на критерий, Н. Гронлунд пишет: «Результаты второго типа тестов обрабатываются с точки зрения специальных знаний или навыков, которые студент может продемонстрировать (например, «он может определить все части микроскопа и продемонстрировать их правильное использование»). Он дает возможность определить, что каждый ученик может сделать с точки зрения конкретной задачи, не соотнося его действия с действиями других членов группы»6. Критерий определяется на основе экспертного оценивания как по номенклатуре, так и по критическому уровню. Например, специалисты по русскому языку создают тест для оценки уровня владения определениями по теме «Части речи». Они выясняют, какие определения включить, как оценивать ответы и тот уровень, превысив который можно считать, что ученик владеет определениями в достаточной степени. Например, они определили, что достаточным является включение в тест 18 определений, при этом они также определяют, что для получения положительной оценки достаточно правильно дать ответ на 12 из них. С точки зрения оценки, этот подход дает оценку только по дихотомической шкале: справился – не справился, прошел – не прошел, зачет-незачет и т.д. Этот подход имеет и еще один, может быть, не менее важный аспект, чем оценка ученика. Это – широкие возможности для описания тех задач, с которыми ученик справляется, тех задач, с которыми справляется меньше всего учащихся. Наличие и реализация такой возможности, с педагогической точки зрения, наиболее существенное отличие критериально-ориентированного тестирования.
Нельзя сказать, что возможность анализа того материала, с которым лучше или хуже справляются ученики, невозможна в рамках подхода, ориентированного на норму. Однако, реализуя задачу максимального разнообразия оценок в рамках подхода, ориентированного на норму, мы отбираем задания, которые дают максимальный разброс в оценках испытуемых, отбраковываем задания, с которыми справляются все учащиеся или с которыми не справляется ни один из учеников, поскольку они, с точки зрения оценивания учеников неинформативны. Однако, когда вопрос касается анализа усвоения элементов учебного материала, то задания, с которыми справляются все или не справляется никто становятся для нас чрезвычайно важными. Мы можем утверждать, что данный учебный элемент не освоен никем, а данный освоен всеми учащимися. Таким образом, критериально-ориентированные тесты дают возможность реализовать широкие диагностические возможности в отличие от тестов, ориетированных на норму.
Завершая рассмотрение двух подходов к тестам, приведем сравнительную таблицу.
| Тестирование на основе нормы | Тестирование на основе критерия |
1. Основной вид использования | Обзорное тестирование | Тестирование на степень владения материалом |
2. Основное значение | Оценить индивидуальные различия в уровне достигнутых знаний | Описать задачи, которые студент может выполнить |
3. Обработка результатов | Сравнение индивидуальных результатов с результатами других членов группы | Сравнение результатов с четко определенной областью достижений
|
4. Диапазон охвата | Обычно охватывает широкую область достижений | Обычно фокусируется на ограниченном наборе учебных задач |
5. Характер тестового плана | Обычно используется таблица спецификаций | Принимается во внимание детальная область спецификаций |
6. Процедура подбора вопросов | Отбираются вопросы, обеспечивающие максимальное разнообразие в индивидуальных оценках (для достижения более высокого разнообразия в оценках). Легкие вопросы обычно не включаются в тест | Включаются все вопросы, необходимые для адекватной оценки. Не делаются попытки изменить сложность вопроса или исключить легкие вопросы в целях достижения большего разнообразия в оценках |
7. Стандарты выполнения | Уровень выполнения теста определяется относительно позиции в группе (пятое место в группе из двадцати) | Уровень выполнения теста определяется исходя из абсолютных стандартов (владение материалом демонстрируется определением 90 процентов технических терминов) |
Таким образом, приступая к построению системы тестирования, мы должны определить те цели, которые мы преследуем и выбрать соответственно им подходы и область применения планируемого тестового инструментария.
Вариант и способ создания тестов будут зависеть и от того, как широко мы планируем использовать создаваемый тестовый инструмент. Более подробно мы остановимся на этом аспекте в следующем разделе.
К настоящему времени сложилась практика организации различных видов тестирования, требующих соответственно разных тестов, попытаемся представить наиболее полную классификацию тестов, в которой кроме учебных достижений представлены и другие виды тестов, в частности различные психодиагностические тесты. Это сделано для того, что бы представить себе место тестов учебных достижений в общей структуре имеющихся на сегодня видов тестов, дать возможность для обогащения практики тестирования учеников за счет использования иных возможностей, которые могут появиться на стыке различных видов и типов тестового инструментария.
Таким образом, кроме приведенных подходов, тесты можно классифицировать по целому ряду оснований.
1. По процедуре создания могут быть выделены стандартизированные и не стандартизированные тесты.
Стандартизируются процедура и условия проведения тестирования, способы обработки и интерпретации результатов, которые должны привести к созданию равных условий для испытуемых и минимизировать случайные ошибки и погрешности как на этапе проведения, так и на этапе обработки результатов и интерпретации данных.
В образовании можно выделить ряд задач, которые могут быть решены не стандартизированными тестами. Однако для целей итоговой аттестации учащихся можно использовать только стандартизированный тестовый инструмент.
2. По средствам предъявления:
— бланковые (тесты «бумага и карандаш»), эти тесты в свою очередь можно разделить на два вида:
а) с использованием тестовых тетрадей, в которых находятся тестовые задания и в которых испытуемый фиксирует результаты;
б) с использованием бланков, в которых испытуемые отмечают или вписывают правильные ответы (фиксируют ответы). Бланки предъявляются отдельно от заданий;
— предметные – в которых необходимо манипулировать материальными объектами, результативность выполнения этих тестов зависит от скорости и правильности выполнения заданий;
— аппаратурные — тесты с использованием устройств для изучения особенностей внимания, восприятия, памяти и мышления;
— практические — появившиеся относительно недавно эти тесты сходны с известными у нас лабораторными работами (по химии, физике, биологии и пр.), однако снабженные соответствующими инструкциями и имеющие тестовое оснащение);
— компьютерные.
Кроме этого B.C. Аванесов предлагает в рамках компьютерного тестирования выделить еще адаптивные тесты — задания, в которых предъявляются по одному, в зависимости от ответа испытуемого на предыдущий вопрос8. Вероятно, в этом есть смысл, поскольку большинство тестов предполагает предъявление конечного набора вопросов испытуемому и не предполагает зависимости от ответа на предыдущие вопросы. Вероятно, можно предположить возможность использования адаптивного тестирования и вне компьютерного предъявления.
Каждый из способов предъявления имеет свои плюсы и минусы. Компьютерные очень быстрые, однако они провоцируют случайные ошибки и не оставляют исходных результатов на случай апелляции, что ограничивает их применение для аттестации учащихся. Бланковые позволяют экономить на бумаге, удобны для пересылки, лают возможность сканирования для обработки результатов, но при этом также не дают исходных результатов и провоцируют случайные ошибки, поскольку требуют наличия навыка работы с бланком. Кроме этого, необходимость проведения черновых записей провоцирует испытуемых на использование незаконных способов выполнения работы. Наиболее качественные результаты могут быть получены с использованием тестовых тетрадей, но при этом возникает проблема ввода результатов для обработки и необходимость дополнительных расходов на печать самих тетрадей.
Для нужд образования подходит любой из этих способов, при этом нужно помнить об одном – предъявляя один и тот же тест в разных формах, мы получим разные результаты. Нельзя сравнивать результаты тестирования, полученные в результате разных способов предъявления.
3. По направленности, т.е. по тому, что именно предполагается изучать с помощью данного теста:
— тесты интеллекта, выявляющие особенности последнего;
— личностные тесты, с помощью которых изучаются особенности личности испытуемого, помимо его интеллекта включая тесты мотивов (то же, что и тесты динамики), предназначенные для диагностики мотивационно-потребностной сферы личности, позволяющие определить, на что направлена активность индивидуума и каким образом осуществляется им саморегуляция поведения, тесты настроений и состояний, направленные на изучение временных состояний, таких, например, как эмоции;
— тесты достижений.
4. По характеру действий:
— вербальные (связанные с необходимостью произведения умственных действий – словесно-логические тесты, вопросники на проверку знаний, установление закономерностей и пр.);
— невербальные (практические), связанные с практическим манипулированием предметами – карточками, блоками, деталями.
5. По ведущей ориентации:
— тесты скорости, содержащие простые задачи, время решения которых ограничено настолько, что ни один испытуемый не успевает решить все задачи в заданное время;
— тесты мощности или результативности, включающие трудные задачи, время решения которых либо вовсе не ограничено, либо мягко лимитировано. Оценке подлежит успешность и способ решения задачи. Близкими к тестовым заданиям такого рода, в качестве примера можно привести задания для письменных итоговых экзаменов за курс школы;
— смешанные тесты, которые объединяют в себе черты двух вышеперечисленных. В таких тестах представлены задачи различного уровня сложности, от самых простых до очень сложных. Время испытания в данном случае ограничено, но достаточное для решения большинства предлагаемых задач определенной группой обследуемых. Оценкой в данном случае служат как скорость выполнения заданий (количество выполненных заданий), так и правильность решения.
Эти тесты наиболее часто применяются на практике, к ним относится большинство тестов школьных достижений.
6. По степени однородности задач:
— гомогенные, имеющие, как правило, одну шкалу, которые позволяют оценить одно свойство или качество личности и включают задачи, сходные по характеру, но различающиеся конкретным содержанием;
— гетерогенные (многоразмерные), имеющие несколько шкал, которые позволяют оценить разнообразные характеристики личности и включают задания, отличающиеся и по характеру, и по содержанию9.
B.C. Аванесов приводит иную классификацию по данному основанию. Первая часть определения (гомогенные и гетерогенные тесты) существенно не отличается от приведенной нами: гетерогенный тест соответственно определяется как предназначенный для измерения «уровня подготовленности учащихся по нескольким учебным дисциплинам и (или) свойствам личности». Но он вводит еще один вид тестов в данном классификационном основании — «интегративный», направленный на оценку «общей подготовленности выпускника образовательного учреждения». По мнению автора, он отличается от гетерогенного теста особым содержанием заданий, а коль это так, то и классификация тестов по этому основанию должна быть перенесена на классификацию тестовых заданий, поскольку по своей сути он является обычным гетерогенным тестом10.
7. Объективные тесты - тесты, объективность оценки результатов которых обусловливается тем обстоятельством, что в процессе обработки результатов тестирования не предусматривается использование их субъективных толкований тестирующим, к этой группе тестов относятся тесты школьных достижений.
C другой стороны выделяют проективные тесты — совокупность, методик, разработанных в рамках проективного подхода в психологии, и характеризующихся неопределенностью, неоднозначностью используемых в ходе тестирования стимулов (стимулы тестов рассматриваются как экран, на который тестируемый проецирует свойственные ему потребности, внутренние конфликты, способы защиты своего «Я»), что допускает чрезвычайно большое разнообразие ответов и проявление определенной субъективности при их толковании тестирующим.
8. Широкоориентированные (для тестов в системе образования), позволяющие оценить эффективность процесса обучения по степени реализации одной из его основных целей, то есть степени освоения учащимися системы знаний, умений и навыков в ходе учебного, процесса; узкоориентированные, направленные на выявление достижений | учащихся в процессе освоения отдельных предметов, отдельных тем и т. д.
9. По целям использования (только для тестов в системе образования, эта классификация и пояснения к ней приведены по соответствующему разделу книги Нормана Е. Гронлунда):
— знаний или поведения студента в начале обучения (определяющий тест);
— прогресса, достигнутого в процессе обучения (формирующий тест);
— трудности обучения и их источники во время процесса обучения (диагностический тест) или
— основные достижения в конце обучения (суммирующий тест).
Принципы и механизмы разработки одинаковы для этих видов тестов, но содержание материала, включенного в тест, и степень сложности вопросов должны соответствовать целям тестирования.
Предварительный определяющий тест предназначен для оценки начальных способностей, обычно является несложным и охватывает очень небольшой диапазон знаний. Он может затрагивать минимум базовых знаний по теме обучения или другой ограниченный набор требуемых знаний. Он практически не отличается от суммирующего теста, даваемого в конце курса или раздела обучения.
Формирующий тест, используемый для контроля за прогрессом обучения, затрагивает ограниченный сегмент обучения, например, раздел или главу, и с его помощью делается попытка оценить все важные результаты данного сегмента. Акцент делается на оценке степени владения материалом изучаемых задач и обеспечения обратной связи со студентом по корректировке отдельных ошибок в тех областях, в которых они не достигли успехов. Таким образом, формирующий тест состоит из серии отдельных тестовых вопросов, всесторонне охватывающих ограниченную область обучения. Он разрабатывается таким образом, что ученику даются конкретные инструкции для исправления обнаруженных в результате теста ошибок. В связи с тем, что данные тесты являются обучающими тестами, они обычно менее сложны, чем суммирующие тесты, даваемые в конце процесса обучения.
Диагностический тест содержит относительно большое число вопросов, имеющих отношение к конкретной тестируемой области. В связи с тем, что целью теста является определение трудностей обучения, внимание фокусируется на ответах учащихся на конкретный вопрос или группу вопросов, и общий балл имеет второстепенное значение. Этот тест обычно больше фокусируется на распространенных ошибках, которые делают студенты, чем на попытке широкого отбора ожидаемых результатов обучения. В связи с тем, что данного типа тесты разработаны для тех студентов, у которых есть проблемы в обучении, они обычно имеют очень невысокий уровень сложности.
Суммирующий тест разрабатывается для оценки широкого диапазона результатов обучения, ожидаемого в конце учебного процесса. Сложность и представительность выборки являются важными аспектами данного теста в связи с тем, что результаты используются для простановки баллов и определения степени достижения задач курса обучения. Для того чтобы адекватно отобрать все ожидаемые результаты обучения, суммирующий тест обычно содержит вопросы, которые представляют более высокий уровень сложности, чем другие виды тестов.
Для нужд образования можно использовать три из приведенных видов тестов. Если нас интересует динамика подготовленности учащихся на начальном этапе обучения, мы должны использовать определяющие тесты, если нас интересуют трудности в обучении, то мы должны использовать диагностические тесты; а если, и это наиболее вероятно и часто используемо, наш интерес состоит в оценке результатов обучения, мы применяем суммирующие тесты.
Мы должны подчеркнуть тот факт, что каждый из этих видов тестов имеет свои особенности. Использование одних тестов вместо других может привести к негативным и отрицательным последствиям.
10. По широте использования (только для тестов в системе образования).
1.5. Роль и функции фактора времени в тестировании
При создании тестов школьных достижений одним из фундаментальных по значимости факторов является время.
Время является фактором, который определяет качество всего инструментария и качество получаемых в процессе тестирования результатов.
Время нередко называется B.C. Аванесовым в качестве системообразующего фактора при разработке и использовании тестов11. Действительно, одно из соображений, положенных в основу создания тестов, – иметь инструмент быстрого и относительно точного оценивания больших контингентов испытуемых. Требование экономии времени становится естественным в массовых процессах, каковым и является образование.
Каждый тест имеет оптимальное время тестирования, уменьшение или превышение которого снижает качественные показатели теста. Время в тестировании многоаспектно, учет временного фактора требуется на нескольких этапах создания и использования теста. Исходя из важности феномена времени, появилась необходимость рассмотреть вопрос времени в тестировании отдельным разделом.
Почему время, выделяемое на выполнение тестовой работы, должно быть ограничено? Создатели тестов стремятся включить в тест как можно больше тестовых заданий. Такое положение диктуется двумя обстоятельствами — чем больше количество заданий, тем:
— более надежным будет создаваемый тест;
— больший объем информации мы можем получить.
С другой стороны, чем больше количество заданий, тем более продолжительной становится процедура тестирования.
Между результатами, который может показать испытуемый и продолжительностью тестирования существует достаточно простая связь. Время тестирования не может быть бесконечно большим. Простое увеличение времени тестирования приводит к утомлению испытуемых, что в свою очередь снижает результаты тестирования.
Таким образом, необходимо найти оптимальное время, которое отражало бы баланс между временем выполнения теста (количеством заданий) и утомлением испытуемых.
Утомление — временное снижение работоспособности под влиянием длительного воздействия нагрузки. Утомление характеризуется ухудшением продуктивности рабочих процессов, снижением темпа деятельности и ее качества, появлением характерных ошибок. Состояние утомления быстрее возникает при интенсивной или монотонной работе.
Утомление может проявляться:
— на поведенческом уровне, и тогда приводит к уменьшению скорости и точности работы;
— на физиологическом уровне, и приводит к повышению инерции в динамике нервных процессов;
— на психологическом уровне, ведет к нарушению качеств внимания, процессов памяти, степени адекватности функционирования интеллектуальных процессов;
— проходят сдвиги в эмоционально-мотивационной сфере.
Время продуктивного (до момента утомления) выполнения испытуемыми тестовых заданий является ключевым при составлении теста.
Индикатором момента наступления утомления при тестировании является появление большого числа случайных ошибок, снижение скорости выполнения заданий, снижение мотивации.
Таким образом, время от начала процедуры тестирования до момента наступления утомления и можно считать оптимальным временем для выполнения данного теста.
Время наступления момента утомления зависит от целого ряда причин. Основными из этих причин являются:
— возраст детей: чем меньше возраст детей, тем раньше наступает утомление.
— мотивация: взаимосвязь мотивации и времени наступления утомления несколько сложнее. Слишком высокая мотивация, так же как и слишком низкая, приводит к уменьшению времени продуктивной работы испытуемого, то есть к более раннему наступлению момента утомления.
— монотонность выполняемой работы: монотонность, однообразие работы в значительной мере влияют на утомление. Чем однообразнее работа, тем раньше наступает утомление.
— индивидуальные особенности испытуемых, связанные с высотой порога усталости: разброс по характеристикам порога наступления утомления довольно большой. По разным оценкам он может составлять от 20 до 100 минут рабочего времени для детей одной возрастной группы.
Каким образом мы можем повлиять на продолжительность тестирования? Из перечисленных нами причин наступления утомления одни нам необходимо учитывать, на другие мы можем оказывать влияние, третьи мы не можем ни учесть, ни повлиять на них.
Так, мы, безусловно, учитываем возраст испытуемых при составлении теста. Мы можем в определенной степени влиять на эмоционально-мотивационную сферу как непосредственно (интересность, разнообразие заданий), так и опосредованно (ситуация проведения процедуры тестирования). При подборе форм тестовых заданий мы можем снизить монотонность работы. И, наконец, мы совершенно не имеем возможности учесть при создании тестов индивидуальные особенности испытуемых, связанные с высотой их порога усталости.
Исходя из сказанного, проектируя и разрабатывая тесты, мы должны стремиться к тому, что бы мотивация учащихся должна быть устойчивой и положительной, а работа учеников максимально разнообразной.
Оказать влияние на мотивацию учащихся можно изменив условия проведения тестирования, отразив их в соответствующей инструкции, Например, в том случае, если создается тест для проведения эксперимента, в котором учащиеся принимают участие добровольно, если проводится апробация тестового инструментария требуется усиление мотивации. При апробации тестов можно порекомендовать выставить учащимся по его результатам текущую школьную оценку, инструкция для ведущею должна содержать обращение к испытуемым, в котором подчеркивается важность выполняемых работ, объяснение причин, по которым ученикам следует приложить максимум усилий, иногда бывает полезной предварительная беседа с учащимися.
Однако здесь необходимо придерживаться правила, что для апробации всех тестовых материалов должна быть единообразная процедура. Если по какому-то предмету выставляются оценки, то они должны выставляться и по другим предметам или в других группах испытуемых.
В том случае, если существует опасность повышенной мотивации, например, при проведении итоговой аттестации учащихся, то инструкция для ведущего должна содержать слова, которые могут успокоить учащихся, снизить предэкзаменационное волнение. В некоторых случаях, для этих целей, бывает целесообразно проведение предварительного пробного тестирования, чтобы убедить учащихся в адекватности и посильности задач, которые они должны решать, снять излишнюю мотивацию. Однако общее правило единобразности процедуры проведения и в этом случае должно неукоснительно соблюдаться.
Мы можем оказать влияние на снижение порога утомления, предусмотрев максимальное разнообразие выполняемой деятельности. Общее правило — сделать работу максимально разнообразной. И здесь есть две возможности, — во-первых, тест должен содержать задания, максимально разнообразные по форме. Во-вторых, сами задания должны быть максимально разнообразными по видам деятельности и невербальной поддержке.
Какие негативные последствия имеет нарушение оптимальности времени тестирования? Время, которое выделяется учащимся для работы над тестовыми заданиями, должно быть оптимальным. Слишком большое время тестирования, как и слишком малое, имеет свои негативные и позитивные стороны. Слишком большое время приводит к двум негативным последствиям:
— к концу тестирования снижается дисциплина, ученики, которые справились с тестом, имеют возможность «помочь» своим товарищам;
— снижается дискриминативность теста, особенно для коротких тестов, которые содержат задания примерно равные по сложности, то есть возрастает вероятность появления учеников с одинаковым баллом, что особенно плохо для нормативно-ориентированных тестов.
Негативные последствия несет и малое время на проведение тестирования, оно провоцирует учащихся на угадывание правильных ответов. В том случае, когда количество заданий, к которым ученики не приступили, велико, то те учащиеся, которые попытаются угадать ответы в оставшихся заданиях, могут получить достаточно весомую прибавку к собственному баллу.
Следовательно, время тестирования должно быть все-таки достаточно коротким для того, чтобы не провоцировать учащихся на списывание и подсказки. В подавляющем большинстве случае учащиеся начинают подсказывать в том случае, когда они справились со своей работой, по крайней мере, попытались выполнить все задания. Таким образом, короткое время, в том случае, если проблема угадывания для теста не столь актуальна, является хорошим профилактическим средством против подсказок и нарушений дисциплины.
Кроме этого решение вопроса нахождения оптимального времени позволяет экономить ресурсы разработчика и пользователей.
Классическим вариантом борьбы со списыванием является создание двух или более вариантов тестов. Как мы покажем позже, создание полноценных одинаковых вариантов тестов имеет серьезные трудности в рамках классической теории тестирования, кроме того, оно требует дополнительных затрат. Как показывает опыт, в случае нахождения оптимального времени тестирования, проблема списывания практически не возникает.
Для возможной борьбы с угадыванием возможно использование в концовке теста достаточно трудных заданий открытого типа.
Опыт говорит о том, что гораздо проще найти способы борьбы с угадыванием, нежели с нарушениями дисциплины.
Как можно найти оптимальное время для работы над тестом? Ориентиры времени, которое можно выделить на тестирование, необходимо выяснить при апробации теста, однако ориентировочное время у разных авторов примерно одинаково.
Таким образом, при составлении варианта теста для апробации, можно ориентироваться на цифры для средней и старшей школы — около часа. В процессе апробации реальные сроки должны быть уточнены. Для апробации следует брать некоторый запас тестовых заданий и соответственно времени. Запас заданий должен обеспечить необходимое количество заданий взамен тех, что будут отбракованы, а запас времени позволит оценить верхнюю границу приемлемого времени выполнения.
B.C. Аванесов приводит следующий алгоритм определения времени тестирования: «Оптимальное время тестирования определяется эмпирически, по показателю дисперсии тестовых данных. Если по оси абсцисс отложить время тестирования, а по оси ординат – значение дисперсии тестовых результатов, получаемое после каждого пробного контроля, то, соединив точки, получим представление об изменении дисперсии; максимум значения последней укажет на оптимум времени, необходимого для тестового контроля».12 Вероятно, речь здесь идет не о максимуме дисперсии, а о точке начала ее увеличения, которая вызвана началом периода утомления. Как мы отмечали, наступление утомления вызывает повышение количества случайных ошибок, именно они и являются причиной увеличения дисперсии. Такой способ должен быть достаточно точным, и в том случае, когда есть соответствующие технические возможности, его следует использовать.
В качестве практического совета, можно привести вполне современную рекомендацию: время теста должно быть таким, чтобы только 5 процентов испытуемых могли справиться со всеми заданиями.
Если существует необходимость выполнения заданий большей продолжительности, то есть еще один выход — технология проведения должна предусматривать перерыв. Перерыв несколько усложняет процедуру проведения, делает работу ведущего более ответственной, однако он дает вполне ощутимые преимущества. Отметим, что часть международных сравнительных исследований по оценке подготовленности школьников использует процедуру проведения тестирования с перерывом.
Почему время на заполнение тестов должно быть определено точно? От времени, выделяемого на проведение тестирования, напрямую зависит результат. Временной разрыв для работы над тестом для учащихся даже в 1-2 минуты может существенно повысить или понизить общий балл. Если на выполнение короткого тестового задания закрытого типа требуется 10-15 секунд, то можно оценить (правда, гипотетически), какое количество баллов можно получить за дополнительную минуту.
Для тестов школьных достижений следует вести речь не о возрасте испытуемых, а о ступени (классе) и периоде обучения. Возрастной подход, несмотря на то, что при международных сравнительных исследованиях используется именно он, неудобен в силу достаточно ясных причин — дети одного возраста могут обучаться в разных классах.
Особое место среди факторов, влияющих на индивидуальную и групповую работоспособность испытуемых, занимает время проведения теста и характер деятельности учащихся до тестирования. Специальные исследования психофизиологов говорят о том, что наиболее благоприятно время с 9 до 12 или с 16 до 18 часов. Поскольку речь идет о тестах школьных достижений, то наиболее приемлемое время проведения тестирования — второй или третий урок первой смены.
Последнее, про что необходимо сказать в связи с рассматриваемым вопросом, это вопрос о феномене контаминации критерия, который представляет собой комплекс явлений, связанных с влиянием информации о результатах тестирования испытуемого на отношение к нему других лиц. Например, если ученик неудачно справился с тестом по отдельному предмету (что говорит о недостаточной подготовке по определенным темам), это в дальнейшем может сказаться на всей учебной деятельности ученика. Возникновение эффекта контаминации после одного тестирования — явление скорее экзотическое. Оно может возникнуть только у человека, свято верящего в тестирование как универсальный и безошибочный способ изучения человека, а таких людей среди педагогов все меньше и меньше. Однако этот эффект, возникающий по результатам нескольких испытаний, более чем реален. К сожалению, вопросы контаминации критерия в образовании изучены достаточно слабо и еще ждут своих исследователей.
2. ТЕСТОВЫЕ ЗАДАНИЯ
2.1. Состав тестовых заданий
В самом общем виде тестовые задания должны:
- соответствовать содержанию учебного материала;
- быть составлены с учетом соответствующих правил;
- быть проверены на практике (апробированы);
- быть ясными испытуемому.
Кроме этого необходимо отметить, что тестовые задания могут быть охарактеризованы показателями — трудностью и дискриминативностью.
В данном главе нами будут представлены требования к основным видам тестовых заданий, которые применяются в тестах учебных достижений. Эти виды заданий носят «базовый» характер. Все многообразие существующих заданий может быть сведено к нескольким типам или их сочетанию. Например, задача с переструктурированием данных может быть представлена как совокупность задач на восстановление последовательности и соответствия; задания на нахождение ошибок - частный случай заданий на исключение лишнего и так далее.
С точки зрения разработчика минимальные требования к составу тестового заданию состоят в наличии всех трех частей:
1. Инструкции
2. Текста задания (вопроса)
3. Правильного ответа
1. Инструкция должна содержать указания на то, что испытуемый должен сделать, каким образом выполнять задание, где и как делать пометки и записи, описывать то, что ученик должен «сделать руками», каким образом ему следует выполнять задание, где отмечать, как дописывать и т.д.
Собственно говоря, инструкция должна сделать так, чтобы задание и способ его выполнения были абсолютно ясны любому из испытуемых и не приводили к ошибкам.
Например:
— ответ запишите в рамку, которая находится ниже задания, для промежуточных вычислений используйте место слева от вопроса;
— в третьем столбце, над строчками впишите цифры, соответствующие понятиям, обозначенным буквами в этой же строке;
— ответ запишите в бланке, в строке, соответствующей номеру вопроса, для вычислений следует использовать калькулятор...
Ученику важно понять, что от него требуется, как он должен выполнять задание. Мало понять то, что необходимо установить правильную последовательность, то есть выполнить интеллектуальную операцию, но и то, как собственно ее устанавливать, что, каким образом и где надо вписать, отметить и т.д. Кроме этого, для многих заданий важно и то, в каком порядке эту правильную последовательность восстанавливать от раннего (большего) к более позднему (меньшему) или наоборот.
Исходя из необходимости сделать само задание и процедуру его выполнения понятными испытуемому, представляется вполне обоснованным требовать в инструкции для испытуемого наличия именно тех операций, что он должен выполнить практически.
Как показывает опыт, подготовка инструкций для учащихся с требованием четко описать то, каким образом ученик должен выполнять задание, дисциплинирует разработчиков, позволяет им взглянуть на задание с точки зрения его выполнимости.
В тестах допускается делать одну инструкцию для группы однотипных заданий, которая помещается в начале теста или данной группы заданий в тесте. Для проверки того, как испытуемые поняли инструкцию, желательно снабдить ее несколькими примерами, которые разбираются вместе с ведущим тестирование. Общей практикой, сложившейся в последнее время, является создание инструкции для испытуемых, которая помещается в начале тестовой тетради. В ней подробно разбираются инструкции по заполнению всех форм тестовых заданий, которые могут встретиться в Тесте. Они снабжаются примерами, которые разбираются и выполняются вместе с ведущим, правила исправления ошибочно выполненных заданий, другие сведения, необходимые ученику для выполнения задания.
Для разработчиков тестовых заданий подготовка инструкции для испытуемых в каждом задании является необходимой, поскольку это позволяет взглянуть на задание с точки зрения ученика, рассмотреть варианты упрощения заданий, а иногда подталкивают к поиску наиболее адекватной формы тестовых заданий.
Правила составления инструкций, требований к их составу мы разберем в главе, посвященной оснащению тестов. В примерах, данных в дальнейшем, инструкции могут повторяться в краткой форме или не повторяться вовсе, однако это совершенно не означает, что при составлении тестовых заданий или оснащении теста ими следует пренебрегать.
Каким образом лучше делать отметки при выполнении заданий? Это достаточно важный вопрос. Возможно несколько вариантов: отметить крестиком, поставить галочку, обвести кружком, нарисовать стрелочку, соединить линией, отметить любым знаком и т.д.
В случае апелляции по результатам теста, можно очень долго и безрезультатно выяснять, к какому варианту ответа был ближе использованный испытуемым знак.
Иногда, особенно в начальной школе, задания на восстановление соответствия содержат инструкцию «соединить стрелочкам и соответствующие элементы». Этот вариант, кроме возможной неоднозначности, достаточно трудоемок при проверке, особенно когда количество испытуемых становится большим.
Не совсем четким представляется вариант «обведи кружком вариант ответа...», поскольку следую ему формально необходимо весь вариант ответа обвести в кружок, что не всегда уместно и возможно.
Как показывает опыт наиболее универсальным, четким, понятным и однозначным является вариант обведения кружком цифры (буквы), соответствующей правильному ответу для заданий закрытого типа, и требование вписать ответ в отведенное место для заданий открытого вида и заданий на восстановление соответствия (выделив в тестовой тетради и обозначив «место для ответа»).
2. Текст задания или вопроса представляет собой содержательно наполнение задания.
У некоторых авторов можно встретить выделенные части текста задания. Например:
Стимулирующий (стимульный) материал; материал, о котором говорится в вопросе, представлен обычно в виде текста, рисунка, таблицы или другого представления данных. Во многих случаях написание вопросов начинается со сбора подходящих текстов или с обдумывания ситуаций или тем, по которым можно сгруппировать. ряд вопросов.
Введение: информация, предшествующая вопросу.
Вопрос: существенная часть вопроса, например: «До каких пределов падает значение X?» или «Какие достоинства имеют открытые вопросы?».
Ограничения ответа: вопрос должен быть высокого качества, чтобы предотвратить нежелаемые интерпретации учеников, используя ограничения, такие как: «По мнению автора...» или «Вычислите до 2-х десятичных знаков».
По нашему мнению, структура и состав вопроса определяется в большей степени содержанием учебного материала. Стимулирующий материал или, его еще могут называть - невербальная поддержка, может быть представлен не для всех заданий, хотя тенденция ее подготовки для максимально большого количества заданий явно существует. Ее роль и значение мы обсудим отдельно. Ограничения ответа очень важны, но только для незначительного количества тестовых заданий, на них мы остановимся чуть позже.
3. Правильный ответ или оценочная схема - обязательный атрибут любого тестового задания - без него задание, за исключением, пожалуй, самых тривиальных, теряет смысл, поскольку не может быть точно проанализировано и оценено.
Перечисленные три составных части тестового задания являются минимально необходимыми для составления тестов.
Кроме этого, составителям тестовых заданий целесообразно указывать еще ряд необходимых сведений. Сведения разработчиков о заданиях и их целевое назначение представлены в таблице:
Таблица №. Сведения о заданиях и их целевое назначение Сведения о тестовом задании | Дальнейшее использование |
— возраст (класс), на который рассчитано это задание | для экспертизы с целью определения валидности |
— тему (предмет или предметную область в соответствии с технологической матрицей) | для проверки соответствия заданий технологической матрице |
— предполагаемое составителем время выполнения задания | для компоновки теста, предназначенного для апробации |
— сроки предъявления (календарные сроки, поскольку одно и то же задание, будучи предъявленным, например, в октябре и феврале даст разные результаты и соответственно должно иметь разные характеристики) | для включения в инструкцию по проведению теста |
— предполагаемую статистическую сложность | для правильного расположения заданий в тесте, предназначенном для апробации |
— уровень, который соответствует данному заданию, или умения, которые оно выясняет | для проверки соответствия заданий технологической матрице |
— соответствие стандарту или программному материалу | для экспертизы с целью определения валидности |
— данные автора | для получения справок и уточнений |
— возможные варианты невербальной поддержки | для художника и технического редактора, для подготовки невербальных материалов |
Тестовое задание должно иметь однозначный правильный ответ. Данное требование требует пояснения. Часто понятие однозначности ответа трактуется как требование единственности ответа или наличия предполагаемого образца. В данном случае речь идет об однозначной, с точки зрения пользователя возможности оценки результата выполнения тестового задания, как возможность любого пользователя на основе сравнения ответа учащегося и правильного ответа (схемы анализа), предложенного разработчиком, сделать однозначный вывод о том, выполнил данный ученик это задание верно или нет. Поэтому правильный ответ разработчика может заключаться не только в эталонном ответе, но и в описании схемы анализа, содержать конструкции «и ... и», «...или...», описывать вариант неправильного ответа, считая все остальные правильным.
Виды и типы тестовых заданий.
Их особенности, преимущества и недостатки.
Рассмотрим, типологию тестовых заданий, и выделим требования к ним. Существует два типа заданий, которые объединяют шесть видов. К этим шести видам может быть сведено все многообразие существующих заданий без ущерба для их качества. Типы и виды тестовых заданий представлены на схеме:
ТЕСТОВЫЕ ЗАДАНИЯ
ДОПОЛНЕНИЯ
СВОБОДНОГО ИЗЛОЖЕНИЯ
АЛЬТЕРНАТИВНЫХ ОТВЕТОВ
ВОССТАНОВЛЕНИЯ
СООТВЕТСТВИЯ
МНОЖЕСТВЕННОГО ВЫБОРА
ВОССТАНОВЛЕНИЯ
ПОСЛЕДОВАТЕЛЬНОСТИ
К заданиям открытого типа относятся два вида — задания дополнения и задания свободного изложения. Их отличительной особенностью является то, что для их выполнения ученику необходимо самому записать одно или несколько слов (цифр, букв; возможно словосочетаний или даже предложений). Этот тип заданий не имеет дистракторов и вариантов правильных ответов.
Задания закрытого типа, к ним относятся задания четырех видов: альтернативных ответов (АО), множественного выбора, восстановления соответствия и восстановления последовательности.
Тестовые задания закрытого типа - предусматривают различные варианты ответа на поставленный вопрос: из ряда предлагаемых выбираются один или несколько правильных ответов, выбираются правильные (или неправильные) элементы списка и др. Это задания с предписанными ответами, что предполагает наличие ряда предварительно разработанных вариантов ответа на заданный вопрос. Иногда варианты неверных ответов называют дистракторами.
2.2. Задания закрытого типа
2.2.1. Задания альтернативных ответов
1. Задания альтернативных ответов АО (верно — неверно, правильно — неправильно).
К каждой задаче альтернативных ответов дается только два варианта ответов. Испытуемый должен выбрать один из них - «да — нет», «правильно — неправильно» и пр.
Инструкция для заданий альтернативных ответов: обведите кружком вариант ответа «да» или «нет», который вы считаете правильным; или обведи ответ «да» или «нет». (Если ты согласен с утверждением — обведи кружком «да» в клеточке таблицы ответов, а если не согласен — обведи «нет»).
Задания альтернативных ответов (АО) являются самыми простыми, но не самыми распространенными при составлении тестов. Это связано, в основном, со специфичностью того материала, которому в большей степени соответствует эта форма заданий. Задания альтернативных ответов применяются для оценки одного элемента знаний. Использование заданий альтернативных ответов в виде отдельного вопроса, одиночно, приводит, как правило, к тривиальному тестированию и используются достаточно редко. Вопросы альтернативных ответов предлагают только одну альтернативу, которую тестируемый либо принимает как правильную, либо отвергает. Таким образом, у экзаменуемых есть возможность на 50% отгадать правильный ответ на один вопрос. Поэтому эти задания целесообразно применять сериями к одному элементу знаний.
В индивидуальном порядке вопросы альтернативных ответов не очень эффективны, а вот длинные серии таких вопросов имеют определенные преимущества. Ответы на них обычно не занимают много времени, и есть возможность охватить весь материал по предмету, задавая как можно больше вопросов по нему.
Таким образом, эта форма целесообразна для использования заданий этого вида в серии, когда для одного элемента знания задается несколько вопросов. В такой форме задания альтернативных ответов в большей степени подходят для выявления уровня овладения сложными определениями, знания достаточно сложных графиков, диаграмм, схем и т.д.
Особенностью заданий альтернативных ответов является то, что вопрос должен быть сформулирован в форме утверждения, поскольку он предполагает согласие или несогласие, которое можно отнести к утверждению.
Альтернативные задания в наибольшей степени соответствуют задаче выявления того, в какой степени испытуемый понимает данные. Кроме того, это задание содержит проверку форм нормального и бимодального распределений, умений работать с графиками, навыки приближенного вычисления. Любая другая форма представления заданий будет гораздо более громоздкой и менее удобной.
2.2.2. Задания множественного выбора
Это основной вид заданий, применяемый в тестах достижений. Надо помнить, что он не единственный.
Задачи с множественным выбором предполагают наличие вариативности в выборе. Испытуемый должен выбрать один из предложенных вариантов, среди которых чаще всего только один правильный.
Инструкции для заданий с множественным выбором: обведите кружком букву, соответствующую варианту правильного ответа.
Обычный вопрос состоит из введения, самого вопроса и ряда альтернатив, каждая из которых представляет собой ответ на вопрос. Оптимальное количество альтернатив — это 3 или 4. Имея две альтернативы, экзаменуемый начнет догадываться о правильном ответе особенно, если альтернативы похожи друг на друга (менее способные экзаменуемые встретят больше трудности, чем более способные при выявлении различия между этими альтернативами). Обычно трудно найти более 4 интересных и оригинальных альтернатив, и, к тому же, на их чтение уйдет больше времени экзаменуемого.
В заданиях множественного выбора количество правильных ответов объективными причинами не ограничивается. В том случае, если вариантов правильных ответов несколько следует видоизменить инструкцию, указав на то, что необходимо отметить буквы, соответствующие правильным ответам. Или иным образом указать на то, что правильных вариантов несколько.
Однако из практических соображении минимизации возможных форм заданий мы настоятельно рекомендуем придерживаться правила, согласно которому задание множественного выбора содержит только один правильный ответ, а в том случае, если правильных ответов несколько, то такое задание переделывается в форму заданий с альтернативными ответами. Таким образом, удается сократить на одну количество форм заданий и соответствующих им стандартных инструкций, что упрощает процедуру подготовки заданий.
Поиск правдоподобных однородных ответов составляет основную трудность для разработчиков заданий множественного выбора. Решить эту проблему возможно только на основе анализа результатов решения задачи.
2.2.3. Задания на восстановление соответствия (соответствие)
Задания соответствия (восстановления соответствия), в которых необходимо найти или приравнять части, элементы, понятия — конструкциям, фигурам, утверждениям; восстановить соответствие между элементами двух списков.
К этому же типу следует отнести и задания, в которых требуется восстановить порядок ряда, упорядочить. Эти задания могут рассматриваться как частный случай задания на восстановления соответствия, в которых только один ряд, а другим, предполагаемым, является время.
Мы уже отмечали, что распространенной формой инструкции дли учащихся при ответе на данный вопрос данного вида является вариант с использованием стрелочек: нарисуйте стрелочки от элементов первого списка ко второму..., соедините стрелками соответствующие понятия и т.д. Сам по себе способ использования стрелочек вполне правомерен, однако он имеет два существенных недостатка (кроме проблем неопределенности, которые мы обсуждали ранее): первый — сложность проверки, особенно когда необходимо проверить большое количество работ; и второй — есть опасность того, что ученики, привыкнув к способу выполнения этих заданий стрелочками, встретив в дальнейшем классическую форму задания, будут к ней не готовы, воспримут ее как неизвестную, что может снизить их результаты.
Система нумерации и обозначений не имеет, какого то особого стандарта исполнения. Как правило, система обозначений должна быть единой в рамках разрабатываемого тестового инструмента.
Обычно, римскими цифрами нумеруются разделы, арабскими цифрами номера заданий, иногда вместе с нумерацией заданий используются буквенные индексы, в которых зашифровываются предмет, класс, на который рассчитано данное задание, или иную важную для разработчика или пользователя информацию. Варианты ответов обозначают русскими или латинскими заглавными буквами сточкой.
Вопросы нумерации особенно важны для заданий на восстановление соответствия, где существуют два ряда; крайне желательно, что бы один из них был обозначен буквами, а другой цифрами, что помогает избежать путаницы при выполнении этих заданий.
Эта форма заданий достаточно разнообразна и может быть с успехом использована по всем учебным предметам и предметным областям. Практически в каждом предмете существует широкая возможность их использования. В области биологии, например, может быть использован список растений и список соответствующих соцветий, в русском языке слова и соответствующие им части речи или орфограммы, в истории даты и события и т.д.
Задачи соответствия, требуют подбора подходящего ответа. Обычно задание соответствия состоит из трех столбцов: в первом, под заглавными буквами (или цифрами) вопросы, утверждения, факты, понятия и т.д., во втором идет пронумерованный (или в случае если первый список был пронумерован, то под буквами) список утверждений или слов, которые надо поставить в соответствие, и наконец третья графа — вариант ответа. Для каждого пронумерованного слова или утверждения следует отобрать один признак под заглавной буквой, наиболее тесно связанный с ним.
Необходимо подчеркнуть еще один момент, касающийся альтернативных заданий и заданий на восстановление соответствий как тестов достижений — опасность тривиального тестирования.
Хотя и важно знать, что овес имеет соцветие метелку, а воробьиные - это отряд птиц, однако ответы на эти вопросы не предполагают понимания. Знание того, что Пушкин написал «Капитанскую дочку», представляется не столь важным по сравнению со способностью выполнить анализ этого произведения или выразить отношение к проблемам, в нем поднимаемым.
Главными преимуществами заданий этого вида являются: возможность быстрой оценки знаний, умений и навыков в конкретной области знаний, и экономичность размещения задач в тесте.
Для того чтобы задачи соответствия позволяли получить результат, не зависящий от внешних причин, при конструировании их необходимо учитывать требования, вытекающие из особенностей восприятия:
— число входных данных одного списка не должно превышать 10; если их больше, лучше составить еще одну или несколько задач;
— если длина списков не совпадает, то об этом необходимо сделать указание в инструкциях и ключе.
2.2.4. Задания на восстановление последовательности
Как мы уже отмечали, задания на восстановление последовательности можно рассматривать как вариант задания на восстановление соответствия, когда одним из рядов является время, расстояние или иной континуальный конструкт, который подразумевается в виде ряда. Поскольку эта форма заданий требует особой инструкции, мы выделили ее в отдельный подраздел.
Задания на восстановление последовательности незаслуженно редко используются в тестах. На самом деле это очень качественная форма тестовых заданий, обладающая значительными преимуществами: краткостью, простотой проверки. Оно подходит для любого предмета, там, где присутствует алгоритмическая деятельность или временные события. Для технологий это могут быть порядок технологических операций, для истории — восстановление временных последовательностей событий, для русского языка — этапы словообразования, для точных наук — алгоритмы решения задач и этот список практически бесконечен.
Если говорить о форме этого задания, то с одной стороны (если подходить строго) нельзя его отнести к закрытым заданиям, поскольку при его выполнении ученик сам записывает ответ. По форме это задание близко к заданиям на восстановление соответствия, но с другой стороны нельзя не отметить и его близость к заданиям на продолжение последовательности, которые мы рассмотрим в следующем разделе. Отдельно необходимо отметить и характерную для этой формы заданий низкую вероятность угадывания правильного ответа.
Преимущества заданий закрытого типа:
— задания могут быть надежны, поскольку отсутствуют факторы, связанные с субъективными оценками, которые снижают надежность;
— оценивание заданий полностью объективно: между оценками различных проверяющих не может быть различий;
— неважно, умеют ли испытуемые хорошо формулировать ответы;
— задания этого типа легко обрабатываются, тестирование быстро проводится;
— простой алгоритм заполнения снижает количество случайных ошибок и описок;
— эти задания позволяют охватить большие области знания, что для тестов достижений особенно важно;
— возможна машинная обработка ответов;
— низкая вероятность угадывания правильных ответов;
— возможно получение точной оценки содержательности теста, что особенно важно для определения соответствия теста целям исследования.
2.3. Задания открытого типа
К ним относятся задания двух видов:
— дополнения (другое название: задачи с ограничением на ответы). В этих заданиях испытуемые должны также самостоятельно давать ответы на вопросы, однако их возможности ограничены. Ограничения обеспечивают объективность оценивания результата выполнения задания, а формулировка ответа должна дать возможность однозначного оценивания;
— свободного изложения или свободного конструирования. Они предполагают свободные ответы испытуемых по сути задания. На ответы не накладываются ограничения. Однако формулировки заданий должны обеспечивать наличие только одного правильного ответа.
Инструкция для заданий дополнения: вместо каждого многоточия впишите только одно слово (символ, знак и т.д.).
Инструкция для заданий свободного изложения: закончите предложение (фразу), впишите вместо многоточия правильный ответ; дополните определение, записывая ответ в бланке и т.д., то есть вместо многоточия можно вписать словосочетание, фразу, предложение или даже несколько предложений.
Выполнение основного требования для заданий дополнения не представляется сложным, правильным ответом будет то самое выражение, слово и т.д., которое необходимо вписать испытуемому.
Для заданий свободного изложения выполнение основного требования к тестовым заданиям сложнее. Для выполнения этого требования необходимо формализовать сам ответ. В том случае, когда результатом выполнения задания служат цифровые выражения, структура фразы подразумевает два-три однозначных слова — это не сложно.
Трудность в применении этого вида задач заключается в сложности с формализацией ответов, необходимость подготовки оценочных схем затрудняет стандартизацию, громоздкость процедуры и большие затраты времени на проведение.
Задания данного типа рассматриваются психологами как дополнительные методы представления заданий в тестовой форме. Однако, какая из форм заданий лучше, определяется специфичностью тестируемой информации. Если она очень специфична, а в педагогической практике это не редкость, то эффективными будут задания свободного изложения, если она определена не столь четко, то лучше использовать задания дополнения.
Основными трудностями при составлении заданий открытого типа является соблюдение основного требования к тестовым заданиям — наличия однозначного правильного ответа.
Положительными сторонами хорошо составленных заданий дополнения и свободного изложения являются:
1) краткость и однозначность ответов;
2) необходимость воспроизведения ответа по памяти;
3) отсутствие необходимости искать несколько вариантов ответа;
4) простота формулировки вопросов;
5) простота проверки;
6) невозможность угадать ответ.
Основное преимущество этих заданий — невозможность угадать ответ, а основной недостаток - сложность формализации правильного ответа. Тем не менее, для задач на вычисление, задач с формулами в качестве ответа эта форма представляется оптимальной.
2.4. Оценочные схемы тестовых заданий
Существуют два подхода к оценке результатов тестирования. Первый подход говорит о том, что каждое задание должно быть оценено одним баллом в случае правильного выполнения и нулем баллов в случае его неправильного выполнения. Этот подход крайне рациональный, поскольку обработка полученных результатов становится достаточно простой и, что самое важное, этот подход единственно объективный. В случае любой попытки присвоения какого-то количества баллов за одно задание становится невозможным получение корректного ответа на вопрос: «Почему за это задание дается такое количество баллов, а за другое задание другое и чем может быть объяснен баланс оценок за задания в тесте?»
Рассмотрим аргументы сторонников присвоения заданиям разного количества баллов: «С помощью подсчета баллов Вы сможете выразить различие между коротким вопросом, ответ на который не займет много времени (единичным числом или словом), или вопросом, на ответ которого уйдет много времени, а также может потребоваться ответ, состоящий из многих частей, каждая из которых должна быть оценена отдельно. Другим преимуществом подсчета баллов является то, что они отражают более точно значимость вопросов в общем экзамене. Идеальным является вариант, когда максимальное количество баллов за один вопрос равняется количеству важных элементов или отдельных действий в ответе. Например, когда в вопросе требуется назвать трех современных английских писателей или 3 подпункта вопроса требуют подсчета на компьютере, то максимальное количество баллов будет 3. На практике, количество баллов также зависит от других факторов, таких как: важность вопроса или общий балл за весь экзамен. Для того чтобы облегчить процесс оценивания, лучше всего придерживаться определенного количества элементов/подпунктов или их совокупности».
Таким образом, сторонники присвоения разного количества баллов признают то, что, усиливая дифференциацию по вопросам, они жертвуют объективностью оценки. Предложение сторонников присвоения разного количества баллов разным вопросам строится на двух предложениях. Во-первых, разные по трудности задания оцениваются разным количеством баллов, но ведь располагая задания в тесте по мере увеличения трудности, однако мы уже учитываем трудность задания, резонно полагая, что каждый следующий балл получается с большими усилиями. Второе, что предлагают учитывать — это количество операций или элементов внутри задания. И здесь возможны два случая. Первый — когда эти операции или элементы носят одинаковую трудность, как в приведенном выше примере — назвать трех писателей или выполнить три действия на сложение. Такая ситуация представляется относительно редкой. Гораздо чаще можно встретить вариант, когда действия внутри задания являются неоднородными по сложности. Например, для большинства расчетных задач по химии, физике в 2-3 действия оказывается, что одно из действий является более трудным и в нем сосредоточен содержательный смысл задания. Остальные действия носят преимущественно расчетный характер или в любом случае они оказываются легче первого.
Сравнение системы оценивания двух приведенных заданий вызывает еще большие вопросы. За выполнение второго задания, где ученик должен полностью провести решение уравнения и найти ошибку, дается столько же баллов, сколько за выполнение только второго действия в первом задании. Найти рациональные ответы на вопрос «Почему это так?» не представляется возможным.
В этом случае ученики оказываются в неравном положении: те. кто выполнил первое действие, получают, как правило, все возможные баллы, те, кто с ним не справился, не получают баллов вовсе, хотя возможно предположить, что в том случае, если бы они справились с первым действием, то они могли бы справиться и с остальными. То есть фактически мы оцениваем несколькими баллами не правильность выполнения всего задания, а правильность выполнения первого действия такого задания. Таким образом, субъективный фактор оценивания усиливается.
Если проанализировать данный вопрос с точки зрения опыта тестирования, то разные подходы реализуются примерно в одинаковом количестве случаев. Так, при проведении международных сравнительных исследований, промежуточной аттестации учащихся в Англии и Шотландии применяется преимущественно первый подход. Для итоговой аттестации используется ограниченное присвоение баллов в небольших интервалах (большинство заданий по I баллу, некоторые оцениваются в 2, максимум в 3 балла). Тесты, разрабатываемые в Голландии, ориентированы на очень широкое варьирование баллов, до 10 за одно задание.
Оба подхода сходятся в одном — когда используются задания, требующие очень развернутого ответа, большого объяснения, сочинения, то есть когда становится невозможным формализовать ответ, необходимо создавать более общие оценочные схемы и использовать балльные оценки.
При этом задания (например, сочинение) нельзя признать тестовыми, в том понимании тестирования, которое сложилось в нашей стране, поскольку они не соответствуют основному требованию к тестовым заданиям и приводят к субъективным оценкам.
ЛИТЕРАТУРА
1. Аванесов В.С. Композиция тестовых заданий. — М.: Ассоциация инженеров-педагогов, 1996. — 191 с.
2. Баранов П.А. Актуальные проблемы методики преподавания истории в школе. Практическое пособие для системы постдипломного образования. — М.: Русское слово, 2002.
3. Грибов В.С. Тесты и мода // Преподавание истории и обществознания в школе. — 2000. — №2.
4. Дмитриев В.А. Тесты и учебная деятельность школьников // Преподавание истории и в школе. — 1993. — №2.
5. Иванова Е.В., Майоров А.Н., Шурухт СМ., Юрьева Н.Н. Рекомендации по составлению тестовых заданий для учителей. — СПб., 1994.
6. А.Н. Кимберг. Создание систем оценки качества знаний учащихся. Краснодар, 1994
7. Клайн Пол. Справочное руководство по конструированию тестов. — Киев, 1994.
8. Майоров А.Н. Конструирование заданий для тестов школьных достижений. — СПб., 1996.
9. Майоров А.Н. Требования к тестам школьных достижений. — СПб., 1996.
10. Оценка качества подготовки выпускников основной школы по истории / Сост. Л.Н. Алексашкина. — М, 2000.
11. Студеникин М.Т., Зайцева Т.В., Слуцкая Г.И. Итоги тестирования / Преподавание истории в школе. — 1997. № 5.
12. Трескина О.Е. Контрольные тесты // Преподавание истории в школе. — 1995. — № 7.
13. Филиппов В.М. Модернизация российского образования: Обновление школы. Единые государственные экзамены: Правда и домыслы. — М.: Дрофа, 2002. — 96 с.
1 Филиппов В.М. Модернизация российского образования: Обновление школы. Единые государственные экзамены: Правда и домыслы. — М., 2002.
2 Аванесов В.С. Композиция тестовых заданий. — М., 1996. — С. 32.
3 Баранов П.А. Актуальные проблемы методики преподавания истории в школе. Практическое пособие для системы постдипломного образования. — М., 2002. – С. 24.
4 А.Н. Кимберг Создание систем оценки качества знаний учащихся. – Краснодар, 1994. – С. 44.
5 Аванесов В.С. Композиция тестовых заданий. — М., 1996. — С. 52.
6 Баранов П.А. Актуальные проблемы методики преподавания истории в школе. Практическое пособие для системы постдипломного образования. — М., 2002. – С. 45.
7 Баранов П.А. Актуальные проблемы методики преподавания истории в школе. Практическое пособие для системы постдипломного образования. — М., 2002. – С. 50.
8 Аванесов В.С. Композиция тестовых заданий. — М., 1996. — С. 74.
9 Баранов П.А. Актуальные проблемы методики преподавания истории в школе. Практическое пособие для системы постдипломного образования. — М., 2002. – С. 60-62.
10 Аванесов В.С. Композиция тестовых заданий. — М., 1996. — 76.
11 Аванесов В.С. Композиция тестовых заданий. — М., 1996. — С. 80.
12 Аванесов В.С. Композиция тестовых заданий. – М., 1996. – С. 84.