Просмотр содержимого документа
«Два типа ошибок измерений в тестологии и их источники»
Два типа ошибок измерений в тестологии и их источники
Архитекторы прячут свои ошибки под плющом, врачи под землей, а хозяйки под майонезом.
Бернард ШОУ
Так же, как и в любой технической области, тестологические измерения сопровождаются ошибками. Эти ошибки могут быть
систематическими, возникающими, например, по вине создателей тестовых заданий, тестирующей программы, учебного пособия, и
случайными, возникающими из-за того, что участники пытаются «схитрить», выполнить часть заданий методом «случайного тыка».
Систематические ошибки возникают из-за:
разницы толкования определений в ТЗ и в учебнике;
неясностей в интерфейсе;
логических неувязок в текстах ТЗ;
неправильных объяснений, данных сопровождающим тестирования оператором, и др.
На величину ошибок влияет человеческий фактор. Наиболее вероятные величины случайных ошибок определения рейтинга, если их отложить на графике, образуют небольшой интервал значений или, говоря языком статистики, – доверительный интервал. Величина этого интервала зависит от того, в какую область рейтингов попал исследуемый рейтинг. Проще говоря, – если участник правильно выполнил много заданий, вероятность того, что он нажимал клавиши «на авось», мала. И наоборот, эта вероятность велика для участников, результаты которых попали в область «наиболее вероятного» результата.
В общем случае, величину доверительного интервала можно представить функцией двух переменных:
расстояния от исследуемого результата до «идеального» и
расстояния от исследуемого результата до центра области «наиболее вероятного» результата.
Очевидно, с изменением этих переменных, величина области «доверительного интервала» будет изменяться в определенных пределах. Эти пределы заключены между величиной области «наиболее вероятного» результата и нулем.
Знание величин доверительных интервалов поможет на практике при разборе экзаменационных апелляций, а также очень важно для правильного применения методов факторного анализа.