Item response theory

ITEM RESPONSE THEORY - Item Response Theory, переводится некоторыми авторами на русский язык как "Теория тестовых заданий", но чаще встречается в русскоязычной профессиональной литературе в виде англоязычной аббревиатуры. Она предназначена для оценки скрытых свойств испытуемых и параметров ЗАДАНИЙ ТЕСТА осредством применения математико-статистических моделей измерения. Основным в IRT является предположение о существовании связи между наблюдаемыми результатами ТЕСТА и латентными качествами испытуемых, которые обычно трактуются как СПОСОБНОСТИ испытуемых, или их уровень подготовки. Популярно основную идею IRT можно представить так: измеряемое свойство (СПОСОБНОСТЬ или знания) отображается на одной шкале вместе с ТРУДНОСТЬЮ ЗАДАНИЙ - подобно тому, как на одной шкале весов в ходе физических измерений отображается и вес гири (эталона), и вес взвешиваемого предмета. Трудность задания при этом оказывается аналогом "гири" (эталона). Если способность "тяжелее", чем трудность задания, то испытуемый скорее справится с этим заданием, чем не справится.
К наиболее значимым преимуществам IRT обычно относят следующие:
  • Устойчивость и объективность оценок параметра, характеризующего уровень подготовки испытуемых. Источником этой устойчивости является относительная устойчивость оценок способностей (знаний) испытуемых от трудности заданий теста.
  • Устойчивость и объективность оценок параметра ТРУДНОСТИ ЗАДАНИЯ, их независимость от свойств выборки испытуемых, выполняющих тест.
  • Возможность измерения значений параметров испытуемых и заданий тестов в одной и той же шкале, имеющей свойства ИНТЕРВАЛЬНОЙ. Это свойство важно потому, что преобразование исходных величин разного происхождения в одну исходную шкалу позволяет соотнести уровень знаний любого испытуемого с метой трудности каждого заданий теста.
С помощью IRT можно предсказать вероятность правильного выполнения заданий теста любым испытуемым до предъявления теста группе, выявить эффективность различных по трудности заданий, используемых для оценки знаний или способностей, отличающихся по подготовке учеников тестируемой группы.
I