08.05.2006 Время чтения: 7 минут

Ольга Бардина

Руководитель отдела исследований и разработок

Адаптивное тестирование в практике диагностики способностей и знаний

Содержание

Адаптивное тестирование: основные принципы
Тест интеллектуального потенциала - ТИП (адаптивный)
ЛИТЕРАТУРА

Соавторы статьи: Ольга Бардина, Олег Кононов

В начале апреля 2006 года HR-лаборатория "Гуманитарные Технологии" выпустила методику диагностики структуры интеллекта, основанную на современной технологии адаптивного тестирования (Item Response Theory - IRT). Следует отметить, что данная методика - второй продукт лаборатории, в котором реализован принцип адаптивного тестирования. Первый - система тестирования знаний "Телетестинг", в которой принцип адаптивного тестирования был успешно внедрен в 1998 году (см. "Тесты старшеклассников и абитуриентов. Телетестинг", 2000-2001).

Теория "Задание-ответ" (IRT) широко известна на Западе, однако, к сожалению, пока не очень знакома специалистам в нашей стране, которые пока еще в большинстве своем недостаточно овладели даже основами классической теории тестов, сформировавшейся на Западе еще в 30-40 годы прошлого века. Так, недавно на сайте www.ht.ru было проведено голосование, в котором предлагалось ответить на вопрос: "Как Вы относитесь к адаптивному тестированию?". Результаты показали, что 24 % посетителей сайта (с учетом того, что это люди, интересующиеся психодиагностикой и тестированием) не знают, что такое адаптивное тестирование. При этом среди тех, кому знакома технология адаптивного тестирования, наиболее популярным оказался вариант ответа "считаю, что это очень перспективный и практичный универсальный метод, значительно сокращающий временные затраты на тестирование и увеличивающий точность оценки" - 37 % посетителей сайта.

В связи с этим мы посчитали нужным предоставить интересующимся краткое описание сути адаптивного тестирования. Надо сказать, что центральная идея адаптивного тестирования давно была интуитивно понята педагогами и продолжает использоваться ими, особенно в практике проведения экзаменов и других контрольных процедур. Дело в том, что педагог обычно начинает экзамен, задавая студенту вопрос средней сложности. В случае если студент успешно с ним справляется, следующий вопрос оказывается более сложным, и так далее, пока педагог не увидит максимальный доступный для студента уровень. Очевидно, что использование одинаковых вопросов для всех студентов (например, сложных вопросов для слабых студентов или легких для хорошо подготовленных) - неэффективная стратегия. Тем не менее в практике тестирования в нашей стране идеи адаптивного тестирования используются пока неактивно. С целью ознакомления с основными идеями данного вида оценки приведем отрывки из монографии М.Б. Челышковой, ведущего специалиста в области адаптивного тестирования в нашей стране ("Адаптивное тестирование в образовании (теория, методология, технология)", 2001).

Адаптивное тестирование: основные принципы

Как отмечает М.Б. Челышкова "в последние годы в практике образования складывается ситуация, под влиянием которой традиционное тестирование, осуществляемое с помощью стандартизированных тестов фиксированной длины, перерастает в современные эффективные формы адаптивного тестирования, базирующегося на отличных от традиционных теоретико-методологических основах и иных технологиях конструирования и предъявления тестов…

На протяжении ряда лет вопросы адаптивного тестирования неоднократно привлекали внимание зарубежных ученых. Об этом свидетельствуют многочисленные исследования фундаментального характера и публикации таких авторов как J.A. Arter, R.K. Hambleton, J.L. Horn, C.D. Jensema, G.G. Kingsbury, F.M. Lord, J. Millman, L. Nauels, R.J. Owen, K.J. Patience, M.D. Reckase, J. Spray, H. Swaminathan, V.W. Urry, M. Waters, D.J. Weiss, R.W. Wood, A.R. Zara и многих других. С начала 90-х годов компьютерное адаптивное тестирование получило за рубежом широкое признание в сфере практики. В значительной мере этому способствовали прикладные теоретические исследования таких ученых, как C.V. Bunderson, D.K. Inouye, G.G. Kingsbury, J.B. Olsen, H. Wainer, D.J. Weiss, работы которых были не только поддержаны педагогической общественностью, но и нашли широкое применение в практике профессионального отбора в ряде структур промышленного и военного комплексов" (Челышкова, с. 4-6).

Так что же представляет собой адаптивное тестирование и по какой причине оно вызывает интерес специалистов, занимающихся психологическим тестированием или тестированием знаний?

"Основная идея, движущая исследователей в сфере адаптивного тестирования, заключается в том, что тестовые задания необходимо адаптировать (подогнать) по трудности к уровню подготовленности испытуемых в тестируемой группе. При этом исследователи исходят из тех соображений, что слабым испытуемым бесполезно давать трудные задания, так как с большой вероятностью они не сумеют их выполнить верно. Отдельные исключения из сформулированного выше утверждения, конечно, бывают, но они крайне нежелательны, поскольку приводят к снижению валидности профилей ответов слабых испытуемых, способствуя тем самым росту ошибочного компонента в их тестовых оценках.

Столь же бесполезными выглядят легкие задания при тестировании сильных испытуемых. Очевидно, что использование слишком легких заданий может привести к тому, что все или почти все получат примерно одинаковые высокие баллы и, следовательно, измерение не состоится по причине несоответствия уровня трудности заданий подготовленности тестируемых учеников или студентов.

Эта очевидная связь между трудностью заданий и подготовленностью испытуемых натолкнула исследователей на мысль об исключении бесполезных заданий и повышении таким путем эффективности теста. Если процесс адаптации организован верно, то исключение должно привести к оптимизации состава теста, сокращению времени тестирования при условии сохранения либо увеличения точности измерений по сравнению с той, которая могла бы быть достигнута в традиционном тесте фиксированной длины.

Поскольку все испытуемые отличаются по уровню подготовленности, оценки которой к тому же меняются по мере выполнения теста, очередное задание приходится подбирать, подстраиваясь под текущие оценки. Из этих соображений легко предположить, что адаптивный тест состоит из заданий, каждое из которых на момент предъявления было оптимальным по трудности для текущего результата тестируемого. Также легко понять, что все адаптивные тесты внутри группы тестируемых состоят из разных заданий и отличаются по количеству и трудности тем сильнее, чем больше разброс по подготовленности среди испытуемых тестируемой группы" (Челышкова, с. 16-17).

В итоге, адаптивное тестирование определяется как "совокупность процессов генерации, предъявления и оценки результатов выполнения адаптивных тестов, обеспечивающую прирост эффективности измерений по сравнению с традиционным тестированием благодаря оптимизации подбора характеристик заданий, их количества, последовательности и скорости предъявления применительно к особенностям подготовки тестируемых обучающихся" (Челышкова, с. 28).

Тест интеллектуального потенциала - ТИП (адаптивный)

В 2006 году лаборатория "Гуманитарные Технологии" разработала методику, основанную на принципах адаптивного тестирования. Методика получила название "Тест интеллектуального потенциала - ТИП (адаптивный)"; её основное назначение - экспресс-диагностика интеллектуальных способностей людей различных возрастных групп. Тест методологически основан на однопараметрической модели G.Rasch.

ТИП может использоваться менеджером по персоналу, школьным психологом, консультантом в службе занятости, сотрудником центра профориентации и другими заинтересованными специалистами.

Как и другие методики лаборатории, направленные на диагностику интеллекта, ТИП измеряет уровень выраженности способностей испытуемого по шести сферам:

вычисления (математический интеллект, видение закономерностей в числовых рядах);
лексика (активный словарный запас);
эрудиция (широта кругозора);
зрительная логика (конструктивно-технические способности, пространственное мышление);
абстрактная логика (стратегическое мышление, способности к анализу-синтезу);
внимание (способность к мобилизации, концентрации внимания).

Кроме того, испытуемый получает генеральную оценку интеллекта (общий балл по 6 шкалам). Результаты представляются в стандартизованной шкале стенов (1-10) со средним значением 5,5 и условной нормой 3,5-7,5 баллов.

Однако, в отличие от традиционных методов диагностики интеллекта, адаптивный ТИП позволяет варьировать в каждом индивидуальном случае количество и сложность вопросов. Каждый следующий вопрос зависит от правильности или неправильности ответов на предыдущие вопросы. Это возможно благодаря постоянному пересчету уровня подготовленности испытуемого: в случае правильного очередного ответа, на следующем шаге предлагается более сложный вопрос, в случае неправильного очередного ответа - более легкий.

Данная технология наглядно продемонстрирована на приведенном далее графике: по оси абсцисс откладывается номер вопроса, предъявляемого испытуемому, по оси ординат - уровень подготовленности испытуемого и сложность вопросов (в единой шкале логитов). На графике заметно, что в случае успешного ответа испытуемого следующий вопрос имеет большую сложность, и наоборот. Таким образом, тест подстраивается под уровень подготовленности испытуемого: заведомо слишком легкие или слишком трудные для испытуемого задания не предъявляются, что позволяет существенно сократить время, необходимое на прохождение тестирования. Этот момент крайне существенен в случаях массового тестирования или при прохождении одним испытуемым большой батареи методик.

#IMAGE_0#

Кривая зависимости уровня трудности предъявляемого задания от его номера в сеансе тестирования.

Не менее важным является вопрос секретности заданий: для каждого испытуемого набор заданий является уникальным, в результате чего минимизируется возможность подсказок, выучивания правильных ответов и т.д. При повторном прохождении теста испытуемый также вынужден решать новые задания, что уменьшает влияние эффекта тренированности. Банк заданий содержит 450 вопросов (по 75 вопросов на шкалу), относящихся к различным уровням сложности. Количество вариантов ответов для большинства вопросов расширено до 5 (традиционно их было 4), что уменьшает влияние эффекта угадывания на результаты тестирования.

Очевидно, что в данном случае алгоритм адаптивного тестирования является более "жестким" в отношении возможного эффекта экзаменационного (тестового) стресса: после выполнения первого задания программа осуществляет "резкий скачок" к значительно более трудному заданию, но зато в последующих пробах колебание кривой трудности довольно быстро затухает (см. график), так что уже к 20 заданию достигается стабилизация в рамках определенного доверительного интервала, допустимого с точки зрения ошибки измерения, типичной для тестов интеллекта. Важно подчеркнуть, что такой подход с психологической точки зрения оправдан тем, что "затухание кривой трудности" производится отдельно и независимо для каждой субшкалы теста ТИП - отдельно для "числового интеллекта", "вербального", "визуального", "эрудиции", "речевой логики" и т.п. Тем самым испытуемый, поднимаясь по шкале трудности довольно быстро в рамках одного тематического блока (субшкалы), остается на довольно щадящих по трудности заданиях в рамках того блока, который ему удается менее всего.

Выдаваемая тестовой программой интерпретация результатов тестирования не только констатирует наличие и уровень выраженности соответствующих способностей у испытуемого, но и позволяет соотнести их с перспективой успешности или неуспешности самореализации испытуемого в определенной профессиональной сфере.

Примечание: методика ТИП в настоящее время снята с производства. Работа над механизмом адаптивного тестирования продолжается.

ЛИТЕРАТУРА

Челышкова М.Б. Адаптивное тестирование в образовании (теория, методология, технология)". - М: Исследовательский центр проблем качества подготовки специалистов, 2001. - 165 с.
Шмелёв А.Г. (главный редактор). Тесты для старшеклассников и абитуриентов. Телетестино. - М: Первое сентября, 2000-2001. Ежегодник.
Шмелёв А.Г., Ларионов А.Г. Адаптивное тестирование знаний в системе "Телетестинг" // IX международная конференция-выставка "Информационные технологии в образовании": Сборник трудов участников конференции. Часть II. - М.: МИФИ, 1999. С.405
Шмелёв А.Г., Ларионов А.Г. Телетестинг: надежность и валидность результатов. - "Школьные технологии", 2001.
Шмелёв А.Г. Компьютеризация экзаменов: проблема защиты от фальсификаций. - Тезисы международной конференции "Информационные технологии в образовании". - Москва: ИПИ РАН, 2001.
Шмелёв А.Г. Опыт применения компьютерного тестирования знаний при обучении студентов психологов // Вестник Моск. Ун-та. Психология. 2002, 4.

Даю согласие на обработку персональных данных

Руководитель будущего: кто он? Исследование

#Тесты интеллекта

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите ctrl+enter.

0 комментариев

Написание комментария требует предварительной регистрации на сайте

Продолжая, вы даёте согласие на обработку персональных данных

Комментариев пока нет, будьте первым

Похожие статьи

20.03.2024 17:44:00

Оценка интеллектуальных способностей. Разбираем по полочкам

Как устроены тесты интеллекта, какие способности с их помощью можно измерить, а также на примерах реальных результатов тестирования разберём плюсы и минусы уровня интеллекта в профессиональной деятельности.

29.08.2022

Как оценить интеллект сотрудников и зачем это нужно

Показатели интеллекта обладают высокой предсказательной способностью результатов, связанных с работой и карьерой. В статье расскажем, как оценить интеллектуальные способности персонала и чем это полезно для бизнеса.

15.02.2021

Как найти внимательного сотрудника. И как тесты оценки способностей помогают в поиске

В целом, ошибки — это нормально, все иногда ошибаются. Но как заранее узнать: невнимательность у сотрудника — это редкость или норма? В статье расскажем, как тесты на внимание помогают спрогнозировать внимательность каждого сотрудника в компании.

16.02.2017 07:09:33

УЖАСНЫЙ, УЖАСНЫЙ, КОШМАРНЫЙ, КОШМАРНЫЙ, БЕЗУМНЫЙ, БЕЗУМНЫЙ... 21 ВЕК: КТО ВЫПЛЫВЕТ?

Сейчас мы сталкиваемся с огромным количеством обрывочной информации и на ее основе строим свою картину настоящего, ведь это позволяет нам быть «в курсе всех событий». Хорошо это или плохо?

26.12.2016 07:18:50

"И ТОЧНО НАЧАЛ СВЕТ ГЛУПЕТЬ..."

Жить стало комфортнее, жить стало интереснее, жить стало сложнее. Мир изменился, технологии опережают даже самые смелые фантазии большинства людей. Мой приятель, который «учит» компьютеры распознавать визуальные стимулы, утверждает, что автомобили уже готовы ездить без людей, вопрос в том, готовы ли люди? Он, конечно, подразумевал адекватность инфраструктуры, продуманность законодательной базы и прочие прагматические аспекты жизнедеятельности современного человека, мне же хочется копнуть глубже. Окружающая действительность значительно усложнилась за последние сто лет, а усложнился ли человек? Стал ли человек более приспособленным? Поумнел ли?

13.02.2014 08:28:24

М.К. Рыбникова. Теория тестов: классическая, современная и "интеллектуальная"

НЕСТАРЕЮЩАЯ КЛАССИКА Item Response Theory (IRT) – английское название теории, которая достаточно широко используется в психологических и педагогических измерениях. На русский язык его переводят как «теория латентных черт», «теория тестовых заданий» и даже «теория пунктуальных ответов». Но в последнее время все чаще можно услышать другой – куда более вольный и смелый – перевод: «современная теория тестов». Ни больше ни меньше! И пусть этот перевод и не отражает в полной мере оригинальное...

11.01.2013 12:50:59

Поколения X+Y+Z+...+n: кадровые решения для уравнения с многими неизвестными. Часть 2: Интеллект и личность.

Есть ли действительные психологические различия между людьми поколений X, Y, Z...? Мы решили проверить популярную теорию поколений: взяли огромную базу результатов тестирований по комплексной методике "Бизнес-профиль", разделили по дате рождения ее участников на разные поколения и сравнили их показатели между собой. В этой статье мы разбираем найденные различия в интеллектуальных способностях и личностных качествах.

02.08.2011 11:35:20

«Канадские ученые установили…» или об интерпретации данных

Широкое внимание привлекло появившееся в конце прошлого месяца в Интернете сообщение о связи IQ и использования определенного браузера. Рунет радостно откликнулся заголовками в ассортименте: «Ваш IQ зависит от Интернет-браузера», «Выбор браузера зависит от уровня интеллекта пользователя», «Пользователи браузера Internet Explorer … оказались самыми недалёкими …глупее остальных …глупее юзеров Opera!», «Internet Explorer назвали браузером для тупых», «Самые умные пользователи предпочитают Opera» и т.п. Оставим подобные выражения на совести журналистов и обратимся к отчету наших канадских коллег, консалтинговой компании AptiQuant Psychometric Consulting Co., работающей с психометрическими тестами.

22.03.2011 13:33:20

Пол, возраст, интеллект

В данной статье приводятся результаты исследования интеллектуальных особенностей сотрудников одной крупной компании. Целью исследования было установить, влияет ли пол и возраст людей на выраженность различных интеллектуальных способностей.

07.10.2009 16:29:58

Тесты интеллекта, или горечь самопознания

Психология. Журнал Высшей Школы Экономики, Д.В. Ушаков 03 ноября, 2004 Резюме Приводятся факты, подтверждающие высокую прогностическую валидность тестов интеллекта, их предсказательную силу относительно успеха в обучении и профессиональной деятельности, а также социального статуса. С точки зрения развиваемой автором структурно-динамической теории интеллекта предлагается объяснение феномену высокой прогностичности интеллектуальных тестов и обозначаются пределы, за которыми эта прогностичность...

Хотите подобрать тест для оценки?

В нашем арсенале более 30 тестов оценки личностных, мотивационных особенностей, IQ, управленческого потенциала, рискованного поведения, самопознания и др.

Оставьте заявку на бесплатную консультацию специалиста!

Перейти в каталог тестов