25.08.2025 Время чтения: 10 минут
Виталий Федорченко
Виталий Федорченко
Управляющий проектами
Статьи автора

Исследование: в каких тестах интеллекта респонденты чаще всего ищут ответы в интернете

Исследование: в каких тестах интеллекта респонденты чаще всего ищут ответы в интернете

Содержание:


Для каких шкал интеллекта респонденты чаще всего ищут ответ во время тестирования? Чтобы это выяснить, мы проанализировали 949 результатов «Теста Интеллектуальных Способностей» (ТИПС): подсчитали количество переключений между окнами браузера, измерили время поиска ответов на вопросы, выявили гендерные и возрастные различия в поведении, а также оценили финансовые риски проведения тестирования, если не использовать прокторинг.

В отчёте представлены два кейса: данные из служебных файлов о переключениях окон во время теста и анкетные данные для визуализации шкал, по которым пользователи чаще всего обращались к подсказкам.

Анализ поиска ответов в интернете: рейтинг типов вопросов и время переключения

Для анализа взят 84 091 прокат вопросов теста, из которых мы исключили 76 032 проката без переключений в другие окна, затем удалили 2 599 прокатов с переключением менее 3 секунд (считаем как помехи тестирования) и прокаты с длительностью переключения свыше 70 секунд, так как тестовый плеер автоматически переключает задание. 

В итоге для анализа времени переключений — как индикатора поиска ответов в интернете — осталось 4 424 проката вопросов.

Таблица 1. Количество предъявлений вопросов и переключений

Шкала Всего тестир. Без переключ. Менее 3 сек. Переключ > 3 сек. Кол-во > 70 Взяты в анализ
Итого 84 091 76 032 2 599 5 460 1 036 4 424
Вычисления 12 138 10 706 592 840 172 668
Лексика 12 880 10 951 626 1 303 252 1 051
Эрудиция 12 875 10 894 441 1 540 115 1 425
Простр. мышление 11 741 10 937 271 533 131 402
Невербал. логика 11 403 10 934 203 266 73 193
Вербал. логика 11 696 10 867 263 566 197 369
Обраб.информации 11 358 10 743 203 412 96 316


Описание содержания столбцов:

  • Шкала — шкалы теста «ТИПС».
  • «Всего тестирований» — общее количество вопросов по каждой шкале.
  • «Без переключений» — количество вопросов для каждой шкалы, при ответе на которые респонденты не переключали окна браузера.
  • «Менее 3 сек.» — переключения окон, в том числе всплывающие окна других программ в системе. Тайминг выбран произвольно: по мнению автора отчёта, нельзя найти ответ в поисковике за время менее 3 секунд и внести ответ в систему тестирования. Система считает время в миллисекундах.
  • «Переключение > 3 сек.» — общее количество переключений с длительностью более трёх секунд. Как наиболее вероятная гипотеза — поиск ответов на вопросы.
  • «% от всего» — процент «Переключение > 3 сек.» от «Всего тестирований». Процент вопросов для каждой шкалы, для которых искали ответы.
  • Кол-во > 70 — тестовый плеер переключает задание на следующий вопрос, ответ не выбран.
  • Взяты в анализ — количество прокатов вопросов, которые были проанализированы.


Рейтинг шкал, для которых чаще всего идёт поиск вопросов для описанных выше условий: «Эрудиция» закономерно заняла первое место, а вот «Лексика» стала неожиданным открытием, сместив ожидаемые «Вычисления» на третью позицию. Замыкает рейтинг «Невербальная логика» — вероятно, из-за сложности формулировок, затрудняющих быстрый поиск ответов в интернете (табл. 1).

Полный рейтинг, медиана (средневзвешенное) и мода (MODA, наиболее частотное значение) времени переключения представлены в таблице 2.

Таблица 2. Расчёт метрик времени переключения: медиана и мода

Шкала Взяты в анализ Медиана, сек. MODA, сек.
Эрудиция 1 425 10 5
Лексика 1 051 13 4
Вычисления 668 11 4
Пространственное мышление 402 12 4
Вербальная логика 369 13 5
Обработка информации 316 12 4
Невербальная логика 193 17 4


Анализ медианного времени поиска ответов показывает, что быстрее всего пользователи находят ответы по шкале «Эрудиция» — 10 секунд; на втором месте — «Вычисления» с результатом 11 секунд; третье место делят «Пространственное мышление» и «Обработка информации» с показателем 12 секунд. 

Медленнее всего идёт поиск для шкалы «Невербальная логика» — 17 секунд. При этом показатели MODA практически одинаковы для всех шкал, что указывает на то, что большинство пользователей находят ответы в интернете с сопоставимой скоростью независимо от типа заданий.

Визуализация данных не выявила сенсационных открытий, однако обратил на себя внимание «большой правый ус» — значительный временной промежуток от медианы со стандартным отклонением до максимальных значений, — который наблюдался почти у всех шкал, кроме «Эрудиции», показавшей чуть более сжатый диапазон.

Диаграмма 1. Время поиска ответов

Различия по полу и возрасту для поиска ответов

Пол респондента

В исходной выборке из 949 тестирований женщины составляют 511 человек, мужчины — 436, и ещё 2 анкеты не указали пол. Таким образом, общее количество результатов тестирования женщин немного преобладает. Однако при подсчёте активного поиска ответов по шкалам картина меняется — мужчины демонстрируют более высокую активность в поиске ответов по сравнению с женщинами (табл. 3). 

Пока неясно, является ли это устойчивым феноменом или найден локальный факт — нужно сравнивать различные выборки в дальнейшем. При этом рейтинг шкал, по которым ищут ответы, остаётся одинаковым для обоих гендеров: «Эрудиция», «Лексика» и «Вычисления» сохраняют лидерские позиции.

Время поиска. Анализ данных показывает наличие различий во времени поиска ответов: женщины демонстрируют более высокую скорость нахождения правильных ответов практически по всем типам заданий (диагр. 2).

Возраст респондента

Различий в рейтинге популярности шкал снова нет, состав пьедестала «призёров» не изменился — это шкалы «Эрудиция», «Лексика» и «Вычисления». Респонденты из возрастной группы «30–39» чаще ищут ответы по этим шкалам (табл. 4).

Время поиска. Анализ возрастных групп выявил недостаточное количество данных в категориях «до 20» и «50+», поэтому эти группы были исключены из визуализации. При этом ни одна из оставшихся возрастных групп не демонстрирует стабильного преимущества во времени поиска ответов по всем шкалам теста «ТИПС» — результаты варьируются без выраженного лидера (диагр. 3).

Вывод. Анализ данных показывает стабильную картину: респонденты чаще всего ищут ответы по четырём шкалам — «Эрудиция», «Лексика», «Вычисления» и «Пространственное мышление». Значимых возрастных или гендерных различий в частоте поиска не выявлено, однако обнаружено, что женщины в среднем тратят меньше времени на поиск ответов по сравнению с мужчинами.  

Для просмотра таблиц и диаграмм листайте галерею изображений (голубая стрелка вправо).

Как найти «подсматривающих» по данным о переключениях

Теперь разберём, как администратору тестирования, используя стандартные функции, выявить различия между ответственными респондентами и теми, кто активно ищет ответы. Один из практических вариантов — анализ данных столбца «Переключения» в анкете.

Проиллюстрируем на примере. Возьмём результаты тестирования сотрудников одной компании с филиальной структурой, которое проводилось для оценки потенциала подразделений. Всего было протестировано 663 человека.

Сгруппируем данные по столбцу «Переключения» на три категории: «Нет переключений» — идеальный сценарий; «До 11 переключений» — допустимый уровень, вероятно вызванный всплывающими окнами или системными помехами; «11 и более переключений» — явный признак активного поиска ответов.

Такая группировка позволяет выделить подозрительные сессии и сравнить результаты тестирования между группами, оценив потенциальное влияние подглядывания на итоговые баллы. Что видим в результате:

Таблица 5. Группировка данных по столбцу «Переключения», раздел «Анкета» в системе Maintest

Переключения Количество
Нет переключений 225
Переключений 11 и более 283
Переключений до 11 155


Теперь построим график распределения результатов тестирования — сгруппируем данные по столбцу с переключениями и исключим промежуточную группу «До 11 переключений». Это позволит визуально сравнить две крайние группы: тех, кто не совершал переключений (честные результаты), и тех, у кого было 11 и более переключений (активный поиск ответов).

Для наглядности наложим на график кривую нормального распределения — это поможет сразу увидеть, смещены ли результаты группы с высокими переключениями в сторону завышенных баллов, что будет свидетельствовать о систематическом списывании.

График 1. Переключения: плотность распределения результатов для всех шкал теста «ТИПС»

Визуализация наглядно подтверждает различия между группами по ключевым шкалам — «Эрудиция», «Лексика», «Вычисления» и «Пространственное мышление». Особенно интересная картина наблюдается в шкале «Пространственное мышление» для группы с 11+ переключениями: график показывает два выраженных пика распределения.

Первый пик соответствует высоким результатам (вероятно, успешное списывание), но второй пик расположен левее медианы — это указывает на то, что даже активный поиск ответов не всегда даёт преимущество: часть респондентов демонстрирует результаты ниже расчётного среднего для теста.

Оценка финансовых рисков из-за списывания респондентов

Далее мы рассчитали стоимость тестирования для группы из 663 человек из примера выше:

  • Общие затраты на тестирование — 617 916 рублей.
  • Расходы на недостоверные результаты — 42,7% (263 756 рублей).
  • Расходы на условно достоверные результаты — 23,4% (144 460 рублей).
  • Расходы на достоверные результаты — только 33,9% от общих расходов (209 700 рублей).

Пример демонстрирует значительные финансовые риски при проведении тестирования без контроля за достоверностью данных, то есть без использования системы прокторинга. 

Подробнее читайте в статье «Прокторинг: что нужно знать HR-у».

Резюмируем

  1. Респонденты стремятся приукрашивать результаты тех способностей, которые преимущественно можно и нужно развивать всю жизнь — это шкалы «Эрудиция», «Лексика» и «Вычисления».
  2. Проведение тестирования необходимо сопровождать информацией о формах контроля за достоверностью результатов, обязательно контролировать условия получения ответов. Хотя бы по количеству переключений в другие окна. В проекте тестирования иметь чёткие критерии достоверности и список мер для нарушителей с возможностью их применения.
  3. Дистанционное тестирование сопровождать прокторингом, аудио- и видеозаписью прохождения тестирования. Стоимость использования прокторинга может оказаться ниже, чем расходы на получение недостоверных результатов.
  4. Очное тестирование в присутствии администратора не теряет актуальности для достоверности результатов в критически важных проектах. При организации такого тестирования необходимо создать комфортную обстановку, рассказать, зачем проводится оценка, и провести подробный инструктаж по процедуре тестирования. Словом — создать условия, при которых респондент сможет и будет стремиться показать максимально высокие результаты.
  5. Склонность к приукрашиванию результатов тестирования не является особенностью конкретных демографических или профессиональных групп — это повсеместное явление, которое равномерно распределено среди респондентов независимо от пола, возраста, должности или опыта.


Материал подготовлен при участии Алексея Жердева, технического директора, и Владислава Козлова, младшего программиста.

0 комментариев
Написание комментария требует предварительной регистрации на сайте

Войти с помощью:

Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Продолжая, вы даёте согласие на обработку персональных данных
Комментариев пока нет, будьте первым
Хотите подобрать тест для оценки?

В нашем арсенале более 30 тестов оценки личностных, мотивационных особенностей, IQ, управленческого потенциала, рискованного поведения, самопознания и др.

Оставьте заявку на бесплатную консультацию специалиста!

Перейти в каталог тестов