25.08.2025 Время чтения: 10 минут

Виталий Федорченко

Управляющий проектами

Исследование: в каких тестах интеллекта респонденты чаще всего ищут ответы в интернете

Содержание:

Анализ поиска ответов в интернете: рейтинг типов вопросов и время переключения
Различия по полу и возрасту для поиска ответов
Как найти «подсматривающих» по данным о переключениях
Оценка финансовых рисков из-за списывания респондентов
Резюмируем

Для каких шкал интеллекта респонденты чаще всего ищут ответ во время тестирования? Чтобы это выяснить, мы проанализировали 949 результатов «Теста Интеллектуальных Способностей» (ТИПС): подсчитали количество переключений между окнами браузера, измерили время поиска ответов на вопросы, выявили гендерные и возрастные различия в поведении, а также оценили финансовые риски проведения тестирования, если не использовать прокторинг.

В отчёте представлены два кейса: данные из служебных файлов о переключениях окон во время теста и анкетные данные для визуализации шкал, по которым пользователи чаще всего обращались к подсказкам.

Анализ поиска ответов в интернете: рейтинг типов вопросов и время переключения

Для анализа взят 84 091 прокат вопросов теста, из которых мы исключили 76 032 проката без переключений в другие окна, затем удалили 2 599 прокатов с переключением менее 3 секунд (считаем как помехи тестирования) и прокаты с длительностью переключения свыше 70 секунд, так как тестовый плеер автоматически переключает задание.

В итоге для анализа времени переключений — как индикатора поиска ответов в интернете — осталось 4 424 проката вопросов.

Таблица 1. Количество предъявлений вопросов и переключений
Шкала	Всего тестир.	Без переключ.	Менее 3 сек.	Переключ > 3 сек.	Кол-во > 70	Взяты в анализ
Итого	84 091	76 032	2 599	5 460	1 036	4 424
Вычисления	12 138	10 706	592	840	172	668
Лексика	12 880	10 951	626	1 303	252	1 051
Эрудиция	12 875	10 894	441	1 540	115	1 425
Простр. мышление	11 741	10 937	271	533	131	402
Невербал. логика	11 403	10 934	203	266	73	193
Вербал. логика	11 696	10 867	263	566	197	369
Обраб.информации	11 358	10 743	203	412	96	316

Описание содержания столбцов:

Шкала — шкалы теста «ТИПС».
«Всего тестирований» — общее количество вопросов по каждой шкале.
«Без переключений» — количество вопросов для каждой шкалы, при ответе на которые респонденты не переключали окна браузера.
«Менее 3 сек.» — переключения окон, в том числе всплывающие окна других программ в системе. Тайминг выбран произвольно: по мнению автора отчёта, нельзя найти ответ в поисковике за время менее 3 секунд и внести ответ в систему тестирования. Система считает время в миллисекундах.
«Переключение > 3 сек.» — общее количество переключений с длительностью более трёх секунд. Как наиболее вероятная гипотеза — поиск ответов на вопросы.
«% от всего» — процент «Переключение > 3 сек.» от «Всего тестирований». Процент вопросов для каждой шкалы, для которых искали ответы.
Кол-во > 70 — тестовый плеер переключает задание на следующий вопрос, ответ не выбран.
Взяты в анализ — количество прокатов вопросов, которые были проанализированы.

Рейтинг шкал, для которых чаще всего идёт поиск вопросов для описанных выше условий: «Эрудиция» закономерно заняла первое место, а вот «Лексика» стала неожиданным открытием, сместив ожидаемые «Вычисления» на третью позицию. Замыкает рейтинг «Невербальная логика» — вероятно, из-за сложности формулировок, затрудняющих быстрый поиск ответов в интернете (табл. 1).

Полный рейтинг, медиана (средневзвешенное) и мода (MODA, наиболее частотное значение) времени переключения представлены в таблице 2.

Таблица 2. Расчёт метрик времени переключения: медиана и мода
Шкала	Взяты в анализ	Медиана, сек.	MODA, сек.
Эрудиция	1 425	10	5
Лексика	1 051	13	4
Вычисления	668	11	4
Пространственное мышление	402	12	4
Вербальная логика	369	13	5
Обработка информации	316	12	4
Невербальная логика	193	17	4

Анализ медианного времени поиска ответов показывает, что быстрее всего пользователи находят ответы по шкале «Эрудиция» — 10 секунд; на втором месте — «Вычисления» с результатом 11 секунд; третье место делят «Пространственное мышление» и «Обработка информации» с показателем 12 секунд.

Медленнее всего идёт поиск для шкалы «Невербальная логика» — 17 секунд. При этом показатели MODA практически одинаковы для всех шкал, что указывает на то, что большинство пользователей находят ответы в интернете с сопоставимой скоростью независимо от типа заданий.

Визуализация данных не выявила сенсационных открытий, однако обратил на себя внимание «большой правый ус» — значительный временной промежуток от медианы со стандартным отклонением до максимальных значений, — который наблюдался почти у всех шкал, кроме «Эрудиции», показавшей чуть более сжатый диапазон.

Различия по полу и возрасту для поиска ответов

Пол респондента

В исходной выборке из 949 тестирований женщины составляют 511 человек, мужчины — 436, и ещё 2 анкеты не указали пол. Таким образом, общее количество результатов тестирования женщин немного преобладает. Однако при подсчёте активного поиска ответов по шкалам картина меняется — мужчины демонстрируют более высокую активность в поиске ответов по сравнению с женщинами (табл. 3).

Пока неясно, является ли это устойчивым феноменом или найден локальный факт — нужно сравнивать различные выборки в дальнейшем. При этом рейтинг шкал, по которым ищут ответы, остаётся одинаковым для обоих гендеров: «Эрудиция», «Лексика» и «Вычисления» сохраняют лидерские позиции.

Время поиска. Анализ данных показывает наличие различий во времени поиска ответов: женщины демонстрируют более высокую скорость нахождения правильных ответов практически по всем типам заданий (диагр. 2).

Возраст респондента

Различий в рейтинге популярности шкал снова нет, состав пьедестала «призёров» не изменился — это шкалы «Эрудиция», «Лексика» и «Вычисления». Респонденты из возрастной группы «30–39» чаще ищут ответы по этим шкалам (табл. 4).

Время поиска. Анализ возрастных групп выявил недостаточное количество данных в категориях «до 20» и «50+», поэтому эти группы были исключены из визуализации. При этом ни одна из оставшихся возрастных групп не демонстрирует стабильного преимущества во времени поиска ответов по всем шкалам теста «ТИПС» — результаты варьируются без выраженного лидера (диагр. 3).

Вывод. Анализ данных показывает стабильную картину: респонденты чаще всего ищут ответы по четырём шкалам — «Эрудиция», «Лексика», «Вычисления» и «Пространственное мышление». Значимых возрастных или гендерных различий в частоте поиска не выявлено, однако обнаружено, что женщины в среднем тратят меньше времени на поиск ответов по сравнению с мужчинами.

Для просмотра таблиц и диаграмм листайте галерею изображений (голубая стрелка вправо).

Таблица 3. Рейтинг популярных Шкал для поиска ответов в интернете, количество мужчин и женщин

Диаграмма 2. Время поиска ответов: гендерные различия — Таблица 3. Рейтинг популярных Шкал для поиска ответов в интернете, количество мужчин и женщин

Как найти «подсматривающих» по данным о переключениях

Теперь разберём, как администратору тестирования, используя стандартные функции, выявить различия между ответственными респондентами и теми, кто активно ищет ответы. Один из практических вариантов — анализ данных столбца «Переключения» в анкете.

Проиллюстрируем на примере. Возьмём результаты тестирования сотрудников одной компании с филиальной структурой, которое проводилось для оценки потенциала подразделений. Всего было протестировано 663 человека.

Сгруппируем данные по столбцу «Переключения» на три категории: «Нет переключений» — идеальный сценарий; «До 11 переключений» — допустимый уровень, вероятно вызванный всплывающими окнами или системными помехами; «11 и более переключений» — явный признак активного поиска ответов.

Такая группировка позволяет выделить подозрительные сессии и сравнить результаты тестирования между группами, оценив потенциальное влияние подглядывания на итоговые баллы. Что видим в результате:

Таблица 5. Группировка данных по столбцу «Переключения», раздел «Анкета» в системе Maintest
Переключения	Количество
Нет переключений	225
Переключений 11 и более	283
Переключений до 11	155

Теперь построим график распределения результатов тестирования — сгруппируем данные по столбцу с переключениями и исключим промежуточную группу «До 11 переключений». Это позволит визуально сравнить две крайние группы: тех, кто не совершал переключений (честные результаты), и тех, у кого было 11 и более переключений (активный поиск ответов).

Для наглядности наложим на график кривую нормального распределения — это поможет сразу увидеть, смещены ли результаты группы с высокими переключениями в сторону завышенных баллов, что будет свидетельствовать о систематическом списывании.

График 1. Переключения: плотность распределения результатов для всех шкал теста «ТИПС»

Визуализация наглядно подтверждает различия между группами по ключевым шкалам — «Эрудиция», «Лексика», «Вычисления» и «Пространственное мышление». Особенно интересная картина наблюдается в шкале «Пространственное мышление» для группы с 11+ переключениями: график показывает два выраженных пика распределения.

Первый пик соответствует высоким результатам (вероятно, успешное списывание), но второй пик расположен левее медианы — это указывает на то, что даже активный поиск ответов не всегда даёт преимущество: часть респондентов демонстрирует результаты ниже расчётного среднего для теста.

Оценка финансовых рисков из-за списывания респондентов

Далее мы рассчитали стоимость тестирования для группы из 663 человек из примера выше:

Общие затраты на тестирование — 617 916 рублей.
Расходы на недостоверные результаты — 42,7% (263 756 рублей).
Расходы на условно достоверные результаты — 23,4% (144 460 рублей).
Расходы на достоверные результаты — только 33,9% от общих расходов (209 700 рублей).

Пример демонстрирует значительные финансовые риски при проведении тестирования без контроля за достоверностью данных, то есть без использования системы прокторинга.

Подробнее читайте в статье «Прокторинг: что нужно знать HR-у».

Резюмируем

Респонденты стремятся приукрашивать результаты тех способностей, которые преимущественно можно и нужно развивать всю жизнь — это шкалы «Эрудиция», «Лексика» и «Вычисления».
Проведение тестирования необходимо сопровождать информацией о формах контроля за достоверностью результатов, обязательно контролировать условия получения ответов. Хотя бы по количеству переключений в другие окна. В проекте тестирования иметь чёткие критерии достоверности и список мер для нарушителей с возможностью их применения.
Дистанционное тестирование сопровождать прокторингом, аудио- и видеозаписью прохождения тестирования. Стоимость использования прокторинга может оказаться ниже, чем расходы на получение недостоверных результатов.
Очное тестирование в присутствии администратора не теряет актуальности для достоверности результатов в критически важных проектах. При организации такого тестирования необходимо создать комфортную обстановку, рассказать, зачем проводится оценка, и провести подробный инструктаж по процедуре тестирования. Словом — создать условия, при которых респондент сможет и будет стремиться показать максимально высокие результаты.
Склонность к приукрашиванию результатов тестирования не является особенностью конкретных демографических или профессиональных групп — это повсеместное явление, которое равномерно распределено среди респондентов независимо от пола, возраста, должности или опыта.

Материал подготовлен при участии Алексея Жердева, технического директора, и Владислава Козлова, младшего программиста.

#Исследования #Прокторинг

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите ctrl+enter.

0 комментариев

Написание комментария требует предварительной регистрации на сайте

Продолжая, вы даёте согласие на обработку персональных данных

Комментариев пока нет, будьте первым

Похожие статьи

01.10.2025

Бумеры vs зумеры: отношение к работе и эмоциональное состояние

В статье-исследовании разбираем разницу поколений: их отношение к работе и эмоциональное состояние.

29.09.2025

Женское лидерство: в чём сила женщин-руководителей

Разбираем тему женского лидерства и особенности женщин-руководителей.

22.09.2025

Ключевые психологические предикторы карьерного роста

Статья-исследование предикторов карьерного роста от Ольги Бардиной, руководителя отдела исследований и разработок HT Lab.

24.07.2025

Что знает научное сообщество о проактивности. Обзор исследований

Разбираем подходы к пониманию проактивности, классификации проактивного поведения и взаимосвязь проактивности с другими конструктами.

23.06.2025

Что влияет на креативность: исследования, факторы, примеры

Можно ли развить креативность? Или это что-то, что либо есть, либо нет? Современная наука отвечает: можно. Разбираем топ-10 факторов креативности, подтверждённых мета-анализами и эмпирическими исследованиями.

13.03.2025 17:30:00

Лидерская Пятёрка Компетенций: как оценить потенциал карьерного роста с помощью одного инструмента

Разбираем на реальных данных, почему тест «ЛПК» — это валидный инструмент для оценки действующих и выявления потенциальных лидеров и руководителей. Материал основан на исследованиях связи результатов теста с полом, возрастом, образованием и уровнем должности.

04.03.2025 17:05:00

Критическое мышление и well-being: есть ли связь?

В статье разбираем современные исследования, чтобы понять, как уровень критического мышления связан с повседневной жизнью человека: настроением, восприятием стрессовых факторов, выгоранием и удовлетворённостью жизнью.

19.02.2025 16:09:00

Что знает научное сообщество о критическом мышлении. Обзор исследований

В статье разберём, какие когнитивные способности и личностные особенности включает в себя критическое мышление, о чём говорят эмпирические исследования и какие данные есть у нас.

30.09.2024 20:11:00

Исследование: чем отличаются руководители из разных сфер бизнеса

Есть ли разница между управленцами из разных областей? А если есть, то в чём она? В статье-исследовании рассмотрим протоколы тестирования руководителей и разберём полученные результаты

15.12.2023 18:08:00

Сравнение результатов «Бизнес-Профиля» с экспертными оценками в интервью по компетенциям

Результаты и выводы проведённого валидизационного исследования оценочной технологии «Тест-Ассессмент».

12.12.2023 16:17:00

Валидность методов оценки персонала: три важных мета-анализа

Анализируем три больших мета-анализа и пробуем ответить на вопрос, на какие методы оценки лучше опираться работодателю при отборе сотрудников.

10.08.2023

Пять заблуждений о руководителях

Результаты квиз-теста «Специалисты vs Руководители». Расскажем, в каких психологических факторах легко ошибиться при самостоятельном составлении идеального психологического профиля руководителя.

03.03.2023

Результаты опроса: эмоциональное состояние сотрудников в 2022 году

В статье делимся результатами проведённого исследования, вариантами работы с выгоранием по мнению HR и самих сотрудников, и данными из разных источников по этой теме.

27.07.2020

Прокторинг: что нужно знать HR-у

Прокторинг — это автоматизированная процедура наблюдения и контроля за дистанционным испытанием.

03.02.2020

ЛИЧНОСТНЫЕ ОСОБЕННОСТИ ПАССАЖИРОВ И ИХ ПРЕДПОЧТЕНИЯ ПРИ ИСПОЛЬЗОВАНИИ УСЛУГ ТАКСИ: РЕЗУЛЬТАТЫ ИССЛЕДОВАНИЯ

В данной статье хотим поделиться с вами результатами нашего исследования о том, как пользуются услугами такси люди с разными личностными чертами. Это небольшое пилотное исследование было направлено в первую очередь на подтверждение гипотезы о том, что характер клиента вносит свой вклад в потребительское поведение пользователей такси. Немного забегая вперед, приоткроем завесу: гипотеза подтвердилась. И чуть дальше мы расскажем о том, какие особенности характера оказались в данном случае значимыми и как проявились в поведении пассажиров.

23.08.2017 07:26:29

Дистанционное тестирование: где взять большого брата, который за всеми следит?

Технологии не стоят на месте, космические корабли бороздят просторы Вселенной, а провайдеры оценки персонала вот уже больше десятка лет как активно предлагают онлайн-тестирование вместо неудобного очного. Недостаток у онлайн-тестов только один – если ты сам не видел, как тестируется респондент, никогда нельзя быть уверенным в достоверности полученных результатов.

05.05.2015 06:38:37

Увольняющийся герой нашего времени — кто он?

Результаты исследования данных текучести персонала и их связи с результатами психометрических текстов.

Хотите подобрать тест для оценки?

В нашем арсенале более 30 тестов оценки личностных, мотивационных особенностей, IQ, управленческого потенциала, рискованного поведения, самопознания и др.

Оставьте заявку на бесплатную консультацию специалиста!

Перейти в каталог тестов