15.03.2017 Время чтения: 7 минут

КАЧЕСТВЕННЫЕ ДАННЫЕ В HR И ГДЕ ОНИ ОБИТАЮТ

Содержание

#IMAGE_0#


Уже ни для кого не секрет, что HR-аналитика находится в топе наиболее актуальных трендов последних трех лет. В своих ежегодных прогнозах про это писали и John Bersin, и Harvard Business Review, и Tableau, и Gartner. В 2016 году был составлен собственный Gartner’s Hype Cycle (известная кривая зрелости) для различных платформ по управлению персоналом, что являются неотъемлемой частью HR-аналитики и управлением талантами[1]. При этом, не смотря на обилие автоматизированных систем сбора и обработки данных, методология аналитики до сих пор остается недоступна бизнесу, она концентрируется в руках отдельных специалистов, которые понимают и производственный аналитический цикл, и стандарты сбора данных, и методологию обработки. Это порождает определенные проблемы, которые сильно увеличивают порог входа нового бизнеса в область People Analytics – необходимо в каждом отдельном случае перестраивать систему сбора и хранения данных, проектировать работу с СУБД (системами управления базами данных), понимать, какие данные необходимо собирать, а какие являются лишь информационным шумом, поскольку компании, которые не содержат своих аналитических отделов, совершают множество ошибок при выстраивании логики аккумуляции данных.

На самом деле же, самой большой ошибкой является полный отказ от аналитики, как от сложного процесса, который требует либо собственных специалистов в штате, либо внешних провайдеров услуг, которые, как правило, тоже стоят для бизнеса немало. В этой статье мы поговорим о том, какими бывают данные, и какие шаги необходимо совершить для того, чтобы переход к выстраиванию аналитических процессов в Вашей компании происходил наиболее безболезненно.

Там Царь Кощей над златом чахнет…


Фактически, в современном мире информация является драгоценным ресурсом. Данные, которые копятся в мире, являются орудиями – труда, повышения продуктивности. При этом, они же являются и товаром. Трудно недооценивать значимость данных для современного мира. В списках мировой платформы по инвестированию в стартапы AngelList в категории «Аналитика» на данный момент представлено 4752 стартапа со средней оценкой в 4.4 миллиона долларов[2]. При этом, не только компании, которые специализируется на аналитике, работают с данными. Революция в мире аналитики приводит к тому, что многие крупные компании открывают свои аналитические отделы. Некоторые становятся провайдерами и вендорами данных. При этом, очевидно, что все это поле «больших игроков», и, чтобы туда войти, нужно понять, какие данные собирать, и как они помогут именно Вашему бизнесу.

Предназначение аналитики в компании

Очевидно, что любая аналитика призвана отвечать на те или иные вопросы, которые возникают у бизнеса с целью повышения экономической эффективности. Если у бизнеса нет вопросов и понимания, зачем нужна аналитика, но есть данные – ценность таких процессов будет равна нулю. Очень редко майнинг данных без гипотез может принести хоть сколько-то значимую прибыль для компании. Таким образом, построение аналитических процессов компании начинается с вопросов, или, если угодно, – гипотез.

Логика построения аналитических процессов хорошо отражена в модели IMPACT, которая была предложена J.P. Isson[3]. Весь цикл аналитики начинается с определения вопросов, и только затем в игру вступают данные. При этом, Isson в соавторстве с J.S. Harriott выделяют основные домены возникновения вопросов.

#IMAGE_1#
Рисунок 1. Модель IMPACT. Взято с http://www.kdnuggets.com

В своей книге People Analytics in The Era of Big Data[4] выделяют структуру этапов, на которых бизнес чаще всего прибегает к помощи аналитики. Каждый этап требует своего подхода и планирования, требует определенных данных. Но, при этом, как можно заметить, данные этапы покрывают весь жизненный цикл работы с персоналом в компании – от понимания того, кого, откуда и как нанимать, продолжая тем, как персонал обучать и завершая тем, как персонал удержать.

#IMAGE_2#

Рисунок 2. Семь столпов HR-аналитики


После понимания вопросов, на которые необходимо дать ответ, как мы уже говорили, начинается работа с данными. Остановимся на этом этапе подробнее.

Типология HR данных


Данные о персонале отличаются от большинства типов и форм данных, поскольку они находятся на стыке экономической и психологической парадигмы мышления. Для начала, можно выделить две наиболее устойчивые категории: объективные и субъективные данные.

Традиционно, к субъективным данным относятся результаты нестандартизированной оценки, такие, как: результаты интервью, экспертные оценки, самоотчеты. Эти данные обладают ограниченным информационным ресурсом и подвержены искажению на всех этапах. Их трудно верифицировать, зачастую, они трудно поддаются предобработке, но при этом, без них на некоторые вопросы невозможно дать ответ.

К объективным данным относятся данные реального мира, которые отражают результаты деятельности сотрудников в более стандартизированном виде. Такие данные легко оцифровать, они легко поддаются осмыслению. К примеру, сюда можно отнести классические метрики, такие как стоимость человекочаса, экономический урон от абсентеизма сотрудника, данные о его перемещениях по GPS, психофизиологические данные с различных видов носимых устройств.

Но помимо перечисленных классов, есть еще типы данных, которые флуктуируют от одного полюса к другому, в зависимости от того, насколько стандартизованы инструменты для сбора этих данных. К данному пласту данных можно отнести практически все инструменты внутренней и внешней оценки – например: оценка компетенций, результаты прохождения различного рода тестирований, оценка по ключевым показателям эффективности. Фактически, то, к какому полюсу данные больше относятся, зависит от того, насколько валиден сам инструмент получения данных – насколько устойчива и согласована модель компетенций, насколько надежны психометрические методики, насколько валидна модель KPI. Зачастую, на практике, оказывается, что результаты различных оценок слабо связаны друг с другом, хотя, казалось бы, измеряют они одно и то же. И здесь демон кроется в деталях. Если проводить три оценки разными методами, два из которых обладают высокой валидностью и надежностью, а третий – низкой, мы получим противоречивые результаты, и до определённого момента будет неочевидно, каким данным можно доверять, а каким доверять не стоит.

Очевидно, что для построения высокоэффективной аналитики необходимы данные, которые будут максимально объективны. Однако, не все упирается в качество данных, стоит рассмотреть еще и их объемы.

Имеет ли размер значение?


В эпоху технологий Big Data, многие компании пугаются идеи HR-аналитики, поскольку их данные заведомо не могут называться большими. Однако это одно из глобальных заблуждений – для построения грамотной аналитики не обязательно иметь таблицы с миллионами строк (достаточно и сотни тысяч ;)). Технически, большие данные в HR сфере доступны лишь избранным компаниям, которые содержат огромный штат сотрудников, с многофилиальной формой организации бизнеса и строго отлаженной системой HR. В остальном же, Big Data технологии к миру управления человеческими ресурсами еще даже близко не подобрались.

Согласно определению, большие данные – это данные, которые подчиняются закону трех V – volume, velocity, variety[5]. То есть, фактически, это данные, которые копятся с колоссальной скоростью, занимают большие объемы и приходят из разных источников в разных формах. Для обработки больших данных разработана своя методология хранения и обработки, и, в строгом смысле, большие данные – не столько про объемы, сколько именно про методологию работы с ними. Для обработки массивов необходимы распределенные кластеры рабочих машин. Как правило, это все не касается HR подразделений среднего и большинства компаний из сегмента крупного бизнеса. Что же с этим делать?

Есть простой ответ – не гнаться за колоссальными объемами. Безусловно, есть нижние пороги для работы с данными: классические статистические методы не работают с совсем малыми выборками. Современные модели машинного обучения требуют больших объемов данных, но, при этом, не все упирается в объем. Главное – качество[6].

Что нас сдерживает?


Если собрать все вышесказанное, то можно составить образ качественных данных – это данные, которые служат для ответа на бизнес-вопросы, они объективны, содержат минимальное количество шума и максимальное количество полезной информации. Они не ограничены по объему, и при этом малый объем не является ключевым ограничением (если только Ваши таблицы не содержат 20-30 строк – тогда это действительно проблема). Данные должны быть многогранны, но релевантны бизнес-запросу. Если на этапе сбора данных держать все это в голове – то, с высокой долей вероятности, Ваши данные будут качественными, и их можно будет использовать для повышения эффективности Вашего бизнеса.

И напоследок…


Мы рассмотрели лишь малую часть технологического цикла аналитики, но, при этом, одну из самых важных – качество данных. В будущем, мы еще вернемся с Вами в увлекательные дебри HR-аналитики. А пока, прежде чем закончить, дадим несколько практических рекомендаций при работе с данными:
  1. Храните данные в системах управления базами данных. Безусловно, классические табличные редакторы очень удобны и интуитивно понятны, но в процессе накопления данных они гораздо менее гибки и гораздо менее устойчивы к ошибкам. Используйте технологии. Не важно, будут это SQL или noSQL хранилища, это зависит от потребностей Вашего бизнеса. Важно лишь то, что Ваши данные будут сохранять качество и технологии можно будет легко масштабировать и централизовать.
  2. Документируйте Ваши базы данных. Если есть данные – есть кодовая книга к ним. Если нет кодовой книги – появляются ошибки в заполнении и интерпретации. Кодовые книги необходимы для понимания того, что Вы собрали. В качестве примера можно привести European Social Survey – самое крупное социальное исследование в Европе. Любой раздел сайта, где хранятся данные, содержит кодовую книгу. Данные и документация должны идти рука об руку.
  3. Используйте современный инструментарий. Привычно использовать проприетарные (несвободные) программы, такие как SPSS или SAS, но при этом, они недостаточно гибки и их исходный код закрыт. Если Вы хотите получить максимальную пользу от аналитики – переходите на open-source решения – например, на различные языки программирования для статистических исследований – R, Python, Stata, Julia. Все это позволит Вам персонализировать аналитику и отвечать именно на Ваши вопросы.
Желаем Вам продуктивной аналитики!

Если у Вас есть вопросы – специалисты Лаборатории всегда готовы помочь их решить.

Источники:

[1] Helen Poitevin (2016) Hype Cycle for Human Capital Management Software

[2] angel.co

[3] Jean-Paul Isson (2014) The Impact Cycle – how to think of actionable insights

[4] Jean Paul Isson, Jesse S. Harriott (2016) People Analytics in the Era of Big Data: Changing the Way You Attract, Acquire, Develop, and Retain Talent

[5] C. O’Neil, R. Schutt (2013) Doing Data Science

[6] Maxwell Wessel (2016) You Don’t Need Big Data — You Need the Right Data





0 комментариев
Написание комментария требует предварительной регистрации на сайте

Войти с помощью:

Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
Комментариев пока нет, будьте первым
Хотите подобрать тест для оценки?

В нашем арсенале более 30 тестов оценки личностных, мотивационных особенностей, IQ, управленческого потенциала, рискованного поведения, самопознания и др.

Оставьте заявку на бесплатную консультацию специалиста!

Перейти в каталог тестов