Article mis à jour le 13/09/2018
[Le contenu qui suit est un extrait du chapitre 17 du livre “Le SIRH – Enjeux, projets et bonnes pratiques“,
Une affaire de Big Data RH
Le Big Data (« datamasse » ou « mégadonnées » en Français) désigne les masses toujours plus importantes de données générées, collectées et traitées par les organisations. En 2020, le volume des données créées chaque seconde sera de 50 000 gigaoctets (tandis que le volume quotidien de données créé au niveau mondial était de 100 gigaoctets en 1992).(Source [1]).
Le concept et les données qu’il englobe sont connus pour être caractérisés par une trilogie de V :
- un grand Volume de données sont traitées,
- ces données sont Véloces, c’est-à-dire non structurées,
- il existe une Variété significative de données qui requiert une grande capacité et rapidité d’exécution.
La promesse du « Big Data (RH) » est de disposer de manière rapide des informations pertinentes, de simplifier l’accès aux données et de contribuer à la structuration de nouveaux savoirs, utiles à la gestion du facteur humain dans l’organisation.
La datamasse des réseaux sociaux du grand public et son usage possible dans le SIRH : Du marketing aux RH prédictifs
Au tout début de l’informatisation de la gestion des ressources humaines, les seules données exploitables pour la gestion du capital humain de l’entreprise consistaient en des indicateurs sociaux extraits du SIRH au moyen de requêtes (plus ou moins fastidieuses à réaliser d’ailleurs) dans la base de données. Il appartenait ensuite aux professionnels RH de comparer ces informations avec les résultats publiés dans des études ou enquêtes réalisées par des sources externes à l’entreprise dont le périmètre était tantôt international, national ou régional (CREDOC, INSEE, CESE, etc.). Lorsque ces données étaient croisées, les analyses portaient sur des informations morcelées et une période révolue. Partir d’un constat a posteriori pour faire de la prospective requérait alors un talent particulier…
Aujourd’hui, des entreprises réunissent des données sur nos comportements (en ligne et dans la vraie vie) afin d’anticiper nos envies et de nous proposer des offres adaptées à nos styles de vie, envies et mots clés. Dans l’émission Demain la veille (du 27/11/2016) dédiée à l’éloge du hasard, Hubert Krivine, Eric Sadin, et Sylvie Catellin ont été invités à répondre à la question suivante :
« Peut-on craindre que tout soit prévisible à l’avenir, grâce au big data et qu’il n’y ait plus de place pour le hasard ni les imprévus ? ».
La multiplication des données disponibles et la variété des outils disponibles permettent désormais aux responsables RH et SIRH de :
- réaliser des analyses prédictives,
- de fonder leurs décisions sur des faits pour piloter plus finement le recrutement, la formation, la gestion des compétences,
- et aussi identifier les axes d’optimisation de la performance individuelle ou collective (réduire l’absentéisme, améliorer les conditions de travail, évaluer le climat social, limiter le nombre de démissions…).
Le Big Data, une des tendances RH de 2017
Les données issues des réseaux sociaux d’entreprise et leur usage possible dans le SIRH
Les données non structurées échangées en dehors de l’entreprise, sont l’illustration du développement de l’intelligence collective et de la connaissance dans le monde numérique. Pour l’entreprise, ces données non-structurées peuvent être une nouvelle source de création de valeur, si tant est qu’elle soit en capacité de la capter, de la structurer et de l’exploiter.(Source [3] P39).
Selon François Geuze, la différence entre informatique décisionnelle et big data peut se résumer ainsi :
- L’informatique décisionnelle utilise des statistiques descriptives pour mesurer les phénomènes, détecter des tendances, etc.
- Le Big Data consiste en l’utilisation de statistiques inférentielles pour identifier des lois qui expliqueraient des corrélations entre les différentes variables étudiées. Avec le « Big Data », la dimension prédictive prend toute son importance, à la condition, bien sûr, de savoir faire la différence entre une corrélation et une causalité !
En effet, une corrélation n’établit pas une causalité et, ceux qui confondront ces deux notions s’exposeront à de vertes remontrances de la part des membres des comités scientifiques. Par exemple, il existe une forte corrélation entre la consommation de glaces et la criminalité. Cependant, manger des glaces ne rend pas criminel ! C’est la chaleur, en été, qui est la cause commune de ces deux changements. Méfiez-vous donc des articles sur le Big Data RH qui tirent des conclusions trop hâtives d’une simple corrélation. (Voir la définition d’une corrélation[1]).
Les connecteurs, technologies et outils d’exploitation des « mégadonnées »
La logique du « Big Data », qui dépasse celle de l’informatique décisionnelle et du HR Analytics, nous permet d’identifier des corrélations entre variables que nous n’aurions pas spontanément pu envisager.
Les technologies du Big Data permettent de combiner l’utilisation des bases de données du « legacy », et de données contextuelles et volatiles, parfois peu structurées (navigation sur Internet par exemple), et de réaliser des contrôles en temps réel. La frontière traditionnelle entre les fonctions « front-office » (intégrant beaucoup de fonctions d’acquisition de données) et les fonctions « back-office » et de pilotage a donc tendance à s’estomper. Plus les données seront accessibles simplement, plus elles seront utilisées. Et, plus elles seront utilisées, meilleure sera leur qualité et plus l’entreprise sera en situation d’en tirer de la valeur. (Source [3] P41).
Les algorithmes contenus dans les programmes informatiques permettent de faire apparaître des corrélations significatives (c’est-à-dire la présence effective de relations entre ces variables). Ces algorithmes s’enrichissent progressivement de nouvelles règles qui sont à leur tour intégrées au système.
Avec une ouverture vers des possibilités de simulation, les systèmes d’information (dont les SIRH) sont donc en train de muter pour devenir des systèmes plus intelligents, adaptatifs et évolutifs, capables également de réaliser des prédictions. Ils permettent d’identifier les variables qui ont un impact sur la survenance de l’événement, et celles qui n’en ont pas. Ils sont capables de prendre en compte des dizaines (voire des centaines) de variables liées aux caractéristiques des individus et des organisations.
L’utilité du « Big Data » réside dans la grande capacité de traitement des données avec le soutien de la statistique pour identifier les variables véritablement significatives, toute première étape incontournable de l’élaboration d’un modèle prédictif. Une fois ces variables identifiées et les éventuelles corrélations entre elles examinées, il est possible de les regrouper en grandes familles puis, de mettre en place des plans d’action pour réguler les dysfonctionnements constatés, ou encore anticiper l’impact de la variation d’une ou de plusieurs variables sur les résultats finaux.
On peut s’intéresser, par exemple, à l’absentéisme ou aux arrêts de travail en prenant en compte un ensemble de variables liées aux contextes professionnels (métier, poste, rythmes ou conditions de travail), personnels (ancienneté, âge, temps de trajet, situation familiale, sexe, âge, nombre d’enfants, niveau de formation…), et organisationnels (volume d’activité, chiffre d’affaires, résultat net d’exploitation…).
Pour ce faire, certaines informations utiles sont certes présentes dans le système de gestion de la paie. Selon ADP (Source[2]), un gestionnaire de paie doit vérifier plus de 500 données de paie, et plus de 400 rubriques DSN par bulletin chaque mois.
Mais, d’autres données peuvent être issues des systèmes d’information de la production, des finances, etc. voire comme évoqué plus haut, de bases de données extérieures à l’entreprise.
L’intérêt de la maîtrise des techniques de « Big Data » pour l’exercice des missions RH est de faire face à la profusion d’informations en ordonnant ces dernières dans une logique clairement prospective afin de dépasser les évidences premières, d’anticiper les situations ou encore, d’identifier les réelles causes de dysfonctionnements.
Si l’utilisation du Big Data permet certainement de contribuer à l’amélioration des décisions collectives en offrant aux professionnels RH la possibilité de mieux connaitre les collaborateurs, il est important de se demander si les possibilités offertes par ces outils émergents sont compatibles avec les conditions éthiques et morales qui doivent entourer l’exercice de la mission des professionnels RH.
Sources et liens utiles :
- [1]Infographie : le big data en mots et en chiffres http://ow.ly/p3ry304GTsV
- [2]L’automatisation du contrôle de paie http://ow.ly/VpFm30759mG
- [3] Rapport CIGREF : Comment gérer les données de l’entreprise pour créer de la valeur ? Octobre 2014 http://ow.ly/RjzI3076UQd
- Comment le big data devient la pièce maîtresse des RH http://ow.ly/GleM306wDKh
- Big Data et ressources humaines, attention aux dérives http://bit.ly/2e1ptHN
- Big Data : Exemples d’applications concrètes pour la fonction #RH http://ow.ly/SiaL305vcZk
[1] La corrélation (r) : une corrélation positive entre deux items signifie une fréquence similaire de réponses entre ces deux items (exemple : plus les réponses à la question 1 sont fortes et plus les réponses à la question 2 seront fortes). Réciproquement, une corrélation négative entre deux items signifie une fréquence opposée de réponses entre ces deux items (exemple : plus les réponses à la question 8 sont fortes et plus les questions à la réponse 13 seront faibles). Attention, une corrélation montre simplement un lien dans l’évolution du schéma de réponse, pas le lien de cause à effet. L’interprétation d’une corrélation peut s’effectuer à l’aide du coefficient de corrélation de Bravais-Pearson (r). Il s’agit d’un indice entre 0 et 1 permettant de mesurer à quel point deux mesures ou deux variables évoluent ensemble. Une corrélation de 0 indique que les deux mesures sont totalement indépendantes l’une de l’autre, tandis qu’une corrélation de 1 révèle que les deux mesures évoluent parfaitement l’une avec l’autre. En psychologie, on considère que la corrélation est faible de 0,1 à 0,3 ; modérée de 0,3 à 0,6 ; forte de 0,6 à 1. Attention pour autant, une corrélation ne veut pas forcément dire que l’une des variables est la cause de l’autre. Par exemple, il existe une forte corrélation entre la consommation de glaces et la criminalité ; cependant, manger des glaces ne rend pas criminel ! C’est la chaleur, en été, qui est la cause commune de ces deux changements. Méfiez-vous toujours des études et articles de presse qui tirent des conclusions trop hâtives d’une simple corrélation.