Avec l’accélération de la transformation numérique des entreprises, la révolution du « Big data » est massive.
Qui peut négliger ce phénomène ?
L’exploitation des données, véritable « or noir du XXIème siècle », est essentielle pour assurer le suivi des performances, analyser les comportements des consommateurs ou identifier les opportunités de marché pour les entreprises.
Et cela évolue à toute vitesse : ainsi, les métiers de la data explosent avec de nouveaux postes qui naissent chaque jour ou presque…
Comment s’y repérer ? Comment suivre ?
Comment recruter votre équipe data de rêve ? Avez-vous bien l’équipe data optimale ?
En réalité, entre la théorie et votre réalité, il y aura de nombreuses nuances.
Car la véritable question est la suivante : de quelle équipe data avez-vous réellement besoin ?
Selon vos objectifs et vos moyens, la configuration de vos équipes seront forcément différentes. Il faudra forcément s’adapter à votre situation, vos besoins, votre budget.
Alors pour vous aider à y voir plus clair, creusons ensemble le sujet : de l’équipe de base à celle ultra sophistiquée, partez à la découverte de votre future équipe data.
La data, l’« or noir du XXIème siècle »
Google, Amazon, Facebook, toutes les grandes entreprises ont su se positionner très tôt sur la collecte et l’exploitation des données, bien avant que la data devienne une ressource centrale pour la stratégie des entreprises.
Depuis, la transformation digitale est passée par là : plus aucune entreprise ne peut se permettre de passer à côté d’Internet et de négliger la révolution du big data. Le big data, c’est cet « ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler » qui nécessite un ensemble de procédés chargés de collecter, stocker et traiter ces données en temps réel grâce aux spécialistes de la data et de leurs outils.
Ces données, produites en flux continu par les ordinateurs, ou directement mises en ligne par des millions d’internautes ou salariés à travers les outils informatiques, le web, les réseaux sociaux, mais aussi de plus en plus les objets connectés (IdO/IoT) sont au cœur de nos pratiques du quotidien. Toutes ces données privées (noms, adresses, informations bancaires ou habitudes de consommation) de prestataires, clients, partenaires ou de salariés, confiés en interne ou sur Internet sont donc des biens précieux, source de création de valeur ou de perspectives, de stratégies pour en créer plus encore.
En quelques années, l’homme a créé plus de données que dans toute l’histoire de l’humanité :
Par la même occasion, ces données à collecter, analyser, traiter et exploiter ont créé de nouveaux métiers. La data est, depuis quelques années, source d’inspiration pour créer plus de richesses et fabriquer notre avenir.
Ainsi, la data science est actuellement une profession où la demande dépasse largement l'offre et ses métiers sont très recherchés : Data Scientist, Data Analyst, Data Engineer, Chief data officer, etc. Régulièrement, de nouveaux métiers data apparaissent et peuvent créer une confusion quant au choix des profils à recruter pour monter son équipe data.
Quels profils recruter ?
Monter son équipe Data, c’est comme recruter des musiciens. En musique, vous aurez de nombreuses possibilités : tout dépendra de votre budget, du nombre de musiciens et du style voulu.
Pour un groupe de rock : un batteur, un guitariste et un bassiste… et le tour est joué !
On peut bien sûr, rajouter quelques guitares pour monter en puissance mais dans le fond si vous avez le trio de base plus votre chanteur, c’est suffisant. Mais lorsque vous voulez dépasser le style brutal du rock et jouer sur du velours, il va vous falloir monter en gamme…
Du groupe pop à l’orchestre symphonique et ses 25 instruments, vous aurez alors de multiples possibilités selon vos besoins et vos envies.
Constituer son équipe Data, c’est un peu similaire : vous avez les 3 postes de base puis au plus vous souhaitez monter en objectifs et en compétences, au plus vous pourrez embaucher des postes plus précis et techniques formant alors comme un véritable orchestre.
Insistons sur le fait que tout dépendra, bien entendu, de vos objectifs et de vos moyens.
Plus l’entreprise va maîtriser les données et plus elle est capable de s’adapter aux enjeux économiques. La donnée devient le centre des réflexions stratégiques. Ce sont les organisations dites « Data centric » ou « Data oriented ».
Si, dans les grandes organisations, on tend à privilégier la spécialisation des experts data, certaines adoptant une approche « data centric », avec la constitution d’équipe compétente spécifique dotée de moyens technologiques…
La réalité est très différente dans les TPE/PME, petites ou moyennes structures, où l’on s’appuiera sur des généralistes, véritables couteaux suisses de la data, qui pourront endosser plusieurs casquettes à la fois.
En effet, en fonction du secteur d’activité ou de la taille de l’entreprise, toutes ne se situent pas au même niveau de développement ou de possibilités. Ainsi, si les banques, les assurances, les télécoms, la grande distribution et les gros donneurs d’ordres de l’industrie sont avancées, c’est moins le cas des petites entreprises.
Source :APEC 2020
Parmi les nombreux métiers de la data, certains sont des piliers incontournables pour traiter, disséquer et rendre utiles les informations. Les dernières années ont vu apparaitre de nombreux métiers liés à la data.
On peut cependant les classer rapidement en catégories :
- Il y a ceux que l’on peut qualifier de techniciens de la data.
Leur objectif ? Permettre un traitement efficace et sécurisé des données.
Ils vont mettre en place des infrastructures techniques pour récolter des données : par exemple, le Data Architect, le Data Engineer, le chef de projet BI et le Data Custodian, etc.
- On peut aussi parler des garants de la Data quality
Ils s’occupent de trouver et d’installer les outils qui assureront la qualité des données : par exemple, le Data Owner, le Data Quality Manager et le Data Protection Officer.
- On trouvera évidemment, les analystes de la donnée.
Ils balisent et facilitent l’accès des données aux différents métiers de l’entreprise.
Pour gérer, analyser et exploiter les données, Data Analyst et Data Scientist sont les métiers incontournables de la data.
- Enfin, les protecteurs chargés de la sécurisation des données : Data protection officer, consultant en cybersécurité, etc.
Dans ces métiers, 3 sont la base pour démarrer votre équipe data.
Les 3 profils incontournables :
Data Engineer, Data analyst, Data scientist
Source : https://www.data-bird.co/metiers-data/data-analyst
Pour permettre à la donnée d’être source de valeur, chacun de ces métiers sera le pilier et le garant de la réussite des missions des autres : extraire des données de qualité puis les analyser et les vulgariser, enfin en tirer des modèles capables d’offrir des possibilités de prédiction.
Nulle hiérarchie entre ces 3 métiers, forts diplômés, mais des rôles précis et une complémentarité évidente sur le « chemin de la donnée ».
Source : https://www.data-bird.co/metiers-data/data-engineer
1) Le Data Engineer, le bâtisseur
Le Data Engineer est un développeur informatique qui a pour mission de mettre en place la collecte, l’organisation, le stockage et la mise à disposition des données au sein de l’entreprise. Il met en place et gère les « pipelines » de données, Il est donc le responsable du “chemin de la donnée”, qu’il doit permettre d’arriver à bon port au Data Warehouse, un entrepôt de données, afin d’être ensuite manipulée.
Son rôle est important car de son travail dépend ensuite ceux de ses collègues : les Data Scientists et Data Analysts, qui pourront s’appuyer sur un système de données stables et optimisées.
Il a également la charge d’industrialiser et de mettre en production des traitements sur les données. Par exemple : mise à disposition de tableaux de bords, intégration de modèles statistiques en lien avec les équipes métiers et les équipes de data science qui les analysent.
Il met aussi à jour les systèmes existants avec des versions plus récentes.
Rôle : Extraction des données
- Acheminement de la donnée.
- Mise à disposition des données aux équipes
- Mise en production de modèles de statistiques dans les applications
- Suivi des projets et développement
Source : © DataScientest
2) Le Data Analyst, le vulgarisateur
Expert en statistiques, informatique et marketing, le Data Analyst traite les données d’une entreprise pour en extraire des informations. C’est un vulgarisateur ou un interprète des données.
Il intervient à la fin du chemin de la Data.
Il va exploiter toutes les informations utiles à l'entreprise pour l'aider à adopter la meilleure stratégie marketing, et répondre aux besoins des clients.
Pour se faire, Il crée et utilise des outils d’analyse qui donnent du sens aux données : il doit, par exemple, créer et modifier des algorithmes. De ces nombreuses données, il en tirera une histoire, sous forme de tableaux de bord, utilisables par les divers services : marketing, relations clients, production, etc., et ainsi en faire un levier de création de valeur.
Il est aussi chargé de construire des modèles statistiques facile à exploiter pour éclairer les services opérationnels (segmentations clients ou analyses prédictives). Il pourra alors déterminer des tendances ou des habitudes de consommation, ou transformer des données commerciales en données statistiques. Celles-ci permettant de répondre à des enjeux ciblés, et ainsi en faire un levier de création de valeur.
Il a des tâches assez proches du Data Scientist mais on le retrouve particulièrement dans celles exploratoires et descriptives
Rôle : analyse et exploitation des données
- Extraction et structuration des données.
- Analyse et exploration des données.
- Communication avec les équipes clientes.
- Veille technologique sur les outils d’analyse de données.
Source : https://www.data-bird.co/metiers-data/data-scientist
3) Le Data Scientist, le statisticien
Le Data Scientist résout les problèmes de son entreprise grâce à l’analyse de données et la mise en place de modèles (de Machine et Deep Learning) : il va ainsi développer des algorithmes d’apprentissage automatique et mettre ses compétences, ses connaissances en informatique ou en statistiques au service de la construction de modèles de machine learning.
Il sait alors « faire parler les données » et en fournir une interprétation claire dans l’objectif de trouver une réponse à une question donnée. C’est un métier proche de celui de chercheur.
Son rôle sera alors d’identifier les tendances et les modèles pouvant aider l’entreprise à prendre de meilleures décisions stratégiques : Il donne ainsi de la valeur à la donnée en la transformant en donnée stratégique et en permettant à l’entreprise de proposer de nouveaux services ou produits grâce à des modèles prédictifs.
Rôle : analyse et exploitation des données
- Extraction et structuration des données.
- Élaboration des algorithmes d’intelligence artificielle.
- Industrialisation des modèles d’intelligence artificielle dans les applications.
- Participation active aux projets.
- Veille technologique sur les outils de data science.
Attention à l’équilibre !
Comme on le constate, chaque profil a sa place et un rôle bien défini.
Cependant, ces distinctions ne sont pas toujours aussi claires ou respectées lorsqu’on cherche à monter son équipe ou département data. Il y a des contraintes techniques, budgétaires ou, tout simplement, des effets de mode qui expliquent parfois des choix de recrutement limités.
Convaincues de devoir recruter en data science, certaines entreprises ont pu parfois négliger d’investir en Data Engineers au profit de Data Scientists …
Résultats ?
De nombreux Data Scientists ont dû s’adapter et se transformer en Data Engineer pour créer les infrastructures permettant d’avoir des données stables et fiables avant même de commencer leur tâche spécifique d’analyse des données. Ainsi, au lieu de coder ou de créer des algorithmes, ils se retrouvent à passer du temps à remplir des rôles techniques éloignés de leur prérogative initiale. Si certains s’adaptent d’autres peuvent se décourager et souhaiter quitter l’entreprise.
Ce déséquilibre semble se résorber progressivement mais bien souvent, soit pour des raisons économique soit pour des raisons de méconnaissances des métiers data, les organisations embauchent des spécialistes des données pour leur confier ensuite des tâches d’ingénieurs.
Ainsi, dans la réalité des besoins sur le terrain, les entreprises sont plus souvent à la recherche de véritable touche à tout capables de jouer les couteaux suisses de la data sans trop se préoccuper des rôles respectifs de chacun.
Dans l’idéal, il faudrait au contraire bien répartir les rôles mais l’idéal n’est pas toujours dans l’ordre du possible, on le sait.
Par conséquent, ce sont les talents des métiers data qui s’adaptent en devenant de plus en plus polyvalent :
- Un Data Scientist va s’intéresser aux pipelines de données et à la mise en production…
- Les Data Engineers se spécialisent dans l’application de leur métier au Machine Learning…
- Un Data Analyst va renforcer ses connaissances en SQL…
Si l’on veut correctement monter son équipe data ou tout simplement bien recruter ses collaborateurs data, il faut déjà se préoccuper de définir ses besoins.
Quels sont vos besoins ?
- Si vos besoins en analyses sont simples, que vos données sont déjà fiables, structurées et organisées, alors c’est un Data Analyst qui vous sera utile.
- Si, à l’inverse, vous avez des données peu fiables et peu structurées, que la collecte de ces données est un calvaire, alors c’est un Data Engineer qu’il vous faut en priorité.
- Si vous ne savez pas interpréter ou utiliser vos données, c’est un Data Scientist qu’il vous faut.
Quel ratio ?
Jesse Anderson, auteur et spécialiste data du big data institute , propose le ratio suivant : il faudrait 2 à 3 Data Engineer pour chaque Data Analyst. Et lorsque les données sont plus complexes, il en faudrait 4 à 5. Ça c’est en théorie !
Le Ratio idéal serait donc : DE/(DA+DS)>1
On le sait, peu d’entreprises ont ce ratio avec autant de Data Engineer que de Data Analyst et Data Scientist. Si l’on ne veut pas que les analystes fassent le boulot d’ingénieurs, il faudrait pourtant trouver le bon équilibre.
Dans ce contexte complexe de guerre de talents ou de pénurie, la situation du marché de l’emploi est la suivante : Il y a plus d’offre de Data Scientists que de Data Engineers alors même que la demande en Data Engineers augmente. La formation de Data Engineer étant assez exigeante, une simple formation interne ne suffira pas pour transformer un Data Scientists en Data Engineers. C’est donc en collaboration avec les écoles et universités, qu’il faudra chercher les solutions et innover pour combler les déficits actuels.
Et le reste de l’orchestre ?
Nous avons pu décrire les 3 piliers nécessaires d’une équipe data mais d’autres métiers existent et apparaissent. Ils peuvent, par leurs tâches et rôles, augmenter les capacités du département data selon vos besoins.
- Le Data steward
Il intervient après le Data Engineer sur la chaine data.
C’est un contrôleur qualité et métiers des données. Il va s’assurer que les données soient présentes, conformes et comprises.
Sa mission est d’obtenir une donnée sûre et qualitative et dont l’utilisation sera optimisée. Pour mener à bien cette tâche, il va requalifier la donnée pour fournir le plus d’informations possible : nom d’origine, taille, dates de modification, provenance, niveau de confiance et statut de la donnée. Ensuite, il met ces données vérifiées et validées à la disposition des data scientists ou chefs de projets, ou tout autre utilisateur.
- Data architect
L’architecte Data, fait partie des métiers de la Data les plus techniques.
Il a pour mission d’optimiser la collecte et le stockage de données numériques internes ou externes à l’entreprise. Le Data architect intervient donc en amont du traitement de la donnée et choisit les meilleures solutions techniques pour construire une architecture de gestion des données.
C’est à lui de renouveler, grâce à sa veille technologique, les outils de collecte et de gestion des données en tenant compte des usages, des coûts et des objectifs de qualité. Il doit aussi s’assurer que les solutions mises en place sont en accord avec Le règlement général sur la protection des données (RGPD).
Rattaché à la direction des systèmes d’information de l’entreprise, il travaille avec les Data Engineers, qui s’occupent des solutions de gestion des données, et les Data Scientist, qui analysent les données brutes collectées.
- Chief analytics officer
Il est le responsable travaillant en étroite collaboration avec le Directeur des Systèmes Informatique et/ou d'Information (DSI ou CIO) pour transformer les analyses data en décisions. Il organise, synthétise et traduit ces informations puis repère les plus cruciales et fiables afin que l’entreprise puisse prendre de bonnes décisions.
Pour y arriver, Il va piloter le choix des organisations et de méthodologies statistiques mais aussi exploiter des outils informatiques et méthodes statistiques (y compris la data science) pour permettre d'organiser, synthétiser et traduire efficacement les données.
Il est parfois considéré comme interchangeable avec le Chief Data officer (CDO)
- Le consultant Data visualisation (ou datavaz), l’artiste
C’est un artiste de la donnée. Il est le storyteller de l’entreprise : il exploite et donne du sens aux données par des choix simples de visualisation. Il va présenter les données stockées et complexes d’une entreprise sous forme de tableaux et de graphiques, afin de les rendre compréhensibles et accessibles à tous.
C’est à la fois un développeur créant des applications de data visualisation et un expert en outils de data visualisation faisant ainsi du reporting et storytelling sur les données.
- Le DataOps Engineer (Date Lake/big data), l’ingénieur DataOps
Il est le chef de production de l’équipe. C’est lui qui pilote et automatise le pipeline d’analyse de données en production, et vérifie la disponibilité et la performance des systèmes. Il promeut les fonctionnalités de la production et automatise la qualité, toujours en lien avec le Data Engineer.
Il est responsable de l’environnement de développement des données et créent les outils que les ingénieurs et les analystes de données utiliseront durant le développement. Il ne travaille donc pas directement avec les données.
- Le Data protection officer (DPO) ou délégué à la protection des données (DPD)
Il est chargé de la bonne application, du Règlement général sur la protection des données (RGPD). Il vérifie que les données de l’entreprise soient bien gardées et sécurisées conformément au niveau de sécurité informatique établi.
Le Data protection officer (DPO) a une mission d'information, de conseil et de contrôle de la gouvernance des données (notamment personnelles).
En France, il succède au Correspondant Informatique et Libertés (CIL).
- Le chief data officer (CDO), Le chef d’orchestre
Il existe de nombreuses variantes du titre telles que CAO (Chief Analytics Officer), CDAO (Chief Data & Analytics Officer), CDIO (Chief Digital Information Officer), etc.
Il est le chef d’orchestre d’une transformation data centric de l’entreprise : il doit trouver les plateformes, logiciels de Data & Business Intelligence adéquats pour que chacun puisse effectuer des analyses efficaces. Il a comme mission d’assurer cohérence et accessibilité des données et a la responsabilité de leur qualité et de leur cohérence.
Sa fonction croise donc celles d'autres métiers comme le contrôleur de gestion, le directeur informatique (DSI) ou le responsable des activités opérationnelles.
Il officie en étroite collaboration avec tous les spécialistes des données au sein de son entreprise. Il coordonne ainsi le travail de l’équipe data et s’assure de la bonne transmission entre les différents métiers de l’entreprise.
La liste n’est pas exhaustive et les métiers de la data ne cessent de se renouveler à la vitesse de l’évolution des techniques et des besoins des entreprises. Vous l’aurez compris, selon vos besoins et vos capacités économiques, vous pouvez soit vous contenter d’embaucher les piliers des métiers data (data engineer, data anlytics, data scientitst) en optant pour un ratio équilibré d’effectifs soit vous pouvez étoffer votre équipe et créer un véritable département data qui sera relié à tous vos métiers pour leur apporter toujours plus de précisions et d’éclaircissement sur les données et leur sens. Du simple rock band à l’orchestre philarmonique, vous avez le choix, que vous soyez une petite et moyenne entreprise ou une très grande.
Attention, certains métiers sont rares… On vous souhaite de trouver votre équipe data de rêve !
Si vous avez besoin de collaborateurs data, n’hésitez pas à nous contacter.
par Edmond Kean
Plus d’articles de la catégorie
Inscrivez-vous à notre newsletter
Votre adresse électronique est uniquement utilisée pour vous envoyer les actualités du groupe Anywr. Vous pouvez à tout moment utiliser le lien de désabonnement intégré dans la newsletter.