single

     

Mettre la data science au service des Métiers

LE DATA SCIENTIST, UN STATISTICIEN QUI S'EST MIS A LA DATA ?

Christelle Jason (PMU) pose la question. « Data scientist, est-ce réellement unnouveau métier ? Un data scientist n'est il pas simplement un statisticien qui se serait fait "uberisé" ? Au-delà de la richesse technique, la nouveauté ne saute pas aux yeux... » Selon Clément Carrier (Caisse des Dépôts), « un data scientist est une personne qui a une formation de type ingénieur en mathématiques ou en informatique. Un data miner a, quant à lui, bénéficié d'une formation moins scientifique. Afin de passer du data mining à la data science, il convient d'avoir un bagage mathématique suffisant.

Mon objectif, c'est que le métier exprime clairement ses problématiques. Ensuite, il s'agit pour nous de voir si on peut répondre à ces besoins grace à la manipulation de la donnée. Il nous faut donc être proches des métiers, mais aussi proches de l'IT. » Ainsi, chez Air France KLM, le département IMO Sales, Data & BI, « positionné côté métiers », « intègre dorénavant des data scientists dans [ses] équipes. » Sa directrice Francine Quentel s'en explique.« Jusqu'à il y a peu, nous n'avions besoin que de business analysts situés sur de la donnée "classique", ou structurée. Puis, il y a dix-huit ou vingt-quatre mois environ, nous avons clairement ressenti le besoin de monter en compétences sur la partie big data, de par la nécessité de nous rapprocher des besoins métiers du pôle Commercial. » Pierre-Yves Hémon, (Barclays Pank Plc), résume en ces termes. « Justement, la mission du data scientist ne se rapporte pas exclusivement à la technique... Il doit être en mesure de réaliser le trait d'union entre deux mondes : c'est un marketeur qui sait faire des statistiques. »

TROUVER LES BONS PROFILS...

Beaucoup partagent le constat de Francine Quentel (Air France KLM). « Il s'avère difficilede recruter ces profils » doté d'une double sensibilité. Pour Aurélie Rossignol (Boursorama), un gisement de talents existe déjà dans les entreprises. « Selon moi, le data scientist détient une brique technique plus avancée que le data miner. Il est possible de faire monter ce dernier en compétences, puisque la data science est un prolongement du data mining. Les racines sont communes. » D'ou que les talents proviennent, il s'agit de les alimenter au long cours en missions intéressantes et de les doter des outils pour le faire. Chez M6, témoigne Karim Louedec,« le data lake est là pour que les data scientists puissent s'exprimer pleinement.

Certes, il représente un investissement lourd par rapport à une DMP, mais c'est indispensable. Les effets apparaissent déjà pour le programme data d'M6, avec par exemple le déploiement de nouveaux dispositifs publicitaires (qu'il aurait été impossible à mettre en place avec une simple DMP), ou un nouveau module de recommandation de programmes en replay... »

... ET LA BONNE POSITION

Trait d'union entre deux mondes, ou placer le data scientist dans l'organisation ? Aurélie Rossignol (Boursorama) illustre ce dilemme. « Des projets data ont été menés par les équipes BI, à travers des PoCs transverses sur différents sujets : détection d'alertes sur le SI, lutte contre la fraude, thématiques marketing... Ensuite, nous sommes passés en mode projet, puis à la phase d'industrialisation. Aujourd'hui, nous recherchons des ressources supplé-mentaires : architectes et data scientists. Faudra-t-il placer ces profils au métier ou bien à l'IT ?» Car « l'enjeu, rappelle Xavier Le Roy (Chanel Parfums Beauté), consiste à connaître toujours mieux le marché au sein duquel nous évoluons, d'y voir toujours plus clair. Ces enjeux concernent à la fois le marketing et l'aspect industriel. Recouper les données permet d'apporter des pistes de réponses. »

On l'aura compris, ce nécessaire recoupement implique de placer le data scientist dans un environnement décloisonné. D'ou l'avertissement de Philippe Toublant (TF1). « Un data scientist doit disposer d'un espace de créativité au sein duquel il peut s'exprimer avec une certaine liberté. Le pire écueil serait de placer le data scientist au sein d'un environnement cloisonné. »

FACE AU DEFI DU PARTAGE, LES OUTILS...

Partant du principe qu'une « équipe data doit rassembler trois niveaux de profils : des experts de la data marketing, des mathématiciens branchés au SI et des informaticiens », Philippe Toublant (TF1) estime que « la toute première étape pour briser les silos, c'est de mettre en place un data lake. » Il le décrit en effet comme « un espace ou vont se croiser toutes les données, qu'elles soient internes ou externes » et prévient qu' « en amont de chaque projet, il s'agit de bien s'assurer que, dans les faits, la donnée A pourra bel et bien être croisée avec la donnée B. » Céline Carpeau (fifty-five), « recommande en effet de mettre en place un data lake en amont de tout projet Data Management Platform.» Car « un data lake permettra de nourrir la DMP de manière très pertinente. »

LA GOUVERNANCE...

Pour créer ce décloisonnement essentiel au data scientist, aux outils devront se succéder la mise en place de règles d'accès à la donnée à la fois claires, sûres et facilitantes. Chez PMU, rapporte Christelle Jason, « la plus grande problématique qui se pose à nous concerne la question de la gouvernance... Tout le monde a son mot à dire sur les données : le marketing, la finance, l'informatique, etc. Il convient donc de mettre en place une gouvernance efficace, tout en prenant en compte la question de la montée en compétences des métiers. »

Tout comme Francine Quentel (Air France KLM), de nombreux décideurs de grands groupes plaident pour la création d'un poste de Chief Data Officer, qui « serait un vrai plus pour tendre vers une vision réellement data-centric. On a tendance à craindre la décentralisation de la donnée, car on peut y voir un risque de duplication des data. Sans CDO, la gouvernance restera toujours assez bancale... »

Avec ou sans CDO, Philippe Toublant (TF1) insiste sur la nécessité de placer l'équipe data « le plus haut possible dans l'organisation afin de pouvoir intervenir légitimement dans les différents domaines de façon transversale. C'est ce positionnement nouveau qui a permis de lancer réellement de grands projets. » Auparavant, les différentes initiatives venaient buter sur le fait que les données étaient disséminées dans chacune des filiales, avec un phénomène de silotage. L'enjeu du rattachement de l'équipe data à un haut niveau hiérarchique a donc permis de « proposer un usage véritablement partagé de la donnée. »

ET DE NOUVEAUX MODES DE FONCTIONNEMENT

Reste à mettre en mouvement les outils et la gouvernance. C'est le test & learn et la culture de l'exploration qui doit être encouragée. «En outre, poursuit Philippe Toublant (TF1), il ne faut pas avoir peur de ne pas réussir. Acceptons le fait que certains pans du projet vont échouer, soit parce qu'on ne dispose pas de la donnée nécessaire, soit parce que le modèle est trop complexe... »

Céline Carpeau (fifty-five) prolonge l'observation. « La phase d'itération se révèle absolument indispensable. Un travail d'aller-retour doit être mené entre le marketing et l'exploration data. Ces phases peuvent notamment permettre de découvrir de nouveaux enjeux inattendus, d'adresser des KPIs différents... »

Enfin, si data scientists et utilisateurs métiers doivent avancer ensemble, il convient qu'ils soient alignés sur les bons KPIs. « Tout passe par les KPIs, juge Karim Louedec (M6), qui permettent de valider ou non le fait que le modèle choisi soit bon. Les data scientists partent du principe que ce qui s'est fait dans le passé arrivera de nouveau dans le futur. Par exemple, sur le module de recommandation, avant même de lancer le projet, nous tenons à définir clairement les KPIs que nous suivrons et qui détermineront la réussite du projet. »

EMBARQUER LE METIER

Les data scientists ont certes besoin de s'exprimer. Il ne s'agirait pas d'oublier, pour reprendre les termes de Christelle Jason (PMU), de «[prendre] en compte la question de la montée en compétences des métiers ». Chez Boursorama aussi, « au quotidien, l'enjeu consiste également à embarquer les métiers sur les sujets data. »

Karim Louedec (M6) partage une piste. « Pour le moment, le data lake et les data scientists ont pour ambition principale de montrer la donnée aux métiers. Nous réunissons sur la plateforme 6Play environ 14 millions d'inscrits. Qui sont-ils ? Comment les faire revenir un peu plus souvent ? La première étape consiste donc à mettre à disposition des dashboards. » Benoît Rigaut (Chanel) observe lui aussi que « la capacité à prendre des décisions orientées sur la data est devenu un enjeu majeur. Il s'agit d'"unlocker" la data par la data visualisation. Aujourd'hui, les outils avancés de data visualisation permettent d'aller bien plus loin qu'un dashboard classique. »

Pour consulter l'ensemble du livret, cliquer ici