single

     

Machine learning : l'automatisation de l'apprentissage

Ce processus d'automatisation de l'apprentissage (on parle d'apprentissage statistique) fait appel à des logiques d'intelligence artificielle pour mettre une machine en capacité d'assimiler elle-même des modèles à partir des données auxquelles elle a accès. Il ne s'agit donc plus de spécifier à l'avance un modèle de comportement, mais de laisser à des algorithmes le soin de construire eux mêmes ce dernier, en allant piocher dans un très large dictionnaire de modèles potentiels. Avec le machine learning, certains systèmes vont ainsi pouvoir améliorer leur performance prédictive, optimiser leur fonctionnement général, et gagner en clarté dans leur mode de représentation de la donnée.
Biométrie, prédiction des anomalies dans un système complexe, scoring, moteurs de recommandationet moteurs de recherche… Le nombre d'applications du machine learning ne cesse de croître, à mesure que la quantitéde données mobilisables augmente.
Se lancer dans le machine learning suppose toutefois de faire, d'une certaine façon, confiance à la machine, et de la laisser fonctionner en aveugle, sans être capable d'interpréter clairement son travail. Certains business et certaines structures d'entreprises se montrent plus propices que d'autres lorsqu'il s'agit de faire ce genre de concession, constatent Christèle Baranco(LCL) et Jonathan Badoux (AXA France) :

CES ROBOTS NOUS VEULENT-ILS DU BIEN ?

On a souvent tendance à opposer le modèle statistique et le machine learning, plus complexe et informatique. L'intelligence artificielle et tout ce que l'on peut en faire, ce n'est pas quelque chose que l'on avait l'habitude d'utiliser dans les métiers du marketing. Auparavant, on cherchait à obtenir des scores, qui soient utilisables concrètement par le métier final (scoring autour de l'appétence par exemple, sur des modèles de régression logistique). Depuis trois/quatre ans, ce qui change, c'est la mise en place, parallèlement à cette logique, de techniques de machine learning qui supposent de faire confiance à la machine, et aux résultats qu'elle obtiendra. Maintenant que le temps réel est devenu une notion cruciale pour les entreprises, celles-ci vont de plus en plus accepter de moins comprendre sur quelles variables se font les calculs qu'opèrent la machine, pour se concentrer sur les résultats de ceux ci.
Le machine learning est un élément nouveau de la transformation digitale des entreprises. Accepter de laisser une machine effectuer une recommandation et donc de sortir des idées marketing préconçues et 100% maîtrisées n'est pas simple à gérer dans un marché ou chaque acteur souhaite contrôle parfaitement son discours avec ses prospects/clients.Il faut donc passer par de l'éducation des équipes sur le fonctionnement de ces algorithmes afin que chacun puisse utiliser à bon escient les réponses proposées par ces mêmes algorithmes. Rendre interprétables par l'entreprise les progrès que font, dans leur coin, les machines, voilà l'un des grands enjeux du machine learning. Dans le secteur des telecoms, l'invention du Net Promoteur Score doit justement servir ce délicat objectif :

INTERVIEW : Bouygues Telecom Nicolas Gaude

Avec le machine learning, les machines apprennent, via différents outils mathématiques (réseaux de neurones, random forest, gradient boosting) à s'approcher le plus près possible de l'objectif qui leur est attribué. L'inconvénient, c'est que la façon dont on va influer sur la mesure n'est plus lié à un ou deux éléments clés (par exemple la satisfaction du client, le temps de réactivité avant la résolution d'un problème, bref, des métriques en interne), mais à une combinaison non linéaire de variables qui n'ont plus aucun sens explicatif (lignes de code produites, puissance consommée par le datawarehouse, etc).
Voilà pourquoi, pour rattraper le management, nous sommes contraints de créer des indicateurs composites qui vont incarner la performance (un peu comme le CAC 40 reflète la santé économique de l'industrie française). Le Net Promoter Score par exemple est ainsi, dans le domaine des telecoms, un indicateur composite accepté et approprié au management en ce qu'il permet refléter la capacité qu'a une marque à être recommandée par un individu lambda.

AVIS D'EXPERT : Romain Warlop data Scientist 55

Avec le machine learning, ce n'est plus l'homme qui donne des poids à chaque variable, mais l'algorithme qui les calcule en fonction des données observées. Ainsi ces poids, mis à jour à chaque nouvelle entrée de données, reflètent ce qui s'est réellement passé. Par exemple, un algorithme de machine learning dont le but est de scorer les utilisateurs va calculer les pondérations optimales en fonction des actions passées des utilisateurs pour prédire au mieux leur comportement de demain. Cependant le machine learning ne se fait pas sans l'homme.
En effet, pour avoir un bon modèle il faut une bonne connaissance du domaine d'application : si on demande au modèle de calculer les poids qui relient la quantité de lait qu'il y a dans mon frigo chaque jour au parcours des utilisateurs sur un site, il le fera… et le modèle ne sera sûrement pas très bon. Il faut donc une bonne expertise du domaine d'application pour nourrir le modèle avec de bons signaux et pour interpréter et valider les résultats.

AVIS D'EXPERT : Marc Damez-Fontaine Senior manager PwC

Des machines de plus en plus apprenantes
L'apprentissage artificiel (ou apprentissage automatique, « machine learning » en anglais) est une famille d'algorithmes dont l'objectif est la détection automatique de motifs dans un jeu de données, sans connaissance à priori sur ces données. Ces motifs forment un modèle et l'application de ce modèle à d'autres jeux de données permet de prédire un comportement. On appelle cela la capacité de généralisation du modèle d'apprentissage. Un algorithme d'apprentissage artificiel imite l'apprentissage humain dans sa capacité à reconnaître des comportements similaires lors d'expériences successives.
Il existe deux familles d'algorithmes d'apprentissage : supervisé et non-supervisé. La première est utilisée lorsque l'algorithme construit un modèle sur une variable de sortie particulière (ex : quel est le prochain article que mon client va acheter ?) alors que la deuxième effectue une découverte sans objectif (ex : que dit-on de mon entreprise sur les réseaux sociaux ?). Un algorithme d'apprentissage artificiel sera performant si et seulement si le nombre d'expériences (de données) est important et si la description des expériences (propriétés des données) sont significatives au regard de la tache d'apprentissage.
Une description appropriée de l'événement est un point crucial de la qualité de l'apprentissage. Les méthodes d'apprentissages les plus modernes telles que l'apprentissage profond (deep learning) sont capables d'extraire automatiquement les meilleurs caractéristiques descriptives des évènements (propriétés) si les données sont suffisamment nombreuses.
Le scoring ouvre les portes de la prédiction
Les méthodes de scoring sont un sous-ensemble des méthodes de machine learning. Batir un score consiste à exécuter un algorithme sur une base de données pour extraire un score de prédiction permettant de prédire un comportement futur des individus de la base. Par exemple, le score d'un client peut refléter ses intentions d'achat, ou ses intentions de quitter un service (churn). Les enjeux de généralisation et robustesse d'un modèle de scoring permettent de garantir que le modèle peut scorer correctement de nouveaux jeux de données ou des périodes futures d'activité.
Les méthodes de scoring possèdent 2 caractéristiques particulières. La première consiste à observer la distribution des scores. Ainsi, un palier ou une chute importante du score permet de cibler la quantité d'individus susceptibles de répondre correctement au modèle prédictif. On peut ainsi estimer plus facilement la pertinence d'un budget au regard d'une campagne de communication. La deuxième caractéristique est l'ordre induit par un algorithme de scoring. En effet, les individus ayant un score plus élevé sont plus facilement prédictibles que les individus ayant un score plus faible.