single

     

La solution BDAAS démocratise le Big Data

Au royaume du Big Data les GAFA sont rois (Google, Amazon, Facebook, Apple) et les NATU sont des super héros (Uber, Airbnb, Tesla, Netflix). Les données sont leur secret de beauté... et de performance. Pour les VIP du CAC 40, la Data Gouvernance prend une place grandissante. Et pour les autres ? Comment démocratiser les usages ? Accélérer ? Réduire les coûts DSI ? En utilisant un BDaaS managé. Aujourd'hui, les gains de performance et les résultats opérationnels générés par le Big Data sont estimés à 20 % voire plus. Les applications métiers sont multiples : innovation, connaissance client, amélioration de la production, sécurité, gestion des risques. En France, la moitié des entreprises de plus de 1000 salariés ont déclenché un projet Big Data en 2016, selon l'étude IDC/Atos.

Pour beaucoup pourtant, il peut y avoir des freins au déploiement d'une infrastructure Big Data : moyens humains, coût d'infrastructure matérielle et logicielle, stockage en Cloud (risque de perte de contrôle des données hébergées à l'étranger). Comment faire alors pour que l'efficience économique et sociétale ne soit pas uniquement l'affaire des grands ? Comment démocratiser le Big Data ?

EFFICIENCE ECONOMIQUE

Une solution existe aujourd'hui, le BDaaS. Le Big-Data-asa-Service a pour objectif de contourner l'obstacle du projet d'envergure, coûteux et long, qu'est la mise en oeuvre d'un écosystème Big Data, et la migration des données dans un Data Lake (lac de données), avant d'en extraire de la valeur via la Data Science. Comment ça marche ? Le BDaaS peut et doit être une solution managée. Cette option est fortement recommandée afin de maitriser les coûts d'usage de certaines plateformes. Le BDaaS permet d'externaliser l'intégralité de l'infrastructure Big Data et de ses services. Les coûts d'investissements en matériels, logiciels, maintenance et expertises techniques disparaissent.

SMART DATA, LE GRAAL

Pour l'entreprise utilisatrice d'un BDaaS, la clé est d'identifier ses propres Smart Data, ou données de valeur, qui répondent aux besoins exprimés par les entités métiers (site web, application mobile, systèmes opérationnels, objets connectés, capteurs). Près de la moitié des DSI sont concentrés sur cet objectif. Ils ont besoin de Data Scientists, des profils capables d'aller à la rencontre des professionnels sur le terrain afin de comprendre leurs activités et de récupérer les Data Source* pertinentes. La Data Science nécessite de s'approprier la vue métier pour obtenir les meilleurs résultats.

La plateforme BDaaS et sa suite logicielle va alors permettre l'exploitation de ces data en mode agile, en y associant si besoin des données externes (Open Data publiques, réseaux sociaux, données payantes). Les équipes clientes peuvent se faire accompagner pour élaborer leurs modèles prédictifs et utiliser le machine learning via un POV (Proof of Value) grace au BDaaS. Les Smart Data* permettront d'apporter de l'intelligence et de la valeur aux données. Ensuite, l'entreprise peut envisager le déploiement d'une architecture Big Data en interne : un excellent moyen de réaliser des projets pilotes, les fameux POC (Proof of Concept).

TEMPS REEL ET TEMPS DIFFERE

L'écosystème Big-Data-as-a-Service peut aussi être utilisé sur la durée dans le cadre d'opérations temps réel comme pour des modèles de détection de fraudes par anticipation, analyse comportementale et blocage de l'acte d'achat. Une autre application pourrait être des analyses de sentiments récurrentes autour d'événements via les réseaux sociaux, sur le thème des élections présidentielles, par exemple. Les possibilités sont infinies. Dans l'usage, l'administration des clusters de données est effectuée par le fournisseur de la plateforme. Passer par un BDaaS a le double avantage d'améliorer le business de l'entreprise par la création de modèles, et aussi de former les équipes clients grace à la pratique et aux échanges d'expertises avec les Data Scientists, Data Analysts et Data Architects du prestataire. Les serveurs dédiés au client sont facilement accessibles pour le déploiement d'un cluster Big Data. L'infrastructure logicielle s'appuie généralement sur l'écosystème Hadoop, près à l'emploi et optimisable en fonction des workflows. La plateforme contient déjà des sources de données externes pour enrichir les modèles prédictifs. Une interface d'administration permet de manager, de personnaliser et de faire évoluer l'ensemble.

DONNEES PRIVEES, LOI ET REGLEMENTATION

Les entreprises contractantes dans le cadre d'un BDaaS doivent s'engager à respecter les recommandations de la CNIL lors des transferts de données sensibles et hautement confidentielles qui concernent les particuliers. En France et dans d'autres pays de l'UE, les données de santé sont considérées comme des données sensibles : état de santé, risques potentiels de déclencher une maladie, numéro de sécurité sociale. Autres données sensibles : l'ethnie, l'origine, les opinions politiques, philosophiques et religieuses, la sexualité, etc. La CNIL recommande de crypter ces données, d'y appliquer des règles d'authentification fortes, de les stocker sur une durée limitée. L'usage des données métiers est soumis à la confidentialité et aux spécifications de sécurité internationale. Les transferts de données doivent être cryptés et anonymisés. Les données publiques issues des réseaux sociaux sont accessibles à tous, mais une compagnie qui serait amenée à les utiliser, ne doit pas aller à l'encontre du droit à la vie privée.

Article réalisé par Gabrielle Carta, Chief Marketing Officer chez Octopeek.
Pour consulter l'ensemble de l'ouvrage, cliquer ici