📌 Retour d’expérience basé sur nos missions terrain, chez nos clients…
Quelle que soit leur taille, la quasi-totalité des entreprises ont la volonté de mieux exploiter leurs données. Afin de parvenir à “industrialiser” une approche Data driven, l’acquisition ou la construction d’une plateforme Data est bien souvent un passage incontournable… et à risque ! Retour d’expérience de nos missions “terrain” chez nos clients :
Quel est l’intérêt de se doter d’une plateforme data ?
Un nombre croissant d’entreprises se lancent dans un projet pour se doter d’une plateforme de données.
C’est le moyen de pouvoir unifier, intégrer, analyser et partager des données, actuellement silotées dans leur système d’information, de manière sécurisée, gouvernée et conforme.
Cependant derrière le terme de plateforme se cachent plusieurs choix technologiques possibles, et parfois même complémentaires : datalake, datawarehouse, data hub,…
La plus grande différence entre ces types de plateformes est sans doute l’écart de structure entre les données brutes et les données transformées : les data lakes stockent généralement des données brutes non transformées, alors que les data warehouses stockent des données transformées et nettoyées.
La mise en œuvre de ces plateformes transverses est guidée par une multitude de principes et d’approches architecturales. Après trois décennies de bons et loyaux services, les data warehouse se sont retrouvés face à d’autres alternatives technologiques que sont les data lakes (apparus avec l’émergence du Big Data) et les data hub.
Au-delà des questions de nouveauté ou d’obsolescence, c’est sur l’utilisation future des données au sein de l’entreprise que doit se porter l’attention afin d’opérer les meilleurs choix technologiques et architecturaux.
Est-ce indispensable de se doter d’une plateforme data ?
Se doter d’une plateforme Data, au sens générique du terme, est une nécessité pour maîtriser ses données mais cela ne veut pas dire pour autant qu’il faut obligatoirement s’équiper d’une solution du marché.
Selon la taille et les objectifs de l’entreprise, plusieurs possibilités sont envisageables :
- Un premier pas peut être d’organiser et structurer ses données dans des fichiers tableurs. Ceci nécessite a minima de rationaliser et prendre du recul sur son périmètre de données.
- Il est également possible de développer en interne sa plateforme. L’approche Build VS Buy ne doit pas être écartée si vous bénéficiez de ressources internes ayant les compétences (et l’envie) nécessaires à la conception et la réalisation de la plateforme. Bien que plus complexe en terme de mise en œuvre, co-construire en interne permet une meilleure appréhension des flux de valeurs et assure une maîtrise de bout en bout. Cela n’empêche aucunement de travailler aussi avec/sur des solutions du marché.
- La plateforme data peut également être intégrée dans une suite logicielle data “light”, par exemple ReportOne.
- La solution la plus aboutie porte sur un outil du marché “pure player” des plate-formes data, telles que SnowFlake, DataBricks.
Tirer bénéfice de la future plateforme data nécessitera de disposer d’une solution efficace d’alimentation et de standardisation opérationnelle. C’est pourquoi nous recommandons d’entamer ce chantier préalablement au choix de la plateforme. Un des dictons de l’analyse de données est “Garbage In garbage Out”…
De même, l’expérience, parfois pénible, de devoir mener des preuves de concept (en anglais proof of concept, POC), avec les moyens actuels en attendant la future plateforme, se révélera en fait vertueuse. Elle permettra de mieux cerner les usages, la typologie de données manipulées … et les problèmes à régler avant l’intégration de la plateforme (ex : référentiel sémantique unifié).
Quels sont les points de vigilance pour choisir sa plateforme Data ?
Concernant la PLATEFORME DATA
- Le choix de la typologie de plateforme est aussi (sinon plus) important que la solution retenue in fine.
- Contrairement à un choix d’ERP, le nombre d’exigences est plutôt limité. Il est préférable de mener une étude adaptée pour se concentrer sur les exigences incontournables (les autres seront assurées du fait de la puissance des plateformes)
- Demander une démonstration de la plateforme en soutenance sur la base de quelques use cases n’a pas vraiment de sens : Il est préférable d’insister sur la démonstration concrète de l’administration de la plateforme afin de juger de sa facilité d’usage.
Concernant son INTEGRATION
- De grande différences de charges existent sur une même activité d’un intégrateur à l’autre (design, build, run…).
- Il est important de pouvoir échanger avec la (vraie) équipe projet en phase d’avant-vente, et ne pas se contenter des profils Commerciaux (même si sûrement très compétents).
- Il faut demander aux intégrateurs de justifier l’architecture cible qu’ils recommandent. Quelles autres solutions ont-ils étudiées ? Et pourquoi sont-elles moins pertinentes que la solution proposée ?
- Clarifier l’accompagnement post go-live (hypercare). C’est une fois le système lancé que l’on voit les premières anomalies et les ajustements à faire.
A tout égal par ailleurs, la maturité de l’entreprise en matière de gouvernance de la donnée est à prendre en compte dans le choix de la future plateforme. En effet, le niveau de compétences requis pour la bonne administration, peut être très différent d’une plateforme à l’autre.
L’évaluation de cette maturité permettra aussi de prévoir l’effort et la nature de conduite du changement à mettre en œuvre.
Et l’IA dans tout ça ?
La plus grande fausse idée est que vous pouvez facilement “utiliser l’IA sur vos données” et en voir la valeur du jour au lendemain. Construire un modèle d’intelligence artificielle qui apporte efficacement de la valeur à une entreprise est beaucoup plus complexe. Ce processus méticuleux implique la collecte, le nettoyage et la préparation des données afin de construire un modèle autour de ces données. Après de nombreuses itérations, le modèle est alors prêt à être implémenté.
METHODOLOGIE : Les bonnes pratiques
Quelle approche adopter pour choisir sa platefome Data ?
1
Mobiliser les parties prenantes
Identifier l’ensemble des parties prenantes au sein de votre entreprise, aussi bien côté Métiers (Data analysts, Data owners CRM / ERP / TMS, e-commerce, RH, finance, …) que côté DSI (architectes, gestionnaires de bases de données, RSSI,…). Les mobiliser au cours de la consultation est aussi un moyen de les préparer au changement qui les attend.
2
Cadrer les usages et les données
Identifier quels seront les usages dominants (Reporting, Business Analyse, Data Science, …) et les sources de données existantes qui seront utilisées et/ou qui seront à concevoir. La nature de ces données doit aussi être analysée ( structurées, semi-structurées, non structurées).
3
Penser l’architecture Data Cible
Ne pas se restreindre au seul périmètre des fonctionnalités des plateformes data envisagées : il est essentiel d’avoir au préalable une vue d’ensemble de l’écosystème data cible (ETL, Data viz, …) dans lequel la future plateforme va devoir s’intégrer et rendre possibles les usages visés (accès interne / publication externe)
4
Évaluer l’ensemble des coûts
Bien identifier tous les postes de coûts (sans oublier la conduite du changement) et s’assurer que les compétiteurs ont pris les mêmes hypothèses pour les chiffrer. Il est souvent très compliqué d’évaluer le coût “hébergement / cloud computing” : il faut alors au maximum estimer les conditions et volumétrie d’utilisation de la plateforme et tester l’élasticité du prix en fonction de ces hypothèses.
5
Mener la consultation en mode co-construction
Le choix de la future plateforme data doit être orchestré par le Data Manager et mobiliser, en parallèle, les parties prenantes Métier et SI.