Interview MyDataBall réalisé par Philippe Vittenet
Posté le 23 octobre 2011 dans Actualités, Presse par MyDataBall.
Interview réalisé par Philippe Vittenet, expert Décisionnel
Stéphane, pourrais-tu en quelques mots nous décrire ton parcours ?
J’ai principalement œuvré dans les domaines du calcul numérique. Et depuis presque vingt ans j’applique des algorithmes, des techniques et des méthodes statistiques et mathématiques dans les domaines de la défense, la grande distribution, la finance, l’industrie et les services publics. J’organise des projets autour des thèmes de l’extraction des données, des calculs d’information et de l’optimisation des connaissances (calcul des ROI et des risques).
Tu fais partie des artisans des techniques du datamining, comment l’entreprise d’aujourd’hui utilise t’elle cet outil ?
Le résultat de recherche d’information peut se bricoler. C’est artisanal mais très efficace pour bon nombre de problématiques un peu combinatoire. L’exemple d’un tri sur les colonnes d’une base de données marketing est l’exemple à prendre pour les entreprises. En quelques manipulations du type « tableau croisé dynamique d’Excel », l’opérateur peut donner rapidement et intuitivement les deux critères qui expliquent le mieux un événement. XLSTAT sous Excel est un excellent produit pour découvrir des connaissances dans les données et … bricoler. La seule chose importante est de bien connaître ce que l’on mesure et ne pas oublier les fondamentaux sur les théories de la mesure et mesure de la qualité de ces mesures (régulière et normée).
C’est lorsque les critères d’optimisation deviennent nombreux et qu’il est nécessaire d’utiliser l’armada des techniques statistiques avancées (bootstrap pour l’apprentissage sur échantillon par exemple), sont employés alors des logiciels propriétaires ayant toutes les fonctions et formulations statistiques à disposition et automatisables (ceux que j’utilise : SAS, SPAD, SPSS, ALICE, R, …, voir le billet [suivant|/post/2006/05/31/44-espace-17-]).
Pour les entreprises, le calcul consiste à du ROI (Return On Investment, technique statistique du Receiver Operating Characteristic).
Par les mesures statistiques et les algorithmes de knowledge discovery, le datamining permet de décrire, de détecter et de prédire des événements. Le datamining s’applique dans les différents domaines marchands :
* Contrôle de gestion : calculer, détecter et prédire les fraudes par exemple, calculer les meilleurs tableaux de bord
* Ressources Humaines : constituer un road mapping RH (appelé Gestion Prévisionnel des Emplois et des Compétences) pour la conduite du changement (prédire les meilleurs groupes pour exercer un challenge d’équipes)
* Actuariat : prédire les taux d’accidents auto selon le portefeuille client contre celui de la population totale, risque santé
* Commercial / RH : optimisation des forces de vente selon le potentiel local du marché, optimisation des ROI sur les canaux de communication (web, agence, téléphone, sms, réseaux, …).
* Marketing : faire du starting Up Campaign pour tester des messages et des offres, piloter statistiquement celles qui optimisent le ROI, prévoir les socles marketing émergents, …
* Après Vente : optimiser les canaux de communication selon le besoin client pour conserver et augmenter la satisfaction et réduire les coûts de gestion
* Knowledge Management : optimiser l’ordonnancement des documents pour un accès rapide et adéquate au profil utilisateur
* Veille économique et stratégique : robotiser les annonces des concurrents et les catégoriser en « risque message » et mesurer le taux de marge différenciante d’une action selon un marché.
* Production / Industrie: test technique de défaillance dans un grand volume de mesures
* Stratégie financière : mesure des modèles économiques rentables (circuits financiers), évaluation des provisions nécessaires pour couvrir un risque.
* Sécurité des données : cartographie et affectation optimisées des droits à la consultation des informations.
* …
Hormis l’aspect marchand de cette liste, toute activité mesurée, lucrative ou non lucrative, peut être mise à profit par les techniques du datamining pour optimiser les choix possibles : le datamining est la technique de l’aide à la décision par excellence. Le retour sur investissement à utiliser le datamining a été estimé à 1000% pour ceux qui ont impliqué les collaborateurs à un programme travaillé (voir www.kdnuggets.com, site de référence pour le datamining en Amérique du nord).
Quel est l’avenir du datamining ?
Tout le monde conviendra que nos répertoires d’information sont de plus en plus denses et pèsent de plus en plus lourd (en tera et peta octets). Mettre de l’ordre dans cette mine d’information est devenu nécessaire pour gagner du temps, être réactif aux événements, mieux comprendre pour agir à court, moyen et long terme. Le besoin de mesurer pour décider est en pleine expansion. La frénésie de conquête d’information pour mieux décider s’accélère pour deux raisons :
# Le besoin d’adjoindre de nouvelles informations à celles que nous avons déjà (surtout en Marketing).
# Le besoin d’augmenter les domaines d’investigation et de recherche d’information (veilles économique et stratégique).
Seuls les réseaux sociaux ont permis d’obtenir un nouveau puis d’information essentielle pour la connaissance de l’humain (ses goûts et ses couleurs (sic)) et est un levier de connaissance du XXIème siècle. Cependant, le coût de captage des données complémentaires (robots, sondages, recherche documentaire, IHM, …) devient prohibitif. La guerre des multinationales du sondage fait rage. Les enjeux sont importants. Il n’y a qu’à observer les grands travaux gouvernementaux actuels et extra gouvernementaux pour constater de l’intérêt stratégique de mesurer et mieux mesurer (remise en cause des indicateurs du PIB. Et de se rappeler de la limite de l ‘exercice avec l’adage qui « ce qui compte ne se compte pas » (Henri Bergson, Edgar Morin).
Le datamining est LA technique qui contribue à diminuer le besoin en nouvelles informations. Le datamining optimise le potentiel de décision de votre patrimoine de données et réduit vos projets d’extraction de nouvelles informations, coûteuses à mettre en œuvre en temps et en expertise. Le datamining (et les avatars des mathématiques, comme la fusion de données) a de beaux jours devant lui.
Pourquoi MyDataBall ?
MyDataBall est un outil de business intelligence (BI), mise en place des tableaux de bord et des dashboard d’activité) qui optimise l’accès à un cube d’information (OLAP) en organisant les critères selon leur pertinence. C’est pourquoi, nous parlons de Business Optimisation.
MyDataBall a été conçu pour embarquer dans les résultats du BI un résultat optimisé par les techniques statistiques. Même si des tentatives industrielles ont été faites, elles se sont toujours heurtées à des problématiques d’ergonomie de représentation des informations (très techniques et réservés aux informaticiens et / ou aux statisticiens). SpotFire et QlickView sont les outils qui améliorent grandement le rendement de la production des résultats de management des informations pour la prise de décision. Ce sont les outils fars du moment. Cependant, la problématique de l’aspect fortement combinatoire des études n’est pas résolue. MyDataBall contribue à le résoudre.
MyDataBall a deux mérites :
# Simplifier la recherche d’information en accélérant la prise de décision sur les critères pertinents
# Organiser l’information pertinente
En outre, l’ergonomie originale (représentation d’un arbre de décision sur une sphère 3D) permet de visualiser un très grand nombre de critères en étude. Le jeu de couleurs lui confère l’idée d’être un indicateur global sur des données complexes. La visualisation d’un indicateur complexe est peut-être la solution pour créer un indicateur global comme veulent avoir les politiques. Je participe à des projets de mise en place d’indicateurs environnementaux globaux.
Pour finir, [MydataBall|/post/2008/12/17/66-mydataball] offre le service de rendre visible vos données. C’est une solution full web et utilisable en libre service comme moteur de recherche. Toutes les remarques et contributions pour ce projet sont les bienvenues. A quand la création d’une communauté ? A voire si des messages vont dans ce sens sur le blog de R2C-system.
Interview réalisé en 2011.
[…] (la visualisation de l’information complexe comme indicateur global). Vous trouverez dans le billet interview des éléments de solution pour répondre aux enjeux de mieux […]