Analyse de données massives

Exploration de données

L’exploration de données consiste à extraire des perspectives exploitables à partir des données recueillies. Les organisations de premier plan utilisent les techniques d’exploration de données pour cibler les clients rentables et potentiels, réduire les fraudes, reconnaître les clients loyaux, améliorer le service à la clientèle et fidéliser la clientèle. L’exploration de données fait souvent appel à l’analyse prédictive et utilise des outils évolués pour présenter de grandes quantités de données sous forme de modèles statistiques et visuels tels que les arbres de décision et les graphiques tridimensionnels.

Un projet type d’exploration de données de CGI repose sur une approche itérative à haut niveau et comprend les activités ci-dessous.

  • Compréhension du problème d’affaires
  • Préparation du plan
  • Sélection des techniques, des outils et de la plateforme
  • Évaluation des sources de données et obtention des données
  • Préparation des données en vue de leur analyse
  • Exploration des données
  • Interprétation des résultats
  • Création de modèles
  • Évaluation de la performance des modèles et de l'incidence sur les activités

L’exploration de données est particulièrement efficace lorsqu’elle s’inscrit dans un effort intégré d’intelligence d’affaires. La stratégie d’intelligence d’affaires d’une organisation détermine les questions auxquelles doivent chercher à répondre l’exploration de données, les mini-entrepôts et entrepôts de données et les applications analytiques. Tôt dans le cycle d’intelligence d’affaires, les experts de CGI mènent une étude de validation de l’exploration de données pour faciliter la définition des données (et des combinaisons de données) qui permettront de dégager de nouvelles perspectives avec une valeur prédictive.

Une étude de validation aide l’organisation à créer des entrepôts ou des mini-entrepôts de données qui appuieront les prochains efforts d’exploration de données. De telles initiatives peuvent diminuer de 75 % les coûts et la durée de ces projets en réduisant de façon considérable et récurrente le temps requis pour la collecte et la préparation des données.