Leçons de niveau 16

Pentaho/Analyse multidimentionnelle(OLAP)

Une page de Wikiversité.
Sauter à la navigation Sauter à la recherche
Début de la boite de navigation du chapitre
Analyse multidimentionnelle(OLAP)
Icône de la faculté
Chapitre no 5
Leçon : Pentaho
Chap. préc. :Analyse Ad hoc
Chap. suiv. :Intégration de données
fin de la boite de navigation du chapitre
Icon falscher Titel.svg
En raison de limitations techniques, la typographie souhaitable du titre, « Pentaho : Analyse multidimentionnelle(OLAP)
Pentaho/Analyse multidimentionnelle(OLAP)
 », n'a pu être restituée correctement ci-dessus.
Add caption here


Définition[modifier | modifier le wikicode]

« Il s’agit d’une catégorie de logiciels axés sur l’exploration et l’analyse rapide des données selon une approche multidimensionnelle à plusieurs niveaux d’agrégation ». (Caron, 1998)
Les cubes OLAP (Online Analytical Processing) se composent de 4 déclinaisons:


  1. Multidimensional-OLAP
  2. Relational-OLAP
  3. Hybride-OLAP
  4. Spacial-OLAP


  • Multidimensional-OLAP

Ce sont des données détaillées de base ainsi que des données agrégées de l’entreprise qui sont stockées dans une base de données multidimensionnelle (souvent appelée cube ou hypercube). Une base de données multidimensionnelle utilise une structure propriétaire au logiciel utilisé. Le serveur M-OLAP (calcul) extrait les données de l’hypercube et les présente directement au module client.

  • Relational-OLAP

Ce sont des données détaillées de base ainsi que des données agrégées de l’entreprise qui sont stockées sous forme de tables dans une base de données relationnelle. La base de données relationnelle doit être structurée selon un modèle particulier (étoile, flocon, …) Le serveur extrait les données par des requêtes (ex: SQL…) et interprète les données selon une vue multidimensionnelle avant de les présenter au module client.

  • Hybride-OLAP

C'est une architecture qui consiste a croiser des architectures M-OLAP et R-OLAP. Les données détaillées de base de l’entreprise sont stockées dans une base de données relationnelle et les données agrégées sont stockées dans une base de données multidimensionnelle. Le serveur H-OLAP accède deux bases de données et les présente au module client, selon une vue multidimensionnelle dans le cas des données de la base de donnée relationnelle.

  • Spacial-OLAP

C'est une plate-forme visuelle supportant l’exploration et l’analyse spatio-temporelle des données selon une approche multidimensionnelle à plusieurs niveaux d’agrégations via un affichage cartographique, tabulaire ou en diagramme statistique.

Objectifs[modifier | modifier le wikicode]

  • Exploration et analyse rapide :

OLAP vise à assister l’usager dans son analyse en lui facilitant l’exploration de ses données et en lui donnant la possibilité de le faire rapidement.

  • Facilité

L’usager n’a pas à maîtriser des langages d’interrogation et des interfaces complexes. L’usager interroge directement les données, en interagissant avec celles-ci.

  • Rapidité

OLAP exploite une dé-normalisation maximale des données, sous la forme d’une pré-agrégation stockée. L’usager devient opérationnel en très peu de temps.

Utilisation en entreprise d'une analyse multidimentionnelle Pentaho[modifier | modifier le wikicode]

L’analyseur de Pentaho est un outil riche d'aide à la décision. Le temps de réponse à des questions complexes est très rapide et offre des possibilités avancées de visualisation des données grâce aux tableaux de bords, l'intégration d'autres produits dans la suite Pentaho.

Pentaho offre également la possibilité de faire des bilans à partir de fichiers Excel. Pentaho apporte la puissance de l'OLAP à Excel en permettant d'explorer et d'analyser des données directement dans Excel. Cela fonctionne grâce à Mondrian OLAP et fournit des possibilités analytiques puissantes. Pentaho intègre directement les services PivotTable de Microsoft Excel, ainsi que des informations et des outils supplémentaires comme les drill-down et le data-pivoting.
Ces outils permettent facilement et de façon interactive une analyse poussée de l'information, en explorant les données pour découvrir rapidement des tendances ou des anomalies. Par exemple, un utilisateur regardant des informations commerciales pour l'année dernière pourrait facilement faire un « drill down » du résumé annuel pour comparer des ventes à travers des produits, ou pour analyser l'exécution de ventes spécifiques à différentes régions géographiques.

Les outils d'analyse permettent également à des utilisateurs d'enrichir les données avec Excel et les diagrammes d'Excel. Tout ceci est construit sur des normes ouvertes comprenant le DB Ole pour OLAP (ODBO) et XML pour l'analyse (XML/A). Les dashboards fonctionnent avec Pentaho Professional Edition, Pentaho Open BI Suite ou Mondrian de façon autonome.

Add caption here
Add caption here



Cette grille de chaleur affiche visuellement les ventes et permet d’identifier les domaines de haute et faible performance à travers les différents pays en fonction de l'année (2003,2004 et 2005) et des trimestres (QTR1, QTR2, QTR3, QTR4). Les domaines de performances vont du rouge au vert : des mauvaises aux meilleures ventes.

Nous observons qu'en 2005, au 2e trimestre, les ventes étaient insuffisantes en Belgique, au Japon et à Singapour (en rouge) tandis que les meilleures ventes se situaient en Nouvelle-Zélande et en Espagne (vert clair et jaune).

Cette grille de chaleur permet de visualiser les performances des ventes et ainsi de mettre en place des plans d'action et des moyens financiers, matériels et humains pour améliorer les ventes correspondantes aux zones rouge et orange.