Aller au contenu

Datawarehouse/Qu'est ce que le Datawarehouse ?

Leçons de niveau 16
Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
Qu'est ce que le Datawarehouse ?
Icône de la faculté
Chapitre no 3
Leçon : Datawarehouse
Chap. préc. :Historique
Chap. suiv. :Logiciels
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Datawarehouse : Qu'est ce que le Datawarehouse ?
Datawarehouse/Qu'est ce que le Datawarehouse ?
 », n'a pu être restituée correctement ci-dessus.

Entrepôt de données

[modifier | modifier le wikicode]

Le Data Warehouse est un entrepôt de données qui a une vision centralisée et complète de toutes les informations de l'entreprise.

C'est une structure qui a pour but de regrouper les données de l'entreprise pour des fins analytiques et pour aider à la prise de décisions stratégiques. La décision stratégique est une action mise en place par les décideurs de l'entreprise dans l’objectif d’améliorer, quantitativement ou qualitativement, la performance de l'entreprise dans un ensemble d'informations organisées, historiées et provenant de différentes sources de données.

Lorsqu'on réalise un schéma de Base de Données pour un système d'information, on parle de « tables » et de « relations ». Une table est une représentation d'une entité. Une relation est une technique pour lier ces entités entre elles. En terme BI, on parle de « Dimension » et de « Faits ».

Les Data Warehouses sont en général très volumineux et complexes à concevoir. Ainsi, on a décidé de les diviser en sous-parties plus faciles à créer et entretenir. On les appelle les Data Marts.

Les Data Marts peuvent se diviser par fonction : un Data Mart pour les ventes, pour les commandes, pour les ressources humaines, ou par sous-ensemble organisationnel : un Data Mart par succursale.

Une dimension se défini comme des axes avec lesquels on souhaite analyser. Il peut y avoir une dimension client, une dimension produite, une dimension géographie, etc.

Les faits, complément des dimensions, sont le sujet de l'analyse et c’est tout ce que l’on souhaite analyser. Ils représentent des tables qui contiennent des informations opérationnelles et qui retracent la vie de l'entreprise. On peut trouver des tables de faits pour les ventes, pour les stocks, pour les ressources humaines, etc.


L'ETL (Extraction, Transformation, Loading) a pour but de convertir le modèle entité-relation des bases de données, en modèle à base de dimensions et de faits.


Une étoile est une façon de mettre en relation les dimensions et les faits dans un entrepôt de données. Le principe est que chaque dimension est reliée directement à un fait.


Un flocon est un modèle de mis en relation des dimensions et des faits. Il peut exister des hiérarchies de dimensions et qui sont reliées au fait.


Le Data Warehouse possède plusieurs objectifs :

• Les données de l’organisation doivent être accessibles facilement.

• Les données doivent être simples et significatives pour les futurs utilisateurs.

• Une présentation des informations de manière cohérente : les données doivent être centralisées à partir de différentes sources de l’entreprise. Cependant, avant de les diffuser, il faut contrôler la qualité et la fiabilité.

• Être adaptables à chaque utilisateur.

Sécurise les informations de l’entreprise.

• Utilisée lors de la prise de décision.

• Sert de stockage des informations.