Aller au contenu

Datawarehouse/Conception d'entrepôts de données

Leçons de niveau 16
Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
Conception d'entrepôts de données
Icône de la faculté
Chapitre no 5
Leçon : Datawarehouse
Chap. préc. :Logiciels
Chap. suiv. :Critique des méthodes de conception d'entrepôts
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Datawarehouse : Conception d'entrepôts de données
Datawarehouse/Conception d'entrepôts de données
 », n'a pu être restituée correctement ci-dessus.

Un entrepôt de données est une vision complète et centralisée des données de l'entreprise. La modélisation en étoile ou en flocon s’intéresse seulement à la conception d'un sous-ensemble d'entrepôt. Une étoile ou un flocon ne représente même pas un data Mart. En effet, une fonction de l'entreprise peut comporter plusieurs tables de faits.

Comment organiser l’entrepôt de données ?

Une constellation est une série d'étoiles ou de flocons reliés entre eux par des dimensions. Il s'agit donc d'étoiles avec des dimensions en commun. Un environnement décisionnel idéal serait la possibilité de naviguer d'étoile en étoile, de constellation en constellation et de Data Mart en DataMart à la recherche de l'information pertinente et importante.

La taille des constellations est un des indicateurs clés d'une bonne conception d'entrepôt. Plus la constellation est importante, plus les dimensions réutilisées sont complètes et centralisées sur les informations de l’entreprise.

En conception d'entrepôt, dès qu'une dimension existante ne correspond pas aux besoins d'une nouvelle étoile, on en crée une autre, même si elle est quasi identique à la dimension que nous allions utiliser. C'est pour cela, qu'il faut réaliser des dimensions génériques qui soient vrai tout le temps et pour toutes les fonctions de l'entreprise. Ces dimensions pourront être réutilisées et assurer une pérennité des données.


Construire un entrepôt de données

[modifier | modifier le wikicode]

Il existe trois méthodes pour regrouper tous les éléments afin de mettre en œuvre un entrepôt de données, qui sont les suivantes :

Top-Down : c'est la méthode la plus complexe et la plus contraignante mais aussi que la plus complète.

Cette méthode implique un travail rigoureux: il est important de savoir à l'avance toutes les dimensions et tous les faits de l'entreprise afin de les réaliser. L’avantage que cette méthode est qu'elle offre une vision très claire et très conceptuelle des informations de l'entreprise mais également du travail à fournir.

Bottom-Up : Cette méthode est le contraire de la méthode précédente.

Elle a pour but de créer les étoiles une par une, puis les regrouper par des niveaux intermédiaires afin d’obtenir un entrepôt de données sous forme pyramidale. La simplicité de cette méthode est un vrai avantage pour les utilisateurs. Cependant, cette méthode demande un volume de travail d’intégration important afin d’obtenir un entrepôt de données avec la possibilité de répétitions entre les étoiles.

Middle-Out : Cette méthode est conseillée pour les professionnels du BI.

Elle consiste de réaliser la conception totale de l'entrepôt de données, ainsi de créer des divisions plus petites et plus simple à gérer. Cela correspond à découper la conception par éléments en commun et réaliser les découpages un par un.