Talend/L'intégration de données

Leçons de niveau 16
Une page de Wikiversité, la communauté pédagogique libre.
Début de la boite de navigation du chapitre
L'intégration de données
Icône de la faculté
Chapitre no 3
Leçon : Talend
Chap. préc. :Big Data Solutions
Chap. suiv. :Gestionnaire de la qualité et fiabilité
fin de la boite de navigation du chapitre
En raison de limitations techniques, la typographie souhaitable du titre, « Talend : L'intégration de données
Talend/L'intégration de données
 », n'a pu être restituée correctement ci-dessus.
Début d’un théorème
Fin du théorème


Définition[modifier | modifier le wikicode]

L'intégration de données appelé ETL (Extraction Transfer Loading) regroupe les processus par lesquels les données provenant de différentes parties du système d'information sont déplacées, combinées et consolidées. Ces processus consistent habituellement à extraire des données de différentes sources (bases de données, fichiers, applications, Services Web, emails, etc.), à leur appliquer des transformations (jointures, lookups, déduplication, calculs, etc.), et à envoyer les données résultantes vers les systèmes cibles.

Il existe plusieurs systèmes d'intégration de données :

  • La médiation au service de l’intégration de données d’entreprise (EII).
  • L’intégration de données via les applications (EAI).
  • L’intégration de données via les services Web (ESB, SOA).
  • L’intégration de données en nuage (Data Cloud).


Add caption here
Add caption here

Objectifs[modifier | modifier le wikicode]

Les principaux objectifs de l'intégration de données sont les suivants :

  • Un accès aux requêtes, éventuellement aux mises-à-jour.
  • Utilisation des données comme si elles constituaient une seule base de données homogène.
  • Diffusion des données rapidement, simplement, efficacement et économiquement.
  • Fournir les données appropriées aux bonnes personnes.
  • Combinaison de toutes données nécessaires à la veille économique.
  • Accélération de la conception, du développement, de la livraison et de la gestion des flux de données.

Utilisation en entreprise de l'intégration de données Talend[modifier | modifier le wikicode]

L’intégration de données est bénéfique, mais l’intégration de données de haute qualité l’est encore plus. Talend combine des fonctions d’intégration et de qualité de données robustes en une architecture évolutive, afin que les entreprises puissent intégrer, nettoyer et profiler leurs informations en toute confiance. Avec Talend, les risques, les pertes et les coûts associés à des sources de données dupliquées sont considérablement réduits. Talend permet de créer des informations cohérentes via les processus de standardisation et l’implémentation de règles.

Élargissement de la connectivité[modifier | modifier le wikicode]

Talend se connecte habituellement à des bases de données, des applications compactes et dans le Cloud, des applications, des ordinateurs centraux, des fichiers, des services Web, des data warehouses, des data marts et des applications OLAP. Talend fournit des composants intégrés avancés pour l’ETL et le chargement de masse. Les outils graphiques et les assistants simplifient la gestion de données, le monitoring, le développement, le test et le déploiement.

Les trois principaux composants sont les Business Modeler, Job Designer et Metadata Manager. Le Business Modeler est un outil graphique pour créer des logiques métier. Le Job Designer sert à créer des diagrammes, déterminer des développements de données et des séquençages de flux de manière visuelle. Le Metadata Manager stocke et gère toutes les métadonnées des projets, notamment les données contextuelles, comme les informations de connexion aux bases de données et les chemins d’accès aux fichiers.

Standardisation et enrichissement de données[modifier | modifier le wikicode]

Avec Talend, les utilisateurs peuvent profiler et analyser des données, puis créer et partager des rapports basés Web concernant la qualité des données. Avec ces informations, les équipes peuvent s’aligner sur l’usage des données et détecter de possibles améliorations. L’intégration de données Built-in et la technologie puissante de Parsing sont à la base des fonctionnalités de standardisation et d’enrichissement de données de Talend. Elles fournissent des moyens efficaces d’intégration de la plupart des sources de données externes de référence pour validation, identification d’entreprises et informations des risques-clients, entre autres.

Correspondance et Consolidation des données[modifier | modifier le wikicode]

Talend fournit une nouvelle génération de solutions de mise en correspondance de données, rendant ainsi accessible aux utilisateurs métier réels le processus très complexe à écran vert d’édition de règle de mise en correspondance. Les utilisateurs peuvent configurer la mise en correspondance des données dans l’environnement Talend, au lieu d’effectuer des modifications lourdes dans les fichiers de règles et d’utiliser différentes interfaces associées à la plupart des outils de qualité de données.