
ETL = Extract-Transform-Load La Définition Littéraire « Extract-Transform-Load » est connu sous le terme ETL (ou parfois : datapumping). Il s'agit d'une technologie informatique intergicielle permettant d'effectuer des synchronisations massives d'information d'une banque de données vers une autre. Selon le contexte, on traduira par « alimentation », « extraction », « transformation », « constitution » ou « conversion », souvent combinés. Elle est basée sur des connecteurs servant à exporter ou importer les données dans les applications (Ex : connecteur Oracle ou SAP...), des transformateurs qui manipulent les données (agrégations, filtres, conversions...), et des mises en correspondance (mappages). Le but est l'intégration de l'entreprise par ses données. A l'origine, les solutions d'ETL sont apparues pour le chargement régulier de données agrégées dans les entrepôts de données (ou datawarehouse), avant de se diversifier vers les autres domaines logiciels. Ces solutions sont largement utilisées dans le monde bancaire et financier, et en développement dans l'industrie. tiré du site http://fr.wikipedia.org/wiki/ETL |
Notre Définition Un système ETL est tout système qui permet : d'offrir un environnement de développement, des outils de gestion des opérations et de maintenance. de découvrir, analyser et extraire les données à partir de sources hétérogènes; de nettoyer et standardiser les données selon les règles d'affaires établies par l'entreprise; de charger les données dans un entrepôt de données dans et/ou les propager vers les datamarts.
|
Les trois catégories des ETL Actuellement il existe trois catégories d’outils ETL : Engine-based : les transformations sont exécutées sur un serveur ETL, disposant en général d’un référentiel. Ce genre de d’outil dispose d’un moteur de transformation ; Database-embedded : les transformations sont intégrées dans la BD ; Code-generators : les transformations sont conçues et un code est généré. Ce code est déployabe indépendamment de la base de données.
Pourquoi tout cet intérêt ? Les entreprises, aux débuts des entrepôts de données, avaient mis beaucoup d’emphase sur la présentation et l’utilisation finale d’un DW. Avec l’accroissement du volume de données elles se sont, ensuite, focalisées sur la modélisation dimensionnelle. De nos jours l’accent est plutôt mis sur les systèmes ETL.
Que ce soit un outil commercial ou développé maison, l’ETL n’est pas un simple programme d’extraction, transformation et de chargement et ne doit pas être traité de la sorte. Il s’agit plutôt d’un système complexe. D’ailleurs Kimball (2004), après dix huit mois d’études des ETL, en a définit 38 sous-systèmes et il a même statué, et pour raison, que 70% d’un projet d’entrepôt de données est dédié aux systèmes ETL. La mise en place d'un système ETL demande une expertise spéciale et fait appel à plusieurs types de ressources humaines Si vous cherchez une définition détaillée d'un entrepôt de données veuillez vous référer à la page suivante. |
|
Mots clés : ETL, système ETL, Extract-Transform-Load, Extraction, Transformation, chargement, OLAP, MOLAP, ROLAP, 38 sous-systèmes ETL, projet ETL, Plan de projet, rôles, responsabilités, Data warehouse, entrepôt de données, Comparaison ETL, Outils ETL, choix d'outils ETL, Acheter ou développer, choix de suite ETL, décisionnel, aide à la décision, back room, front room, Junk dimension, degenerate dimension, staging area, entreprise data warehouse, persistent staging area, EDW, DataMart, Datawarehouse, Extraction-transaformation-chargemen | |