Introduction aux questions et réponses d'entrevue ETL

ETL signifie Extract-Transform-Load. C'est une base système de l'entrepôt de données, où les données sont extraites des différentes sources, puis les données sont transformées là où les données sont appliquées ou traitées afin de rendre la qualité, la cohérence des données dans un format de présentation approprié, puis enfin le les données sont chargées dans Data Warehouse au format de présentation afin de permettre à l'utilisateur final d'obtenir facilement les informations et de prendre une décision.

Vous trouverez ci-dessous les principales questions d'entrevue ETL 2019 qui sont fréquemment posées lors d'un entretien.

Si vous recherchez un emploi lié à ETL, vous devez vous préparer aux questions d'entrevue ETL 2019. Bien que chaque entretien soit différent et que la portée d'un travail soit également différente, nous pouvons vous aider avec les meilleures questions et réponses d'entrevue ETL, qui vous aideront à franchir le pas et à obtenir votre succès dans votre entretien.

Partie 1 - Questions d'entrevue ETL (de base)

Cette première partie couvre les questions et réponses de base sur les entretiens ETL

1. Développez le système ETL dans l'entrepôt de données? Explique

Répondre:
Le système d'extraction-transformation-charge (ETL) est le fondement de l'entrepôt de données. Un système ETL correctement conçu extrait les données des systèmes source, applique les normes de qualité et de cohérence des données, confirme les données afin que des sources distinctes puissent être utilisées ensemble, et livre enfin les données dans un format prêt à la présentation afin que les développeurs d'applications puissent créer des applications et des utilisateurs finaux peut prendre des décisions.

2. L'importance du système ETL dans l'entrepôt de données?

Réponse :
Supprime les erreurs et corrige les données manquantes. Il fournit des mesures documentées de la confiance dans les données. Capture le flux de données transnationales pour la conservation. Ajuste les données de plusieurs sources à utiliser ensemble. Structure les données pour qu'elles soient utilisables par les outils de l'utilisateur final.

3. Quel est le processus quotidien dans le système ETL?

Réponse :
Construisez la suite de développement / test / production de processus ETL. Comprendre les compromis de diverses structures de données d'arrière-salle, y compris les fichiers plats, les schémas normalisés, les schémas XML et les schémas de jointure en étoile (dimensionnels). Analysez et extrayez les données source. Créez un sous-système complet de nettoyage des données. Structurez les données en schémas dimensionnels pour une livraison plus efficace aux utilisateurs finaux, aux outils de Business Intelligence, aux outils d'exploration de données, aux cubes OLAP et aux applications analytiques. Fournissez des données de manière efficace dans des entrepôts de données hautement centralisés et profondément distribués en utilisant les mêmes techniques. Réglez le processus ETL global pour des performances optimales.

Passons aux prochaines questions d'entrevue ETL.

4. Formats de données dans le système ETL?

Réponse :
Il existe différents formats de données dans ETL, dont certains sont des fichiers plats, des ensembles de données XML, des tables de travail SGBD indépendantes, des schémas normalisés d'entité / relation (E / R) et des modèles de données dimensionnels.

5. Profilage des données dans le système ETL?

Réponse :
Le profilage des données est un examen systématique de la qualité, de la portée et du contexte d'une source de données pour permettre la construction d'un système ETL. À un extrême, une source de données très propre qui a été bien entretenue avant d'arriver à l'entrepôt de données nécessite une transformation minimale et une intervention humaine pour se charger directement dans les tables de dimension finale et les tables de faits.

6. Qu'est-ce qu'un validateur ETL?

Réponse :
ETL Validator est un outil de test de données qui simplifie considérablement le test des projets d'intégration de données, d'entrepôt de données et de migration de données. Il utilise notre architecture ELV brevetée pour extraire, charger et valider des données à partir de sources de données telles que des bases de données, des fichiers plats, XML, Hadoop et des systèmes de BI.

Partie 2 - Questions d'entrevue ETL (avancé)

Jetons maintenant un coup d'œil aux questions d'entrevue avancées d'ETL.

7. Quelles sont les opérations dans le système ETL?

Réponse :
Les trois opérations suivantes: extrait les données de votre système transnational, qui peut être une base de données relationnelle Oracle, Microsoft ou toute autre base de données relationnelle, transforme les données en effectuant des opérations de nettoyage des données. Un chargement est un processus d'écriture des données dans la base de données cible.

8. Nommez certains des outils ETL les plus utilisés sur le marché?

Répondre:
Il existe divers outils ETL utilisés sur le marché, mais certains des outils ETL fortement préférés
• Oracle Warehouse Builder (OWB)
• SAP Data Services.
• IBM Infosphere Information Server.
• Gestion des données SAS.
• Power Center Informatica.
• Répertoire Elixir pour Data ETL.
• Migrateur de données (IBI)
• SQL Server Integration Services (SSIS)

9. Quels sont les rôles et les responsabilités de l'équipe ETL?

Répondre:
Les rôles de l'équipe ETL au plus haut niveau sont de construire l'arrière-boutique de l'entrepôt de données.
• Fournir des données plus efficacement aux outils de l'utilisateur final
• Ajouter de la valeur aux données dans les étapes de nettoyage et de conformité
• Protéger et documenter la lignée des données
• Extraire des données des sources originales
• Qualité assurant et nettoyant les données
• Conformité des étiquettes et des mesures dans les données pour atteindre
• cohérence entre les sources originales
• Fournir des données dans un format physique utilisable par les outils de requête,
• Rédacteurs de rapports et tableaux de bord.

Passons aux prochaines questions d'entrevue ETL.

10. Quel est le rôle de l'analyse d'impact dans le système ETL?

Répondre:
L'analyse d'impact examine les métadonnées associées à un objet (dans ce cas, un tableau ou une colonne) et détermine ce qui est affecté par un changement dans sa structure ou son contenu. La modification des objets de transfert de données peut interrompre les processus qui sont essentiels pour charger correctement l'entrepôt de données. Autoriser des modifications ad hoc sur les objets de transfert de données nuit à la réussite de votre projet. Une fois qu'une table est créée dans la zone de transit, vous devez effectuer une analyse d'impact avant de lui apporter des modifications. De nombreux fournisseurs d'outils ETL fournissent une fonctionnalité d'analyse d'impact, mais cette fonctionnalité est souvent ignorée lors de la validation de principe du produit ETL car il s'agit d'une fonction d'arrière-plan et
Pas vraiment important jusqu'à ce que l'entrepôt de données soit opérationnel et commence à évoluer.

11. Comment traitez-vous le fichier plat de longueur fixe?

Répondre:
Une disposition de fichier de longueur fixe doit inclure le nom du fichier, où le champ commence; sa longueur; et son type de données (généralement du texte ou un nombre). Parfois, la position finale est fournie. Si ce n'est pas le cas, vous devez calculer la position de fin de chaque champ en fonction de sa position de début et de sa longueur si cela est requis par votre outil ETL. Dans la plupart des outils ETL, vous devrez probablement saisir manuellement la disposition du fichier plat une fois. Une fois la disposition entrée, l'outil se souvient de la disposition et attend cette même disposition chaque fois qu'il interagit avec le fichier plat réel. Si la disposition du fichier change ou si les données se déplacent de leurs positions affectées, le processus ETL doit être programmé pour échouer. Lors du traitement de fichiers plats de longueur fixe, essayez de valider l'exactitude des positions des données dans le fichier. Une vérification rapide pour valider les positions consiste à tester n'importe quel champ de date (ou d'heure) pour vous assurer qu'il s'agit d'une date valide. Si les positions sont décalées, le champ de date contient très probablement des caractères alpha ou des nombres illogiques. D'autres champs avec des domaines très spécifiques peuvent être testés de la même manière. XML offre des capacités de validation plus concrètes. Si la validation ou la cohérence des données est un problème, essayez de convaincre le fournisseur de données de livrer les données au format XML.

12.Pourquoi ETL en temps réel dans l'entrepôt de données?

Répondre:
L'entrepôt de données devait fournir un ensemble de données inébranlable aux décideurs commerciaux, fournissant un plancher d'informations fiable sur lequel se tenir. Pour des rapports actualisés sur une base de données scintillante, les utilisateurs métier ont été dirigés vers les applications de production qui gèrent l'entreprise. Par conséquent, les utilisateurs ont dû se rendre à l'entrepôt de données pour obtenir une image historique de ce qui s'est passé dans l'entreprise hier et ont dû rechercher dans de nombreux systèmes OLTP une image de ce qui se passait aujourd'hui. Les utilisateurs professionnels n'ont jamais entièrement accepté cette fracture. Les entrepôts de données ont bien sûr absolument besoin de flux d'informations clients constants à partir d'une opération, mais les systèmes opérationnels dépendent de plus en plus de l'enrichissement des informations clients par les entrepôts de données. Par conséquent, il est prévisible que les organisations ont commencé à explorer des alternatives architecturales qui peuvent prendre en charge des scénarios d'intégration plus généralisés déplaçant les données opérationnelles entre les applications et simultanément dans et hors de l'entrepôt avec une urgence croissante.

Articles recommandés

Cela a été un guide pour la liste des questions et réponses d'entrevue ETL afin que le candidat puisse réprimer facilement ces questions d'entrevue ETL. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Azure Paas vs Iaas - Fonctionnalités
  2. 9 questions et réponses d'entrevue étonnantes de MapReduce
  3. Top 11 des questions et réponses les plus utiles sur les SGBDR
  4. 10 questions d'entretien PHP les plus impressionnantes pour les expérimentés
  5. Connaître le Top 5 des questions et réponses utiles pour les entretiens DBA

Catégorie: