10 questions d'entrevue Essential Data Warehousing (mises à jour pour 2019)

Table des matières:

Anonim

Introduction à l'entrepôt de données Questions et réponses

Qu'est-ce qu'un entrepôt de données?

L'entrepôt de données est un référentiel central qui stocke des données hétérogènes provenant de diverses sources. Les données d'un entrepôt peuvent être utilisées pour des rapports analytiques, des requêtes structurées ou ad hoc et utilisées dans la prise de décision. Le processus de collecte de données à partir de plusieurs sources et de stockage dans le référentiel central s'appelle Data Warehousing.

Les données peuvent être de plusieurs types comme des données structurées, semi-structurées ou non structurées. Les données provenant de diverses sources sont traitées, transformées et ingérées dans une seule base de données appelée entrepôt de données. Les utilisateurs peuvent accéder à ces données traitées dans l'entrepôt de données via divers outils tels que les outils de Business Intelligence, les clients SQL, les feuilles de calcul et de nombreux autres outils. Ces données aident à effectuer des opérations d'exploration de données qui aident à trouver un modèle dans les données.

Maintenant, si vous recherchez un emploi lié à l'entreposage de données, vous devez vous préparer aux questions d'entrevue de l'entrepôt de données 2019. Il est vrai que chaque entretien est différent selon les différents profils d'emploi. Ici, nous avons préparé les importantes questions et réponses d'entrevue de l'entrepôt de données qui vous aideront à réussir votre entrevue.

Maintenant, comprenons certaines des questions importantes de l'entrevue de Datawarehousing 2019 qui peuvent être posées lors d'une entrevue. Mais cela ne signifie pas que ce sont les seules questions qui seront posées dans une interview, vous devez être bien préparé concernant chaque sujet dont nous discutons ici. Ces questions sont divisées en deux parties:

Partie 1 - Questions d'entrevue d'entreposage de données (de base)

Cette première partie couvre les questions et réponses d'entrevue de base sur l'entreposage de données

Q1. Qu'est-ce que l'entreposage de données?

Répondre:
L'entreposage de données est un processus de collecte de données provenant de diverses sources qui les traitent et les stockent dans une énorme base de données, ainsi les données traitées peuvent être utilisées à diverses fins telles que les rapports analytiques, l'intelligence économique ou l'exploration de données, etc. L'idée de base derrière l'entrepôt de données n'est rien mais stockant une énorme quantité de données.

Q2. Différence entre la base de données et l'entrepôt de données?

Répondre:
Veuillez trouver ci-dessous les différentes tables prises en charge par Data Warehousing:

Base de données Entrepôt de données
Collecte des données utilisées pour le stockage, l'accès et la récupérationCollecte de données utilisées pour effectuer des analyses
Contraint à la seule applicationPeut être utilisé par plusieurs applications
Stocke des données normaliséesLes données n'ont pas besoin d'être normalisées, généralement stockées en tant que données dénormalisées
Basée sur les ER et orientée vers les applicationsflocon de neige ou commencer basé sur un schéma et orienté sujet
Utilisé pour le traitement des transactionsUtilisé pour la modélisation et l'analyse des données

Passons aux prochaines questions d'entrevue de Data Warehousing

Q3. Quelles sont les étapes de l'entreposage de données?

Répondre:
Les étapes générales de l'entrepôt de données sont les suivantes:

  • Base de données opérationnelle hors ligne: les données sont copiées du système d'exploitation vers un autre serveur pour effectuer diverses opérations.
  • Entrepôt de données hors ligne: les données de l'entrepôt de données sont régulièrement mises à jour à partir de la base de données opérationnelle.
  • Entrepôt de données en temps réel: l'entrepôt de données est mis à jour lorsqu'une transaction a lieu dans le système opérationnel.
  • Entrepôt de données intégré: l'entrepôt de données est mis à jour en permanence lorsqu'une transaction est effectuée sur le système opérationnel.

Q4. Qu'est-ce que la Business Intelligence (BI)?

Répondre:
Il s'agit des questions d'entrevue de base sur l'entreposage de données posées lors d'une entrevue. La BI est un processus basé sur la technologie pour analyser les données et présenter des informations significatives aux utilisateurs finaux qui aident à une meilleure prise de décision. La BI comprend divers outils qui aident à comprendre les tendances et les modèles de données cachés dans les données. Certains des outils largement utilisés sont SAP Business Intelligence, MicroStrategy, Science, Tableau et bien d'autres.

Q5. Quels sont les composants de Data Warehouse?

Répondre:
Quatre composants de l'entrepôt de données sont:

  • Load Manager: il effectue toutes les opérations associées à l'extraction et au chargement des données dans l'entrepôt.
  • Warehouse Manager: il effectue les opérations associées aux données de l'entrepôt. Il effectue des opérations telles que l'analyse des données pour assurer la cohérence, la création d'index et de vues et de nombreuses autres opérations.
  • Gestionnaire de requêtes: il effectue toutes les opérations liées aux requêtes des utilisateurs. Les opérations de ce composant sont des requêtes directes vers les tables appropriées.
  • Outil d'accès de l'utilisateur final: outils utilisés par les utilisateurs finaux pour accéder aux données. Il est classé en différents groupes comme
  1. Outils de rapport de données
  2. Outils de requête
  3. Outils de développement d'applications
  4. Outils EIS
  5. Outils OLAP et d'exploration de données

Partie 2 - Questions d'entrevue sur l'entreposage de données (avancé)

Jetons maintenant un coup d'œil aux questions d'entrevue avancées sur l'entreposage de données.

Q6. Qu'est-ce que la table Dimension?

Répondre:
La table de dimension dans un entrepôt de données est une table dans un schéma en étoile. Les tables de dimension sont utilisées pour stocker la dimension ou les attributs qui décrivent les données dans la table de faits. Par exemple, la dimension du produit peut contenir le nom, la description, le prix unitaire, le poids, la couleur et de nombreux autres attributs. Le système généré la clé est utilisé pour identifier de manière unique la ligne dans la table de dimension. Cette clé agit comme une clé primaire dans la table de dimension et utilisée comme clé étrangère dans la table de fait, ce qui permet de joindre les deux tables.

Q7. Qu'est-ce que la table de faits?

Répondre:
Une table de faits est la table centrale du schéma en étoile, entourée d'une table de dimensions d'un entrepôt de données. Le tableau des faits se compose des mesures quantitatives ou des faits du processus opérationnel. La table de faits fonctionne avec une table de dimensions et elle stocke les données à analyser. La table de faits contient une colonne de clé étrangère qui agit comme une clé primaire dans la table de dimension, cette clé permet la jointure entre ces deux tables.

Passons aux prochaines questions d'entrevue de Data Warehousing

Q8. Qu'est-ce que Data Mart?

Répondre:
Data Mart est un sous-ensemble de l'entrepôt de données qui contient généralement un ensemble spécifique de données liées à un secteur d'activité spécifique. Le Data Mart est petit et utilisé pour interroger ou analyser un ensemble spécifique de données, par exemple, les données liées aux "Ventes", "Clients", "Commande" etc.

Q9. Qu'est-ce que le magasin de données opérationnelles (ODS)?

Répondre:
Il s'agit des questions d'entrevue les plus posées lors d'une entrevue. Un ODS est le type de base de données qui stocke les données utilisées par les systèmes opérationnels avant de les stocker dans un entrepôt de données. Il sert de base de données intermédiaire. Un ODS contient des données à court terme tandis qu'un entrepôt de données contient des données historiques.

Q10. Expliquez l'architecture de l'entrepôt de données.

Répondre:
Il comprend les étapes suivantes:

  • Couche de source de données: à ce stade, les données sont collectées à partir de diverses sources et stockées dans une base de données relationnelle. Les données comprennent les données des médias sociaux, les données opérationnelles, les données transactionnelles et bien d'autres.
  • Couche de transfert de données : à ce stade, les données de la couche de source de données sont extraites et traitées car les données proviendront de diverses sources et de formats différents. Les données extraites seront soumises à des contrôles de qualité et les résultats finaux seront des données propres et organisées qui seront chargées dans l'entrepôt de données.
  • Couche de stockage des données: cette couche est l'endroit où les données de la zone de transit seront stockées en tant que référentiel central unique. Selon les besoins de l'entreprise, le stockage peut être un entrepôt de données, un magasin de données ou un magasin de données opérationnelles.
  • Couche de présentation des données: cette couche est utilisée par les utilisateurs pour accéder aux données. Les utilisateurs peuvent effectuer diverses requêtes ou exécuter une analyse pour effectuer des rapports.

Article recommandé

Cela a été un guide pour la liste des questions et réponses d'entrevue de l'entrepôt de données afin que le candidat puisse réprimer ces questions d'entrevue de l'entrepôt de données facilement. Ici, dans cet article, nous avons étudié les principales questions d'entrevue de Data Warehousing qui sont souvent posées lors des entretiens. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Questions et réponses d'entrevue RMAN
  2. Questions d'entretiens pour le poste de Data Analyst
  3. Questions d'entretiens chez Most Ask Hibernate
  4. Questions d'entretiens chez PowerShell
  5. Guide complet d'Oracle Data Warehousing