Tableau des dimensions - Présentation - Types - Comment ça marche - Les avantages

Table des matières:

Anonim

Introduction au tableau des dimensions

Une table de dimension est présente dans le schéma en étoile ou en flocon de neige. Les tableaux de dimension aident à décrire les dimensions, c'est-à-dire les valeurs de dimension, les attributs et les clés. Il est généralement de petite taille. La taille peut varier de plusieurs à mille lignes. Il décrit les objets présents dans la table de faits. Le tableau des dimensions fait référence à la collecte ou au groupe d'informations liées à tout événement mesurable. Ils forment un noyau pour la modélisation dimensionnelle. Il contient une colonne qui peut être considérée comme une colonne de clé primaire qui permet d'identifier de manière unique chaque ligne ou enregistrement de dimension. Il est joint aux tables de faits via cette clé. Lorsqu'il est créé, une clé appelée clé de substitution générée par le système est utilisée pour identifier de manière unique les lignes de la dimension.

Pourquoi devons-nous utiliser?

  • Son aide à stocker l'historique des informations ou des informations dimensionnelles.
  • C'est plus facile à comprendre que les tableaux normalisés.
  • D'autres colonnes peuvent être ajoutées au tableau sans affecter les applications existantes qui les utilisent.

Types de tableau de dimensions

Voici les différents types de tableau de dimensions:

1. SCD (dimensions à évolution lente)

Les attributs de dimension qui ont tendance à changer lentement avec le temps plutôt qu'à changer dans un intervalle de temps régulier sont appelés dimensions à changement lent. Par exemple, les changements d'adresse et de numéro de téléphone mais pas régulièrement. Voyons l'exemple d'un homme qui voyage dans différents pays, il doit donc changer d'adresse en fonction de ce pays. Cela peut se faire de trois manières:

Type1: écrase la valeur précédente. Cette méthode est facile à appliquer et permet d'économiser de l'espace et donc de réduire les coûts. Mais, l'histoire est perdue dans ce scénario.

Le tableau avant le changement

IdentifiantNOMPAYSNATIONALITÉ
1001RachelIndeIndien

Tableau après le changement

IdentifiantNOMPAYSNATIONALITÉ
1001RachelChineIndien

Type2: ajoutez une nouvelle ligne avec la nouvelle valeur. Dans cette méthode, l'historique est enregistré et peut être utilisé chaque fois que nécessaire. Mais cela prend beaucoup de place donc augmente le coût.

Le tableau avant le changement

IdentifiantNOMPAYSNATIONALITÉ
1001RachelIndeIndien

Tableau après le changement

IdentifiantNOMPAYSNATIONALITÉ
1001RachelIndeIndien
1001RachelChineIndien

Type3: ajoutez une nouvelle colonne. C'est la meilleure approche car l'histoire peut être maintenue facilement.

La table avant le changement

IdentifiantNOMPAYSNATIONALITÉ
1001RachelIndeIndien

Tableau après modification

IdentifiantNOMPAYSVIEUX PAYSNATIONALITÉ
1001RachelChineIndeIndien

2. Dimension conforme

Cette dimension est partagée entre plusieurs domaines ou magasins de données. Le même peut être utilisé dans différents projets sans aucune modification effectuée dans le même. Ceci est utilisé pour maintenir la cohérence. Les dimensions conformes sont celles qui sont exactement identiques ou un sous-ensemble approprié de toute autre dimension.

3. Dimension indésirable

Une dimension indésirable est un groupe d'attributs de faible cardinalité. Il contient des attributs différents ou divers qui ne sont liés à aucun autre attribut. Ceux-ci peuvent être utilisés pour mettre en œuvre le RCD (dimension changeant rapidement) comme les drapeaux, les poids, etc.

4. Dimension dégénérée

Il attribue qui sont stockés dans la table de faits elle-même et non comme une table de dimension séparée, ces attributs sont appelés dimension dégénérée. Par exemple, le numéro de ticket, le numéro de facture, le numéro de transaction, etc.

5. Dimension du jeu de rôle

Les relations multiples avec la table de faits sont appelées dimension de jeu de rôle. En d'autres termes, c'est lorsque la même clé de dimension avec tous ses attributs associés est jointe à plusieurs clés étrangères présentes dans la table de faits. Il peut remplir plusieurs fonctions dans la même base de données existante.

Comment ça marche dans l'entrepôt de données?

  • La dimension fait référence à la collecte ou au groupe d'informations liées à tout événement mesurable. Ils forment un noyau pour la modélisation dimensionnelle. Lorsqu'une dimension est créée, la structure d'un projet est générée. Créé peut être utilisé dans différents projets et reflète l'idée de réutilisabilité. Lorsqu'une modification est apportée à l'un d'entre eux, son effet se reflète uniquement dans ce tableau particulier. Lorsqu'un rapport doit être créé, l'utilisateur peut extraire les données car les tableaux de dimensions contiennent toutes les informations nécessaires.
  • Lors de la modélisation des dimensions, les données atomiques sont chargées dans des structures dimensionnelles. Ensuite, les modèles dimensionnels sont générés ou construits autour des processus métier. Lors de sa création, il ne faut pas oublier de filtrer les valeurs de domaine et de stocker les étiquettes des rapports dans ces tableaux. Il faut s'assurer que la clé de substitution (clé générée par le système utilisée lors de la création de la table de dimension qui permet d'identifier de manière unique chaque enregistrement présent dans la table de dimension.) Doit être utilisée lors de la création de la table de dimension. Il doit être dénormalisé car leur tâche est de permettre à l'utilisateur de lire et d'analyser les données facilement et efficacement, plutôt que de gérer les transactions. L'objectif principal de dimension est de fournir le filtrage, d'effectuer un regroupement et un étiquetage efficace.

Les avantages

Voici les différents avantages du tableau des dimensions:

  • Il a une structure simple.
  • Il est facile à analyser et à comprendre.
  • Données dénormalisées.
  • Aide à conserver des informations historiques pour n'importe quelle dimension.
  • Facile à récupérer des données.
  • Rapide à créer et à mettre en œuvre.
  • Il donne le contexte entourant tout processus métier.

Conclusion - Tableau des dimensions

Cela fait partie intégrante de la modélisation des données. Il est utilisé dans le schéma en étoile ou en flocon de neige. Il contient les dimensions, les clés et les valeurs des attributs de la table de faits. Il existe différents types qui sont utilisés dans différents scénarios.

Articles recommandés

Ceci est un guide du tableau des dimensions. Ici, nous avons discuté des types, comment fonctionne la table de dimension dans l'entrepôt de données avec des avantages. Vous pouvez également consulter nos autres articles connexes pour en savoir plus-

  1. Tableau des faits vs tableau des dimensions
  2. Qu'est-ce que la table des faits?
  3. Qu'est-ce que Tableau?
  4. Mélange de données dans Tableau