Introduction au schéma en étoile

Le schéma en étoile est l'approche et le modèle dimensionnel les plus simples où les tables de fonction, les dimensions et les faits sont organisés de manière organisée et il est principalement appliqué dans la Business Intelligence et l'entreposage de données. Un schéma en étoile est formé en disposant chaque fait avec ses dimensions associées qui ressemblent à une étoile. Un fait est un résultat infini, comme les détails des ventes et le nombre de connexions. Une dimension est la collecte de données de référence comprenant des faits, tels que la date, des détails sur le produit et les clients. Le schéma en étoile est optimisé pour les énormes requêtes de données dans l'entrepôt de données, les cubes de données de traitement analytique en ligne et les requêtes ad hoc.

Comment créer un schéma en étoile?

Ici, l'utilisateur va créer un schéma en étoile par conversion du modèle de relation d'entité. Les modèles de relation d'entité sont trop complexes pour expliquer les quantités et les attributs fonctionnels, il est donc simplifié en schéma d'étoiles dimensionnel comme suit:

  • Recherchez la procédure d'entreprise dans la vue des relations d'entité et comprenez le modèle qui peut être divisé en plusieurs modèles dimensionnels. Une relation d'entité se compose de données d'entreprise.
  • Trouvez plusieurs à plusieurs tables en relation d'entité qui explique la procédure de l'entreprise et convertissez-les en tables de réalité de modèle dimensionnel. Cette table contient des données comprenant la table de faits et une table dimensionnelle avec des valeurs numériques et des attributs de clé uniques.
  • L'idée derrière ce processus est de différencier les tables d'informations basées sur l'échange ou les tables d'informations effacées. Il est donc nécessaire de concevoir plusieurs à plusieurs relations. Par exemple, dans la base de données ERP, il y a des détails de facture qui sont la table d'échange. Les détails mis à jour et actualisés sont des tables basées sur l'échange. Maintenant, en comparant les deux tableaux, il est dérivé que les données sont réellement statiques.
  • La table de réalité est une représentation d'un modèle dimensionnel qui montre plusieurs à plusieurs réseaux entre des mesures finies. Il en résulte que les clés étrangères dans les tables de réalité partagent plusieurs à plusieurs, ce qui est une relation dénombrable. la plupart de ce tableau relève des tables basées sur l'échange
  • La dernière étape de la conception du schéma en étoile consiste à dénormaliser les tables résidantes en tables de mesure. La clé obligatoire consiste à créer une clé en double. Cette clé repose sur la table de réalité qui aide à une meilleure compréhension. Recherchez la date et l'heure dans la conception de la relation d'entité et archivez la table de dimension. Les dates sont enregistrées comme horodatage. Une colonne de dimension de date représente l'année, le mois ou la date ou l'heure

Exemple: La table dimensionnelle temporelle a TIMEID, Quartername, QuarterNo, MonthName, MonthNo, DayName, DayofMonth, DayOfWeek qui peuvent être des critères importants des tables dimensionnelles. De même, toutes les tables ont un identifiant et des attributs uniques. Les langages de requête tels que SQL peuvent être appliqués à l'exploration de données, à l'entrepôt de données et à l'analyse de données.

Syntaxe de la définition du cube:

Define cube (cube-name)(dimension-list): (measure-list)

Les cubes sont déployés pour répondre aux alertes à différents niveaux et le temps de réponse pour répondre à la requête est minimum. Il est disponible en tant que conception pré-construite et applicable dans les situations requises. La création d'un schéma en étoile est très facile et efficace à appliquer et est également adaptable. Il est obligatoire de compléter la table de faits et la table dimensionnelle qui à leur tour forment une étoile et peuvent être formées à l'aide de requêtes SQL ou de code en cours d'exécution. Cette conception est faite pour une meilleure compréhension et une récupération facile des données.

Caractéristiques du schéma en étoile

1. Le schéma en étoile fournit des agrégations et des calculs rapides tels que le nombre total d'articles vendus et les revenus générés à la fin de chaque mois. Ces détails et processus peuvent être filtrés selon les exigences en encadrant des requêtes appropriées.

2. Il a la capacité de filtrer les données des données normalisées et de répondre aux besoins d'entreposage de données. Les informations associées de la table normalisée sont empilées dans un onglet à plusieurs dimensions. Une clé unique est générée pour chaque table de faits pour identifier chaque ligne.

3. La table de faits est la mesure d'événements spécifiques, y compris les valeurs de nombres finis et se compose de clés étrangères liées aux tables dimensionnelles. Ce tableau est encadré de valeurs de faits au niveau atomique et permet de stocker plusieurs enregistrements à la fois. Il existe trois types différents de table de faits.

4. Les tableaux de faits de transaction contiennent des données sur des événements spécifiques tels que les événements de vacances, les événements de vente.

5. Enregistrement des faits pour des périodes données comme les informations de compte à la fin de chaque trimestre.

6. Les tables dont l'agrégation est rapide pendant une certaine période sont appelées tables d'accumulation de clichés.

7. Les tableaux dimensionnels fournissent des données d'attribut détaillées, les enregistrements trouvés dans le tableau de faits. La table de dimensions peut avoir des fonctionnalités variées. Les tableaux dimensionnels sont principalement utilisés comme tableau dimensionnel heure et date, tableau dimensionnel produit et bon de commande, détails dimensionnels des employés et des comptes, tableau dimensionnel Géographie et emplacements. Ces tables sont affectées avec un seul type de données entier qui est la clé primaire en double.

8. L'utilisateur peut concevoir sa table en fonction des besoins. Par exemple, s'il a besoin d'une table dimensionnelle des ventes avec clé de produit et de client, clé de date et d'heure, clé de revenu généré par les revenus. Si l'homme d'affaires encadre une table dimensionnelle de produit avec des attributs clés tels que la couleur, la date de l'article acheté, la clé de promotion et la clé client.

Les avantages

  • Il est formé avec une logique simple et des requêtes faciles à extraire les données du processus transactionnel.
  • Il a une logique de rapport commune qui est impliquée dynamiquement.
  • Le schéma en étoile peut offrir une augmentation des performances pour les applications de génération de rapports.
  • Schéma en étoile conçu en alimentant des cubes appliqués par le processus de transaction en ligne pour créer et faire fonctionner les cubes efficacement.

Désavantages

  • Il a une intégrité élevée et un état dénormalisé élevé. Si l'utilisateur ne met pas à jour les valeurs, le processus complet sera réduit. Les protections et la sécurité ne sont pas fiables jusqu'à la limite. Il n'est pas aussi flexible qu'un modèle analytique et ne prolonge pas son soutien efficace à de nombreuses relations.
  • Le schéma en étoile est déployé dans la base de données pour contrôler la récupération plus rapide des données. La requête est utilisée pour sélectionner le besoin plutôt que de rechercher dans la base de données entière. Les données filtrées et sélectionnées peuvent être appliquées dans différents cas. Par conséquent, ce schéma en étoile est un modèle simple qui est facilement adopté.

Article recommandé

Ceci est un guide sur Qu'est-ce que le schéma en étoile? Nous discutons ici de l'introduction au schéma en étoile et de ses caractéristiques ainsi que des avantages et des inconvénients. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus -

  1. Aperçu du tableau de faits
  2. Schéma étoile vs schéma flocon de neige | Principales différences
  3. Modélisation d'entrepôt de données avec types
  4. Bases de données AWS avec avantages
  5. Pipeline de données AWS

Catégorie: