Différence entre Star Schem a et Snowflake Schema

Dans cet article, nous discuterons en détail des différences entre le schéma en étoile et le schéma en flocon de neige. Le schéma est le moyen de décrire logiquement l'ensemble des bases de données ou des entrepôts de données à l'aide de bases de données relationnelles. La description peut inclure le nom et les détails des enregistrements de tout type avec tous les agrégats et éléments de données. Les entrepôts de données utilisent les schémas Star, Snowflake, Fact Constellation et Galaxy.

Schéma en étoile

Il s'agit du schéma d'entrepôt de données le plus simple. Comme son nom l'indique, sa structure est comme une étoile. Dans ce schéma, la table de faits est présente au centre et le nombre de tables de dimensions lui est associé via une clé étrangère et la table de dimensions contient l'ensemble d'attributs. Dans ce schéma, chaque dimension est représentée avec une seule table de dimension mais les tables de dimension ne sont pas jointes les unes aux autres. Ses avantages incluent le découpage, la compréhension facile des données, l'utilisation optimale du disque et l'augmentation des performances. Voyons un exemple pour une meilleure compréhension.

Exemple:

Considérez une entreprise de fabrication de réfrigérateurs et nous devons créer un schéma pour les ventes de cette entreprise de fabrication de réfrigérateurs. Les ventes auront les dimensions suivantes:

  • Article
  • Emplacement
  • Branche
  • Temps

Le schéma comporte une table de faits au centre des ventes qui contiendrait des clés à associer à chaque dimension, ayant deux mesures, à savoir les unités vendues et les dollars vendus.

Schéma de flocon de neige

Snowflake Schema est l'extension du schéma en étoile. Il lui ajoute des dimensions supplémentaires. Comme son nom l'indique, il ressemble à un flocon de neige. Dans ce schéma, les tables de dimension sont normalisées, c'est-à-dire que les données sont divisées en tables supplémentaires. La division de la table réduit la redondance et le gaspillage de mémoire. Il a la forme hiérarchique de tableaux dimensionnels. Les tables de dimension et de sous-dimension sont associées aux clés primaire et étrangère dans la table de faits. Il est plus facile à implémenter et utilise moins d'espace disque. Comme il a plusieurs tables, les performances de la requête sont réduites. Plus de maintenance est nécessaire car il y a plus de tables de recherche. Voyons un exemple pour une meilleure compréhension.

Exemple:

En considérant le même exemple que ci-dessus d'une entreprise de fabrication de réfrigérateurs, dans le schéma en flocons de neige, la table de faits est la même que dans le schéma en étoile, mais la principale différence réside dans la définition ou la disposition des tableaux de dimensions.

Dans ce schéma, la table à une dimension de l'article a été normalisée et a été scindée et une nouvelle table fournisseur a été créée avec des informations sur le type de fournisseur. De même, la table des dimensions de l'emplacement est normalisée et les données sont divisées en une nouvelle table de ville contenant les détails de la ville particulière.

Comparaison directe entre le schéma en étoile et le schéma en flocon de neige (infographie)

Voici les 9 principales différences entre le schéma en étoile et le schéma en flocon de neige.

Différences clés entre le schéma en étoile et le schéma en flocon de neige

Voyons quelques différences majeures entre le schéma en étoile et le schéma en flocon de neige.

Schéma en étoile:

  • Les hiérarchies de dimension dans le schéma en étoile sont stockées dans la table de dimension.
  • Il contient une table de faits centrale entourée d'une table de dimensions.
  • En cela, une jointure unique a associé la table de faits à une table de dimensions.
  • Il a un design simple.
  • La structure des données est dénormalisée.
  • La requête s'exécute à un rythme plus rapide.
  • Dans ce cube, le traitement est plus rapide.
  • Il a des données plus redondantes.
  • Il utilise des requêtes simples.
  • Le schéma en étoile est facile à comprendre.
  • Dans un schéma en étoile, plus d'espace est consommé.

Schéma de flocon de neige:

  • Les hiérarchies dans un schéma en flocons de neige sont stockées dans des tables distinctes.
  • Il contient également une table de faits entourée d'une table de dimension et ces tables de dimension sont en outre entourées d'une table de dimension.
  • Dans ce schéma, de nombreuses jointures sont nécessaires pour récupérer les données.
  • Il a une conception complexe.
  • La structure des données est normalisée dans le schéma des flocons de neige.
  • La requête s'exécute comparativement plus lentement que le schéma en étoile.
  • Dans le schéma de flocon de neige, le traitement des cubes est plus lent.
  • Il contient des données moins redondantes.
  • Il utilise des requêtes complexes.
  • Le schéma en flocons de neige est relativement difficile à comprendre ce schéma en étoile.
  • Dans le schéma de flocon de neige, moins d'espace est consommé.

Tableau comparatif Schéma étoile vs Schéma flocon de neige

Discutons des comparaisons entre le schéma en étoile et le schéma en flocon de neige.

Caractéristique

Schéma en étoile

Schéma de flocon de neige

Maintenance / changementIl a des données plus redondantes et donc il est plus difficile de changer ou de maintenirCe schéma est plus facile à modifier et à entretenir en raison d'une redondance moindre
CompréhensibilitéLa complexité de la requête est moindre et donc facile à comprendreLes requêtes appliquées sont plus complexes et donc difficiles à comprendre
Temps d'exécution de la requêteIl a moins de clés étrangères et donc l'exécution de la requête est plus rapide et prend moins de tempsEn raison de plus de clés étrangères, le temps d'exécution de la requête est supérieur ou la requête s'exécute lentement
Type d'entrepôt de donnéesMieux pour les datamarts ayant une relation unique, c'est-à-dire un à un ou un à plusieursMieux pour les relations complexes, c'est-à-dire plusieurs à plusieurs relations
Nombre de jointuresIl a plus de nombre de jointuresIl a moins de jointures
Tableau des dimensionsIl n'a qu'une seule table de dimension pour chaque dimensionIl a une ou plusieurs tables de dimensions pour une seule dimension
ConvivialitéSi la taille de la table de dimension est inférieure, c'est-à-dire moins de nombre de lignes, le schéma en étoile est préférableBon à utiliser lorsque la taille du tableau des dimensions est plus grande
Normalisation et dénormalisationLa table de faits et les tables de dimensions sont dénormalisées.Une table de faits est dénormalisée tandis que la table de dimensions est normalisée
Modèle de donnéesIl suit une approche descendanteIl suit une approche ascendante

Conclusion

Dans cet article, nous avons discuté en détail du schéma Star vs schéma Snowflake. Ces schémas sont utilisés pour représenter l'entrepôt de données. Ils sont similaires à certains égards et différents à d'autres. Snowflake est l'extension du schéma en étoile. Lorsque les données sont plus nombreuses, le flocon de neige est préféré car il réduit la redondance, mais l'étoile est comparativement plus populaire que le schéma de flocon de neige.

Articles recommandés

Ceci est un guide pour le schéma en étoile par rapport au schéma en flocon de neige. Ici, nous discutons également des différences clés entre le schéma en étoile et le schéma en flocon de neige avec des infographies et un tableau de comparaison. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus -

  1. Encodage vs décodage - principales différences
  2. Différence entre les petites données et les grandes données
  3. Tests fonctionnels vs tests non fonctionnels
  4. Test de fumée vs test de santé mentale
  5. Qu'est-ce que le test d'intégrité et comment cela fonctionne-t-il?