Qu'est-ce que le modèle de données?

L'interprétation et la documentation des procédures et transactions existantes de conception et de développement de logiciels sont appelées modélisation de l'information. Les méthodes et les instruments de modélisation de l'information simplifient les conceptions de systèmes complexes pour simplifier la réingénierie de l'exploitation des informations. Il est utilisé pour concevoir logiquement et physiquement un entrepôt d'informations. Dans cette rubrique, nous allons découvrir la modélisation de l'entrepôt de données.

Besoin de modélisation d'entrepôt de données

  1. Collecte des exigences commerciales
  2. Amélioration des performances de la base de données
  3. Fournit la documentation du système source et cible

1. Collecte des exigences opérationnelles

Un entrepôt de données est généralement conçu pour déterminer les entités requises pour l'entrepôt de données et les faits qui doivent être enregistrés auprès des architectes de données et des utilisateurs métier. Cette première conception a beaucoup d'itérations avant que le modèle final ne soit décidé.

À ce stade, nous devons surmonter les inconvénients courants de la phase de conception. Étant donné qu'un système existant implémente un entrepôt de données, les architectes intègrent parfois une grande partie de l'ancien système dans la nouvelle conception, ce qui permet de gagner du temps ou de divulguer.

Le modèle logique capture efficacement les besoins de l'entreprise et sert de base au modèle physique.

2. Amélioration des performances de la base de données

La vérification de l'efficacité est une caractéristique essentielle d'un magasin de données. Dans un entrepôt de données, des informations énormes sont impliquées, il est donc très essentiel d'utiliser un produit de modèle de données pour les métadonnées et la gestion des données utilisées par les consommateurs BI.

Le modèle physique ajoute une indexation pour optimiser l'efficacité de la base de données. Les schémas sont également parfois modifiés. Par exemple, si un schéma en étoile promet une récupération plus rapide des données, il peut passer à un schéma en flocons de neige

3. Fournit la documentation du système source et cible

Lors du développement d'un système ETL, les modèles physiques et logiques des systèmes source et cible sont très importants à vérifier.

Cette documentation est offerte par la modélisation de l'information comme référence pour l'avenir.

Modèle de données conceptuel

La relation la plus élevée entre les entités distinctes est déterminée par un modèle de données conceptuel.

Il s'agit de la première étape vers la création d'un modèle de données descendant qui représente la présentation précise de l'organisation commerciale.

Conçoit la structure totale de la base de données et répertorie les domaines

Comprend les types et les interactions des entités. Les notations symboliques (IDEF1X ou IE) représentent la connexion entre les champs de rubrique. Dans un modèle d'information, la cardinalité montre les relations une à une ou plusieurs

Modèle de données sur les relations

La modélisation des informations relatives dans les schémas OLTP orientés transaction est utilisée. Un modèle de données relationnel présente des caractéristiques importantes:

  • Utilisations de la clé
  • Redondance des données
  • Relation entre les données

Utilisations de la clé

La clé principale d'une table est la clé. Il est utilisé comme une seule identification. Une colonne non nulle est une clé primaire. Pour la clé principale, la clé étrangère est utilisée. Ils lient les informations d'une table à une autre table et se connectent.

Redondance des données

Le modèle d'information sur les relations applique les lois sur l'intégrité de l'information

La redondance des données est supprimée. Une information n'est pas collectée à plusieurs reprises. Cela garantit la cohérence des données et le stockage de données restreint

Relation entre les données

Toutes les données sont stockées dans des tableaux et chaque relation a des colonnes et des lignes.

Un en-tête et un corps devraient être sur la table. L'en-tête est la liste des colonnes du tableau et le tableau se compose des lignes. Le tuple est la valeur unique produite par une intersection de colonnes et de lignes.

Modèle de données multidimensionnel

Une organisation qui reflète les entités importantes d'une entreprise et la connexion entre elles est une perspective logique d'un modèle de données multidimensionnel. Les bases de données et les tables ne sont pas limitées à une base de données naturelle. Les diagrammes ER ne sont pas représentés.

  • Les attributs
  • Les faits
  • Dimension

une. Dimension

  1. Un aspect est une collecte de données composée de composants d'information individuels qui ne se chevauchent pas
  2. Vous pouvez définir, grouper et filtrer les informations à des fins de visualisation et de navigation par les utilisateurs finaux.

b. Les faits

  1. Un tableau de colonnes utilisé pour répondre aux problèmes de l'entreprise pour des raisons numériques.
  2. Les mesures sont additives, semi-additives et non additives

c. Les attributs

  1. Les conditions abstraites sont conçues pour faciliter le résumé des informations dans une étude
  2. Ils peuvent également être décrits comme des en-têtes de colonne qui ne sont pas inclus dans un calcul de rapport.

Avantages du modèle dimensionnel

  1. La normalisation des dimensions facilite la génération de rapports dans tous les domaines d'activité.
  2. Dimensionnel également pour stocker des données afin de faciliter l'obtention de données à partir des données lorsque les données sont stockées dans la base de données.
  3. L'entreprise est très compréhensible pour le modèle dimensionnel. Ce modèle est basé sur les termes de l'entreprise afin que l'entreprise comprenne la signification de chaque réalité, aspect ou caractéristique.
  4. Pour une interrogation rapide des informations, les modèles dimensionnels sont déformalisés et optimisés. De nombreuses plateformes de bases de données relationnelles reconnaissent ce modèle et optimisent les plans de performances des requêtes.
  5. Les modèles dimensionnels peuvent facilement s'adapter au changement. Les tableaux de dimensions peuvent inclure des colonnes supplémentaires sans influencer l'utilisation de ces tableaux par les applications d'intelligence d'entreprise actuelles.

Modélisation des données sur les meilleures pratiques

Avant de commencer le modèle de données, une analyse complète des besoins de l'entreprise cliente doit être effectuée.Il doit être extrêmement important de rencontrer les clients pour discuter des exigences et des techniques de modélisation de l'information et de le faire immédiatement confirmer par les spécialistes de l'entreprise.

L'entreprise doit comprendre le modèle de données, que ce soit dans un format graphique / métadonnées ou en tant que règles commerciales pour les textes.

Articles recommandés

Ceci est un guide de modélisation de l'entrepôt de données. Ici, nous discutons du modèle de données, pourquoi est-il nécessaire dans l'entreposage de données ainsi que ses avantages ainsi que les types de modèles. Vous pouvez également consulter l'article suivant pour en savoir plus -

  1. Outils d'entrepôt de données
  2. Types d'entrepôt de données
  3. Outils d'analyse de données
  4. Outils de science des données
  5. Oracle Data Warehousing

Catégorie: