Introduction à la conception d'entrepôt de données

Un entrepôt dans un mot commun signifie, stocker quelque chose en un seul endroit et des cas similaires dans les industries pour stocker la quantité complexe de données en un seul endroit. La Business Intelligence (BI) vous permet d'interroger des données à partir des sources de données et la confiance ne peut être établie que s'il existe une bonne conception d'entrepôt de données.

L'entrepôt de données intègre plusieurs sources de données et fournira un bon support pour l'analyse et le reporting analytique. Si vous avez une mauvaise conception de l'entrepôt de données, cela aura un impact sur la croissance de votre organisation en ayant des données de requête inexactes.

Prenez un exemple de popularité de la boutique en ligne Amazon en commandant l'article et il peut être livré à notre porte. Lorsque le client se connecte au site e-commerce et recherche le produit disponible dans la boutique. Ensuite, nous avons sélectionné et commandé l'article, dès que le fournisseur accepte et expédié immédiatement. Ici, nous pouvons économiser notre temps pour acheter l'article requis.

Un cas similaire à cet entrepôt de données également, les données peuvent être stockées et obtenues à partir du système de transaction. L'entrepôt de données comme un concept majeur

  • OLAP - Traitement analytique en ligne
  • OLTP - Traitement transactionnel en ligne

Les deux sont des systèmes de traitement en ligne mais présentent quelques différences. OLTP gère l'application transactionnelle comme ATM, OLAP utilise pour le traitement analytique comme le reporting, les prévisions, etc.,

Rassemblement des exigences

  • La collecte des exigences est une phase de la conception d'un entrepôt de données. Il doit déterminer les critères et les mettre en œuvre avec succès. Il y aura deux stratégies utilisées pour la conception de l'entrepôt de données, l'une s'appelle l'entreprise et l'autre est appelée technique.
  • La stratégie commerciale se concentre sur la vision commerciale à long terme et contribue à augmenter le profit pour la croissance. L'exigence de stratégie technique est basée sur les rapports utilisateur, l'analyse, la sélection du matériel, la méthode de développement, la technique de test, l'environnement d'implémentation et la formation des utilisateurs.
  • Lorsque nous avons déterminé la stratégie commerciale et technique, nous devons également concevoir le plan BCP (Disaster Recovery). En cas de catastrophe d'origine humaine ou naturelle, nous devons avoir un plan pour récupérer rapidement les données et éviter toute perte de données. L'élaboration du plan de reprise après sinistre est l'un des défis et fait confiance à l'organisation.

Configuration de l'environnement

  • Une fois que nous avons rassemblé les données pour la conception de l'entrepôt de données, nous devons créer une configuration d'environnement appropriée pour le développement, les tests et la production. De préférence, il devrait y avoir un système distinct pour l'application, la base de données et séparé pour le reporting / ETL.
  • Lorsque nous construisons un environnement séparé pour chacun, nous garantissons que tous les changements peuvent être développés / testés puis passés à la production.
  • Si nous avons un environnement unique conçu pour toutes ces activités, il pourrait y avoir un problème et la perte de données. Par exemple, lorsqu'un incident s'est produit dans le système, nous ne pouvions pas naviguer et trouver le moyen de le réparer et cela le rend plus complexe.

Modélisation des données

  • Une fois la collecte des exigences et l'environnement configurée, la prochaine consiste à concevoir comment connecter la source de données, le processus et le stockage dans l'entrepôt de données. Cette technique est appelée modélisation des données. Il peut s'agir d'une analyse de l'objet et de la relation entre les autres.
  • Lors de la conception de l'entrepôt de données, les ingénieurs ont conçu comment et où les données doivent être stockées. À la même occasion, nous devons également définir la manière possible de récupérer les données de l'entrepôt de données. Une fois la source identifiée, l'équipe peut construire la logique et créer une vue de schéma de structure.

Types de modèle de données

Il existe trois types

  • Conceptuel
  • Logique
  • Physique

Les trois types de modèle de données sont mentionnés ci-dessous:

1. Conceptuel: il indique CE QUE le système contient et il est conçu par les architectes d'entreprise pour définir la portée de la stratégie d'entreprise.

2. Logique: Ceci définit COMMENT la logique peut être créée dans le SGBD, elle sera conçue par Business Analyst et Data Architect pour créer un ensemble de règles pour stocker / récupérer les données

3. Physique: Ceci définit COMMENT le système peut être implémenté.

Utilisation de la conception de l'entrepôt de données

Une bonne conception d'entrepôt de données peut prendre du temps lors de la récupération des données. Chaque étape doit être suivie efficacement pour que le système soit bon. Il aidera l'organisation à gérer les types de données complexes et à améliorer la productivité en fonction de l'analyse des tendances. Ainsi, chaque étape de la conception d'une architecture DWH est importante et plus consciente dans la méthode de sélection. L'organisation intervient ensuite dans chaque flux et conduit à la mise en œuvre réussie de l'entrepôt de données.

Il existe peu d'utilisations importantes de Data Warehouse

1. Secteur bancaire: la plupart des banques utilisent l'entrepôt de données pour stocker une grande quantité de données de transaction et la possibilité de récupérer les données de requête beaucoup plus rapidement. Il peut être géré comme les données clients, les tendances du marché, les rapports, les analyses, etc.,

2. Secteur financier: il est similaire au secteur bancaire, mais le seul objectif est d'améliorer les changements financiers en analysant les données des clients

3. Gouvernement: De nos jours, le gouvernement gère un grand nombre de données en ligne et stocke dans la base de données relationnelle. Chaque donnée a une relation comme Aadhaar, PAN est liée à de nombreuses sources.

4. Soins de santé: les gestionnaires et les services de santé ont tellement d'informations. Il conserve les détails cliniques, les dossiers des clients et les aide à prédire les résultats, à analyser les commentaires et à générer les rapports.

5. Assurance: Compagnie d'assurance principalement utilisée pour les modèles de données, la tendance des clients et la tenue des registres.

6. Industrie de fabrication et de distribution: il est le plus largement utilisé dans toutes les industries pour stocker des informations sur les articles et les aide à prédire l'article demandé pour la fabrication et les ventes. Analyser l'article vendu qui donne de meilleures techniques de prise de décision.

7. Services aux détaillants: Les détaillants sont l'intermédiaire entre le producteur et le client. L'entrepôt de données les aide pour les promotions et les tendances d'achat d'articles.

8. Industrie du téléphone: les industries du téléphone gèrent un grand nombre de données historiques, ce qui contribue à faire évoluer les données des clients et à cibler les campagnes publicitaires.

Avantages de l'entrepôt de données

  • Fournit une intelligence d'affaires améliorée
  • Garantit la qualité et la cohérence des données
  • Gain de temps et d'argent
  • Suit les données historiquement intelligentes
  • Génère un retour sur investissement élevé

Inconvénient de Data Warehouse

  • Travail de rapport supplémentaire
  • Inflexibilité et homogénéisation des données
  • Préoccupations liées à la propriété
  • Demandes de grandes quantités de ressources
  • Les problèmes cachés prennent du temps

Articles recommandés

Ceci est un guide de conception d'entrepôt de données. Nous discutons ici de la technique de conception de l'entrepôt de données, de la collecte des exigences, de la configuration de l'environnement, des utilisations, des avantages / désavantages. Vous pouvez également consulter l'article suivant pour en savoir plus -

  1. Avantages de l'entrepôt de données
  2. Mise en œuvre de l'entrepôt de données
  3. Modélisation de l'entrepôt de données
  4. Outils d'entrepôt de données
  5. Top 4 différents types de modèles de données

Catégorie: