Qu'est-ce que Data Mart? - Types, fonctionnalités et étapes pour implémenter Data Mart

Table des matières:

Anonim

Introduction à Data Mart

Le monde devient de plus en plus numérique et chaque organisation génère plusieurs pétaoctets de données. Data Mart est une telle classification des données d'un entrepôt de données où la concentration est sur un sujet.

Nous pouvons dire que ce sont les données concernant un département ou une catégorie spécifique comme les ventes, les finances ou le marketing, etc. Fondamentalement, il s'agit d'un sous-ensemble d'entreposage de données. Puisqu'il y a concentration sur des sujets ou des départements spécifiques, nous pouvons dire que la source est limitée ou dépend de très peu de sources.

Data Mart vs Data Warehouse

Un entrepôt de données est un entrepôt avec une collection de données provenant de plusieurs flux du sujet. La partie maintenance et contrôle, comme la collecte et le traitement des données brutes, est principalement gérée par les groupes informatiques des technologies de l'information d'entreprise qui fournissent divers services aux organisations mères.

L'entrepôt de données est également appelé entrepôt de données central ou d'entreprise. Ainsi, la source d'un entrepôt de données sera multiple contrairement au magasin de données qui est un sous-ensemble de l'entrepôt de données dans certains cas.

Types de Data Mart

Il existe généralement trois types de data marts. Elles sont:

1. Entrepôt de données dépendant

Un magasin de données dépendant provient uniquement de l'entrepôt de données et toutes les personnes dépendantes groupées formeront un entrepôt de données d'entreprise. Il s'agit purement d'un sous-ensemble de l'entrepôt de données car il est créé à partir du DW central.

Étant donné que des données propres et résumées sont déjà présentes dans le processus ETT de l'entrepôt de données central, ou Extraire la transformation et le transport est simplifié. Nous avons juste besoin d'identifier le sous-ensemble particulier ici et d'effectuer ETT par-dessus.

Ces data marts sont généralement conçus pour obtenir une meilleure disponibilité et de nombreuses performances améliorées avec un meilleur contrôle et une meilleure efficacité.

2. Data Mart indépendant

Il n'est pas créé à partir de l'entrepôt de données central et la source de celui-ci peut être différente. Étant donné que les données proviennent d'un autre que le processus DW ETT central, c'est un peu différent.

La plupart des magasins de données indépendants sont utilisés par un plus petit groupe d'organisations et la source de ces données est également limitée. Le magasin de données indépendant est généralement créé lorsque nous devons obtenir une solution dans un délai relativement court.

3. Data Mart hybride

Le magasin de données hybride vous permettra de regrouper les données de toutes les autres sources autres que l'entrepôt de données central DW. Lorsque nous traitons avec une intégration ad hoc, cela bénéficiera grandement au meilleur travail sur tous les produits qui ont été ajoutés aux organisations en externe.

Caractéristiques de Data Mart

Voici quelques-unes des fonctionnalités d'un magasin de données:

  • Étant donné que la source des données est concentrée sur le sujet, le temps de réponse de l'utilisateur est amélioré en l'utilisant.
  • Pour les données fréquemment requises, l'utilisation de data marts sera bénéfique car elle est un sous-ensemble du DW central et donc la taille des données sera moindre.
  • De plus, comme le volume des données est limité, le temps de traitement sera assez réduit par rapport aux Dws centraux.
  • Ceux-ci sont fondamentalement agiles et peuvent s'adapter aux changements du modèle assez rapidement et efficacement par rapport à l'entrepôt de données.
  • Datamart requiert un expert unique pour gérer, contrairement aux données d'entrepôt, l'expertise dont nous avons besoin dans plusieurs entrepôts soumis. Pour cette raison, nous disons que Data Mart est plus agile.
  • Nous pouvons séparer les catégories d'accès à un bas niveau avec des données partitionnées et avec un magasin de données, c'est très facile.
  • La dépendance à l'infrastructure est assez limitée et les données peuvent être stockées sur différentes plates-formes matérielles lors de la segmentation.

Étapes pour implémenter Data Mart

Vous trouverez ci-dessous les étapes nécessaires à sa mise en œuvre.

1. Conception

Ce sera la première étape de la mise en œuvre où toutes les tâches et sources requises seront identifiées pour recueillir des informations techniques et commerciales. Plus tard, le plan logique est mis en œuvre et après examen, il sera converti en plan physique. De plus, la structure logique et physique des données est décidée ici comme la façon de partitionner les données et le champ de partition comme la date ou tout autre fichier.

2. Construction

Il s'agit de la deuxième phase de mise en œuvre où les bases de données physiques ont été générées à l'aide du SGBDR, qui a été déterminé dans le cadre du processus de conception et des structures logiques. Tous les objets comme le schéma, les index, les tables, les vues, etc. sont créés.

3. Peupler

Il s'agit de la troisième phase et ici les données y sont remplies lors de la recherche des données. Toutes les transformations requises sont implémentées avant de remplir les données.

4. Accès

Il s'agit de la prochaine étape de la mise en œuvre où nous utiliserons les données renseignées pour interroger la création de rapports. L'utilisateur final utilise cette étape pour comprendre les données à l'aide de requêtes.

5. Gérer

Il s'agit de la dernière étape de la mise en œuvre du magasin de données et ici, diverses tâches telles que la gestion des accès, l'optimisation du système et le réglage, la gestion et l'ajout de nouvelles données au magasin de données et la planification des scénarios de récupération pour gérer les cas de défaillance sont prises en charge.

Avantages de Data Mart

Voici certains des avantages de son utilisation.

  • Il s'agit de l'une des meilleures alternatives économiques à un entrepôt de données où vous ne devez travailler que sur un petit segment de données.
  • La séparation des données des sources rendra le magasin de données efficace car un groupe spécifique de personnes peut travailler les données à partir d'une source spécifique au lieu d'utiliser toutes l'entrepôt de données.
  • Un accès plus rapide aux données est possible en utilisant le magasin de données si nous savons à quel sous-ensemble nous avons besoin d'accéder.
  • Datamart est beaucoup plus facile à utiliser afin que les utilisateurs finaux puissent facilement interroger par-dessus eux.
  • Pour arriver à l'implémentation, le magasin de données nécessite moins de temps que l'entrepôt de données, car les données sont séparées en groupes.
  • Les données historiques d'un sujet particulier peuvent être utilisées pour une analyse facile des tendances.

Conclusion

Parce qu'il est concentré sur un seul domaine fonctionnel, il y a de nombreux avantages à la fois pour l'implémentateur du processus et pour l'utilisateur final. Par conséquent, une mise en œuvre efficace des marts est nécessaire avec un entrepôt de données dans l'organisation.

Articles recommandés

Ceci est un guide sur Qu'est-ce que Data Mart. Nous discutons ici de l'introduction, des fonctionnalités et des 3 principaux types ainsi que de ses fonctionnalités et étapes. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Oracle Data Warehousing
  2. Types de données R
  3. Types de données Python
  4. Modélisation des données Cassandra
  5. Guide complet du modèle de données dans Cassandra