Questions et réponses basées sur un scénario Informatica - Introduction

Informatica est un outil très important utilisé dans l'entreposage de données, qui aide à gérer de grandes quantités de données et à rendre compte de l'analyse des données. Voici quelques questions qui vous seront utiles lorsque vous assisterez à un entretien sur Informatica.

Vous avez donc finalement trouvé l'emploi de vos rêves dans Informatica, mais vous vous demandez comment résoudre l'interview d'Informatica et quelles pourraient être les questions probables des interviews basées sur un scénario Informatica. Chaque entretien est différent et la portée d'un travail est également différente. Gardant cela à l'esprit, nous avons conçu les questions et réponses d'entrevue basées sur le scénario Informatica les plus courantes pour vous aider à réussir votre entrevue.

Certaines des questions d'entrevue basées sur le scénario Informatica les plus importantes qui sont fréquemment posées lors d'une entrevue sont les suivantes:

1. Comment supprimer les enregistrements en double dans Informatica? Expliquez les différentes façons de le faire?

Répondre:
Il existe de nombreuses façons d'éliminer les doublons:

1. S'il existe des doublons dans la base de données source, un utilisateur peut utiliser la propriété dans le qualificatif source. Un utilisateur doit accéder à l'onglet Transformation et cocher l'option «Sélectionner distinct». En outre, un utilisateur peut utiliser la substitution SQL dans le même but. L'utilisateur peut aller dans l'onglet Propriétés et dans l'onglet de requête SQL écrire la requête distincte.
2. Un utilisateur peut utiliser Aggregator et sélectionner des ports comme clé pour obtenir des valeurs distinctes. Si un utilisateur souhaite trouver des doublons dans toute la colonne, tous les ports doivent être sélectionnés en tant que groupe par clé.
3. L'utilisateur peut également utiliser Sorter avec la propriété Sort distinct pour obtenir des valeurs distinctes.
4. L'expression et la transformation du filtre peuvent également être utilisées pour identifier et supprimer les données en double. Si les données ne sont pas triées, elles doivent d'abord être triées.
5. Lorsqu'une propriété dans la transformation de recherche est modifiée pour utiliser le cache dynamique, un nouveau port est ajouté à la transformation. Ce cache est mis à jour au fur et à mesure de la lecture des données. Si une source a des enregistrements en double, l'utilisateur peut regarder dans le cache de recherche dynamique, puis le routeur ne sélectionne qu'un seul enregistrement distinct.

2. Quelle est la différence entre le qualificatif source et la transformation de filtre?

Répondre:
La transformation de qualificateur source est utilisée pour représenter les lignes que le service d'intégration lit dans une session. C'est une transformation active. En utilisant le qualificatif source, les tâches suivantes peuvent être accomplies:
1. Lorsque deux tables de la même base de données source avec une relation de transformation clé primaire - clé étrangère sont présentes, les sources peuvent être liées à une transformation de qualificateur de source.
2. Filtrage des lignes lorsque le service d'intégration ajoute une clause where à la requête par défaut de l'utilisateur.
3. Lorsqu'un utilisateur souhaite une jointure externe au lieu d'une jointure interne, les informations de jointure sont remplacées par les métadonnées spécifiées dans la requête SQL.
4. Lorsque des ports triés sont spécifiés, le service d'intégration utilise la clause order by pour la requête par défaut.
5. Si un utilisateur choisit de trouver une valeur distincte, le service d'intégration utilise select distinct pour la requête spécifiée.
Lorsque les données que nous devons filtrer ne sont pas une source relationnelle, l'utilisateur doit utiliser la transformation Filtre. Il aide l'utilisateur à remplir la condition de filtre spécifiée pour se laisser aller ou passer. Il supprimera directement les lignes qui ne remplissent pas la condition et plusieurs conditions peuvent être spécifiées.

3. Concevez un mappage pour charger les 3 dernières lignes d'un fichier plat dans la cible?

Répondre:
Supposons que le fichier plat considéré contienne des données ci-dessous:
Colonne A
Aanchal
Priya
Karishma
Snehal
Nupura

Étape 1 : attribuez des numéros de ligne à chaque enregistrement. Générez des numéros de ligne à l'aide de la transformation d'expression en créant un port variable et en l'incrémentant de 1. Après cela, affectez ce port variable au port de sortie. Après la transformation de l'expression, les ports seront comme -

Variable_count = Variable_count + 1
O_count = Variable_count
Créez un port de sortie factice pour la même transformation d'expression et affectez 1 à ce port. Ce port factice renverra toujours 1 pour chaque ligne.
Enfin, l'expression de transformation sera la suivante:
Variable_count = Variable_count + 1
O_count = Variable_count
Dummy_output = 1

Le résultat de cette transformation sera:
Colonne A O_count Dummy_output
Aanchal 1 1
Priya 2 1
Karishma 3 1
Snehal 4 1
Nupura 5 1

Étape 2 : passez la sortie ci-dessus à un agrégateur et ne spécifiez aucun groupe par condition. Un nouveau port de sortie doit être créé en tant que O_total_records dans l'agrégateur et lui affecter le port O_count. L'agrégateur renverra la dernière ligne. La sortie finale de cette étape aura un port factice avec une valeur de 1 et O_total_records aura un nombre total d'enregistrements dans la source. La sortie de l'agrégateur sera: O_total_records, Dummy_output
5 1

Étape 3 : passez cette sortie à la transformation de jointure et appliquez une jointure sur le port factice. L'entrée triée des propriétés doit être vérifiée dans la transformation de jointure. Ce n'est qu'alors que l'utilisateur peut connecter l'expression et la transformation d'agrégateur à la transformation de jointure. La condition de transformation de jointure sera la suivante:
Dummy_output (port de transformation d'agrégateur) = Dummy_output (port de transformation d'expression)

La sortie de la transformation de jointure sera
Colonne A o_count o_total_records
Aanchal 1 5
Priya 2 5
Karishma 3 5
Snehal 4 5
Nupura 5 5

Étape 4 : Après la transformation de jointure, nous pouvons envoyer cette sortie pour filtrer la transformation et spécifier la condition de filtre comme O_total_records (port de l'agrégateur) -O_count (port de l'expression) <= 2

Par conséquent, la condition du filtre sera
O_total_records - O_count <= 2

Le résultat final de la transformation du filtre sera:
Colonne A o_count o_total_records
Karishma 3 5
Snehal 4 5
Nupura 5 5

4. Comment charger uniquement les enregistrements NULL dans la cible? Expliquez comment utiliser le flux de mappage?

Répondre:
Considérez les données ci-dessous comme une source
Emp_Id Emp_Name Salaire Code postal de la ville
619101 Aanchal Singh 20000 Pune 411051
619102 Nupura Pattihal 35000 Nagpur 411014
NULL NULL 15000 Mumbai 451021

La table cible a également une structure de table comme source. Nous aurons deux tables, une qui contiendra des valeurs NULL et l'autre qui ne contiendrait pas de valeurs NULL.
Le mappage peut être le suivant:

SQ -> EXP -> RTR -> TGT_NULL / TGT_NOT_NULL
EXP - La transformation d'expression crée un port de sortie
O_FLAG = IIF ((ISNULL (emp_id) OU ISNULL (emp_name) OU ISNULL (salaire) OU ISNULL (Ville) OU ISNULL (Pincode)), 'NULL', 'NNULL')
RTR - Transformation de routeur deux groupes
Groupe 1 connecté à TGT_NULL (Expression O_FLAG = 'NULL')
Groupe 2 connecté à TGT_NOT_NULL (Expression O_FLAG = 'NNULL')

5. Expliquez comment les performances de la condition de jointure peuvent être augmentées?

Répondre:
Les performances de la condition de jointure peuvent être améliorées en suivant quelques étapes simples.
1) L'utilisateur doit effectuer des jointures autant que possible. Lorsque, pour certaines tables, cela n'est pas possible, un utilisateur peut créer une procédure stockée, puis joindre les tables dans la base de données.
2) Les données doivent être triées avant d'appliquer la jointure dans la mesure du possible.
3) Lorsque les données ne sont pas triées, une source avec moins de lignes doit être considérée comme une source principale.
4) Pour la transformation de jointure triée, une source avec moins de valeurs de clé en double doit être considérée comme une source principale.

Article recommandé

Ceci a été un guide pour la liste des questions et réponses d'entrevue basées sur un scénario Informatica afin que le candidat puisse réprimer facilement ces questions d'entrevue basées sur un scénario Informatica. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. D'entretiens et réponses à Maven Maven | Top et les plus demandés
  2. 10 questions d'entrevue avancées AngularJS pour les expérimentés
  3. Guide des outils Informatica ETL
  4. 12 questions et réponses d'entrevue les plus impressionnantes sur le sélénium
  5. Guide étonnant de l'architecture Informatica
  6. Guide complet d'Informatica vs Datastage