Questions et réponses d'entrevue ab initio

Vous avez donc finalement trouvé votre emploi de rêve chez Ab initio, mais vous vous demandez comment résoudre l'interview Ab initio et quelles pourraient être les probables questions d'entrevue Ab initio pour 2018. Chaque entretien est différent et la portée d'un travail est également différente. En gardant cela à l'esprit, nous avons conçu les questions et réponses d'entrevue Ab initio les plus courantes pour 2018 pour vous aider à réussir votre entrevue.

Vous trouverez ci-dessous les principales questions d'entrevue ab initio qui sont fréquemment posées lors d'une entrevue. Ces questions d'entrevue sont divisées en deux parties:

Partie 1 - Questions d'entrevue ab initio (de base)

Cette première partie couvre les questions et réponses d'entrevue de base Ab initio.

1. Quels sont les composants ou fonctions disponibles dans ab initio?

Répondre:
Les principaux composants de ab initio sont ci-dessous,

ComposantObjectif
DedupPour supprimer les doublons
JoindrePour joindre plusieurs jeux de données d'entrée en fonction d'une valeur de clé commune.
TrierCe composant réorganise les données. Il prend l'ordre de classement et vide les données en mémoire
FiltreToute suppression conditionnelle des données.
ReproduireCe composant est principalement destiné au parallélisme, car une copie supplémentaire des données est utile tandis que les autres nœuds ne sont pas disponibles.
fusionnerCe composant consiste à combiner plusieurs données d'entrée.

2. Quels sont les types de traitement parallèle?

Répondre:
Ce sont les questions d'entrevue Ab initio les plus fréquemment posées lors d'un entretien. Différents types de traitement parallèle sont,

  1. Parallélisme des composants
  2. Parallélisme des données
  3. Parallélisme de pipeline

Parallélisme des composants: application qui a plusieurs composants exécutés simultanément sur le système. Mais les données sont distinctes. Ceci est réalisé grâce au traitement parallèle au niveau des composants.

Parallélisme des données: les données sont divisées en segments et exécutent les opérations simultanément. Ce type de processus est réalisé en utilisant le parallélisme des données

Parallélisme de pipeline: une application avec plusieurs composants mais s'exécutant sur le même ensemble de données. Cela utilise le parallélisme du pipeline.

3. Quelle est la manière différente de réaliser les partitions?

Répondre:
Il existe plusieurs façons de faire les partitions.

CloisonsLa description
ExpressionRépartition des données selon le langage de manipulation des données.
CléRegroupement des données par clés spécifiques
Équilibre de chargeÉquilibrage de charge dynamique
PourcentageSéparez les données où la taille de sortie est sur les fractions de 100
GammeRépartissez les données uniformément en fonction d'une clé et d'une plage entre les nœuds
Tournoi à la rondeDistribution uniforme des données en taille de bloc sur les partitions de sortie.

Passons aux prochaines questions d'entrevue Ab initio.

4. Qu'est-ce qu'un système multifichier?

Répondre:
Multifile est un ensemble de répertoires sur différents nœuds d'un cluster. Ils possèdent une structure de répertoires identique. Le système multifichier conduit à de meilleures performances car il s'agit d'un traitement parallèle où les données résident sur plusieurs disques.

Il est créé avec la partition de contrôle sur un nœud et les partitions de données sur les autres nœuds pour répartir le traitement afin d'améliorer les performances.

5. Différence entre Hadoop et Ab initio?

Répondre:

HadoopAb initio
Open sourceLogiciel propriétaire
Traitement parallèle via mappeurs et réducteursArchitecture de traitement parallèle
Toute variété de données est la mieux adaptée iciIdéal pour les implémentations EDW traditionnelles
La tolérance aux pannes est atteinteLa tolérance aux pannes n'est pas atteinte
MapReduce est contrôlé sur tous les composants ou fonctionsLes composants comme joindre, grouper, trier sont facilement

exécuté

Pas cher comme open source et peut essayer tous les cas d'utilisation commerciale.Cher et applicable sur une analyse de rentabilisation de grande valeur en raison du coût
Composants à couplage lâche où des fonctions personnalisées sont crééesÉtroitement couplé entre les composants car ils sont fortement recommandés en fonction du cas d'utilisation métier.

Partie 2 - Questions d'entrevue ab initio (avancé)

Jetons maintenant un coup d'œil aux questions avancées de l'entrevue Ab initio.

6. Quels types de dispositions Ab initio prend-il en charge?

Répondre:

  • Prend en charge les dispositions série et parallèle.
  • Une mise en page graphique prend en charge à la fois les mises en page série et parallèle.
  • Un système multi-fichiers est un système parallèle à 4 voies
  • Un composant d'un système graphique peut exécuter un système parallèle à 4 voies.

7. Quelle est la relation entre l'environnement de métadonnées d'entreprise (EME), l'environnement de développement graphique (GDE) et le système de coopération?

Répondre:
CoOperating System: Il fonctionne au-dessus du système d'exploitation et cela est fourni par l'ab initio et c'est la base de tous les processus Ab Initio. Les commandes aériennes sont l'une des fonctionnalités qui peuvent être installées sur différents systèmes d'exploitation comme UNIX, Linux, IBM, etc.

Ce sont les fonctionnalités suivantes qu'il fournit,
- Gère et exécute les graphes Ab Initio et contrôle les processus ETL
- Fournir les extensions
- Surveillance et débogage des processus ETL
- Gestion des métadonnées et interaction avec l'EME

GDE: C'est un composant de conception et utilisé pour exécuter les graphiques ab initio.

Les graphiques sont formés par les composants (prédéfinis ou définis par l'utilisateur) et les flux et les paramètres. Il fournit le processus ETL dans Ab Initio qui est représenté par des graphiques.

Possibilité d'exécuter, de déboguer les travaux des journaux de processus et de suivre les journaux d'exécution

Méta-environnement d'entreprise (EME): c'est un environnement de stockage et également de gestion des métadonnées (métadonnées commerciales et techniques). Les métadonnées sont accessibles à partir de l'environnement de développement graphique et également du navigateur Web ou de la ligne de commande coopérante. Il s'agit d'un référentiel ab initio pour tous les espaces réservés.

Passons aux prochaines questions d'entrevue Ab initio.

8.Comment les données sont traitées et quels sont les fondements de cette approche?

Répondre:
Il y a certaines activités qui nécessitent la collecte des données et la meilleure chose à faire dépend largement de la même chose dans de nombreux cas. Avant de traiter les données, elles doivent résider sur un espace réservé comme un stockage bien défini. Cette tâche dépend de certains facteurs majeurs,

1. Collecte de données
2. Présentation
3.Résultats finaux
4. analyse
5. tri

9. Quelle est la différence entre le partitionnement avec clé et le tourniquet?

Réponse :
Ce sont les questions avancées de l'entrevue Ab initio posées lors d'une entrevue. Partition par clé
En cela, nous devons spécifier la clé en fonction de laquelle la partition se produira. Il en résulte des données bien équilibrées en raison des partitions basées sur les clés. Il est utile pour les clés dépendantes
parallélisme.
Partition par round robin: dans ce cas, en répartissant uniformément les données en blocs de taille de bloc, les enregistrements sont partitionnés de manière séquentielle sur la partition de sortie. Ce n'est pas la clé
et les résultats sont des données bien équilibrées, en particulier avec une taille de bloc de 1. Il est utile pour
enregistrer le parallélisme indépendant.

10. Comment améliorez-vous les performances d'un graphique?

Réponse :
Il existe de nombreuses façons d'améliorer les performances du graphique.
1) Réduisez l'utilisation de plusieurs composants sur certaines phases.
2) Utiliser une valeur raffinée et bien définie des valeurs de base max pour trier et joindre les composants
3) Minimiser l'utilisation des fonctions d'expression régulière comme re_index dans les fonctions de transfert
4) Minimisez le composant de jointure trié et, si possible, remplacez-le par une jointure en mémoire / jointure par hachage
5) Utilisez uniquement les champs obligatoires dans les composants de tri, de reformatage et de jointure
6) Utilisation de Phase ou du tampon de flux lors des cas de fusion ou de jointures triées
7) Utilisez la jointure de hachage si les deux ensembles d'entrée sont petits, sinon mieux choisir la jointure triée pour la taille d'entrée énorme
8) Pour un grand ensemble de données, mieux vaut ne pas utiliser la diffusion comme partitionnée
9) Réduisez le nombre de composants de tri pendant le traitement.
10) Évitez de répartir inutilement les données

Article recommandé

Ceci a été un guide pour la liste des questions et réponses d'entrevue ab initio afin que le candidat puisse réprimer facilement ces questions d'entrevue ab initio. Ici, dans cet article, nous avons étudié les principales questions d'entrevue ab initio qui sont souvent posées lors des entretiens. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Questions d'entrevue Android - Top 10 des questions utiles
  2. D'entretiens chez The Statistics | Utile et le plus demandé
  3. Questions d'entrevue Minitab - Top 7 des questions utiles à apprendre
  4. Questions et réponses d'entrevue Splunk que vous devez savoir