Introduction à Pig Question et réponses

Apache Pig est une plate-forme de haut niveau pour laquelle est utilisé pour créer des programmes qui s'exécutent sur Hadoop. La langue du cochon est connue sous le nom de Pig Latin. Pig est écrit en Java et a été développé par Yahoo Research et Apache Software Foundation. Sa sortie initiale a eu lieu le 11 septembre 2008. Préparation d'un entretien d'embauche à Pig. Je suis sûr que vous voulez connaître les questions et réponses les plus courantes de l'interview de Pig qui vous aideront à réussir facilement l'interview de Pig.

Vous trouverez ci-dessous la liste des principales questions et réponses de Pig Interview à votre secours. ces questions d'entrevue sont divisées en deux parties:

  • Partie 1 - Questions d'entrevue de porc (de base)
  • Partie 2 - Questions d'entrevue de porc (avancé)

Partie 1 - Questions d'entrevue de porc (de base)

Cette première partie couvre les questions et réponses de base de l'entretien avec Pig

Q1.Quelle est la différence entre Map Reduce et Pig?

Répondre:
Map Reduce est un langage compilé et l'efficacité du code de Map-Reduce est élevée et Pig est un langage de script avec moins d'efficacité du code.

Q2.Que voulez-vous dire par le sac dans Pig?

Répondre:
La collection de tuples est connue comme un sac dans un cochon.

Q3.Quels sont les types de données complexes dans Pig?

Répondre:
La carte, les tuples et le sac sont les types de données complexes de Pig.

Q4.Quel est l'aplatissement chez Pig?

Répondre:
Lorsque nous voulons supprimer l'imbrication des données dans le tuple ou le sac, nous utilisons Aplatir.

Q5.Supposons que nous ayons un nom de fichier avec abc.csv et ayant l'attribut comme id, nom, année, note, durée. Comment allez-vous télécharger ce fichier sur un cochon?

Répondre:
films = LOAD 'chemin de abc.csv' UTILISATION de Pig Storage (', ') as (id, nom, année, évaluation, durée);

Q6. Quelle est la différence entre PigLatin et HIVEQL?

Répondre:
HIVEQL est un langage déclaratif et PigLatin est un courrier procédural.

Passons aux prochaines questions d'entrevue avec Pig.

Q7.Que voulez-vous dire par un sac intérieur et un sac extérieur en porc?

Répondre:
La relation à l'intérieur du sac fait référence au sac intérieur et la relation normale est connue sous le nom de sac extérieur.

Q8.Quelle est la différence entre le Groupe et COGROUP?

Répondre:
L'opérateur GROUP est utilisé pour regrouper les données dans une seule relation et COGROUP est utilisé pour établir la relation dans GROUP et JOIN.

Q9.Quelle est la différence entre COUNT et COUNT_STAR?

Répondre:
La fonction COUNT ne fonctionne pas avec une valeur NULL lorsque nous comptons un élément dans un sac, mais COUNT_STAR considérera la valeur NULL.

Q10. Quels sont les opérateurs de diagnostic disponibles dans Apache Pig?

Répondre:
Opérateur de vidage, Opérateur de description, Opérateur d'explication, Opérateur d'illustration.

Q11.Que voulez-vous dire par opérateur UNION et SPLIT?

Répondre:
En utilisant un opérateur UNION, nous pouvons fusionner le contenu de deux ou plusieurs relations et un opérateur SPILLED est utilisé pour diviser la relation unique en deux ou plusieurs relations.

Q12.Comment obtenir les 10 premiers tuples de la relation R?

Répondre:
En utilisant la fonction TOP ().

Passons aux prochaines questions d'entrevue avec Pig.

Q13.Quelles sont les similitudes entre Pig et Hive?

Répondre:
Pig utilise PigLatin et Hive utilise HiveQL convertit les commandes en travaux MapReduce.

Q14.Quels sont les différents types de fonctions UDF de JAVA prises en charge par Apache Pig?

Répondre:
Les fonctions algébriques, Eval, Filtre sont les types de fonctions UDF.

Q15.Vous avez un fichier movies.txt dans le répertoire HDFS avec 1000 enregistrements. Vous souhaitez voir uniquement les 10 premiers enregistrements du fichier movies.txt. Comment allez-vous faire cela?

Répondre:
Tout d'abord, vous devez charger le fichier movies.txt avec le film de nom de relation:
movies = LOAD 'path of movies.txt' USING Pig Storage (', ') as (attributes);
Résultat = limiter l'employé 10

Partie 2 - Questions d'entrevue de porc (avancé)

Jetons maintenant un coup d'œil aux questions avancées sur les entrevues avec les porcs.

Q16.Comment les utilisateurs interagissent-ils avec Hadoop dans Pig?

Répondre:
En utilisant grunt shell

Q17.Pig prend-il en charge les commandes multilignes?

Répondre:
Oui

Q18.Quelles sont toutes les classes de statistiques dans un package pigstats?

Répondre:
PigStats, JobStats, OutputStats, InputStats.

Q19.Qu'est-ce que l'UDF?

Répondre:
La fonction qui n'est pas intégrée à l'opérateur mais peut créer par programmation une fonction pour afficher la fonctionnalité.

Q20.Expliquer la sensibilité à la casse dans Pig Latin?

Répondre:
Les fonctions et les noms des relations sont sensibles à la casse en latin latin, mais un nom ou un mot-clé et un paramètre ne respectent pas la casse.

Q21.Qu'est-ce que Grunt in Pig?

Répondre:
Grunt est un terminal de commande qui est un shell interactif où nous donnons la commande de Pig.

Q22.Quelle est l'exigence de MapReduce dans la programmation Pig?

Répondre:
MapReduce est un moteur d'exécution.

Passons aux prochaines questions d'entrevue avec Pig.

Q23.Qu'est-ce que le moteur Pig?

Répondre:
Le moteur Pig fournit l'environnement d'exécution pour exécuter les programmes Pig. Il convertit les opérations de raclage en tâches MapReduce.

Q24.Quels sont les modes d'exécution de Pig?

Répondre:
Mode local: l'opération Pig sera exécutée dans une seule machine virtuelle Java.
Mode MapReduce: l'exécution se fera du cluster Hadoop.

Q25.Quelles sont les différentes fonctions Eval disponibles chez le porc?

Répondre:
AVG, CONCAT, MAX, MIN, SM, SIZE, COUNT sont différentes fonctions du cochon EVAL.

Q26.Que voulez-vous dire par LOAD et STORE dans Pig?

Répondre:
Il s'agit de l'opérateur de chargement et de stockage des données dans hdfs.

Passons aux prochaines questions d'entrevue avec Pig.

Q27.Quelle fonction mathématique disponible dans Pig?

Répondre:
ABS, ACOS, LOG, ROUND, CBRT, SORT sont les fonctions mathématiques disponibles dans Pig.

Q28.Que faisait le mot-clé distinct dans Pig?

Répondre:
Des mots clés distincts suppriment les mots clés en double des enregistrements. Par exemple:
films = LOAD 'chemin de abc.csv' UTILISATION de Pig Storage (', ') as (id, nom, année, évaluation, durée);
New_movies = distinct (id, nom, année, note, durée);

Q29.Que voulez-vous dire par type de données primitif dans Pig?

Répondre:
Int, Long, Float, Double, Char array, Byte array sont les types de données primitifs dans Pig.

Q30.Que voulez-vous dire par un tuple dans Pig?

Répondre:
Un ensemble ordonné de champs d'une donnée est appelé Tuple.

Conclusion

Si vous vous préparez pour les emplois liés à Hadoop, vous devez préparer le Pig pour cela, car ce sujet jouera le rôle principal pour obtenir de bonnes remarques dans l'interview. Les questions d'entrevue de porc qui sont partagées ci-dessus vous aideront à préparer les bases et théoriquement du porc, mais vous devez avoir les mains sur le porc. Cela vous aidera à renforcer la confiance et les connaissances avancées.

Article recommandé

Ceci a été un guide pour la liste des questions et réponses d'entrevue de porc afin que le candidat puisse réprimer facilement ces questions d'entrevue de porc. Ici, nous avons couvert à la fois les questions d'entrevue de base et avancées de Pig. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Questions d'entretiens utiles Apache PIG
  2. Questions d'entretiens chez C ++
  3. Questions d'entretien d'embauche Spark que vous devez savoir
  4. Questions d'entretiens chez Cucumber