Introduction sur Hive Drop Table

Le mot clé "DROP" fait référence à la suppression. Pour la suppression des données, nous exigeons que les données soient présentes dans la ruche.

Dans Hadoop, nous avons deux fonctionnalités:

  1. Stockage de données
  2. Traitement de l'information

Pour le stockage des données, HDFS (Hadoop Distributed File System) apparaît dans l'image. Maintenant, quand nous disons que nous avons des données dans la table de ruche, cela signifie deux choses:

  1. Les données sont en HDFS
  2. Nous avons créé une table de ruche sur ce fichier HDFS et nous chargeons les données de ce fichier HDFS dans la table de ruche.

Donc, fondamentalement, pour que la table de dépôt de ruche contienne les données, le fichier de données est une condition préalable. Dans cet article, nous allons voir comment supprimer des tables dans la ruche, ce qui se passe lorsque la table est supprimée et tout ce qui concerne la table de dépôt dans la ruche.

Types de table basse dans Hive

Dans la ruche, il existe deux types de tables:

  1. Table interne ou table gérée
  2. Table externe ou table non gérée

Table gérée / table interne:

  1. Dans Hive, « user / hive / warehouse » est le répertoire par défaut. Les tables internes sont stockées dans ce répertoire par défaut. Nous n'avons pas à fournir l'emplacement manuellement lors de la création de la table.
  2. La commande «Drop table» supprime définitivement les données.
  3. Hive gère toute la sécurité des tables gérées.

J'ai une table déjà présente dans le répertoire "user / hive / warehouse" appelée "codes".

Pour vérifier si la table existante est gérée ou non, nous pourrions utiliser la commande ci-dessous:

Syntaxe de commande:

Décrire le nom de table formaté;

Production:

Voyons, les données présentées dans le tableau «codes».

Tout d'abord, en utilisant la commande hive-

Deuxièmement, utiliser Hue (Hadoop User Experience a Web UI)

Commande Supprimer: Drop table nom_table;

Production:

Maintenant, si je veux sélectionner les données des «codes», cela me donnera une erreur car le tableau est supprimé.

De plus, ne pourra pas voir ce tableau dans le répertoire par défaut qui est

«Utilisateur / ruche / entrepôt»

Observez ici,

Table non gérée / table externe:

  1. Tables externes, nous sommes tenus de fournir le chemin où nous devons stocker cette table en utilisant le mot-clé «emplacement» dans la commande create table.

Par exemple:

CRÉER UNE TABLE EXTERNE stg_s2_json.products

(produit sans chaîne, chaîne de nom de produit, chaîne de description, chaîne active, chaîne de date créée, chaîne de date mise à jour) champs délimités au format de ligne se terminant par ', '

LIEU '/user/data/hive/stg_s2_json.db/products';

  1. Hive supprime uniquement les métadonnées. Les données sont permanentes.
  2. Ces tableaux peuvent être utilisés par toute personne ayant accès à HDFS, ils doivent donc gérer la sécurité au niveau du dossier.

Pour comprendre l'abandon de la table externe, nous utiliserons la table «produits».

Vérifions si la table est interne ou externe. Encore une fois, la commande «décrire le nom de table formaté».

Observez «limite 10» dans la commande de sélection. Les produits de table contiennent les données ci-dessous:

Pour le vérifier à Hue, cela ressemble à ceci:

Voyons ce qui se passe lorsque nous supprimons ce tableau:

Syntaxe:

Drop table table_name;

Production:

Maintenant, si vous essayez de récupérer les données de la table, cela génère une erreur.

Tout d'abord, en utilisant la commande "select" sur le terminal, cela va me renvoyer une erreur qui signifie que les métadonnées de la table externe sont supprimées.

Observez l'erreur ici:

Deuxièmement, en vérifiant la teinte de l'état des données, le fichier «products.json» est toujours présent dans HDFS, ce qui signifie que les données sont permanentes.

Conclusion

Je vais vous faciliter la tâche et vous fournir des points clés pour les deux types de tableaux. Vous décidez quel type conviendra à vos besoins.

Table interne

Table externe

Également appelé «table gérée»Également appelé «table non gérée»
Pas besoin de fournir d'emplacement, le répertoire par défaut de Hive gère ces donnéesBesoin de fournir un emplacement
Supprime les métadonnées de la table ainsi que (les données sont temporaires)Hive laissera les données intactes (les données sont permanentes)
La ruche elle-même contrôle la sécurité de la tableBesoin de gérer la sécurité au niveau du dossier

Articles recommandés

Ceci est un guide de Hive Drop Table. Nous discutons ici de l'introduction de Hive Drop Table, Types de Drop Table dans Hive le long de la syntaxe. Vous pouvez également consulter nos autres articles suggérés pour en savoir plus -

  1. Qu'est-ce qu'une ruche?
  2. Architecture de la ruche
  3. Commandes Hive
  4. Qu'est-ce que la base de données Oracle
  5. Ordre de ruche par
  6. Installation de ruche

Catégorie: