Présentation de la trame de données R

Les trames de données sont une liste de vecteurs de longueur égale. Cependant, la différence entre la matrice et les trames de données est que les trames de données acceptent différents types de données. (Caractère, numérique, etc.). Dans cette rubrique, nous allons en savoir plus sur R Data Frame.

Avantages de l'utilisation de trames de données

  • Collecte de données distribuée et organisée.
  • Il a de meilleures optimisations par rapport à une base de données relationnelle.
  • Contient une variété de données hétérogènes.

Création d'une trame de données dans R

Nous créons data_frame. Voici l'exemple pour déclarer une trame de données.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

Dans l'exemple ci-dessus, nous n'avons pas défini les variables. Voyons maintenant comment nous attribuons des valeurs aux variables et les stockons dans le bloc de données.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Production:

Nombre alpha booléens

1 2 x VRAI

2 3 y VRAI

3 4 z FAUX

Structure de la trame de données

Lorsque nous voulons connaître la structure d'une trame de données particulière. Nous pouvons utiliser la fonction ci-dessous.

Étoile ()

str(Data_frame)

Production:

Numéro: num 2 3 4

alpha: Facteur avec 3 niveaux "x", "y", "z": 1 2 3

Booléens: logi TRUE TRUE FALSE

Extraire des données spécifiques de la trame de données

1. Utilisation du nom de colonne

Nous pouvons extraire un ensemble particulier de données de la trame de données.

De notre exemple ci-dessus, extrayons uniquement la première colonne du bloc de données qui est Number.

Data_ frame <- data. Frame(Number)

Production:

Nombre

1 2

2 3

3 4

2. Utilisation des rangées

Nous pouvons extraire les données des lignes comme dans l'exemple ci-dessous.

Supposons que nous voulons imprimer seulement deux lignes de la colonne Number.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Production:

Nombre alpha booléens

1 2 x VRAI

2 3 y VRAI

3 4 z FAUX

------------

Nombre alpha booléens

1 2 x VRAI

2 3 y VRAI

Nous pouvons observer la différence entre les première et deuxième sorties.

3. Impression de lignes et de colonnes spécifiques

Nous pouvons également imprimer des lignes et des colonnes spécifiques.

Dans l'exemple ci-dessous, nous imprimons les 1 er et 2 ème lignes, colonnes

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Production:

Nombre alpha booléens

1 2 x VRAI

2 3 y VRAI

3 4 z FAUX

-------------

Nombre alpha

1 2 x

2 3 ans

4. Ajout d'une autre colonne au bloc de données

Nous pouvons ajouter une autre colonne avec des valeurs au bloc de données.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Production:

Nombre alpha classe booléenne

1 2 x VRAI A

2 3 y VRAI B

3 4 z FAUX C

5. Ajout d'une ligne au bloc de données

Nous utilisons la fonction rbind pour ajouter une nouvelle ligne au bloc de données existant.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Production:

Nombre alpha classe booléenne

1 2 x VRAI A

2 3 y VRAI B

3 4 z FAUX C

4 5 x FAUX D

6. Combinaison des deux trames de données

Nous pouvons également combiner deux trames de données pour produire une seule sortie.

Pour combiner deux trames de données, nous devons avoir la même colonne pour les trames de données.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Production:

Nombre alpha booléens
1 2 x VRAI
2 3 y VRAI
3 4 z FAUX
-------------–
Nombre alpha booléens
1 4 x VRAI
2 5 y VRAI
3 6 z FAUX

-------------–

Nombre alpha booléens
1 2 x VRAI
2 3 y VRAI
3 4 z FAUX
4 4 x VRAI
5 5 y VRAI
6 6 z FAUX

Inspection des trames de données

Voici les différentes façons d'inspecter une trame de données et fournit des informations sur une trame de données, tout comme la fonction étoile ci-dessus.

1. Noms - Fournit les noms des variables dans la trame de données

Syntaxe : names(data frame name)

Exemple

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

sortie : (1) «Number» «alpha» «Booleans»

2. Résumé - Fournit les statistiques de la trame de données.

Syntaxe: summary(data frame name)

Exemple

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Production:

Nombre alpha booléens
Min. : 2.0 x: 1 Mode: logique
1er qu.: 2, 5 ans: 1 FAUX: 1
Médiane: 3, 0 z: 1 VRAI: 2
Moyenne: 3, 0 NA: 0
3rd Qu.:3.5
Max. : 4, 0

3. Tête - Fournit les données pour les premières lignes.

Syntaxe: Head( name of the data frame)

Exemple

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Production:

Nombre alpha booléens
1 2 x VRAI
2 3 y VRAI
3 4 z FAUX
4 5 a VRAI
5 6 b FAUX
6 7 c FAUX

4. Tail- Imprime les dernières lignes du bloc de données.

Syntaxe: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Production:

Nombre alpha booléens
5 6 b FAUX
6 7 c FAUX
7 8 j FAUX
8 9 f FAUX
9 10 g FAUX
10 11 j FAUX

Conclusion

Les trames de données sont un concept important dans la programmation R. Il est facile mais puissant de créer des ensembles de données qui peuvent être modifiés et accessibles facilement. Tout comme la matrice, les ensembles de données sont accessibles via les noms de lignes et de colonnes, l'ajout et la suppression de données étant faciles.

Articles recommandés

Ceci est un guide pour R Data Frame. Nous discutons ici de la création d'une trame de données dans R avec la structure et de l'extraction de données spécifiques à partir de la trame de données. Vous pouvez également consulter les articles suivants pour en savoir plus -

  1. Types de données en C
  2. Carrière en science des données
  3. Technologies Big Data
  4. Plateforme de science des données
  5. Java booléens

Catégorie: