library(tidyverse)
Le package tidyverse fournit un ensemble de fonction pour sélectionner, renommer et réordonner les colonnes d’un tableau.
Utilisation du pipe : %>%
\[ f(a) <=> a \,\text{ %>% }\, f()\]
Exemple :
colnames(iris) # Nom des variables
est équivalent à
iris %>% colnames() # Nom des variables
On utilise le jeu de données iris
head(iris) # Affichage des 6 premières lignes
glimpse(iris) # Descriptif des données
colnames(iris) # Nom des variables
On sélectionne les variables Sepal.Length,Sepal.Width et Species. La
table obtenue est affectée à l’objet iris_selection
iris_selection <- iris %>% select(Species,Sepal.Length,Sepal.Width)
head(iris_selection)
On peut aussi garder toutes les variables et indiquer la liste des variables à supprimer grâce à l’opérateur de soustraction.
iris_selection <- iris %>% select(-Sepal.Length,-Sepal.Width)
head(iris_selection)
On renomme la variable Sepal.Length. Son nouveau nom est
longueur_sepal. La table obtenue est affectée à l’objet
iris_selection
iris_selection <- iris %>% rename(longueur_sepal=Sepal.Length)
head(iris_selection)
Si le nom d’une variable contient un espace ou des caractères spéciaux, utiliser les guillemets.
iris_selection <- iris %>% rename('longueur des petales'=Sepal.Length)
head(iris_selection)
Pour changer l’ordre des variables, on peut utiliser la fonction
relocate
.
Exemple 1 : On place la variable Species en première position
iris_selection <- iris %>% relocate(Species,1)
Exemple 2 : On place les variables Species et Sepal.Length après la variable Petal.Length
iris_selection <- iris %>% relocate(Species,Sepal.Length,.after=Petal.Length)