library(tidyverse)

Le package tidyverse fournit un ensemble de fonction pour sélectionner, renommer et réordonner les colonnes d’un tableau.

Utilisation du pipe : %>%

\[ f(a) <=> a \,\text{ %>% }\, f()\]

Exemple :

colnames(iris) # Nom des variables

est équivalent à

iris %>% colnames() # Nom des variables

Données

On utilise le jeu de données iris

head(iris)     # Affichage des 6 premières lignes
glimpse(iris)  # Descriptif des données
colnames(iris) # Nom des variables

Selectionner : select()

On sélectionne les variables Sepal.Length,Sepal.Width et Species. La table obtenue est affectée à l’objet iris_selection

iris_selection <- iris %>% select(Species,Sepal.Length,Sepal.Width)
head(iris_selection)

On peut aussi garder toutes les variables et indiquer la liste des variables à supprimer grâce à l’opérateur de soustraction.

iris_selection <- iris %>% select(-Sepal.Length,-Sepal.Width)
head(iris_selection)

Renommer : rename()

On renomme la variable Sepal.Length. Son nouveau nom est longueur_sepal. La table obtenue est affectée à l’objet iris_selection

iris_selection <- iris %>% rename(longueur_sepal=Sepal.Length)
head(iris_selection)

Si le nom d’une variable contient un espace ou des caractères spéciaux, utiliser les guillemets.

iris_selection <- iris %>% rename('longueur des petales'=Sepal.Length)
head(iris_selection)

Réordonner : relocate()

Pour changer l’ordre des variables, on peut utiliser la fonction relocate.

Exemple 1 : On place la variable Species en première position

iris_selection <- iris %>% relocate(Species,1) 

Exemple 2 : On place les variables Species et Sepal.Length après la variable Petal.Length

iris_selection <- iris %>% relocate(Species,Sepal.Length,.after=Petal.Length)