La syntaxe chaînée de tidyverse / dplyr nous invite à décomposer les deux opérations logiques nécessaires : le choix du
critère de regroupement (dep), puis la
liste des variables à sommer. Nul besoin d’énumérer les 10 variables numériques concernées, les possibilités offertes par la syntaxe
dplyr vont simplifier l’écriture, dès lors que l’on veut sommer
toutes les colonnes numériques. Plus simple qu’en SQL, n’est-il pas ?
tb_dep <- tb_com %>% group_by(dep) %>%
summarise_if(is.numeric, sum, na.rm = TRUE)
# introduction d'un filtrage préalable sur une région (Bretagne, de code '53')
tb_dep <- tb_com %>% filter(reg == '53') %>%
group_by(dep) %>%
summarise_if(is.numeric, sum, na.rm = TRUE)
Super papier très synthétique et clair en même temps.
Merci pour votre lecture attentive et ce commentaire sympathique !