Formation sur mesure R/tidyverse/dplyr

R est avec Python le langage préféré des statisticiens, le plus ancien dans cette famille des outils libres et open source. Hadley Wickham a su en renouveler la pratique avec beaucoup d’intelligence et d’élégance : l’univers tidyverse qu’il a conçu concentre l’essentiel de ce dont le manipulateur passionné de données a besoin. Il offre par sa cohérence et sa simplicité un vrai plaisir d’écriture. Son ouverture aux nouveaux formats de données comme parquet ou arrow lui confère une vélocité remarquable.

La formation sur mesure et avancée que nous proposons s’adresse à des praticiens de R qui souhaitent donner plus de puissance, d’élégance et de robustesse à leurs requêtes quotidiennes. Elle s’appuie sur plusieurs décennies de pratique du requêtage de bases de données. Elle tire aussi parti des toutes dernières évolutions de tidyverse, et notamment son noyau dplyr.

À qui s’adresse cette formation ?

Profil des stagiaires

Praticien·nes de R, analystes de toute sorte de jeux de données et responsables d’enquêtes, équipes souhaitant adopter et consolider de bonnes pratiques pour faciliter la maintenance et le partage des scripts, renforcer aussi le plaisir à les écrire et les affiner.

Besoins des stagiaires

  • écrire des scripts plus faciles à relire et faire évoluer 
  • traduire en requêtes tous ses besoins d’analyse
  • automatiser les traitements qui se répètent
  • fiabiliser ses écritures
  • calculer facilement totaux et sous-totaux

Prérequis

  • connaissance minimale de R et maîtrise d’un environnement de travail de type RStudio
  • liaison internet et proxy permettant de lire dynamiquement des ressources open data

Objectifs de la formation

  • éviter les répétitions inutiles un utilisant des listes
  • écrire des fonctions et maitriser l’injection de paramètres
  • construire des scripts documentés (RMarkdown, Quatro, etc.)
  • comprendre l’intérêt de différents formats de stockage ou d’échange : CSV, parquet, base de données, classeur Excel ou Google sheets…
  • tirer le meilleur parti des fonctions avancées comme recode(), pivot_longer(), across() et les multiples possibilités de jointure
  • saisir la puissance et les atouts de la programmation fonctionnelle (map et walk)

Contenu et déroulé

  • Jour 1 : exemples simples, améliorations spectaculaires et/ou ludiques de scripts existants
  • Jour 2 : exemples plus avancés, approche plus fonctionnelle

Formateur

Éric Mauvière

Points forts

Groupe à taille humaine, avec 4 à 8 stagiaires maximum, favorisant les interactions entre stagiaires et avec le formateur, en présence.

Formateur statisticien et rédacteur disposant d’une expérience longue et concrète des traitements statistiques et des outils proposés.

Scripts, jeux de données et enjeux issus de l’environnement de travail quotidien des stagiaires. Introduction possible à la sémiologie graphique.

Modalités pratiques

Préparation de la formation

  • Entretien préalable avec le commanditaire et chaque stagiaire
  • Constitution du groupe de stagiaires : 4 à 8 personnes, aux besoins proches
  • Identification de cas concrets fournis par les stagiaires 
  • Adaptation des exercices en fonction des cas concrets retenus
  • La formation s’organise en présence avec un groupe issu d’un même organisme, dans les locaux de l’organisme

Moyens pédagogiques et techniques

  • Documents RMarkdown à compléter, avec jeux de données de travail fournis
  • Exemples issus de l’environnement de travail des stagiaires, correspondant à des besoins pratiques
  • Mise en perspective historique et documentaire des concepts présentés, liens vers de nombreuses ressources « pour en savoir plus » sélectionnées avec soin

Modalités d’évaluation de la formation

  • Cahier d’exercices RMarkdown individuel 
  • Feedback collectif en fin de chaque journée
  • Questionnaire « à chaud » communiqué à chaque stagiaire, rempli en fin de chaque journée
  • Questionnaire « à froid » communiqué à chaque stagiaire à l’issue de la formation (rendu dans la semaine suivante)
  • Questionnaire « à froid » + entretien avec le commanditaire quelques semaines après la formation, pour apprécier l’efficacité de la formation vue de l’extérieur.

Nous sommes à votre écoute
pour tout besoin spécifique :
contactez-nous.

Contact

Le formulaire de contact permet à tout candidat de demander des renseignements sur la formation qui l’intéresse et de s’inscrire. Un livret d’accueil (CGV, CGU, règlement intérieur, convention-type, modalités d’accueil, modèles de convocation, feuille de présence, modalités de rétractation, grille d’évaluation initiale et finale, accueil des personnes en situation de handicap) vous sera adressé si vous le souhaitez. Nous nous engageons à répondre à toute demande dans un délai de 1 jour ouvré. Les délais d’organisation d’une formation sont au maximum de 2 mois. 

Prochaines dates : 18-19 septembre 2023.

Les personnes en situation de handicap sont invitées à nous contacter, afin d’étudier ensemble les possibilités de bénéficier de la formation dans les meilleures conditions.

Tarif

  • Facturation possible avec exonération de TVA
  • 4 000 € HT par groupe de 8 pour deux journées, préparation sur mesure comprise

Retours d'expérience

« Cette formation m’a été très utile pour acquérir de bonnes pratiques et de l’efficacité dans mon code. »

« Les supports sont vraiment de qualité ; je n’ai pas eu le temps de réaliser les autres exercices proposés mais j’ai déjà pu progresser très vite lors de ces 2 jours. »

Dernière mise à jour de cette page : mai 2023