
3 explorations bluffantes avec DuckDB – Croiser les requêtes spatiales (3/3)
Nous sommes entourés de données géolocalisées. La séparation données statistiques / données spatiales est bien souvent arbitraire. Mais si elle perdure, c’est parce que les

Nous sommes entourés de données géolocalisées. La séparation données statistiques / données spatiales est bien souvent arbitraire. Mais si elle perdure, c’est parce que les

DuckDB saurait-il rivaliser avec JavaScript pour exploiter des données JSON ? Ce n’est pas le terrain sur lequel j’attendais ce moteur SQL. Quelle ne fut

DuckDB révolutionne notre approche des données. En dépit de sa console austère, fleurant bon l’antique terminal, ce petit programme de moins de 20 Mo butine

L’autre jour, ma femme m’interpelle, tout à trac : « toi qui aimes jouer avec les données, pourrais-tu me faire une carte des rues de Toulouse portant

Les publications statistiques de la Drees sont très intéressantes sur le fond, mais j’ai parfois un peu de mal à comprendre rapidement le message des

Comment une datavisualisation peut ébranler les idées reçues et représenter un outil d’aide à la décision, pour mieux peser bénéfices et risques.

Parquet est un format ouvert de stockage de jeux de données. Créé en 2013 par Cloudera et Twitter, longtemps réservé aux pros du big data,

Arrivée à maturité il y a deux ans avec sa version 1.0, dplyr introduisait en fanfare l’intriguant élément « across() », destiné à remplacer plus d’une dizaine de fonctions préexistantes.

Quelques réflexions à propos du temps, cette notion qui rend compte du changement dans le monde. Comment on le perçoit. Comment on le représente. Quelle place centrale il occupe pour le statisticien.