
La base des décès : un symbole méconnu de l’open data
La base nationale des décès est un ovni statistique : c’est une des rares bases open data France entière qui décrive des personnes avec leurs
Dans cette rubrique, sont classés les billets du blog dont l’objet est en relation avec l’open data. Cela concerne toute base de données mises à disposition par ses producteurs selon une licence ouverte, c’est-à-dire garantissant leur libre accès, sans restriction technique, juridique ou financière. Les producteurs sont des organismes publics ou privés, qui rendent leurs données accessibles de façon régulière, structurée et documentée, dans le but de faciliter leur réutilisation par d’autres. Les administrations et les collectivités sont les principaux producteurs de données ouvertes.
Pour les statisticiens, l’ouverture des données offre des opportunités inédites pour créer de nouveaux outils qui permettent de mieux décrire et mieux comprendre le monde dans lequel nous vivons. L’interopérabilité, c’est-à-dire la possibilité que ces données et ces outils soient connectés entre eux, propose des perspectives nouvelles et stimule la créativité.
La base nationale des décès est un ovni statistique : c’est une des rares bases open data France entière qui décrive des personnes avec leurs
Nous sommes entourés de données géolocalisées. La séparation données statistiques / données spatiales est bien souvent arbitraire. Mais si elle perdure, c’est parce que les
DuckDB saurait-il rivaliser avec JavaScript pour exploiter des données JSON ? Ce n’est pas le terrain sur lequel j’attendais ce moteur SQL. Quelle ne fut
DuckDB révolutionne notre approche des données. En dépit de sa console austère, fleurant bon l’antique terminal, ce petit programme de moins de 20 Mo butine
L’autre jour, ma femme m’interpelle, tout à trac : « toi qui aimes jouer avec les données, pourrais-tu me faire une carte des rues de Toulouse portant
Les publications statistiques de la Drees sont très intéressantes sur le fond, mais j’ai parfois un peu de mal à comprendre rapidement le message des
Parquet est un format ouvert de stockage de jeux de données. Créé en 2013 par Cloudera et Twitter, longtemps réservé aux pros du big data,
On ne sait pas toujours à l’avance ce que l’on va trouver dans un fichier CSV, pouvoir s’en faire un aperçu, quelle que soit sa
Cet étonnant outil libre de l’Université d’Auckland répondra à nombre de vos besoins de manipulation de fichiers CSV et, bien au-delà, d’analyse statistique exploratoire –