Mosa'hic : variations sur un graphique de répartition

Parue en janvier 2022 dans le journal Libération, cette infographie sur les « déserts médicaux » attire l’attention : elle présente sur une belle surface un éventail de couleurs contrastées, dramatisant l’opposition entre des populations en situation fragile pour l’accès aux soins de ville (zones rouges) et d’autres bénéficiant d’un « accès suffisant » (en vert) :

La population française est ainsi divisée en deux (opposition rouge/vert), puis en quatre catégories. La surface du graphique autorise – quitte à le surcharger – le placement d’un titre en son sein : le rédacteur a mis l’emphase sur les zones les plus fragiles, qualifiées de « déserts médicaux », coloriées en rouge vif. Plus globalement, « déserts et quasi-déserts » représentent plus de 60 %, ce qui constitue l’information principale, exprimée par toute la surface en tons rouges.

Le choix des termes (« déserts ») et de l’opposition rouge/vert résulte d’un parti sémiologique quelque peu simplificateur, qui peut se discuter, j’y reviendrai à la fin de cet article.

Cette visualisation comporte deux couches, l’une purement graphique, composée de rectangles colorés, l’autre textuelle et plutôt dense, avec chiffres et légendes, indispensables pour comprendre la représentation graphique.

La mosaïque renouvelle le camembert,
mais fait-elle mieux ?

Héraut d’une ligne graphique résolument moderniste, voire avant-gardiste, Libération – dont je suis lecteur depuis 30 ans – ne pouvait pas publier un vulgaire camembert pour exprimer une répartition.

À la place, cette disposition « mosaïque » à la Mondrian, de format carré, captive l’attention du lecteur par ses vastes aplats de couleur. Elle ménage suffisamment d’espaces libres pour disposer au plus près de chaque catégorie des éléments d’explication.

Est-elle pour autant efficace et utile, facilite-t-elle la compréhension et la mémorisation des deux ou trois enseignements majeurs de l’étude ? Pour mieux l’apprécier – et c’est tout l’intérêt de l’analyse sémiologique, qui remet le lecteur au centre du jeu – posons-nous quelques questions simples :

Le rectangle ② est -il supérieur ou inférieur à ④ ?
Quel part représente ① dans l’ensemble ?
Quelle part représentent les zones rouges dans l’ensemble ?

Pour jouer l’exercice avec sincérité, tâchons d’oublier les chiffres que le concepteur avait inséré dans le graphique d’origine. Une représentation efficace se passe de chiffres surimprimés.

Comme de nombreuses études l’ont établi, nous savons plutôt bien – nous autres Sapiens – apprécier les longueurs, surtout quand leur base est commune. Ainsi, la part des zones rouges dans l’ensemble s’évalue rapidement par simple lecture de la bordure gauche du graphique : environ deux tiers.

Il est difficile de comparer des rectangles
surtout d'allongement différent

En revanche, l’œil humain a plus de mal à évaluer des surfaces, et c’est particulièrement difficile quand elles sont rectangulaires et d’allongement (« aspect ratio ») différent. C’est la principale raison pour laquelle Stephen Few énonce : « I’ve never seen an example of a mosaic plot that couldn’t be presented more effectively using a different approach ».

Considérons quelques alternatives. Disques ou carrés sont plus faciles à évaluer (en superficie) que les rectangles :

Mais à peine. Si l’on comprend vite que ② et ④ sont très proches, il faut un peu plus d’attention pour saisir que ② est un peu supérieur à ④. Quant au rapport qu’entretiennent ① et ②, ou ① dans l’ensemble des quatre, vous avez toute chance de vous tromper significativement : l’œil surestime en général les rapports de surface, ayant du mal à choisir entre surface et diamètre.

Pour les comparaisons, le graphique en barres horizontales est imbattable : la ② est clairement supérieure à la ④ :

Mais cette représentation ne permet pas de bien apprécier la part de ① dans l’ensemble, ou celle des zones rouges dans l’ensemble.

Alternative simple à la mosaïque originelle, les barres empilées offrent un bon compromis entre l’évaluation des parts dans l’ensemble et la comparaison individuelle des catégories ; nous pouvons estimer facilement les hauteurs de chaque rectangle, ou des trois rectangles rouges :

Et ce fameux et souvent honni camembert,
que donnerait-il ici ?

Après la célèbre étude de Cleveland et McGill, d’autres travaux ont bien situé la hiérarchie des mesures : les longueurs s’apprécient mieux que les angles (motif majeur de critique des camemberts). Mais les mêmes recherches nous enseignent que les angles sont mieux perçus que les surfaces.

Le camembert présente un autre avantage : comme l’œil est expert en reconnaissance des verticales et des horizontales, tout secteur proche du quart, de la moitié ou des trois-quarts est très vite identifié. Ainsi nous saisissons tous immédiatement que le secteur ① est légèrement inférieur à 25 % (24 % en réalité).

En définitive, si l’on considère que les deux enseignements à retenir de ces données sont :

Les zones en tension (rouges) représentent deux tiers de la population totale,
Les zones les plus fragiles ① en représentent un quart (titre du graphique de Libération).

Le camembert est – sans doute ici – le plus efficace, et donc le plus utile. Cette efficacité tient aussi au faible nombre de secteurs et au choix des couleurs, même si les deux premiers rouges sont trop proches.

La mosaïque ne présente en réalité qu’un avantage : il est plus facile d’y loger des textes (chiffres et légendes).

Comprendre d’où viennent les données
pour mieux concevoir la représentation pertinente

Sur le fond, il est dommage que l’article de Libé ne cite pas précisément ses sources : la seule mention « ARS – Insee » ne permet pas d’identifier la publication correspondante. Le « zonage médecins » est un sujet que je connais un peu, pour avoir travaillé de nombreuses années avec ses concepteurs.

Il s’appuie sur un maillage un peu particulier, celui des territoires vie/santé (TVS), sortes de bassins de santé, affiné spécifiquement pour isoler les quartiers prioritaires (QPV) et certaines îles (bretonnes en particulier). Sur cette base se mesure dans chaque commune (voire à l’infracommunal) une accessibilité potentielle localisée (APL) aux médecins généralistes, qui se mesure en nombre de consultations par an et par personne.

Cet indicateur incorpore de multiples données : présence de médecins (y compris en centres de santé), âge et temps de travail de ces médecins, distance-temps pour les patients, âge et spécificités socio-sanitaires de ces patients…

Quand on parle de « désert médical », il convient d’avoir à l’esprit que le 13^e arrondissement de Paris fait partie des zones les plus « fragiles ». Il ne s’agit donc pas uniquement de territoires ruraux ou de zones comportant très peu de médecins.

Les quatre catégories du Zonage médecins

Le « zonage médecins » distingue quatre types de territoires :

les zones d’intervention prioritaire – ZIP : les territoires les plus fragiles (correspond pour Libé à la catégorie « désert médical ») ;
les zones d’action complémentaire – ZAC : territoires moins fragilisés par le manque de médecins mais où des moyens doivent être mis en œuvre pour éviter que la situation ne se détériore (« quasi désert médical » pour Libé) ;
les zones de vigilance – ZV : territoires pour lesquels l’accès à la médecine générale n’est pas en difficulté immédiate mais qui font l’objet d’une vigilance particulière pour le moyen terme (« en tension » pour Libé, terme à l’évidence exagéré) ;
les autres territoires.

ZIP et ZAC donnent droit à des aides de la part de l’État et de l’Assurance-Maladie. Les agences régionales de santé (ARS) disposent d’une marge de définition et de concertation locale dans la délimitation des ZIP, ZAC et ZV, arrêtée (et donc modifiée) chaque année. Le concept de ZV est en particulier mobilisé de façon très variable d’une région à une autre. Parmi les quelques régions qui l’utilisent, la Bretagne classe par exemple en zone de vigilance tout ce qui n’est pas ZIP ou ZAC.

Le zonage médecin est un zonage de politique sanitaire qui s’appuie – en partie mais pas uniquement – sur des données statistiques. À l’échelle nationale, selon l’arrêté du 1^er octobre 2021, 30 % de la population française a vocation à être classée en ZIP et 42 % en ZAC, soit au total 72 %. Ces chiffres ne sont pas tout à fait les mêmes que ceux figurant dans le graphique de Libération.

Comment affiner cette représentation ?

Il est clair que les deux tiers de la population française ne peuvent être considérés en situation de « désert ou quasi-désert » comme l’énonce Libé, assertion renforcée par la – trop forte – proximité des deux tons rouges correspondants.

Il y a en fait une gradation continue entre les quatre types de territoire, que les couleurs retenues pour le graphique simplifient à l’excès. On y retrouve cet effet de mode : l’emploi systématique de l’opposition rouge/vert dans la production datavisuelle récente (pratique pourtant proscrite par les canons de l’accessibilité et, accessoirement, le bon sens statistique).

Pour résumer, ce graphique de Libé est instructif à plus d’un titre :

Il valorise des données de grand intérêt sanitaire et social, qui mériteraient d’être davantage explicitées et sourcées ;
Il « datavisualise » selon un schéma privilégiant l’esthétique à l’efficacité ;
Il légende selon le principe « gestaltien » de proximité (textes au plus près des marques graphiques qu’ils explicitent), mais au risque d’obscurcir la couche purement graphique. Le titre, en particulier, tel qu’il est placé, provoque une légère dissonance cognitive, étiquetant la zone ② (quasi désert) alors qu’il commente la zone ① (désert) : il devrait être placé au-dessus du graphique, et pourrait mieux hiérarchiser ses principaux enseignements ;
Il schématise et déforme la réalité en suremployant le terme « désert » (qui n’appartient naturellement pas au vocabulaire des ARS) et en utilisant des couleurs très contrastées quand la catégorisation d’origine est plus régulièrement étagée ;
Il n’offre pas de point d’entrée et de sens de parcours « naturel ».

Comme il ne suffit pas de critiquer, voici le graphique que je proposerais, c’est moins sexy, trendy et accrocheur, mais plus lisible et équilibré – tout en ajoutant des liens de téléchargement des données détaillées et d’accès à la méthodologie :

Pour aller plus loin

Le Zonage médecins

Articles sémiologiques

Mosa’hic : variations sur un graphique de répartition

La mosaïque renouvelle le camembert,
mais fait-elle mieux ?

Il est difficile de comparer des rectangles
surtout d'allongement différent

Et ce fameux et souvent honni camembert,
que donnerait-il ici ?

Comprendre d’où viennent les données
pour mieux concevoir la représentation pertinente

Les quatre catégories du Zonage médecins

Comment affiner cette représentation ?

Pour aller plus loin

Laisser un commentaire Annuler la réponse

Mosa’hic : variations sur un graphique de répartition

La mosaïque renouvelle le camembert, mais fait-elle mieux ?

Il est difficile de comparer des rectangles surtout d'allongement différent

Et ce fameux et souvent honni camembert, que donnerait-il ici ?

Comprendre d’où viennent les données pour mieux concevoir la représentation pertinente

Les quatre catégories du Zonage médecins

Comment affiner cette représentation ?

Pour aller plus loin

Laisser un commentaire Annuler la réponse

La mosaïque renouvelle le camembert,
mais fait-elle mieux ?

Il est difficile de comparer des rectangles
surtout d'allongement différent

Et ce fameux et souvent honni camembert,
que donnerait-il ici ?

Comprendre d’où viennent les données
pour mieux concevoir la représentation pertinente