Hantamap

Sources et méthodologie

Hantamap agrège les signalements d'hantavirus à partir de sources officielles et de presse, avec une priorité explicite donnée aux autorités sanitaires. La carte affichée et les chiffres de surveillance ne sortent pas d'une boîte noire. Tout est sourcé, daté, vérifiable. Cette page détaille comment on travaille.

Les sources officielles primaires

France

Europe

Mondial

La veille presse

En complément des sources officielles, nous suivons en continu une trentaine de médias francophones et internationaux pour détecter les signaux faibles, les communications hospitalières et les annonces gouvernementales rapportées avant publication d'un bulletin officiel. Les articles sont catégorisés automatiquement par notre pipeline et présentés dans le fil "Signaux récents" à droite de la carte.

Tout article de presse est par défaut classé comme "non confirmé" (point jaune sur la carte). Il ne devient "suspecté" (orange) que s'il cite explicitement une autorité sanitaire. Un article de presse n'est jamais classé comme "confirmé" (rouge), quel que soit le contenu : seule une autorité publique peut produire cette classification.

Le filtre de corroboration

Pour éviter de relayer une coquille ou une mauvaise interprétation d'un seul média, les chiffres-clés de la barre statistique (cas France confirmés, cluster Hondius) n'intègrent une mise à jour automatique que si au moins deux articles distincts citent indépendamment la même autorité avec le même nombre. Sans cette double validation, le chiffre attendu reste celui du dernier bulletin officiel publié.

Une garde monotone empêche par ailleurs le compteur annuel des cas France confirmés de décroître. Une variation supérieure à trois fois un chiffre établi est refusée et signalée pour vérification humaine.

La géolocalisation

Pour chaque event, la localisation est extraite du contenu de l'article par un modèle de langage entraîné à distinguer le lieu réel des cas du lieu d'édition du média. Un article régional comme "La République des Pyrénées" qui rapporte un cas hospitalisé à Paris est géolocalisé sur Paris, pas dans les Pyrénées. Quand la localisation est ambiguë, l'event est placé au centre du département ou du pays, et la popup l'indique explicitement.

Pour les articles français de portée nationale qui ne précisent aucune ville, les points sont répartis sur les départements d'endémie réelle du Nord-Est, pondérés par leur score d'endémie historique. Ces points sont rendus en opacité réduite pour signaler visuellement leur caractère indicatif.

La fréquence de mise à jour

La cluster_key

Quinze articles peuvent couvrir le même incident. Pour ne pas afficher quinze fois le même cas sur la carte, chaque event reçoit une clé de regroupement déterministe calculée à partir de sa semaine ISO, de sa zone géographique arrondie à 0,5 degré et de sa souche virale. Les events partageant la même clé sont regroupés en un seul marker, avec un badge "+N sources" dans la popup et la liste des articles qui ont couvert le même incident.

Politique d'intelligence artificielle

L'extraction structurée depuis les articles de presse repose sur Claude (Anthropic). Le prompt utilisé est public et reproductible. L'IA n'est jamais autorisée à classer un article presse comme "confirmé" (cap à "suspecté" au maximum, quoi qu'elle dise) et doit explicitement refuser de géolocaliser un cas si la source ne fournit pas la ville précise.

Notre politique vis-à-vis des crawlers IA tiers est documentée dans le fichier llms.txt.

Limites de l'observatoire

Hantamap est un observatoire indépendant, non affilié au gouvernement. Les bulletins officiels font foi en cas de divergence. Nos compteurs de couverture média ne sont pas des compteurs de cas. Les localisations approximatives (centroïde de département ou de pays) sont signalées comme telles dans la popup de chaque point.

Pour signaler une erreur ou une donnée à corriger, écris à contact@hantamap.fr.

Aller plus loin