Art11-2023

Un pipeline de traitement d'informations issues du web pour anticiper les dangers en santé des plantes

Le rôle de Plateforme d’Épidémiosurveillance en Santé Végétale (ESV) est de mettre à jour des connaissances, à destination des gestionnaires du risque et des acteurs de la surveillance, mais aussi d’anticiper les problématiques sanitaires. Afin de mener à bien sa mission, l’ESV a développé sa propre méthode de veille, basée notamment sur le web scraping.

Auteur(s)

Sandy Duperier1,4, Marie Grosdidier1,4, Jean-Baptiste Louvet1,4, Isabelle Pieretti2,4, Anne Quillévéré-Hamard3,4

Résumé

Novae-2023-art11

Dans un contexte de changement climatique et d’intensification des échanges internationaux, les situations sanitaires des végétaux peuvent évoluer rapidement, avec un risque sanitaire accru. Afin d’informer au mieux les gestionnaires des risques sanitaires, la Plateforme d’Épidémiosurveillance en Santé Végétale (ESV) a mis en place une Veille Sanitaire Internationale (VSI) qui condense les éléments d’intérêt dans des bulletins publics. Cette veille relaie des informations médiatiques et scientifiques permettant d’identifier et/ou de suivre les évolutions de foyers épidémiques dans une zone géographique donnée, ainsi que des avancées scientifiques qui présentent un intérêt opérationnel. Pour répondre à ces objectifs, la Plateforme ESV a développé sa propre méthode de veille, pour laquelle la collecte d’informations est basée notamment sur le Web scraping. La chaîne de traitement des articles est semi-automatique, hybridant codes informatiques, système d’information et apports humains, permettant la diffusion de ces derniers à travers des bulletins. À ce jour, les articles diffusés par la VSI de la Plateforme ESV représentent environ 1 % de la totalité des articles collectés. Ce taux de pertinence est en lien avec les méthodes utilisées. Dans le futur, un des enjeux de l’évolution de la chaîne de traitement sera d’améliorer les processus de collecte et de tri des articles sans dénaturer la qualité des informations récupérées puis diffusées. Pour ce faire, la VSI souhaite s’appuyer sur le développement d’outils informatiques opérationnels, notamment issus de travaux de recherche.

Mots clés

Veille sanitaire, web scraping, média-scanning, santé végétale, organismes nuisibles, épidémiosurveillance.

1. INRAE, Unité BioSP, Domaine Saint-Paul, Site Agroparc, 84914 Avignon Cedex 9, France.
2. CIRAD, PHIM Plant Health Institute, Univ Montpellier, CIRAD, INRAE, Institut Agro, IRD, Montpellier, France.
3. Université de Lyon - ANSES, unité d’Épidémiologie et Appui à la Surveillance (EAS), 69364 Lyon Cedex 7, France.
4. Plateforme d’Épidémiosurveillance en Santé Végétale (Plateforme ESV).