Coronavirus : Les réseaux sociaux pouvaient-ils nous alerter sur les risques du Covid-19 avant son identification ?

ETUDE Les prémices de l’épidémie étaient déjà perceptibles sur Twitter bien avant que le Covid-19 ne soit identifié, estiment des chercheurs dans une étude publiée dans la revue « Scientific Reports »

H. B.

— 

Illustration de la propagation du coronavirus.
Illustration de la propagation du coronavirus. — Avishek Das / SOPA Images/Sipa U
  • Des chercheurs de l’IMT School for Advanced Studies Lucca ont constaté une hausse significative du nombre de tweets concernant des cas de « pneumonie » signalés en Europe, plusieurs semaines avant le premier cas officiel de Covid-19.
  • Les tweets publiés au cours des semaines précédant l’officialisation de la maladie ont également permis d’identifier des foyers de l’épidémie.
  • « La surveillance des médias sociaux peut aider les autorités publiques à détecter et intercepter les premiers signes d’une nouvelle maladie, avant qu’elle ne prolifère, et aussi à suivre sa propagation », expliquent les scientifiques, auteurs de cette étude.

Après la surveillance épidémiologique des eaux usées, celle des réseaux sociaux ? Une étude publiée cette semaine dans la revue Scientific Reports par des scientifiques de l’IMT School for Advanced Studies Lucca indique que les prémices de la pandémie mondiale de coronavirus étaient déjà perceptibles sur Twitter, bien avant que le Covid-19 ne soit officiellement identifié.

En épluchant les données de Twitter – soit des centaines de milliers de tweets –, les auteurs de cette étude se sont rendu compte que des signaux laissaient apparaître l’émergence de premiers cas de coronavirus dès fin 2019. Des utilisateurs du réseau social évoquaient alors des cas de pneumonie jugés préoccupants, principalement dans des régions qui se sont avérées être les principaux foyers du virus, plusieurs semaines avant que le premier cas d’infection soit confirmé.

Une augmentation du nombre de tweets avec le mot « pneumonie »

Les chercheurs de l’IMT School for Advanced Studies Lucca ont décidé d’utiliser pour leurs recherches le terme « pneumonie », un des symptômes les plus graves du Covid-19. « Nous avons créé une base de données unique comprenant tous les messages contenant le mot-clé « pneumonie » dans les sept langues les plus parlées de l’Union européenne (anglais, allemand, français, italien, espagnol, polonais et néerlandais), et postés sur Twitter entre le 1er décembre 2014 et le 1er mars 2020 », expliquent les scientifiques italiens, qui ont pris le soin de supprimer dans leur base tous les articles de presse et messages officiels, ainsi que les retweets.

Ils ont ainsi pu observer « une préoccupation certaine de nombreux usagers » à ce sujet, et ce bien avant que le premier cas de Covid-19 ne soit officiellement annoncé. Tous les pays européens étudiés [à l’exception de l’Allemagne] ont été témoins d’une « publication excessive » de tweets liés à la pneumonie au cours de l’hiver 2019-2020 par rapport aux années précédentes. Le mot-clé « pneumonie » a par exemple été utilisé par deux fois plus d’utilisateurs français de Twitter en janvier 2020 qu’en janvier 2019, avec un total de plus de 2.000 tweets. « En Italie, également, des points chauds d’infection potentiellement cachés ont été identifiés plusieurs semaines avant l’annonce de la première source locale d’une infection au Covid-19 », précisent les chercheurs.

Évolution des tweets liés à la pneumonie en Europe depuis décembre 2019.
Évolution des tweets liés à la pneumonie en Europe depuis décembre 2019. - Scientific reports

Des foyers d’épidémie déjà identifiés

Les tweets publiés au cours des semaines précédant l’officialisation de la maladie ont également permis d’identifier des foyers de l’épidémie. En analysant la géolocalisation de plus de 13.000 internautes ayant parlé de « pneumonie », les scientifiques ont ainsi pu « montrer que les signaux provenaient principalement des régions géographiques qui se sont avérées être les principaux foyers d’infection [clusters] » au début de la pandémie. La majorité des utilisateurs discutant de cas de pneumonie venaient de la Lombardie, Madrid, l’Ile-de-France et l’Angleterre, des régions qui ont en effet signalé des cas précoces de contagion au Covid-19.

Afin de consolider ces résultats, les scientifiques ont réalisé la même analyse avec le terme « toux sèche », autre symptôme du coronavirus. « Les résultats [nombre de tweets et géolocalisation des internautes] concordent avec la répartition géographique des utilisateurs signalant une pneumonie au cours de la même période. Les messages concernant les symptômes liés au Covid-19 ont précédé les annonces publiques officielles sur les flambées locales et étaient concentrés dans les zones qui sont devenues par la suite des points chauds d’infection », confirme l’étude.

Un nouvel outil de surveillance épidémiologique ?

Les réseaux sociaux peuvent-ils donc être un outil de surveillance du Covid-19 ? « Notre étude vient s’ajouter aux preuves existantes que les médias sociaux peuvent être un outil utile de surveillance épidémiologique. […] Ils peuvent aider les autorités publiques à détecter et géolocaliser des chaînes de contagion qui, autrement, proliféreraient sans être détectées pendant plusieurs semaines […] », a expliqué dans un communiqué le professeur Massimo Riccaboni, qui a coordonné la recherche.

Ces résultats soulignent « l’urgence de mettre en place un système de surveillance numérique intégré », estiment également les quatre auteurs de cette étude, Milena Lopreite, Pietro Panzarasa, Michelangelo Puliga et Massimo Riccaboni. « Au-delà de ce virus, tout système de surveillance numérique destiné à surveiller une épidémie doit être contrôlé par des autorités indépendantes de protection des données, et adhérer à un ensemble clair de principes de préservation de la vie privée et de partage des données qui ne compromettent pas les droits des citoyens et les autres libertés fondamentales », préviennent-ils toutefois.

En juillet dernier, une étude effectuée à partir de données extraites de requêtes effectuées sur le moteur de recherche Google avait également révélé qu’il était possible d’identifier les foyers de Covid-19 plus rapidement qu’avec les statistiques officielles. Une augmentation des requêtes autour de la perte d’odorat – particulièrement aux Etats-Unis – avait notamment permis de déterminer qu’il s’agissait d’un des symptômes de la maladie, avant même que les différents organismes de santé le reconnaissent officiellement.