L’humeur de la planète sondée grâce aux réseaux sociaux

/l-humeur-de-la-planete-sondee-grace-aux

  • L’humeur de la planète sondée grâce aux réseaux sociaux
    https://www.lemonde.fr/sciences/article/2022/04/26/l-humeur-de-la-planete-sondee-grace-aux-reseaux-sociaux_6123724_1650684.html

    L’humeur de la planète sondée grâce aux réseaux sociaux
    Une vaste étude, portant sur l’état affectif de 11 millions de personnes dans 100 pays pendant le premier confinement, illustre l’émergence de sciences sociales dites computationnelles, aux fondements épistémologiques encore fragiles.
    Par Laure Belot
    Publié le 26 avril 2022 à 12h00 - Mis à jour le 26 avril 2022 à 12h00

    Article réservé aux abonnés

    L’intelligence artificielle va-t-elle devenir un outil banal pour sonder de façon massive et en temps réel les citoyens ? De plus en plus de chercheurs s’y attellent. Ainsi, l’exceptionnelle situation pandémique de 2020, pendant laquelle plus de 4 milliards de personnes ont été confinées, a permis à une équipe pluridisciplinaire de scientifiques du MIT (Etats-Unis), de l’Académie des sciences de Pékin et du Max Planck Institute de Berlin de réaliser une étude inédite : suivre, à l’aide des réseaux sociaux Twitter et son équivalent chinois Weibo, l’état affectif de 11 millions de personnes de 100 pays sur cinq mois, du 1er janvier au 31 mai 2020.
    La publication qui en découle, « Preuve globale de l’altération des sentiments exprimés pendant la pandémie du Covid-19 » (Nature Human Behaviour, 17 mars), représente, mappemondes à l’appui, l’évolution du « bien-être » de ces populations, l’hypothèse étant que ce bien-être est corrélé à ce que l’on exprime en ligne : plus on se plaint, moins on se sent bien dans la vie, et vice-versa. Afin d’éviter la pollution de certaines campagnes politiques, les scientifiques se sont limités, pour constituer cette énorme base de données de 650 millions de messages géolocalisés et anonymisés, à ceux qui ne se référaient pas directement au Covid-19.
    Comme on pouvait s’y attendre, la baisse du moral est nette sur la période étudiée, accentuée notamment après le 11 mars, date à laquelle l’Organisation mondiale de la santé (OMS) a déclaré que la crise liée au Covid-19 relevait d’une pandémie. En moyenne, cette plongée est presque cinq fois plus importante en amplitude que le passage « d’un dimanche, journée habituellement la plus heureuse de la semaine, à un lundi », précise Nicolas Guetta-Jeanrenaud, un des auteurs, étudiant-chercheur au MIT. Des pays tels l’Australie, l’Espagne, le Royaume-Uni et la Colombie ont été particulièrement affectés, bien plus que la Tunisie et la Grèce, par exemple. La France se situe dans la moyenne.
    Pour mesurer la capacité de récupération des populations face à ce fléau, les chercheurs ont identifié un indicateur fort disparate, le nombre de jours après lequel le moral revient à mi-parcours. Ce délai est d’à peine 1,2 jour pour les messages géolocalisés en Israël contre 14 en France et 29 en Turquie. Au terme des cinq mois étudiés, d’ailleurs, seuls 18 % des pays n’ont pas récupéré leur niveau de moral exprimé en janvier 2020, 35 % y sont tout juste et 46 % l’ont dépassé. « Ces résultats ne doivent pas être interprétés par la seule résilience émotionnelle des populations », commente l’étude. Dans cette période, où la perspective de trouver un vaccin était encore lointaine, « ces indicateurs reflètent tout autant la sévérité de la pandémie que les mesures de santé publique prises localement ».Enfin, ces économistes, sociologues et data scientists (statisticiens de la donnée) ont cherché à qualifier l’impact du premier confinement sur le moral. La forte hétérogénéité des résultats obtenus « a particulièrement surpris l’équipe, reconnaît Nicolas Guetta-Jeanrenaud. Nous n’avons pas trouvé de différences statistiquement significatives ». A l’échelle d’un pays, les citoyens ont donc exprimé des sentiments contradictoires, allant tout autant du gain de sécurité à la perte de liberté ou à la crainte de voir disparaître un emploi. Par contre, une tendance plus précise est apparue : plus un pays avait des citoyens qui se sentaient malheureux avant la période du Covid-19, plus les réactions au confinement étaient exacerbées.
    Les auteurs soulignent d’emblée les limites de l’étude. « Nous savons que tout le monde n’est pas sur Twitter et Weibo et que le bien-être des citoyens est un concept subjectif, qui ne possède pas de mesure standardisée, reconnaissent-ils. Nous savons également que ce type d’analyse, naissante, ne permet pas encore de faire le lien avec la santé mentale. » Pour autant, estiment-ils, de telles recherches peuvent apporter une aide complémentaire à la décision pour les puissances publiques.
    Au-delà même de ces résultats, que préfigure une telle recherche ? « Nous sommes au tout début d’une nouvelle discipline intitulée “computational social sciences”. Les sciences sociales sous stéroïdes, dopées par les données et les algorithmes », commente le pionnier français Guilhem Fouetillou, à la fois professeur-chercheur au Médialab de Sciences Po et fondateur de Linkfluence, une entreprise qui, depuis quinze ans, décrypte les tendances sur le Web et les réseaux sociaux pour des entreprises ou des institutions.
    Tenter d’analyser les données massives pour donner du sens à ce qui se trouve en ligne n’est pas une nouveauté. « Cela a été initié par des physiciens et sociologues tels Albert-Laszlo Barabasi et Duncan Watts, au tournant du XXIe siècle, pour modéliser le Web, se souvient Guilhem Fouetillou. Les sciences sociales ont essayé de s’en emparer pour avoir un discours sur la société, il y a une décennie. C’est maintenant que ce type d’analyse est technologiquement plus accessible. »Ainsi, les paroles en ligne de ces 11 millions de citoyens écrites posément ou sous le coup de l’émotion pendant ces cinq mois ont pu être analysées par une technique de traitement du langage naturel récente et en accès libre, le Bidirectional Encoder Representation from Transformers (BERT). Il s’agit d’« un réseau de neurones profonds, qui prend en compte la syntaxe globale de la phrase et pas seulement les occurrences de mots positifs ou négatifs », explique Nicolas Guetta-Jeanrenaud. Google a entraîné cette intelligence artificielle sur Wikipédia, entre autres, et l’a rendue publique en 2018. D’où la possibilité de travailler sur des messages en 65 langues. »
    Ce n’est pas tout. Outre la mise à disposition par Amazon, Google et Facebook de plates-formes de traitement, pour entraîner les algorithmes d’apprentissage supervisé (appelé aussi machine learning), certains Gafam proposent de stocker les données sur leur cloud et « même d’acheter du temps de calcul comme un service », précise Guilhem Fouetillou. Ces moyens nouveaux posent désormais à tout chercheur une question centrale, quand il veut manipuler des données : faut-il le faire si c’est faisable ? « Le risque est de pencher vers la quantophrénie [le gigantisme pour le gigantisme des données], poursuit Guilhem Fouetillou. Il y a quelques années, beaucoup d’études ont été réalisées par des data scientists qui ont multiplié les corrélations sans que l’interprétation apporte de la valeur ajoutée, faute de causalité. »En France, plusieurs nouveaux projets de recherche multidisciplinaires se dessinent. Ainsi, le mathématicien Pedro Ramaciotti Morales, chercheur au médialab de Sciences Po et au Learning Planet Institute (ex-CRI), s’apprête, explique-t-il, à diriger « une équipe spécialisée en modèles mathématiques, modèles sociaux et informatiques afin de mener des recherches à large échelle sur le comportement en ligne, les dynamiques d’opinion, la polarisation et les algorithmes de recommandation ». Il va aussi codiriger un projet financé par le McCourt Institute (fondé par Sciences Po et l’université de Georgetown à Washington), « destiné à produire de la recherche applicable à la gouvernance des technologies, dont les grandes plates-formes du Web, comme les Gafam, qui regroupent une partie considérable des dynamiques sociales et politiques ».Aujourd’hui encore, ajoute Guilhem Fouetillou, « tel un macroscope », les approches analytiques utilisées peuvent être parfois déformantes ou posséder des angles morts. « Nous savons bien décrire les données du Web social, mais nous ne savons pas encore en quoi elles décrivent ou non le monde, estime-t-il. Il nous faut construire un véritable cadre interprétatif de ces données. L’épistémologie de la donnée sociale n’est pas encore établie. »

    #Covid-19#migrant#migration#sante#epidemiologie#IA#santementale#pluridisciplinarité#recherche#confinement#emotion