La politique de modération de Facebook révélée par la fuite de documents internes

La politique de modération de Facebook révélée par la fuite de documents internes

photo de profil

Par Thibault Prévost

Publié le

Des documents obtenus par un journal allemand, nous permettent de plonger dans les équations qui gouvernent l’équipe de modération Facebook.

À voir aussi sur Konbini

Sous un feu nourri de critiques en 2016 pour sa gestion souvent laxiste de la modération des contenus publiés sur sa plateforme, Facebook a toujours maintenu une chape d’opacité protectrice autour de son algorithme de vérification des posts, et les équipes qui travaillent avec. Même lorsqu’il censure, inexplicablement, L’origine du monde de Courbet, la célèbre photo de la “fillette au napalm” ou le moindre téton qui passe sur le fil d’actualité tout en diffusant allègrement des vidéos de fusillades en direct, comme celle de Dallas en juillet dernier, l’entreprise ne donne aucune explication sur sa politique de modération. Grâce aux documents internes obtenus par le journal Süddeutsche Zeitung, qui détaillent le fonctionnement du fameux système, on peut enfin comprendre un peu mieux comment ça fonctionne.

Selon ces documents, l’équation de base pour la filtration des contenus, comme indiquée dans les “Community Guidelines” de la plateforme, fonctionne selon deux variables : les “catégories protégées” (PC) et les attaques. Ces catégories regroupent l’âge, le sexe, l’orientation sexuelle, la nationalité, le handicap, la religion ou la maladie. Mais ce qu’on ignorait, c’est que la protection concerne également la situation d’emploi, l’âge, le camp politique, la catégorie socioprofessionnelle et même l’apparence. Comme le résume Le Monde, “catégorie protégée + attaque = discours haineux”. Jusque-là, pas de souci.

Ce que nous apprennent les documents, en revanche, c’est qu’il existe aussi des “catégories non protégées” (NPC), qui ne figurent pas dans les standards de la communauté. Certains termes peuvent donc être attaqués, car hors du champ de protection de la modération. Et ce, même s’ils sont accolés à une catégorie protégée. Pour expliquer ces subtilités, les documents utilisent alors un langage mathématique. Concrètement, la phrase “les femmes irlandaises sont stupides” regroupe deux termes catégorisés PC, “femmes”(sexe) et “irlandaises” (nationalité), elle tombe donc sous le coup de la modération : “PC + PC = PC”. En revanche, il est possible d’écrire “les adolescents irlandais sont stupides”, car “adolescent” est une NPC. Ainsi, “PC + NPC = NPC”.

“Migrant”, une catégorie “quasi protégée”

Précision intéressante, les protections s’appliquent à l’appartenance, pas aux ensembles : les membres d’une religion sont protégés, pas la religion elle-même ; idem pour les citoyens d’un pays, alors que la nationalité ne l’est pas. On peut donc tranquillement écrire que l’islam ou le christianisme sont dégueulasses, alors qu’attaquer un musulman ou un chrétien est interdit. Et ces catégories ne cessent d’évoluer en fonction des nouvelles cibles de discrimination. Ainsi, le terme “migrant” est, selon les documents, une “catégorie quasi protégée”, que Facebook s’attelle à inscrire dans le PC “après des plaintes en Allemagne”, selon le Süddeutsche Zeitung.

Sur le sujet de la modération, notre voisin allemand est particulièrement actif contre Facebook. En décembre 2015, face aux pressions du gouvernement, la plateforme s’était ainsi engagée auprès du ministère de la Justice à supprimer les contenus discriminatoires sous 24 heures. Insuffisant aux yeux de la Commission européenne,qui a rappelé une nouvelle fois à l’ordre Facebook, mais également les autres réseaux sociaux, en leur intimant de régler le problème. Il y a cinq jours, enfin, le ministère de la Justice allemand a carrément menacé Facebook de lui infliger 500 000 euros d’amende par publication non modérée en 24 heures. S’il souhaite se plier à la législation, Facebook va devoir embaucher plus de modérateurs.