“Imagine un mariage en banlieue” : quand l’IA reproduit des clichés humiliants

“Imagine un mariage en banlieue” : quand l’IA reproduit des clichés humiliants

Image :

© Heetch

photo de profil

Par Julie Morvan

Publié le , modifié le

Tu nous fais quoi là, Midjourney ?

Le mot “banlieue”, utilisé dès le Moyen Âge pour désigner un espace d’environ quatre kilomètres (une “lieue”) autour d’une ville où régnait la loi féodale (“ban”), porte en lui une connotation péjorative depuis trop longtemps. “Banlieue”, c’est le mot fourre-tout par excellence pour faire exister – et diaboliser – un univers anxiogène et violent qui n’existe pourtant que dans un imaginaire malsain. Aujourd’hui, dans Le Robert, le terme désigne l’“ensemble des agglomérations qui entourent une grande ville”. Mais à force de l’utiliser à tort et à travers, de l’accuser de tous les maux, la langue française en a fait une insulte… qui se reflète jusque dans les intelligences artificielles.

À voir aussi sur Konbini

C’est notamment le cas de Midjourney, l’IA générative qui s’inspire d’une immense base de données visuelles. Il suffit de lui écrire une légende descriptive (ou “prompt”) pour générer une sélection de quatre images, que l’on peut ensuite modifier. Par exemple, la photo d’un mariage en France.

© Heetch/Midjourney

Mais il suffit de huit lettres pour que tout ce petit monde se transforme en cauchemar digne d’un film catastrophe. Injustement, quand on précise “banlieue” à la fin du prompt, l’IA génère un tout autre type de scénario… qui concentre tous les préjugés et biais que le monde porte sur les banlieues :

© Heetch/Midjourney

La foule joyeuse a disparu, les jeunes époux font la gueule, la voiture rutilante s’est transformée en carcasse, et le sol n’est plus qu’un long chemin boueux qui salit la robe de la mariée. Ce biais, on l’observe peu importe le lieu : restaurant, terrain de basket, anniversaire, marché aux puces, bâtiment, bateau, statue… Chaque élément innocent se retrouve diabolisé par la mention de la banlieue.

L’IA “se nourrit [elle] aussi des stéréotypes qu’on trouve dans les médias”, déplore Renaud Berthe, directeur du marketing de Heetch. L’entreprise affirme détenir une “base de données corrective de milliers de photos de la banlieue, la vraie, capable de nuancer un peu sa représentation par l’IA”. Cette observation, réalisée par le service de VTC Heetch, semble avoir été améliorée depuis.

On a testé différents prompts sur Midjourney – en anglais – et les résultats avec ou sans la mention de la banlieue diffèrent beaucoup moins qu’avant :

“A wedding in France”. (© Midjourney)

“A wedding in the suburbs of France”. (© Midjourney)

“A wedding in France in banlieue”. (© Midjourney)

En observant les différences entre ces trois prompts, on retrouve certes les mêmes sourires, les bâtiments diffèrent encore légèrement ; le château du mariage en France est troqué contre un domaine, voire une rue de village. Ces quelques nuances sont tout de même bien plus légères qu’avant ; le terme “banlieue” semble avoir pris l’acception de “campagne” ou “province” plus qu’autre chose.

En revanche, “banlieue” reste toujours un mot négatif quand on l’associe à d’autres événements comme un anniversaire. Quand on mentionne le terme “suburbs” dans le prompt, aucun souci, mais quand il s’agit de “banlieue”, le résultat est bien moins flatteur :

“A birthday party in France”. (© Midjourney)

“A birthday party in the suburbs of France”. (© Midjourney)

“A birthday party in France in banlieue”. (© Midjourney)

L’assemblée diminue drastiquement et on note également toujours le même manque criant de diversité. Presque aucune personne racisée n’est représentée dans ces images. Il faudra le préciser dans le prompt pour que cela change, comme si les personnes étaient blanches “par défaut” selon l’IA.

Cette légère amélioration dans les prompts citant la banlieue marque donc une petite victoire symbolique qui doit pourtant nous alerter plus qu’autre chose sur le poids et le sens des mots que nous utilisons, aussi bien à l’oral qu’à l’écrit, dans le monde réel ou virtuel.