Les ingénieur·e·s du centre Samsung consacré à l’intelligence artificielle ont dévoilé à la mi-mai les avancées de leurs recherches. Depuis Moscou, l’équipe a mis en place une technologie troublante capable d’animer ne serait-ce qu’une seule image et d’en faire une vidéo.
À voir aussi sur Konbini
Les modélisations 3D ne datent pas d’hier mais, jusqu’à présent, les “deepfake” (ces vidéos truquées substituant un visage par un autre) nécessitaient de disposer de plusieurs images fixes pour créer une vidéo. La nouveauté apportée par Samsung, c’est la possibilité de créer une vidéo relativement réaliste avec seulement une image.
Salvador Dalí. (© Samsung AI Center)
La différence avec la création de “deepfake”, c’est que l’intelligence artificielle ne substitue pas un visage à un autre mais transpose une ou plusieurs images sur des “modèles de têtes parlantes photoréalistes”, ainsi que le décrit Vice. Ces schémas, utilisés pour animer des visages fixes, présentent des mimiques et des mouvements typiquement humains :
“Ces ‘modèles de têtes parlantes photoréalistes’ sont créés grâce à des réseaux neurologiques convolutifs : l’algorithme est composé d’une large banque de données regroupant des têtes parlantes aux apparences variées. Ici, ils ont utilisé les bases de données VoxCeleb, sur lesquelles sont publiquement accessibles plus de 7 000 images de célébrités tirées de vidéos YouTube.
[Ces images] permettent au programme d’identifier des points de repère caractéristiques des visages : les yeux, les différentes formes de bouche, les tailles et formes de l’arête du nez.”
Des avancées technologiques aussi spectaculaires qu’effrayantes
Potentiellement, chaque visage – aussi unique soit-il – pourrait ainsi trouver des caractéristiques concordantes dans cette base de données. Plus les images et les angles du visage d’une personne sont nombreux, plus la vidéo créée aura l’air crédible ; cependant, une seule image suffit pour réaliser des vidéos étonnantes.
this is really, really something: researchers developed a way to make "perfectly realistic" fake videos of faces, using only one source image https://t.co/qDYSa5EQxb pic.twitter.com/bVc2eDSlhh
— Samantha Cole (@samleecole) 23 mai 2019
Certains se sont ainsi amusés à faire bouger les visages d’artistes dont on ne disposait d’aucune image filmée (à l’instar de l’écrivain Fiodor Dostoïevski) ou de visages peints, à l’exemple de celui d’une des modèles les plus connue de l’histoire de l’art occidentale : Mona Lisa.
Aussi impressionnantes ces avancées technologiques soient-elles, elles n’en sont pas moins quelque peu inquiétantes. En effet, cette intelligence artificielle facilitera encore un peu plus la création et la diffusion de vidéos truquées (il en existe déjà beaucoup) et permettra de faire dire à peu près n’importe quoi à n’importe quelle personne dont on détient au moins une photo, et cela de façon toujours plus réaliste.
Marilyn Monroe. (© Samsung AI Center)
Fiodor Dostoïevski. (© Samsung AI Center)
Via la chaîne YouTube d’Egor Zakharov.