40 000 photos dérobées sur Tinder… pour aider les IA de reconnaissance faciale

Grâce à un script fait maison, le développeur Stuart Colliani a dérobé 40 000 photos d’utilisateurs de Tinder. Pour entraîner les IA de reconnaissance faciale…

capture-decran-2017-05-02-a-13-57-14

© Tinder

Quelle est, aujourd’hui, la base de données qui regroupe des photos d’anonymes cherchant à être reconnaissables au premier regard ? Réponse : Tinder, le site de rencontres géolocalisé, sur lequel une opinion sur quelqu’un se joue en un quart de seconde et se base uniquement sur le physique. Sur Tinder, tout le monde est sur son trente-et-un, et devinez qui ça peut intéresser ? Des algorithmes de reconnaissance faciale, qui trouveraient là une formidable matière première pour s’exercer à leur activité préférée. Si le raisonnement vous étonne, c’est normal car il est un peu anxiogène. Mais c’est pourtant bien ce que s’est dit un développeur, Stuart Colliani, lorsqu’il a conçu un petit programme permettant de récolter automatiquement 40 000 photos Tinder d’habitants de la région de San Francisco – à répartition égale entre hommes et femmes –, avant de le balancer sur Internet.

Publicité

Mis à disposition sous le nom "People of Tinder" sur Kaggle, la plate-forme de machine learning et d’analyse de données récemment acquise par Google, le pack de photos a été téléchargé plus de 300 fois, rapporte Numerama. Visiblement pas emmerdé par les lois relatives à la vie privée, Stuart Colliani a assumé son acte à fond en postant sur GitHub le code de son programme de récolte automatique ("TinderFaceScraper"), qu’il décrit comme "un simple script pour choper des photos de profil Tinder dans le but de créer une base de données faciales", et qui exploite une backdoor dans l’interface de programmation de l’appli.

Mais pourquoi se tourner vers Tinder alors que Google Images regorge déjà de milliards de clichés ? "J’ai beaucoup été déçu" par les bases de données biométriques, explique le développeur. "Les ensembles sont souvent extrêmement stricts dans leur structure, et souvent trop restreints. Tinder vous offre accès à des milliers de personnes proches de vous. Pourquoi donc ne pas le mettre à profit pour construire un ensemble de données, non seulement plus large mais meilleur ?" C’est vrai ça, pourquoi ? Récoltons joyeusement des données biométriques sans le consentement des utilisateurs visés et balançons-les par paquets de 10 000 à la disposition des chercheurs en reconnaissance faciale, le tout sous licence de domaine public ! Pas de souci… du moins pour Colliani.

Une violation des conditions d’utilisations

La base de données n’aura finalement pas fait long feu. Selon The Next Web, Colliani a annoncé "avoir discuté avec des représentants de Kaggle après avoir reçu une demande de suppression de la part de Tinder. À la suite de quoi, l’ensemble des données hébergées sur Kaggle a été supprimé". Visiblement, l’application ne partage pas la noble volonté du développeur de faire avancer la science en mettant à sa disposition des photos d’inconnus, surtout quand celui-ci référence les fichiers sous l’agréable terme de "putes" dans les lignes de code du programme, comme l’a remarqué The Next Web. D’autant que les intentions de Colliani peuvent être discutées, les fichiers – que TechCrunch a pu consulter – faisant également la part belle à des photos d’animaux ou de mèmes, qui fleurissent sur les profils Tinder de gens qui n’ont pas trop compris le principe de l’appli.

Publicité

Le 28 avril, Tinder a finalement réagi aux sollicitations de TechCrunch en publiant le communiqué suivant :

Nous prenons la sécurité et la vie privée de nos utilisateurs au sérieux, et nous avons des outils et systèmes en place pour assurer l’intégrité de notre plate-forme. Il est important de noter que Tinder est gratuit et utilisé dans plus de 190 pays, et que les images que nous offrons sont des images de profil, disponibles à quiconque utilise l’appli. Nous sommes constamment au travail pour améliorer l’expérience Tinder et nous continuons à implémenter des mesures contre l’usage automatisé de notre API, ce qui inclut des systèmes pour prévenir et décourager le pillage. Cette personne a violé nos conditions d’utilisation, et nous avons pris des mesures appropriées.

Si le programme de Colliani ne devrait donc plus nuire dans l’avenir, il est cependant bon de se rappeler que lorsque vous acceptez les conditions d’utilisation de l’application lors de l’installation, vous acceptez de lui donner le droit de "stocker, utiliser, copier, afficher, reproduire, adapter, éditer, publier, modifier et distribuer le contenu" que vous avez posté. Vos photos, quoi. Si Tinder s’inspirait de Colliani pour vendre votre visage à des entreprises de reconnaissance faciale, vous ne pourriez donc rien y faire.

Publicité

Par Thibault Prévost, publié le 02/05/2017

Pour vous :