Comment Excel a plombé des années de recherche en génétique

Publié le par Victoria Beurnez,

Crédits : Pixabay / Arek Socha

Changer des noms de gènes humains est plus facile que de changer les paramètres d'Excel.

A voir aussi sur Konbini

Personne n’irait immédiatement faire le lien entre Excel, l’usine à feuilles de calcul de Microsoft, et la recherche sur la génétique humaine. Pourtant, depuis des années, le tableur corrompt des tonnes et des tonnes de données scientifiques.

Publicité

Comme l’explique The Verge, les scientifiques, eux aussi, ont régulièrement recours à ce logiciel pour faire du traitement de données, mais aussi des analyses d’essais cliniques.

Publicité

1/5e des données corrompues

Problème : il y a quelque temps, les blouses blanches ont commencé à se rendre compte que certaines suites de caractères utilisées pour annoter les gènes se transformaient… en date. Par exemple, le gène “Membrane associated Ring-CH-Type Finger 1”, qui est simplifié en “MARCH1”, est immédiatement converti en 03/01/2020 par le tableur, entraînant dans son sillon des erreurs dans les résultats.

Publicité

Cette automatisation du logiciel aurait affecté, selon une étude de 2016, environ 20 % des 3 500 rapports scientifiques analysés.

Pour pallier le problème, la solution semblait évidente : changer les paramètres d’Excel. Mauvaise pioche ! Cela s’est avéré bien plus laborieux que ce qu’on avait imaginé. En effet, Excel a horreur de se faire dompter. Le logiciel ne laisse pas la possibilité à ses utilisateurs de changer ce genre de paramètre, et encore moins de supprimer les formules d’automatisation du tableur.

27 gènes renommés

Les choses ont donc dû se faire en sens inverse. Les généticiens ont été contraints de changer les noms de certains gènes pour ne pas corrompre leurs recherches à cause de l’immixtion de Microsoft dans la partie.

Publicité

Le bilan des courses est éloquent : en un an, c’est plus de 27 gènes différents qui ont été rebaptisés, ils sont répertoriés dans cet article de la revue Science. Pas une mince affaire pour la communauté scientifique.

Derrière ces grands changements, un cénacle obscur au nom évocateur : le Comité de la nomenclature du gène, raccourci en HGNC. Le groupe a pris les choses en main et modifié les noms qui posaient problème. Le susnommé MARCH1 est devenu MARCHF1. De la même manière, SEPT1, qui, vous le devinez, se transformait en 1er septembre, est devenu SEPTIN1.

Le club des baptiseurs de gènes

Pour éviter les couacs dans le futur, il faudra bien se passer le mot : ça tombe bien, ce sera aussi le travail du HGNC d’avertir la communauté scientifique de ce grand chantier de la génétique.

Publicité

Enfin, sur une note plus light, les scientifiques, eux, ne semblent pas traumatisés par ces évolutions. Ils s’en sont même donné à cœur joie lorsque le HGNC les a annoncées :

Publicité

Morale de l’histoire : il est plus facile de changer des noms de gènes humains que les paramètres d’Excel, CQFD.

Vous avez rencontré ce type de problème lors de soirées acharnées à traiter des données ? Vous avez une dent contre Excel ? Parlez-nous en à hellokonbinitechno@konbini.com !