Par Lucie Aubourg
Des chercheurs de Google DeepMind, entreprise du géant américain spécialisée dans l'intelligence artificielle, ont présenté, le 19 septembre 2023, un outil prédisant si des mutations génétiques sont potentiellement pathogènes ou non. Il s'agit d'un "nouveau pas dans la reconnaissance de l'impact que l'intelligence artificielle a dans les sciences naturelles", a déclaré lors d'une conférence de presse Pushmeet Kohli, vice-président pour la recherche chez Google DeepMind.
9 000 mutations chez un humain...
L'outil s'est penché sur des mutations dites "faux-sens", où une seule lettre du code génétique est affectée, avec pour conséquence de pouvoir changer la fonction des protéines. Or chaque cellule exécute sa fonction à l'aide de protéines, qui livrent en permanence leurs instructions. Un individu compte environ 9 000 de ces mutations, pour la plupart bénignes, selon l'entreprise, mais certaines peuvent entraîner des maladies, par exemple la mucoviscidose. A ce jour, quatre millions de ces mutations ont déjà été observées chez les humains, mais seulement 2 % d'entre elles ont été classées comme pathogènes ou comme bénignes. Et, au total, il existe 71 millions de ce type de mutations possibles.
... dont 32 % probablement pathogènes
Elles ont été passées en revue par l'outil de Google DeepMind, appelé AlphaMissense, qui a pu se prononcer sur 89 % d'entre elles. Il a attribué à chaque mutation un score entre 0 et 1 indiquant le risque qu'elle soit pathogène, c'est-à-dire à l'origine d'une maladie. Résultat : 57 % ont été classées comme probablement bénignes et 32 % comme probablement pathogènes, le reste restant incertain. La base de données a été rendue publique et mise à disposition de tous les scientifiques. Une étude pour la présenter a été publiée dans la prestigieuse revue Science.
Pour développer de nouveaux traitements ?
AlphaMissense affiche des "performances supérieures" aux outils existants, ont écrit les experts Joseph Marsh et Sarah Teichmann dans un article également publié dans Science. L'outil "ne dit pas quelle maladie cela va causer", a précisé durant la conférence de presse Jun Cheng, scientifique chez Google DeepMind. "Mais nous pensons que nos prédictions peuvent être utiles pour augmenter le taux de diagnostic de maladies rares, et aussi potentiellement nous aider à trouver de nouveaux gènes en cause dans des maladies." Indirectement, cela pourrait mener au développement de nouveaux traitements, estiment les chercheurs, qui préviennent toutefois qu'AlphaMissense ne doit pas être utilisé seul pour poser un diagnostic.
Entraînement sur de l'ADN humain et de primates
L'outil a été entraîné à partir d'une base de données d'ADN humain et de primates, lui permettant de reconnaître quelles mutations génétiques sont répandues. "Il apprend à quoi ressemble habituellement une séquence de protéines et, lorsqu'il est mis en présence d'une séquence avec une mutation, il peut dire si cela a l'air inquiétant ou non", a expliqué Jun Cheng. "C'est un peu comme avec le langage humain : si on remplace un mot dans une phrase en anglais, une personne qui connaît l'anglais verra immédiatement si ce changement affecte la signification de la phrase ou non", a-t-il comparé. AlphaMissense s'est appuyé sur AlphaFold, un autre programme d'apprentissage automatique présenté il y a plus de deux ans par Google DeepMind, qui avait permis de publier la plus grande base de données de protéines.