Recherche bio-médicale

L’IA de Google résout un problème vieux de 50 ans: prédire la structure des protéines

C’est un important jalon de la recherche bio-médicale qu'a franchi la technologie d'intelligence artificielle de DeepMind. La filiale de Google a su résoudre le «problème du repliement des protéines», vieux de 50 ans, consistant à prédire la structure d’une protéine avec précision à partir de sa séquence d'acides aminés.

La fonction d'une protéine est déterminée par sa structure tridimensionnelle. (Source: DeepMind)
La fonction d'une protéine est déterminée par sa structure tridimensionnelle. (Source: DeepMind)

Filiale de Google dédiée à l'intelligence artificielle, DeepMind annonce que ses algorithmes ont su prédire la structure d’une protéine avec précision et bien plus rapidement qu’avec les techniques utilisées actuellement par les chercheurs. Le système AlphaFold est plus exactement parvenu à déterminer la forme que prendront des protéines qui se replient.

Un problème vieux de 50 ans

Défi scientifique vieux d’un demi siècle, le «problème du repliement» consiste à prédire la structure tridimensionnelle d’une protéine à partir de sa séquence unidimensionnelle d'acides aminés. Il faut savoir que la forme d'une protéine est étroitement liée à sa fonction. Etre en mesure de prédire cette structure peut permettre de comprendre un processus biologique et relever de nombreux challenges, tels que la mise au point de traitements pour de nombreuses maladies (par exemple le Covid-19) ou la recherche d'enzymes qui décomposent les déchets industriels, soulignent les équipes de DeepMind dans leur annonce.

La première version d’AlphaFold date de 2018. Le système s'est depuis enrichi d'architectures de deep learning développées par DeepMind. La dernière version repose sur un réseau de neurones artificiels entraîné pour interpréter la structure du «graphe spatial» représentant une protéine repliée. Pour ce faire, le modèle a ingurgité une base de données d’environ 170’000 structures protéiques, ainsi qu'une autre base de données contenant des séquences protéiques de structure inconnue, détaille les équipes de DeepMind sur leur blog.

Beaucoup de promesses mais d’autres défi à relever

Les algorithmes d’AlphaFold ont remporté le concours bisannuel du CASP (Critical Assessment for Structure Prediction), avec un score plus élevé qu’une analyse expérimentale réussie. «Les modèles étonnamment précis d'AlphaFold nous ont permis de résoudre une structure protéique sur laquelle nous étions bloqués pendant près d'une décennie», confie le Professeur Andrei Lupas, directeur de l'Institut Max Planck de biologie du développement. Les équipes de DeepMind concèdent toutefois qu’il reste des progrès à réaliser: «Toutes les structures que nous prévoyons ne seront pas parfaites. Il reste beaucoup à apprendre, notamment sur la façon dont de multiples protéines forment des complexes, sur leur interaction avec l'ADN, l'ARN ou les petites molécules, et sur la façon dont nous pouvons déterminer l'emplacement précis de toutes les chaînes latérales d'acides aminés».

Tags
Webcode
DPF8_200383