Nous avons également vu des signes que la prédiction de la structure des protéines pourrait être utile dans les efforts futurs de réponse à la pandémie, comme l’un des nombreux outils développés par la communauté scientifique. Plus tôt cette année, nous avons prédit plusieurs structures protéiques du virus SARS-CoV-2, y compris ORF3a, dont les structures étaient auparavant inconnues. À CASP14, nous avons prédit la structure d’une autre protéine du coronavirus, ORF8. Des travaux d’une rapidité impressionnante réalisés par des expérimentateurs ont maintenant confirmé les structures de l’ORF3a et de l’ORF8. Malgré leur nature difficile et le fait d’avoir très peu de séquences connexes, nous avons atteint un haut degré de précision sur nos deux prédictions par rapport à leurs structures déterminées expérimentalement.
En plus d’accélérer la compréhension des maladies connues, nous sommes enthousiasmés par le potentiel de ces techniques pour explorer les centaines de millions de protéines pour lesquelles nous n’avons pas de modèles actuellement – un vaste terrain de biologie inconnue. Puisque l’ADN spécifie les séquences d’acides aminés qui composent les structures protéiques, la révolution génomique a permis de lire des séquences protéiques du monde naturel à grande échelle – avec 180 millions de séquences protéiques et en comptant dans la base de données universelle des protéines (UniProt). En revanche, compte tenu des travaux expérimentaux nécessaires pour passer de la séquence à la structure, seulement environ 170 000 structures protéiques sont dans la Banque de données sur les protéines (PDB). Parmi les protéines indéterminées, certaines peuvent avoir des fonctions nouvelles et passionnantes et – tout comme un télescope nous aide à voir plus profondément dans l’univers inconnu – des techniques comme AlphaFold peuvent nous aider à les trouver.
Ouvrir de nouvelles possibilités
AlphaFold est l’une de nos avancées les plus significatives à ce jour, mais, comme pour toute recherche scientifique, il reste encore beaucoup de questions à répondre. Toutes les structures que nous prédisons ne seront pas parfaites. Il reste encore beaucoup à apprendre, notamment comment de multiples protéines forment des complexes, comment elles interagissent avec l’ADN, l’ARN ou les petites molécules, et comment nous pouvons déterminer l’emplacement précis de toutes les chaînes latérales d’acides aminés. En collaboration avec d’autres, il y a aussi beaucoup à apprendre sur la meilleure façon d’utiliser ces découvertes scientifiques dans le développement de nouveaux médicaments, les façons de gérer l’environnement, etc.
Pour nous tous qui travaillons sur les méthodes de calcul et d’apprentissage automatique en science, des systèmes comme AlphaFold démontrent le potentiel étonnant de l’IA en tant qu’outil de découverte fondamentale. Tout comme il y a 50 ans, Anfinsen a présenté un défi bien au-delà de la portée de la science à l’époque, de nombreux aspects de notre univers restent inconnus. Les progrès annoncés aujourd’hui nous donnent encore plus confiance dans le fait que l’IA deviendra l’un des outils les plus utiles de l’humanité pour élargir les frontières de la connaissance scientifique, et nous attendons avec impatience les nombreuses années de travail acharné et de découvertes à venir!
Jusqu’à ce que nous ayons publié un article sur ce travail, veuillez citer:
Prédiction De La Structure Des Protéines De Haute Précision À L’Aide De L’Apprentissage En Profondeur
John Jumper, Richard Evans, Alexander Pritzel, Tim Green, Michael Figurnov, Kathryn Tunyasuvunakool, Olaf Ronneberger, Russ Bates, Augustin Žídek, Alex Bridgland, Clemens Meyer, Simon A A Kohl, Anna Potapenko, Andrew J Ballard, Andrew Cowie, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor Back, Stig Petersen, David Reiman, Martin Steinegger, Michalina Pacholska, David Silver, Oriol Vinyals, Andrew W Senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis.
Dans Quatorzième Évaluation Critique des Techniques de Prédiction de la Structure des Protéines (Livre Abstrait), 30 novembre – 4 décembre 2020. Récupéré d’ici.
Nous en sommes au début de l’exploration de la meilleure façon de permettre à d’autres groupes d’utiliser nos prévisions de structure, tout en préparant un article évalué par des pairs pour publication. Bien que notre équipe ne soit pas en mesure de répondre à toutes les demandes, si AlphaFold peut être pertinent pour votre travail, veuillez soumettre quelques lignes à ce sujet à [email protected] . Nous serons en contact s’il y a des possibilités d’exploration.