Abbiamo anche visto segni che la previsione della struttura delle proteine potrebbe essere utile in futuri sforzi di risposta pandemica, come uno dei tanti strumenti sviluppati dalla comunità scientifica. All’inizio di quest’anno, abbiamo previsto diverse strutture proteiche del virus SARS-CoV-2, tra cui ORF3a, le cui strutture erano precedentemente sconosciute. A CASP14, abbiamo predetto la struttura di un’altra proteina del coronavirus, ORF8. Il lavoro straordinariamente rapido degli sperimentalisti ha ora confermato le strutture di ORF3a e ORF8. Nonostante la loro natura impegnativa e con pochissime sequenze correlate, abbiamo raggiunto un alto grado di precisione su entrambe le nostre previsioni rispetto alle loro strutture determinate sperimentalmente.
Oltre ad accelerare la comprensione delle malattie conosciute, siamo entusiasti del potenziale di queste tecniche per esplorare le centinaia di milioni di proteine per cui attualmente non abbiamo modelli – un vasto terreno di biologia sconosciuta. Poiché il DNA specifica le sequenze di aminoacidi che comprendono le strutture proteiche, la rivoluzione genomica ha permesso di leggere sequenze proteiche dal mondo naturale su larga scala – con 180 milioni di sequenze proteiche e contando nel database proteico universale (UniProt). Al contrario, dato il lavoro sperimentale necessario per passare dalla sequenza alla struttura, solo circa 170.000 strutture proteiche sono nella Protein Data Bank (PDB). Tra le proteine indeterminate possono esserci alcune con funzioni nuove ed eccitanti e – proprio come un telescopio ci aiuta a vedere più in profondità nell’universo sconosciuto-tecniche come AlphaFold possono aiutarci a trovarle.
Sbloccare nuove possibilità
AlphaFold è uno dei nostri progressi più significativi fino ad oggi, ma, come con tutta la ricerca scientifica, ci sono ancora molte domande a cui rispondere. Non tutte le strutture che prevediamo saranno perfette. C’è ancora molto da imparare, incluso come più proteine formano complessi, come interagiscono con DNA, RNA o piccole molecole e come possiamo determinare la posizione precisa di tutte le catene laterali degli amminoacidi. In collaborazione con altri, c’è anche molto da imparare su come utilizzare al meglio queste scoperte scientifiche nello sviluppo di nuovi farmaci, modi per gestire l’ambiente e altro ancora.
Per tutti noi che lavoriamo su metodi computazionali e di apprendimento automatico nella scienza, sistemi come AlphaFold dimostrano il potenziale sbalorditivo per l’IA come strumento per aiutare la scoperta fondamentale. Proprio come 50 anni fa Anfinsen ha lanciato una sfida ben oltre la portata della scienza al momento, ci sono molti aspetti del nostro universo che rimangono sconosciuti. I progressi annunciati oggi ci danno ulteriore fiducia che l’IA diventerà uno degli strumenti più utili dell’umanità per espandere le frontiere della conoscenza scientifica, e non vediamo l’ora di molti anni di duro lavoro e di scoperta!
Fino a quando non abbiamo pubblicato un articolo su questo lavoro, si prega di citare:
Alta Precisione Previsione della Struttura delle Proteine Utilizzando un Profondo Apprendimento
John Jumper, Richard Evans, Alexander Pritzel, Tim Green, Michael Figurnov, Kathryn Tunyasuvunakool, Olaf Ronneberger, Russ Bates, Augustin Žídek, Alex Bridgland, Clemens Meyer, Simone Un Kohl, Anna Potapenko, Andrew J Ballard, Andrew Cowie, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor Indietro, Stig Petersen, David Reiman, Martin Steinegger, Michalina Pacholska, David Silver, Oriol Vinyals, Andrew W Senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis.
Nel Quattordicesimo Critical Assessment of Techniques for Protein Structure Prediction (Abstract Book), 30 novembre – 4 dicembre 2020. Recuperato da qui.
Siamo proprio all’inizio di esplorare il modo migliore per consentire ad altri gruppi di utilizzare le nostre previsioni di struttura, oltre a preparare un documento peer-reviewed per la pubblicazione. Mentre il nostro team non sarà in grado di rispondere ad ogni richiesta, se AlphaFold può essere rilevante per il vostro lavoro, si prega di inviare alcune righe su di esso per [email protected]. Saremo in contatto se c’è spazio per ulteriori esplorazioni.