olemme myös nähneet merkkejä siitä, että proteiinin rakenteen ennustaminen voisi olla hyödyllistä tulevissa pandemian vastatoimissa, yhtenä monista tiedeyhteisön kehittämistä työkaluista. Aiemmin tänä vuonna ennustimme useita SARS-CoV-2-viruksen proteiinirakenteita, mukaan lukien ORF3a: n, jonka rakenteet olivat aiemmin tuntemattomia. CASP14: ssä ennustimme toisen koronavirusproteiinin, ORF8: n rakenteen. Kokeellisten vaikuttavasti nopea työ on nyt vahvistanut sekä ORF3a: n että ORF8: n rakenteet. Huolimatta niiden haastava luonne ja ottaa hyvin vähän liittyvät sekvenssit, saavutimme korkean tarkkuuden molempien ennusteiden verrattuna niiden kokeellisesti määritetty rakenteita.
olemme innoissamme näiden tekniikoiden mahdollisuuksista tutkia satoja miljoonia proteiineja, joille meillä ei tällä hetkellä ole malleja – laaja tuntemattoman biologian maasto. Koska DNA määrittää aminohapposekvenssit, jotka muodostavat proteiinirakenteita, genomiikan vallankumous on mahdollistanut proteiinisekvenssien lukemisen luonnosta laajamittaisesti – 180 miljoonaa proteiinisekvenssiä ja laskenta Universal Protein database (UniProt) – tietokannassa. Sen sijaan, koska kokeellista työtä tarvitaan siirtyä sekvenssistä rakenteeseen, vain noin 170,000 proteiini rakenteet ovat proteiini Data Bank (PDB). Määrittelemättömien proteiinien joukossa voi olla joitakin uusia ja jännittäviä toimintoja, ja aivan kuten kaukoputki auttaa meitä näkemään syvemmälle tuntemattomaan universumiin, alphafoldin kaltaiset tekniikat voivat auttaa meitä löytämään ne.
uusien mahdollisuuksien avaaminen
AlphaFold on yksi merkittävimmistä edistysaskeleistamme tähän mennessä, mutta kuten kaikessa tieteellisessä tutkimuksessa, on vielä monia kysymyksiä vastattavana. Kaikki ennustamamme rakenteet eivät ole täydellisiä. On vielä paljon opittavaa, kuten kuinka monet proteiinit muodostavat komplekseja, miten ne vuorovaikuttavat DNA: n, RNA: n tai pienten molekyylien kanssa ja miten voimme määrittää kaikkien aminohappojen sivuketjujen tarkan sijainnin. Yhteistyössä muiden kanssa on myös paljon opittavaa siitä, miten näitä tieteellisiä löytöjä voidaan parhaiten hyödyntää uusien lääkkeiden kehittämisessä, tapoja hallita ympäristöä ja paljon muuta.
kaikille meille, jotka työskentelemme laskennallisten ja koneoppimisen menetelmien parissa tieteessä, alphafoldin kaltaiset järjestelmät osoittavat tekoälyn tainnuttavan potentiaalin apuvälineenä perusteellisen löytämisen apuna. Aivan kuten 50 vuotta sitten Anfinsen asetti haasteen, joka oli tuolloin tieteen ulottumattomissa, maailmankaikkeudessamme on monia asioita, jotka ovat edelleen tuntemattomia. Tänään julkistettu edistys antaa meille lisää luottamusta siihen, että tekoälystä tulee yksi ihmiskunnan hyödyllisimmistä välineistä tieteellisen tiedon rajojen laajentamisessa, ja odotamme innolla monien vuosien kovaa työtä ja löytöjä edessä!
kunnes olemme julkaisseet tutkielman tästä teoksesta, please cite:
High Accuracy Protein Structure Prediction Using Deep Learning
John Jumper, Richard Evans, Alexander Pritzel, Tim Green, Michael Figurnov, Kathryn Tunyasuvunakool, Olaf Ronneberger, Russ Bates, Augustin Žídek, Alex Bridgland, Clemens Meyer, Simon A A Kohl, Anna Potapenko, Andrew J Ballard, Andrew Cowie, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor back, Stig Petersen, David Reiman, Martin Steinegger, Michalina pacholska, David Silver, Oriol Vinyals, Andrew W Senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis.
In Fourthte Critical Assessment of Techniques for Protein Structure Prediction (Abstract Book), 30 November – 4 December 2020. Noudettu täältä.
olemme aivan alussa selvittämässä, miten muut ryhmät voisivat parhaiten käyttää rakenneennusteitamme, samalla kun valmistelemme vertaisarvioitua tutkielmaa julkaisua varten. Vaikka tiimimme ei voi vastata jokaiseen kyselyyn, jos AlphaFold voi olla merkitystä työsi, lähetä muutama rivi siitä [email protected] otamme yhteyttä, jos voimme tutkia lisää.