Vi har også set tegn på, at forudsigelse af proteinstruktur kan være nyttig i fremtidig pandemisk responsindsats, som et af mange værktøjer udviklet af det videnskabelige samfund. Tidligere i år forudsagde vi flere proteinstrukturer af SARS-CoV-2-viruset, herunder ORF3a, hvis strukturer tidligere var ukendte. Hos CASP14 forudsagde vi strukturen af et andet coronavirusprotein, ORF8. Imponerende hurtigt arbejde fra eksperimentalister har nu bekræftet strukturerne for både ORF3a og ORF8. På trods af deres udfordrende natur og med meget få relaterede sekvenser, vi opnåede en høj grad af nøjagtighed på begge vores forudsigelser sammenlignet med deres eksperimentelt bestemte strukturer.
ud over at fremskynde forståelsen af kendte sygdomme er vi begejstrede for potentialet for disse teknikker til at udforske de hundreder af millioner proteiner, vi ikke i øjeblikket har modeller for – et stort terræn med ukendt biologi. Da DNA specificerer aminosyresekvenserne, der omfatter proteinstrukturer, har genomikrevolutionen gjort det muligt at læse proteinsekvenser fra den naturlige verden i massiv skala – med 180 millioner proteinsekvenser og tælle i Universal Protein database (UniProt). I modsætning hertil er der i betragtning af det eksperimentelle arbejde, der er nødvendigt for at gå fra sekvens til struktur, kun omkring 170.000 proteinstrukturer i Protein Data Bank (FBF). Blandt de ubestemte proteiner kan være nogle med nye og spændende funktioner og – ligesom et teleskop hjælper os med at se dybere ind i det ukendte univers-teknikker som AlphaFold kan hjælpe os med at finde dem.
oplåsning af nye muligheder
AlphaFold er et af vores mest betydningsfulde fremskridt til dato, men som med al videnskabelig forskning er der stadig mange spørgsmål at besvare. Ikke alle strukturer, vi forudsiger, vil være perfekte. Der er stadig meget at lære, herunder hvordan flere proteiner danner komplekser, hvordan de interagerer med DNA, RNA eller små molekyler, og hvordan vi kan bestemme den nøjagtige placering af alle aminosyresidekæder. I samarbejde med andre er der også meget at lære om, hvordan man bedst kan bruge disse videnskabelige opdagelser i udviklingen af nye lægemidler, måder at styre miljøet på og meget mere.
for os alle, der arbejder med beregnings-og maskinindlæringsmetoder inden for videnskab, demonstrerer systemer som AlphaFold det fantastiske potentiale for AI som et værktøj til at hjælpe grundlæggende opdagelse. Ligesom Anfinsen for 50 år siden lagde en udfordring langt ud over videnskabens rækkevidde på det tidspunkt, er der mange aspekter af vores univers, der forbliver ukendte. De fremskridt, der er annonceret i dag, giver os yderligere tillid til, at AI vil blive et af menneskehedens mest nyttige værktøjer til at udvide grænserne for videnskabelig viden, og vi ser frem til de mange års hårdt arbejde og opdagelse, der ligger foran os!
indtil vi har udgivet et papir om dette arbejde, bedes du citere:
forudsigelse af proteinstruktur med høj nøjagtighed ved hjælp af dyb læring
John Jumper, Richard Evans, Aleksandr Pritsel, Tim Green, Michael Figurnov, Kathryn Tunyasuvunakool, Olaf Ronneberger, Russ Bates, Augustin Kristidek, Aleks Bridgland, Clemens Meyer, Simon A A Kohl, Anna Potapenko, Andreas J Ballard, Andrey Koie, Bernardino Romera-Paredes, Stanislav Nikolov, Rishub Jain, Jonas Adler, Trevor tilbage, Stig Petersen, David Reiman, Martin Steinegger, Michalina Pacholska, David Silver, Oriol Vinyals, Andrey med senior, Koray Kavukcuoglu, Pushmeet Kohli, Demis Hassabis.
i fjortende kritisk vurdering af teknikker til forudsigelse af proteinstruktur (abstrakt bog), 30.November – 4. December 2020. Hentet herfra.
Vi er lige i begyndelsen af at undersøge, hvordan vi bedst kan gøre det muligt for andre grupper at bruge vores strukturforudsigelser sammen med at forberede et fagfællebedømt papir til offentliggørelse. Selvom vores team ikke kan svare på enhver forespørgsel, hvis AlphaFold kan være relevant for dit arbejde, skal du indsende et par linjer om det til [email protected] vi kontakter dig, hvis der er plads til yderligere udforskning.