Veštačka inteligencija – priča o AlphaFoldu 2

Dobro je poznato da struktura određuje funkciju. Kako se proteini, esencijalni makromolekuli za skoro sve procese u živom organizmu, savijaju i organizuju u jedinstvenu trodimenzionalnu strukturu pitanje je koje intirigira naučnike već pet decenija.

Krajem novembra prošle godine, načinjen je revolucionarni pomak u ovom polju Praktično rešenje ovog problema ponudio je AlphaFold 2, program veštačke inteligencije razvijen od strane kompanije DeepMind, sa sedištem u Londonu. Mogućnost ovog programa da izuzetno precizno predvidi trodimenzionalni oblik koji će niz aminokiselina formirati oduševio je i prodrmao naučnu zajednicu, otvarajući niz novih mogućnosti i primena.

 

Zvezda CASP takmičenja

CASP (Critical Assessment of protein Structure Prediction) je bijenalno takmičenje koje se održava od 1994. sa ciljem inovacija komputacionih metoda za predviđanje struktura proteina. Svakoj takmičarskoj grupi dodeljuju se sekvence proteina čije su strukture eksperimentalno određene, ali nisu javno objavljene.

Neke od eksperimentalnih tehnika koje se koriste u ove svrhe jesu nuklearna magnetna rezonanca, rendgenska kristalografija ili novija krio-elektronska mikroskopija. Međutim, problem sa svakom od njih je što zahtevaju godine intenzivnog laboratorijskog rada i veoma skupu specijalizovanu opremu, i to za određivanje strukture jednog jedinog proteina. 

Ovo i jeste razlog zašto su bile potrebne nove, brže, a podjednako precizne metode. U tome se AlphaFold 2 izdvojio svojim neverovatnim rezultatima. Još na CASP takmičenju 2018. godine, AlphaFold pobedio je ostale timove.

Prema prošlogodišnjim rezultatima, objavljenim 30. novembra, unapređeni sistem osvojio je ukupni skor od vrtoglavih 92,4 GDT (Global Distance Test – mera sličnosti dva proteina istih aminokiselinskih sekvenci, ali različitih tercijarnih struktura) ili 87.0 GDT za najsloženije proteinske strukture. Poređenja radi, uobičajeni rezultat za eksperimentalne metode je 90. Prema tome, problem savijanja proteina’’ je na neki način rešen, ali smatra se da ima još dosta mesta za napredak.

Napredak u predikciji konformacije proteinaNapredak u predikciji konformacije proteina

Preciznost AlphaFold-ovih predikcija isprva je zapanjila sudije, čak je bilo sumnji da je došlo do prevare. Zbog toga im je jedan od CASP sudija, Andrej Lupas postavio poseban zadatak – membranski protein vrste arhea na kome je on 10 godina bezuspešno radio sa svojim istraživačkim timom. Ipak, nakon samo pola sata, AlphaFold je imao skoro savršene podatke koji su se poklapali sa njegovim zapažanjima dobijenih metodom rendgenske kristalografije. Mnogobrojni nejasni slučajevi, poput ovog, moći će uz pomoć AlphaFold-a  da dobiju svoj epilog.

 

Kako funkcioniše AlphaFold?

Prvobitni AlphaFold oslanjao se na duboko učenje’’, pristup u kome je softver istreniran da u velikim setovima podataka (u ovom slučaju, proteinskih sekvenci i struktura) pronalazi obrasce. Iako su ti rezultati bili prilično uspešni, još uvek su bili nedovoljno precizni da bi bili praktično primenljivi. AlphaFold 2 poboljšao je svoje performanse inkorporirajući tzv. Algoritam pažnje’’ koji prvo povezuje aminokiseline u manje grupe, a onda razmatra kako da te manje grupe poveže u veću celinu.

AlphaFold 2 je istreniran na javno dostupnim podacima iz proteinske banke podataka, koja obuhvata oko 170,000 proteina, kao i velikim bazama podataka koje obuhvataju proteinske sekvence nepoznatih struktura.

 

Kako će AlphaFold oblikovati budućnost?

Uticaj koji će AlphaFold 2 imati na nauku je izuzetan. Brzo i lako otkrivanje strukture i oblika proteina dovešće do značajno bržeg razumevanja bolesti i dizajniranja lekova. Takođe, ovo predstavlja priliku za sintetisanje proteina koji razgrađuju plastiku ili izgrađuju biogoriva, te je potencijalno koristan alat za rešavanje ekološke krize u kojoj se naša planeta nalazi. Već pomenuti profesor Lupas navodi: Ovo će osnažiti novu generaciju molekularnih biologa da postavljaju napredna pitanja. Zahtevaće se više razmišljanja i manje pipetiranja.’’

Kvartarna konformacija proteinaSlika proteina

 

Izvori: