AlphaFold, rețeaua revoluționară bazată pe inteligență articifială, poate prezice forma a 200 de milioane de proteine de la un milion de specii. Baza de date a fost creată de DeepMind, compania de inteligență artificială de la Google, și Institutul European de Bioinformatică al Laboratorului European de Biologie Moleculară.
Forma 3D sau structura unei proteine este cea care determină funcția acesteia în celule. Majoritatea medicamentelor sunt concepute folosind informații structurale, iar formele precise sunt adesea primul pas către descoperirea modului în care funcționează proteinele.
AlphaFold, programul care prezice forma 3D a unei proteine
În interiorul fiecărei celule din corpul uman, miliarde de mașini moleculare minuscule lucrează din greu. Ele sunt cele care permit „instrucțiunilor” din ADN să fie citite, ochilor să detecteze lumina, iar neuronilor să se declanșeze. Toate acestea fac ca fiecare persoană să fie unică. Aceste mașini rafinate și complicate sunt proteinele. Ele susțin nu doar procesele biologice din corp, ci și fiecare proces biologic din fiecare ființă vie. Proteinele sunt elementele de bază ale vieții.
În prezent, există peste 200 de milioane de proteine cunoscute, dar multe altele sunt descoperite în fiecare an. Fiecare are o formă 3D unică care determină cum funcționează și ce face.
Descoperirea structurii exacte a unei proteine rămâne un proces costisitor și adesea consumator de timp. Până acum oamenii de știință au reușit să studieze doar structura exactă 3D a unei mici fracțiuni din proteinele cunoscute științei.
Găsirea unor modalități de a reduce acest decalaj în expansiune rapidă și de a prezice structura a milioane de proteine necunoscute ne poate ajuta nu numai să luptăm împotriva bolilor și să găsim mai rapid medicamente noi. Dar poate, de asemenea, să dezvăluie misterele modului în care funcționează viața însăși.
În acest sens a fost dezvoltat AlphaFold, rețeaua revoluționară bazată pe Inteligență Artificială. Acest program poate prezice formele 3D ale celor 200 de milioane de proteine cunoscute.
Baza de date are peste 200 de milioane de proteine
DeepMind a dezvoltat rețeaua AlphaFold folosind o tehnică AI numită deep learning. Baza de date AlphaFold a fost lansată în urmă cu un an, cu 350.000 de predicții de structură. Acestea acoperă aproape fiecare proteină produsă de oameni, șoareci și alte 19 organisme studiate pe scară largă. Catalogul a crescut de atunci la aproximativ 1 milion de predicții. Acum are peste 200 de milioane de predicții.
„Ne pregătim pentru eliberarea acestui imens tezaur”, a spus Christine Orengo, biolog computațional la University College London. Ea a folosit baza de date AlphaFold pentru a identifica noi familii de proteine. „A avea toate datele prezise pentru noi este pur și simplu fantastic.”
AlphaFold a fost lansată în 2021
Lansarea AlphaFold de anul trecut a făcut o explozie în comunitatea oamenilor de știință. Rețeaua produce predicții foarte precise ale formei sau structurii 3D a proteinelor. De asemenea, oferă informații despre acuratețea predicțiilor sale, astfel încât cercetătorii să știe pe care să se bazeze.
În mod tradițional, oamenii de știință au folosit metode experimentale costisitoare și consumatoare de timp, cum ar fi cristalografia cu raze X și microscopia crio-electronică pentru a rezolva structurile proteinelor.
Potrivit Institutul European de Bioinformatică, aproximativ 35% din cele peste 214 milioane de predicții sunt considerate foarte precise. Ceea ce înseamnă că sunt la fel de bune ca structurile determinate experimental.
Cercetătorii folosesc în anumite cazuri predicțiile AlphaFold pentru a valida și a da sens datelor experimentale. Predicțiile slabe sunt adesea evidente, iar unele dintre ele sunt cauzate de o tulburare intrinsecă a proteinei în sine. Asta înseamnă că nu are o formă definită, cel puțin fără alte molecule prezente.
AlphaFold, accesată de peste 500.000 de cercetători
Cele 200 de milioane de predicții făcute publice se bazează pe secvențele dintr-o altă bază de date, numită UNIPROT. Descărcarea de date este disponibilă la adresa AICI. „Până în prezent, peste 500.000 de cercetători din 190 de țări au accesat AlphaFold DB pentru a vizualiza peste 2 milioane de structuri. Structurile noastre disponibile gratuit au fost, de asemenea, integrate în alte seturi de date publice, cum ar fi Ensembl, UniProt și OpenTargets, unde milioane de utilizatori le accesează ca parte a fluxurilor lor de lucru zilnice”, se menționează pe site-ul DeepMind.
AlphaFold a lansat platforma într-o eră a abundenței structurale, deblocând explorarea științifică la viteză digitală. AlphaFold DB servește ca o „căutare pe Google” pentru structurile proteinelor, oferind cercetătorilor acces instantaneu la modelele prezise ale proteinelor pe care le studiază, permițându-le să-și concentreze eforturile și să accelereze munca experimentală. De la lupta împotriva bolilor până la dezvoltarea de vaccinuri.