Van volgorde tot struktuur: hoe KI proteïenvou verander

Wat as ons kunsmatige intelligensie kan gebruik om een van die lewe se grootste raaisels te beantwoord – proteïenvou? Wetenskaplikes werk al dekades hieraan.

Masjiene kan nou proteïenstrukture met ongelooflike akkuraatheid voorspel deur diepleermodelle te gebruik, die ontwikkeling van geneesmiddels, biotegnologie en ons kennis van fundamentele biologiese prosesse te verander.

Sluit by my aan op 'n verkenning in die intrigerende gebied van KI-proteïenvou, waar die nuutste tegnologie bots met die kompleksiteit van die lewe self.

Ontrafel die raaisel van proteïenvou

Proteïene werk in ons liggame soos klein masjiene om belangrike take uit te voer soos om voedsel af te breek of suurstof te vervoer. Hulle moet reg gevou word sodat hulle doeltreffend kan funksioneer, net soos 'n sleutel reg gesny moet word om in 'n slot te pas. Sodra die proteïen geskep word, begin 'n baie ingewikkelde vouproses.

Proteïenvou is die proses waardeur lang kettings van aminosure, die proteïen se boustene, in driedimensionele strukture vou wat die funksie van die proteïen bepaal.

Oorweeg 'n lang string krale wat in 'n presiese vorm bestel moet word; dit is wat gebeur wanneer 'n proteïen vou. Tog, anders as krale, het aminosure unieke eienskappe en interaksie met mekaar op verskeie maniere, wat proteïenvou 'n komplekse en sensitiewe proses maak.

Die prentjie hier verteenwoordig menslike hemoglobien, wat 'n bekende gevoude proteïen is

Proteïene moet vinnig en presies vou, anders sal hulle verkeerd gevou en defektief raak. Dit kan lei tot siektes soos Alzheimer's en Parkinson's. Temperatuur, druk en die teenwoordigheid van ander molekules in die sel het almal 'n effek op die vouproses.

Na dekades se navorsing probeer wetenskaplikes steeds uitvind presies hoe proteïene vou.

Gelukkig verbeter vooruitgang in kunsmatige intelligensie ontwikkeling in die sektor. Wetenskaplikes kan die struktuur van proteïene meer akkuraat as ooit tevore voorspel deur te gebruik masjienleer-algoritmes om massiewe volumes data te ondersoek.

Dit het die potensiaal om medikasie-ontwikkeling te verander en ons molekulêre kennis van die siekte te verhoog.

Kan masjiene beter presteer?

Konvensionele proteïenvoutegnieke het beperkings

Wetenskaplikes probeer al dekades lank om proteïenvouing uit te vind, maar die ingewikkeldheid van die proses het dit 'n uitdagende onderwerp gemaak.

Konvensionele proteïenstruktuurvoorspellingsbenaderings gebruik 'n kombinasie van eksperimentele metodologieë en rekenaarmodellering, maar hierdie metodes het almal nadele.

Eksperimentele tegnieke soos X-straalkristallografie en kernmagnetiese resonansie (KMR) kan tydrowend en duur wees. En rekenaarmodelle maak soms staat op eenvoudige aannames, wat tot foutiewe voorspellings kan lei.

KI kan hierdie struikelblokke oorkom

Gelukkig, kunsmatige intelligensie bied nuwe belofte vir meer akkurate en doeltreffende proteïenstruktuurvoorspelling. Masjienleeralgoritmes kan massiewe volumes data ondersoek. En hulle ontbloot patrone wat mense sou mis.

Dit het gelei tot die skepping van nuwe sagteware-instrumente en -platforms wat in staat is om proteïenstruktuur met ongeëwenaarde akkuraatheid te voorspel.

Die mees belowende masjienleeralgoritmes vir voorspelling van proteïenstruktuur

Die AlphaFold-stelsel wat deur Google gebou is DeepMind span is een van die mees belowende vordering op hierdie gebied. Dit het die afgelope paar jaar groot vordering gemaak deur te gebruik diep leeralgoritmes om die struktuur van proteïene op grond van hul aminosuurvolgordes te voorspel.

Neurale netwerke, ondersteuningsvektormasjiene en ewekansige woude is van meer masjienleermetodes wat belofte toon vir die voorspelling van proteïenstruktuur.

Hierdie algoritmes kan leer uit enorme datastelle. En hulle kan die korrelasies tussen verskillende aminosure verwag. So, kom ons kyk hoe dit werk.

Ko-evolusionêre ontledings en die eerste AlphaFold-generasie

Die sukses van AlphaFold is gebou op 'n diep neurale netwerkmodel wat ontwikkel is deur gebruik te maak van ko-evolusionêre analise. Die konsep van ko-evolusie sê dat as twee aminosure in 'n proteïen met mekaar in wisselwerking tree, hulle saam sal ontwikkel om hul funksionele skakel te behou.

Navorsers kan opspoor watter pare aminosure waarskynlik in kontak sal wees in die 3D-struktuur deur die aminosuurvolgorde van talle soortgelyke proteïene te vergelyk.

Hierdie data dien as die grondslag vir die eerste herhaling van AlphaFold. Dit voorspel die lengtes tussen aminosuurpare sowel as die hoeke van die peptiedbindings wat hulle verbind. Hierdie metode het beter gevaar as alle vorige benaderings vir die voorspelling van proteïenstruktuur vanaf volgorde, alhoewel akkuraatheid steeds beperk was vir proteïene met geen sigbare sjablone nie.

AlphaFold 2: 'n Radikaal nuwe metodologie

AlphaFold2 is 'n rekenaarsagteware wat deur DeepMind geskep is wat 'n proteïen se aminosuurvolgorde gebruik om die 3D-struktuur van die proteïen te voorspel.

Dit is betekenisvol omdat 'n proteïen se struktuur bepaal hoe dit funksioneer, en om die funksie daarvan te verstaan, kan wetenskaplikes help om medikasie te ontwikkel wat die proteïen teiken.

Die AlphaFold2 neurale netwerk ontvang as invoer die proteïen se aminosuurvolgorde sowel as besonderhede oor hoe daardie volgorde met ander volgordes in 'n databasis vergelyk (dit word 'n "volgordebelyning" genoem).

Die neurale netwerk maak 'n voorspelling oor die proteïen se 3D-struktuur gebaseer op hierdie insette.

Wat onderskei dit van AlphaFold2?

In teenstelling met ander benaderings, voorspel AlphaFold2 die werklike 3D-struktuur van die proteïen eerder as bloot die skeiding tussen pare aminosure of die hoeke tussen die bindings wat hulle verbind (soos vorige algoritmes gedoen het).

Ten einde die neurale netwerk die volle struktuur gelyktydig te verwag, word die struktuur end-tot-end geënkodeer.

Nog 'n belangrike kenmerk van AlphaFold2 is dat dit 'n skatting bied van hoe selfversekerd dit is in sy voorspelling. Dit word aangebied as 'n kleurkodering op die verwagte struktuur, met rooi wat hoë vertroue voorstel en blou wat lae vertroue voorstel.

Dit is nuttig aangesien dit wetenskaplikes inlig oor die stabiliteit van die voorspelling.

Voorspelling van die gekombineerde struktuur van verskeie reekse

Die jongste uitbreiding van Alphafold2, bekend as Alphafold Multimer, voorspel die gekombineerde struktuur van verskeie reekse. Dit het steeds hoë foutsyfers, selfs al vaar dit baie beter as vroeëre tegnieke. Slegs %25 van 4500 proteïenkomplekse is suksesvol voorspel.

70% van die ruwe streke van kontakvorming is korrek voorspel, maar die relatiewe oriëntasie van die twee proteïene was verkeerd. Wanneer die mediaan belyningsdiepte minder as ongeveer 30 rye is, neem die akkuraatheid van Alphafold multimeer voorspellings aansienlik af.

Hoe om Alphafold-voorspellings te gebruik

Die voorspelde modelle van AlphaFold word in dieselfde lêerformate aangebied en kan op dieselfde maniere as eksperimentele strukture gebruik word. Dit is van kardinale belang om die akkuraatheidskattings wat met die model aangebied word, in ag te neem om misverstande te voorkom.

Dit is veral nuttig vir ingewikkelde strukture soos verweefde homomere of proteïene wat slegs vou in die teenwoordigheid van 'n
onbekende ligand.

Sommige uitdagings

Die hoofprobleem met die gebruik van voorspelde strukture is om die dinamika, ligand-selektiwiteit, beheer, allosterie, post-translasieveranderinge en kinetika van binding te verstaan sonder toegang tot proteïen- en biofisiese data.

Masjienleer en fisika-gebaseerde molekulêre dinamika-navorsing kan gebruik word om hierdie probleem te oorkom.

Hierdie ondersoeke kan baat vind by gespesialiseerde en doeltreffende rekenaarargitektuur. Alhoewel AlphaFold geweldige vordering in die voorspelling van proteïenstrukture behaal het, is daar nog baie om te leer op die gebied van strukturele biologie, en AlphaFold-voorspellings is slegs die beginpunt vir toekomstige studie.

Wat is ander merkwaardige gereedskap?

RoseTTAFvou

RoseTTAFold, geskep deur navorsers van die Universiteit van Washington, gebruik eweneens diepleeralgoritmes om proteïenstrukture te voorspel, maar dit integreer ook 'n nuwe benadering bekend as "torsiehoekdinamika-simulasies" om die voorspelde strukture te verbeter.

Hierdie metode het bemoedigende resultate opgelewer en kan nuttig wees om die beperkings van bestaande KI-proteïenvougereedskap te oorkom.

trRosetta

Nog 'n instrument, trRosetta, voorspel proteïenvouing deur 'n neurale netwerk opgelei op miljoene proteïenvolgordes en strukture.

Dit gebruik ook 'n "sjabloon-gebaseerde modellering" tegniek om meer presiese voorspellings te skep deur die teikenproteïen te vergelyk met vergelykbare bekende strukture.

Dit is gedemonstreer dat trRosetta in staat is om die strukture van klein proteïene en proteïenkomplekse te voorspel.

DeepMetaPSICOV

DeepMetaPSICOV is nog 'n instrument wat fokus op die voorspelling van proteïenkontakkaarte. Dit word gebruik as 'n gids om proteïenvouing te voorspel. Dit gebruik diep leer benaderings om die waarskynlikheid van residu-interaksies binne 'n proteïen te voorspel.

Dit word vervolgens gebruik om die algehele kontakkaart te voorspel. DeepMetaPSICOV het potensiaal getoon in die voorspelling van proteïenstrukture met groot akkuraatheid, selfs wanneer vorige benaderings misluk het.

Wat hou die toekoms in?

Die toekoms van KI-proteïenvou is blink. Diep leer-gebaseerde algoritmes, veral AlphaFold2, het onlangs groot vordering gemaak in die betroubare voorspelling van proteïenstrukture.

Hierdie bevinding het die potensiaal om geneesmiddelontwikkeling te transformeer deur wetenskaplikes in staat te stel om die struktuur en funksie van proteïene, wat algemene terapeutiese teikens is, beter te verstaan.

Nietemin bly kwessies soos die voorspelling van proteïenkomplekse en die opsporing van die werklike funksionele status van verwagte strukture. Meer navorsing is nodig om hierdie probleme op te los en die akkuraatheid en betroubaarheid van AI-proteïenvoualgoritmes te verhoog.

Tog is die potensiële voordele van hierdie tegnologie enorm, en dit het die potensiaal om te lei tot die produksie van meer doeltreffende en presiese medikasie.

Van volgorde tot struktuur: hoe KI proteïenvou verander

Ontrafel die raaisel van proteïenvou

Kan masjiene beter presteer?