Sekuentziatik egiturara: nola AI ari den eraldatzen proteina tolestura

Zer gertatzen da adimen artifiziala erabiliko bagenu bizitzako misterio handienetako bati erantzuteko: proteina tolestea? Zientzialariek hamarkadak daramatzate horretan lanean.

Makinek orain zehaztasun harrigarriarekin iragar ditzakete proteinen egiturak ikaskuntza sakoneko ereduak erabiliz, botiken garapena, bioteknologia eta oinarrizko prozesu biologikoen ezagutza aldatuz.

Bat egin nirekin AI proteina tolestearen eremu intrigagarrian esplorazio batean, non punta-puntako teknologiak bizitzaren konplexutasunarekin talka egiten duen.

Proteinen tolesketaren misterioa argituz

Proteinek gure gorputzean makina txikiek bezala funtzionatzen dute, elikagaiak apurtzea edo oxigenoa garraiatzea bezalako zeregin erabakigarriak burutzeko. Behar bezala tolestu behar dira eraginkortasunez funtzionatzeko, giltza bat behar bezala moztu behar den sarrailean sartzeko. Proteina sortu bezain laster, toleste prozesu oso korapilatsua hasten da.

Proteinen tolesketa aminoazidoen kate luzeak, proteinaren eraikuntza-blokeak, proteinaren funtzioa agintzen duten hiru dimentsioko egituretan tolesten diren prozesua da.

Demagun forma zehatz batean ordenatu beharreko aleen kate luze bat; hau da proteina bat tolesten denean gertatzen dena. Hala ere, aleek ez bezala, aminoazidoek ezaugarri bereziak dituzte eta elkarren artean era ezberdinetan elkarreragiten dute, proteina toleste prozesu konplexu eta sentikorra bihurtuz.

Hemengo irudiak giza hemoglobina adierazten du, hau da, tolesturiko proteina ezaguna

Proteinak azkar eta zehatz tolestu behar dira, bestela gaizki tolestu eta akastu egingo dira. Horrek Alzheimerra eta Parkinsona bezalako gaixotasunak sor ditzake. Tenperaturak, presioak eta beste molekula batzuk zelularen presentziak eragina dute toleste prozesuan.

Hamarkadetako ikerketaren ondoren, zientzialariak proteinak nola tolesten diren zehazten saiatzen ari dira oraindik.

Zorionez, adimen artifizialaren aurrerapenak sektorearen garapena hobetzen ari dira. Zientzialariek proteinen egitura inoiz baino zehatzago aurreikus dezakete erabilita makina ikasteko algoritmoak datu-bolumen handiak aztertzeko.

Horrek botiken garapena aldatzeko eta gaixotasunaren ezagutza molekularra areagotzeko aukera du.

Hobeto egin dezakete makinak?

Proteinen tolestura konbentzionaleko teknikek mugak dituzte

Zientzialariek hamarkadetan zehar proteinen tolesturak irudikatzen saiatzen ari dira, baina prozesuaren korapilatsuak gai zaila bihurtu du.

Proteinen egitura iragartzeko ohiko planteamenduek metodologia esperimentalen eta ordenagailu bidezko modelizazioaren konbinazioa erabiltzen dute, hala ere, metodo hauek guztiek eragozpenak dituzte.

X izpien kristalografia eta erresonantzia magnetiko nuklearra (NMR) bezalako teknika esperimentalak denbora asko eta garestia izan daitezke. Eta, ordenagailu-ereduak batzuetan hipotesi sinpleetan oinarritzen dira, eta horrek iragarpen okerrak sor ditzake.

AIk oztopo hauek gaindi ditzake

Zorionez, adimen artifizialeko Proteinen egituraren iragarpen zehatzagoa eta eraginkorragoa izateko promesa berria eskaintzen ari da. Ikaskuntza automatikoko algoritmoek datu-bolumen handiak azter ditzakete. Eta, jendeak galduko lituzkeen ereduak deskubritzen dituzte.

Horren ondorioz, proteinaren egitura zehaztasun paregabearekin aurreikusteko gai diren software tresna eta plataforma berriak sortu dira.

Proteinen egitura iragartzeko makina ikasteko algoritmorik itxaropentsuenak

Google-k eraikitako AlphaFold sistema Deepmind taldea arlo honetan aurrerapenik itxaropentsuenetako bat da. Azken urteotan aurrerapen handia lortu du erabilerarekin ikasketa sakonerako algoritmoak proteinen egitura iragartzeko aminoazidoen sekuentzietan oinarrituta.

Sare neuronalak, euskarri-makina bektorialak eta ausazko basoak dira proteina-egitura iragartzeko itxaropentsuak erakusten dituzten ikaskuntza-metodo gehiagoren artean.

Algoritmo hauek datu multzo izugarrietatik ikas dezakete. Eta, aminoazido ezberdinen arteko korrelazioak aurreikus ditzakete. Beraz, ikus dezagun nola funtzionatzen duen.

Koeboluzioko analisiak eta AlphaFold belaunaldia

Arrakasta AlphaFold analisi koebolutiboa erabiliz garatu zen neurona-sare eredu sakon batean eraikita dago. Koeboluzioaren kontzeptuak dio proteina bateko bi aminoazido elkarren artean elkarri eragiten badiote, elkarrekin garatuko direla lotura funtzionala mantentzeko.

Ikertzaileek antzeman dezakete 3D egituran zein aminoazido bikote egon daitezkeen harremanetan, antzeko proteina ugariren aminoazidoen sekuentziak alderatuz.

Datu hauek AlphaFold-en lehen iteraziorako oinarri gisa balio dute. Aminoazido-bikoteen arteko luzerak iragartzen ditu, baita haiek lotzen dituzten peptido-loturen angeluak ere. Metodo honek proteinen egitura sekuentziatik iragartzeko aurreko ikuspegi guztiak gainditu zituen, nahiz eta zehaztasuna oraindik mugatuta zegoen itxurazko txantiloirik gabeko proteinen kasuan.

AlphaFold 2: Metodologia Erradikal Berria

AlphaFold2 DeepMind-ek sortutako ordenagailu-software bat da, proteinaren 3D egitura iragartzeko proteina baten aminoazido-sekuentzia erabiltzen duena.

Hau esanguratsua da proteina baten egiturak nola funtzionatzen duen agintzen duelako, eta bere funtzioa ulertzeak proteina helburu duten botikak garatzen lagun diezaiekete zientzialariei.

AlphaFold2 sare neuronalak sarrera gisa jasotzen ditu proteinaren aminoazidoen sekuentzia, baita sekuentzia hori datu-base bateko beste sekuentzia batzuekin nola alderatzen den buruzko xehetasunak ere (horri "sekuentzia lerrokatzea" deitzen zaio).

Sare neuronalak proteinaren 3D egiturari buruzko iragarpena egiten du sarrera horretan oinarrituta.

Zerk bereizten du AlphaFold2-tik?

Beste ikuspegi batzuekin ez bezala, AlphaFold2-k proteinaren 3D egitura erreala aurreikusten du, aminoazidoen bikoteen arteko bereizketa besterik ez edo haiek lotzen dituzten loturen arteko angeluak (aurreko algoritmoek egiten zuten bezala).

Neurona-sareak egitura osoa aldi berean aurreikus dezan, egitura muturrean kodetzen da.

AlphaFold2-ren beste ezaugarri gako bat bere iragarpenean konfiantza duen zenbatespena eskaintzen duela da. Hau aurreikusten den egituraren kolore-kode gisa aurkezten da, gorriak konfiantza handia adierazten du eta urdinak konfiantza baxua iradokitzen du.

Hau erabilgarria da, zientzialariei iragarpenaren egonkortasunaren berri ematen baitie.

Hainbat sekuentziaren egitura konbinatua aurreikustea

Alphafold2-ren azken hedapenak, Alphafold Multimer izenez ezagutzen dena, hainbat sekuentziaren egitura konbinatua aurreikusten du. Akats-tasa handiak ditu oraindik, nahiz eta lehenagoko teknikak baino askoz hobeto funtzionatzen duen. 25 proteina-konplexuetatik % 4500 besterik ez ziren arrakastaz aurreikusi.

Kontaktuen eraketa-eskualde zakarren % 70 behar bezala aurreikusi ziren, baina bi proteinen orientazio erlatiboa okerra zen. Lerrokatze-sakonera ertaina gutxi gorabehera 30 sekuentzia baino txikiagoa denean, Alphafold multimeroen iragarpenen zehaztasuna nabarmen jaisten da.

Nola erabili Alphafold iragarpenak

AlphaFold-en aurreikusitako ereduak fitxategi formatu berdinetan eskaintzen dira eta egitura esperimentalen modu berean erabil daitezke. Funtsezkoa da ereduarekin eskaintzen diren zehaztasun estimazioak kontuan hartzea gaizki-ulertuak saihesteko.

Bereziki lagungarria da egitura korapilatsuetarako, hala nola elkar ehundutako homomeroak edo proteinak, baten aurrean bakarrik tolesten direnak.
ligando ezezaguna.

Erronka batzuk

Aurreikusitako egiturak erabiltzearen arazo nagusia proteina eta datu biofisikoetara sarbiderik gabe loturaren dinamika, ligandoen selektibitatea, kontrola, alosteria, translazio osteko aldaketak eta zinetika ulertzea da.

Makina ikaskuntza eta fisikan oinarritutako dinamika molekularraren ikerketa erabil daiteke arazo hori gainditzeko.

Ikerketa hauek ordenagailuen arkitektura espezializatu eta eraginkor baten onura izan dezakete. AlphaFold-ek proteina-egituren iragarpenean aurrerapen izugarriak lortu baditu ere, oraindik asko dago ikasteko egitura-biologiaren arloan, eta AlphaFold-en iragarpenak etorkizuneko azterketarako abiapuntua baino ez dira.

Zeintzuk dira beste tresna nabarmenak?

ArrosaTTAFfold

Washingtongo Unibertsitateko ikertzaileek sortutako RoseTTAFold-ek, era berean, ikaskuntza sakoneko algoritmoak erabiltzen ditu proteinen egiturak iragartzeko, baina "tortsio-angeluaren dinamika simulazioak" deritzon ikuspegi berri bat ere integratzen du aurreikusitako egiturak hobetzeko.

Metodo honek emaitza pozgarriak eman ditu eta erabilgarria izan daiteke lehendik dauden AI proteina tolesteko tresnen mugak gainditzeko.

trRosetta

Beste tresna batek, trRosettak, proteina tolesturak aurreikusten ditu a erabiliz sare neural milioika proteina-sekuentzia eta egituratan trebatua.

Era berean, "txantiloietan oinarritutako modelizazioa" teknika erabiltzen du helburuko proteina egitura ezagunekin alderatuz iragarpen zehatzagoak sortzeko.

Frogatuta dago trRosetta proteina txikien eta proteina konplexuen egiturak iragartzeko gai dela.

DeepMetaPSICOV

DeepMetaPSICOV proteina kontaktuen mapak iragartzen zentratzen den beste tresna bat da. Hauek, proteinen tolesketa aurreikusteko gida gisa erabiltzen dira. Erabiltzen du ikaskuntza sakona proteina baten barruan hondakinen elkarrekintzak izateko probabilitatea iragartzeko planteamenduak.

Ondoren, kontaktuen mapa orokorra aurreikusteko erabiltzen dira. DeepMetaPSICOV-ek proteina-egiturak zehaztasun handiz iragartzeko potentziala erakutsi du, nahiz eta aurreko planteamenduek huts egin dutenean.

Zer dauka Etorkizunak?

AI proteinaren tolesketaren etorkizuna argia da. Ikaskuntza sakonean oinarritutako algoritmoek, batez ere AlphaFold2k, aurrerapen handia egin dute duela gutxi proteinen egiturak modu fidagarri batean aurreikusten.

Aurkikuntza honek sendagaien garapena eraldatzeko ahalmena du, zientzialariek helburu terapeutiko arruntak diren proteinen egitura eta funtzioa hobeto ulertzeko aukera emanez.

Hala ere, proteina-konplexuak aurreikustea eta aurreikusitako egituren benetako egoera funtzionala detektatzea bezalako arazoek jarraitzen dute. Ikerketa gehiago behar dira arazo hauek konpontzeko eta AI proteina tolestearen algoritmoen zehaztasuna eta fidagarritasuna areagotzeko.

Hala ere, teknologia honen onura potentzialak izugarriak dira, eta sendagai eraginkor eta zehatzagoak ekoizteko ahalmena du.

Sekuentziatik egiturara: nola AI ari den eraldatzen proteina tolestura

Proteinen tolesketaren misterioa argituz

Hobeto egin dezakete makinak?