Paano kung maaari tayong gumamit ng artificial intelligence upang sagutin ang isa sa mga pinakadakilang misteryo sa buhay – ang pagtitiklop ng protina? Ang mga siyentipiko ay nagtatrabaho dito sa loob ng mga dekada.
Maaari na ngayong hulaan ng mga makina ang mga istruktura ng protina na may kamangha-manghang katumpakan gamit ang mga modelo ng malalim na pag-aaral, binabago ang pagbuo ng gamot, biotechnology, at ang aming kaalaman sa mga pangunahing biological na proseso.
Samahan mo ako sa isang paggalugad sa nakakaintriga na larangan ng AI protein folding, kung saan ang makabagong teknolohiya ay sumasalungat sa pagiging kumplikado ng buhay mismo.
Paglalahad ng Misteryo ng Pagtitiklop ng Protein
Gumagana ang mga protina sa ating mga katawan tulad ng maliliit na makina upang magsagawa ng mga mahahalagang gawain tulad ng pagsira ng pagkain o pagdadala ng oxygen. Dapat na nakatiklop ang mga ito nang tama para gumana ang mga ito nang mabisa, tulad ng isang susi na dapat maputol nang tama upang magkasya sa isang lock. Sa sandaling malikha ang protina, magsisimula ang isang napaka-komplikadong proseso ng pagtitiklop.
Ang pagtitiklop ng protina ay ang proseso kung saan ang mahahabang kadena ng mga amino acid, ang mga bloke ng gusali ng protina, ay natitiklop sa mga three-dimensional na istruktura na nagdidikta sa paggana ng protina.
Isaalang-alang ang isang mahabang string ng mga kuwintas na dapat i-order sa isang tiyak na anyo; ito ang nangyayari kapag ang isang protina ay nakatiklop. Gayunpaman, hindi tulad ng mga kuwintas, ang mga amino acid ay may mga natatanging katangian at nakikipag-ugnayan sa isa't isa sa iba't ibang paraan, na ginagawang kumplikado at sensitibong proseso ang pagtitiklop ng protina.
Ang larawan dito ay kumakatawan sa hemoglobin ng tao, na isang kilalang nakatiklop na protina
Ang mga protina ay dapat na nakatiklop nang mabilis at tumpak, o sila ay magiging mali at may depekto. Na maaaring humantong sa mga sakit tulad ng Alzheimer's at Parkinson's. Ang temperatura, presyon, at ang pagkakaroon ng iba pang mga molekula sa cell ay may epekto sa proseso ng pagtitiklop.
Pagkatapos ng mga dekada ng pananaliksik, sinusubukan pa rin ng mga siyentipiko na malaman kung paano natitiklop ang mga protina.
Sa kabutihang palad, ang mga pagsulong sa artificial intelligence ay nagpapabuti ng pag-unlad sa sektor. Maaaring mahulaan ng mga siyentipiko ang istraktura ng mga protina nang mas tumpak kaysa dati sa pamamagitan ng paggamit algorithm ng pag-aaral ng machine upang suriin ang napakalaking dami ng data.
Ito ay may potensyal na baguhin ang pagbuo ng gamot at dagdagan ang ating molekular na kaalaman sa sakit.
Maaari bang Magsagawa ng Mas Mahusay ang Mga Makina?
May Limitasyon ang Mga Tradisyonal na Teknik sa Pagtitiklop ng Protein
Sinusubukan ng mga siyentipiko na alamin ang pagtitiklop ng protina sa loob ng mga dekada, ngunit ang pagiging kumplikado ng proseso ay ginawa itong isang mapaghamong paksa.
Ang maginoo na mga diskarte sa paghula ng istruktura ng protina ay gumagamit ng kumbinasyon ng mga pang-eksperimentong pamamaraan at pagmomodelo ng computer, gayunpaman, lahat ng mga pamamaraang ito ay may mga kakulangan.
Ang mga pang-eksperimentong pamamaraan tulad ng X-ray crystallography at nuclear magnetic resonance (NMR) ay maaaring magtagal at magastos. At, minsan umaasa ang mga modelo ng computer sa mga simpleng pagpapalagay, na maaaring humantong sa mga maling hula.
Malalampasan ng AI ang Mga Sagabal na Ito
Sa kabutihang-palad, artificial intelligence ay nagbibigay ng bagong pangako para sa mas tumpak at mahusay na hula ng istraktura ng protina. Maaaring suriin ng mga algorithm ng machine learning ang napakalaking volume ng data. At, natuklasan nila ang mga pattern na mapapalampas ng mga tao.
Nagresulta ito sa paglikha ng mga bagong tool at platform ng software na may kakayahang hulaan ang istraktura ng protina na may walang katulad na katumpakan.
Ang Pinaka-Promising Machine Learning Algorithm para sa Protein Structure Prediction
Ang AlphaFold system na binuo ng Google Deepmind Ang koponan ay isa sa mga pinaka-maaasahan na pagsulong sa lugar na ito. Ito ay nakakuha ng mahusay na pag-unlad sa mga nakaraang taon sa pamamagitan ng paggamit malalim na algorithm ng pag-aaral upang mahulaan ang istraktura ng mga protina batay sa kanilang mga pagkakasunud-sunod ng amino acid.
Ang mga neural network, sumusuporta sa mga vector machine, at random na kagubatan ay kabilang sa higit pang mga pamamaraan sa pag-aaral ng makina na nagpapakita ng pangako para sa paghula ng istruktura ng protina.
Ang mga algorithm na ito ay maaaring matuto mula sa napakalaking dataset. At, maaari nilang asahan ang mga ugnayan sa pagitan ng iba't ibang mga amino acid. Kaya, tingnan natin kung paano ito gumagana.
Mga Co-evolutionary na Pagsusuri at ang Unang AlphaFold Generation
Ang tagumpay ng AlphaFold ay binuo sa isang malalim na modelo ng neural network na binuo gamit ang co-evolutionary analysis. Ang konsepto ng co-evolution ay nagsasaad na kung ang dalawang amino acid sa isang protina ay nakikipag-ugnayan sa isa't isa, sila ay bubuo nang magkasama upang mapanatili ang kanilang functional na link.
Matutukoy ng mga mananaliksik kung aling mga pares ng mga amino acid ang malamang na nakikipag-ugnayan sa 3D na istraktura sa pamamagitan ng paghahambing ng mga pagkakasunud-sunod ng amino acid ng maraming katulad na mga protina.
Ang data na ito ay nagsisilbing pundasyon para sa unang pag-ulit ng AlphaFold. Hinuhulaan nito ang mga haba sa pagitan ng mga pares ng amino acid pati na rin ang mga anggulo ng mga peptide bond na nag-uugnay sa kanila. Ang pamamaraang ito ay nalampasan ang lahat ng mga naunang diskarte para sa paghula ng istraktura ng protina mula sa pagkakasunud-sunod, kahit na ang katumpakan ay pinaghihigpitan pa rin para sa mga protina na walang maliwanag na mga template.
AlphaFold 2: Isang Radikal na Bagong Pamamaraan
Ang AlphaFold2 ay isang computer software na nilikha ng DeepMind na gumagamit ng amino acid sequence ng isang protina upang mahulaan ang 3D na istraktura ng protina.
Mahalaga ito dahil ang istraktura ng isang protina ang nagdidikta kung paano ito gumagana, at ang pag-unawa sa paggana nito ay makakatulong sa mga siyentipiko na bumuo ng mga gamot na nagta-target sa protina.
Natatanggap ng AlphaFold2 neural network bilang input ang sequence ng amino acid ng protina pati na rin ang mga detalye tungkol sa kung paano inihahambing ang sequence na iyon sa iba pang sequence sa isang database (ito ay tinatawag na "sequence alignment").
Ang neural network ay gumagawa ng isang hula tungkol sa 3D na istraktura ng protina batay sa input na ito.
Ano ang Pinagkaiba nito sa AlphaFold2?
Sa kaibahan sa iba pang mga diskarte, hinuhulaan ng AlphaFold2 ang totoong 3D na istraktura ng protina sa halip na ang paghihiwalay lamang sa pagitan ng mga pares ng amino acid o ang mga anggulo sa pagitan ng mga bono na nagkokonekta sa kanila (tulad ng ginawa ng mga naunang algorithm).
Upang maasahan ng neural network ang buong istraktura nang sabay-sabay, ang istraktura ay naka-encode ng end-to-end.
Ang isa pang pangunahing katangian ng AlphaFold2 ay nag-aalok ito ng pagtatantya kung gaano ito kumpiyansa sa pagtataya nito. Ito ay ipinakita bilang isang color coding sa inaasahang istraktura, na may pula na kumakatawan sa mataas na kumpiyansa at asul na nagmumungkahi ng mababang kumpiyansa.
Ito ay kapaki-pakinabang dahil ito ay nagpapaalam sa mga siyentipiko tungkol sa katatagan ng hula.
Paghuhula sa Pinagsamang Istraktura ng Ilang Pagkakasunod-sunod
Ang pinakabagong pagpapalawak ng Alphafold2, na kilala bilang Alphafold Multimer, ay nagtataya ng pinagsamang istraktura ng ilang mga sequence. Mayroon pa rin itong mataas na rate ng pagkakamali kahit na ito ay gumaganap nang mas mahusay kaysa sa mga naunang pamamaraan. %25 lamang sa 4500 na mga kumplikadong protina ang matagumpay na nahula.
70% ng mga magaspang na rehiyon ng pagbuo ng contact ay tama na hinulaang, ngunit ang kamag-anak na oryentasyon ng dalawang protina ay hindi tama. Kapag ang median alignment depth ay mas mababa sa humigit-kumulang 30 sequence, ang katumpakan ng Alphafold multimer predictions ay makabuluhang bumababa.
Paano Gamitin ang Alphafold Predictions
Ang mga hinulaang modelo mula sa AlphaFold ay inaalok sa parehong mga format ng file at maaaring gamitin sa parehong paraan tulad ng mga pang-eksperimentong istruktura. Mahalagang isaalang-alang ang mga pagtatantya sa katumpakan na inaalok kasama ng modelo upang maiwasan ang mga hindi pagkakaunawaan.
Ito ay partikular na nakakatulong para sa mga kumplikadong istruktura tulad ng mga interwoven homomer o mga protina na nakatiklop lamang sa pagkakaroon ng isang
hindi kilalang ligand.
Ilang Hamon
Ang pangunahing problema sa paggamit ng mga hinulaang istruktura ay ang pag-unawa sa dynamics, ligand selectivity, control, allostery, post-translational na mga pagbabago, at kinetics ng pagbubuklod nang walang access sa protina at biophysical data.
Pag-aaral ng machine at ang pananaliksik sa molecular dynamics na nakabatay sa pisika ay maaaring magamit upang malampasan ang problemang ito.
Maaaring makinabang ang mga pagsisiyasat na ito mula sa dalubhasa at mahusay na arkitektura ng computer. Habang nakamit ng AlphaFold ang napakalaking pag-unlad sa paghula ng mga istruktura ng protina, marami pa ring dapat matutunan sa larangan ng structural biology, at ang mga hula ng AlphaFold ay ang panimulang punto lamang para sa hinaharap na pag-aaral.
Ano ang Iba Pang Mga Kahanga-hangang Tool?
RoseTTAFold
Gumagamit din ang RoseTTAFold, na nilikha ng mga mananaliksik ng University of Washington, ng malalim na pag-aaral ng mga algorithm upang mahulaan ang mga istruktura ng protina, ngunit isinasama rin nito ang isang nobelang diskarte na kilala bilang "torsion angle dynamics simulation" upang mapabuti ang mga hinulaang istruktura.
Ang pamamaraang ito ay nagbunga ng mga nakapagpapatibay na resulta at maaaring maging kapaki-pakinabang sa pagtagumpayan ng mga limitasyon ng umiiral na AI protein folding tool.
trRosetta
Ang isa pang tool, trRosetta, ay hinuhulaan ang pagtitiklop ng protina sa pamamagitan ng paggamit ng a neural network sinanay sa milyun-milyong pagkakasunud-sunod at istruktura ng protina.
Gumagamit din ito ng diskarteng "pagmomodelo na nakabatay sa template" upang lumikha ng mas tumpak na mga hula sa pamamagitan ng paghahambing ng target na protina sa maihahambing na mga kilalang istruktura.
Ipinakita na ang trRosetta ay may kakayahang hulaan ang mga istruktura ng maliliit na protina at mga kumplikadong protina.
DeepMetaPSICOV
Ang DeepMetaPSICOV ay isa pang tool na nakatutok sa paghula ng mga mapa ng contact ng protina. Ang mga ito, ay ginagamit bilang gabay upang mahulaan ang pagtitiklop ng protina. Ito ay gumagamit ng malalim na pag-aaral diskarte upang hulaan ang posibilidad ng mga nalalabi na pakikipag-ugnayan sa loob ng isang protina.
Ang mga ito ay kasunod na ginagamit upang hulaan ang pangkalahatang mapa ng contact. Nagpakita ang DeepMetaPSICOV ng potensyal sa paghula ng mga istruktura ng protina na may mahusay na katumpakan, kahit na nabigo ang mga nakaraang diskarte.
Ano ang Hinaharap?
Ang hinaharap ng AI protein folding ay maliwanag. Ang mga algorithm na nakabatay sa malalim na pag-aaral, lalo na ang AlphaFold2, ay gumawa kamakailan ng mahusay na pag-unlad sa mapagkakatiwalaang paghula ng mga istruktura ng protina.
Ang paghahanap na ito ay may potensyal na baguhin ang pagbuo ng gamot sa pamamagitan ng pagpayag sa mga siyentipiko na mas maunawaan ang istraktura at paggana ng mga protina, na karaniwang mga therapeutic target.
Gayunpaman, nananatili ang mga isyu tulad ng pagtataya ng mga complex ng protina at pag-detect sa totoong functional na status ng mga inaasahang istruktura. Higit pang pananaliksik ang kinakailangan upang malutas ang mga isyung ito at mapataas ang katumpakan at pagiging maaasahan ng AI protein folding algorithm.
Gayunpaman, ang mga potensyal na benepisyo ng teknolohiyang ito ay napakalaki, at ito ay may potensyal na humantong sa paggawa ng mas epektibo at tumpak na mga gamot.
Mag-iwan ng Sagot