Од секвенце до структуре: Како АИ трансформише савијање протеина

Шта ако бисмо могли да употребимо вештачку интелигенцију да одговоримо на једну од највећих животних мистерија – савијање протеина? Научници су радили на томе деценијама.

Машине сада могу да предвиде протеинске структуре са невероватном прецизношћу користећи моделе дубоког учења, мењајући развој лекова, биотехнологију и наше знање о фундаменталним биолошким процесима.

Придружите ми се у истраживању интригантног царства савијања АИ протеина, где се најсавременија технологија судара са сложеношћу самог живота.

Разоткривање мистерије савијања протеина

Протеини раде у нашим телима као мале машине за обављање кључних задатака попут разлагања хране или транспорта кисеоника. Морају бити правилно пресавијени да би ефикасно функционисали, баш као што кључ мора бити правилно исечен да би стао у браву. Чим се протеин створи, почиње веома компликован процес савијања.

Савијање протеина је процес којим се дугачки ланци аминокиселина, грађевинских блокова протеина, савијају у тродимензионалне структуре које диктирају функцију протеина.

Размислите о дугачком низу перли које се морају наручити у прецизном облику; то се дешава када се протеин савија. Ипак, за разлику од перли, аминокиселине имају јединствене карактеристике и међусобно делују на различите начине, чинећи савијање протеина сложеним и осетљивим процесом.

Слика овде представља људски хемоглобин, који је добро познати пресавијени протеин

Протеини се морају брзо и прецизно савијати, иначе ће постати погрешно савијени и дефектни. То може довести до болести као што су Алцхајмерова и Паркинсонова болест. Температура, притисак и присуство других молекула у ћелији утичу на процес савијања.

После деценија истраживања, научници још увек покушавају да открију како се протеини савијају.

Срећом, напредак у вештачкој интелигенцији побољшава развој у сектору. Научници могу да предвиде структуру протеина прецизније него икада раније коришћењем алгоритми машинског учења да испита огромне количине података.

Ово има потенцијал да промени развој лекова и повећа наше молекуларно знање о болести.

Могу ли машине да раде боље?

Конвенционалне технике савијања протеина имају ограничења

Научници су деценијама покушавали да открију савијање протеина, али замршеност процеса учинила је ово изазовном темом.

Конвенционални приступи предвиђању структуре протеина користе комбинацију експерименталних методологија и компјутерског моделирања, међутим, све ове методе имају недостатке.

Експерименталне технике као што су рендгенска кристалографија и нуклеарна магнетна резонанца (НМР) могу бити дуготрајне и скупе. А компјутерски модели се понекад ослањају на једноставне претпоставке, што може довести до погрешних предвиђања.

АИ може да превазиђе ове препреке

Срећом, вештачка интелигенција пружа ново обећање за прецизније и ефикасније предвиђање структуре протеина. Алгоритми машинског учења могу да испитају огромне количине података. И откривају обрасце који би људима недостајали.

Ово је резултирало стварањем нових софтверских алата и платформи способних да предвиде структуру протеина са неупоредивом прецизношћу.

Алгоритми машинског учења који највише обећавају за предвиђање структуре протеина

АлпхаФолд систем који је направио Гоогле ДеепМинд тим је једно од најперспективнијих достигнућа у овој области. Последњих година је постигао велики напредак коришћењем алгоритми дубоког учења да предвиди структуру протеина на основу њихових аминокиселинских секвенци.

Неуронске мреже, машине за подршку векторима и насумичне шуме су међу више метода машинског учења које обећавају за предвиђање структуре протеина.

Ови алгоритми могу да уче из огромних скупова података. И, они могу предвидети корелације између различитих аминокиселина. Дакле, да видимо како то функционише.

Коеволуционе анализе и прва генерација АлпхаФолд-а

Успех АлпхаФолд је изграђен на моделу дубоке неуронске мреже који је развијен коришћењем коеволуционе анализе. Концепт коеволуције каже да ако две аминокиселине у протеину интерагују једна са другом, оне ће се развијати заједно како би задржале своју функционалну везу.

Истраживачи могу открити који парови аминокиселина ће вероватно бити у контакту у 3Д структури упоређујући секвенце аминокиселина бројних сличних протеина.

Ови подаци служе као основа за прву итерацију АлпхаФолд-а. Он предвиђа дужине између парова аминокиселина, као и углове пептидних веза које их повезују. Овај метод је надмашио све претходне приступе за предвиђање структуре протеина из секвенце, иако је тачност и даље била ограничена за протеине без видљивих шаблона.

АлпхаФолд 2: радикално нова методологија

АлпхаФолд2 је компјутерски софтвер који је креирао ДеепМинд који користи секвенцу аминокиселина протеина за предвиђање 3Д структуре протеина.

Ово је значајно јер структура протеина диктира како он функционише, а разумевање његове функције може помоћи научницима да развију лекове који циљају на протеин.

АлпхаФолд2 неуронска мрежа прима као улаз аминокиселинску секвенцу протеина, као и детаље о томе како се та секвенца упоређује са другим секвенцама у бази података (ово се назива „поравнање секвенце“).

Неуронска мрежа предвиђа 3Д структуру протеина на основу овог улаза.

Шта га разликује од АлпхаФолд2?

За разлику од других приступа, АлпхаФолд2 предвиђа стварну 3Д структуру протеина, а не само раздвајање између парова амино киселина или углове између веза које их повезују (као што су то чинили претходни алгоритми).

Да би неуронска мрежа могла да предвиди пуну структуру одједном, структура је кодирана од краја до краја.

Још једна кључна карактеристика АлпхаФолд2 је да нуди процену колико је сигуран у своју прогнозу. Ово је представљено као кодирање у боји на предвиђеној структури, при чему црвена представља високо поверење, а плава указује на ниско поверење.

Ово је корисно јер информише научнике о стабилности предвиђања.

Предвиђање комбиноване структуре неколико секвенци

Најновија експанзија Алпхафолд2, позната као Алпхафолд Мултимер, предвиђа комбиновану структуру неколико секвенци. И даље има високу стопу грешака чак и ако ради много боље од ранијих техника. Само %25 од 4500 протеинских комплекса је успешно предвиђено.

70% грубих региона формирања контакта је тачно предвиђено, али је релативна оријентација два протеина била нетачна. Када је средња дубина поравнања мања од отприлике 30 секвенци, тачност Алфафолд мултимерних предвиђања значајно опада.

Како користити Алпхафолд предвиђања

Предвиђени модели из АлпхаФолд-а се нуде у истим форматима датотека и могу се користити на исти начин као и експерименталне структуре. Кључно је узети у обзир процене тачности које се нуде са моделом како би се спречили неспоразуми.

Посебно је корисно за компликоване структуре као што су испреплетени хомомери или протеини који се савијају само у присуству
непознати лиганд.

Неки изазови

Главни проблем у коришћењу предвиђених структура је разумевање динамике, селективности лиганда, контроле, алостерије, посттранслационих промена и кинетике везивања без приступа протеинским и биофизичким подацима.

Машинско учење а истраживање молекуларне динамике засновано на физици може се користити за превазилажење овог проблема.

Ова истраживања могу имати користи од специјализоване и ефикасне рачунарске архитектуре. Док је АлпхаФолд постигао огроман напредак у предвиђању протеинских структура, још увек има много тога да се научи у области структуралне биологије, а предвиђања АлпхаФолда су само почетна тачка за будућа проучавања.

Који су други изузетни алати?

РосеТТАФолд

РосеТТАФолд, који су креирали истраживачи са Универзитета у Вашингтону, такође користи алгоритме дубоког учења за предвиђање протеинских структура, али такође интегрише нови приступ познат као „симулације динамике торзионог угла“ за побољшање предвиђених структура.

Ова метода је дала охрабрујуће резултате и може бити корисна у превазилажењу ограничења постојећих алата за савијање АИ протеина.

трРосетта

Други алат, трРосетта, предвиђа савијање протеина коришћењем а неуронска мрежа обучени на милионе протеинских секвенци и структура.

Такође користи технику „моделирања заснованог на шаблону“ за стварање прецизнијих предвиђања упоређивањем циљног протеина са упоредивим познатим структурама.

Показано је да је трРосетта способна да предвиди структуре ситних протеина и протеинских комплекса.

ДеепМетаПСИЦОВ

ДеепМетаПСИЦОВ је још један алат који се фокусира на предвиђање мапа контакта протеина. Они се користе као водич за предвиђање савијања протеина. Користи дубоко учење приступи предвиђању вероватноће интеракција остатака унутар протеина.

Они се касније користе за предвиђање укупне мапе контаката. ДеепМетаПСИЦОВ је показао потенцијал у предвиђању протеинских структура са великом тачношћу, чак и када претходни приступи нису успели.

Шта доноси будућност?

Будућност савијања АИ протеина је светла. Алгоритми засновани на дубоком учењу, посебно АлпхаФолд2, недавно су постигли велики напредак у поузданом предвиђању протеинских структура.

Овај налаз има потенцијал да трансформише развој лекова омогућавајући научницима да боље разумеју структуру и функцију протеина, који су уобичајени терапеутски циљеви.

Без обзира на то, остају питања попут предвиђања протеинских комплекса и откривања стварног функционалног статуса предвиђених структура. Потребно је више истраживања да би се решили ови проблеми и повећала тачност и поузданост алгоритама за савијање АИ протеина.

Ипак, потенцијалне предности ове технологије су огромне и она има потенцијал да доведе до производње ефикаснијих и прецизнијих лекова.

Од секвенце до структуре: Како АИ трансформише савијање протеина

Разоткривање мистерије савијања протеина

Могу ли машине да раде боље?