Від послідовності до структури: як штучний інтелект перетворює згортання білка

Що, якби ми могли використати штучний інтелект, щоб відповісти на одну з найбільших загадок життя – згортання білка? Над цим вчені працювали десятиліттями.

Тепер машини можуть прогнозувати структури білка з неймовірною точністю, використовуючи моделі глибокого навчання, змінюючи розробку ліків, біотехнології та наші знання про фундаментальні біологічні процеси.

Приєднуйтесь до мене в дослідженні інтригуючої сфери згортання білка ШІ, де передові технології стикаються зі складністю самого життя.

Розкриття таємниці згортання білка

Білки працюють у нашому організмі як маленькі машини, щоб виконувати важливі завдання, такі як розщеплення їжі або транспортування кисню. Вони повинні бути правильно складені, щоб вони працювали ефективно, так само, як ключ має бути правильно обрізаний, щоб увійти в замок. Як тільки білок створюється, починається дуже складний процес згортання.

Згортання білка – це процес, за допомогою якого довгі ланцюги амінокислот, будівельних блоків білка, згортаються в тривимірні структури, які визначають функцію білка.

Розглянемо довгий рядок бісеру, який потрібно замовити в точну форму; це те, що відбувається, коли білок згортається. Проте, на відміну від бісеру, амінокислоти мають унікальні характеристики та взаємодіють одна з одною різними способами, що робить згортання білка складним і чутливим процесом.

На зображенні зображено людський гемоглобін, який є добре відомим згорнутим білком

Білки повинні згортатися швидко і точно, інакше вони будуть неправильно згорнуті та пошкоджені. Це може призвести до таких захворювань, як хвороба Альцгеймера та Паркінсона. Температура, тиск і присутність інших молекул у клітині впливають на процес згортання.

Після десятиліть досліджень вчені все ще намагаються з’ясувати, як саме згортаються білки.

На щастя, прогрес у галузі штучного інтелекту сприяє розвитку сектора. Вчені можуть передбачити структуру білків точніше, ніж будь-коли раніше, використовуючи алгоритми машинного навчання для вивчення величезних обсягів даних.

Це може змінити розвиток ліків і розширити наші молекулярні знання про хворобу.

Чи можуть машини працювати краще?

Звичайні методи згортання білка мають обмеження

Вчені десятиліттями намагалися з’ясувати згортання білка, але складність процесу зробила це складним питанням.

Звичайні підходи до прогнозування структури білка використовують комбінацію експериментальних методологій і комп’ютерного моделювання, однак усі ці методи мають недоліки.

Експериментальні методи, такі як рентгенівська кристалографія та ядерний магнітний резонанс (ЯМР), можуть бути трудомісткими та дорогими. Крім того, комп’ютерні моделі іноді спираються на прості припущення, які можуть призвести до помилкових прогнозів.

ШІ може подолати ці перешкоди

На щастя, штучний інтелект дає нові обіцянки для більш точного та ефективного прогнозування структури білка. Алгоритми машинного навчання можуть досліджувати величезні обсяги даних. І вони виявляють моделі, які люди пропустили б.

Це призвело до створення нових програмних засобів і платформ, здатних передбачати структуру білка з неперевершеною точністю.

Найперспективніші алгоритми машинного навчання для прогнозування структури білка

Система AlphaFold, розроблена компанією Google Deepmind є одним із найперспективніших досягнень у цій галузі. Останніми роками він досяг значного прогресу завдяки використанню алгоритми глибокого навчання передбачити структуру білків на основі їхньої амінокислотної послідовності.

Нейронні мережі, опорні векторні машини та випадкові ліси є одними з інших методів машинного навчання, які є перспективними для прогнозування структури білка.

Ці алгоритми можуть навчатися з величезних наборів даних. І вони можуть передбачати кореляції між різними амінокислотами. Отже, давайте подивимося, як це працює.

Коеволюційний аналіз і перше покоління AlphaFold

Успіх AlphaFold побудовано на моделі глибокої нейронної мережі, яка була розроблена з використанням коеволюційного аналізу. Концепція спільної еволюції стверджує, що якщо дві амінокислоти в білку взаємодіють одна з одною, вони розвиватимуться разом, щоб зберегти свій функціональний зв’язок.

Дослідники можуть виявити, які пари амінокислот, ймовірно, перебувають у контакті в 3D-структурі, порівнюючи амінокислотні послідовності багатьох подібних білків.

Ці дані служать основою для першої ітерації AlphaFold. Він передбачає довжину між парами амінокислот, а також кути пептидних зв’язків, які їх з’єднують. Цей метод перевершив усі попередні підходи для прогнозування структури білка за послідовністю, хоча точність все ще була обмежена для білків без очевидних шаблонів.

AlphaFold 2: радикально нова методологія

AlphaFold2 — це комп’ютерне програмне забезпечення, створене DeepMind, яке використовує амінокислотну послідовність білка для прогнозування 3D-структури білка.

Це важливо, оскільки структура білка визначає, як він функціонує, і розуміння його функції може допомогти вченим розробити ліки, спрямовані на білок.

Нейронна мережа AlphaFold2 отримує як вхідні дані послідовність амінокислот білка, а також деталі про те, як ця послідовність порівнюється з іншими послідовностями в базі даних (це називається «вирівнюванням послідовності»).

Нейронна мережа робить прогноз щодо 3D-структури білка на основі цих даних.

Що відрізняє його від AlphaFold2?

На відміну від інших підходів, AlphaFold2 передбачає реальну тривимірну структуру білка, а не просто поділ між парами амінокислот або кути між зв’язками, що їх з’єднують (як це робили попередні алгоритми).

Для того, щоб нейронна мережа передбачала повну структуру відразу, структура кодується наскрізно.

Ще одна ключова характеристика AlphaFold2 полягає в тому, що він пропонує оцінку того, наскільки він впевнений у своєму прогнозі. Це представлено у вигляді кольорового кодування очікуваної структури, де червоний колір означає високу достовірність, а синій — низьку достовірність.

Це корисно, оскільки інформує вчених про стабільність прогнозу.

Прогнозування комбінованої структури кількох послідовностей

Останнє розширення Alphafold2, відоме як Alphafold Multimer, прогнозує об’єднану структуру кількох послідовностей. Він все ще має високий рівень помилок, навіть якщо він працює набагато краще, ніж попередні методи. Лише 25% з 4500 білкових комплексів були успішно передбачені.

70% шорстких областей утворення контакту були правильно передбачені, але взаємна орієнтація двох білків була неправильною. Коли середня глибина вирівнювання становить менше приблизно 30 послідовностей, точність прогнозів мультимерів Alphafold значно знижується.

Як використовувати алфавітні прогнози

Прогнозовані моделі від AlphaFold пропонуються в тих же форматах файлів і можуть використовуватися так само, як експериментальні структури. Важливо взяти до уваги оцінки точності, запропоновані моделлю, щоб запобігти непорозумінням.

Це особливо корисно для складних структур, таких як переплетені гомомери або білки, які згортаються лише за наявності
невідомий ліганд.

Деякі виклики

Основною проблемою у використанні передбачених структур є розуміння динаміки, селективності лігандів, контролю, алостерії, посттрансляційних змін і кінетики зв’язування без доступу до білкових і біофізичних даних.

навчання за допомогою машини і дослідження молекулярної динаміки на основі фізики можуть бути використані для подолання цієї проблеми.

Для цих досліджень може бути використана спеціалізована та ефективна комп’ютерна архітектура. Незважаючи на те, що AlphaFold досяг величезних успіхів у передбаченні білкових структур, у галузі структурної біології ще багато чому потрібно навчитися, і прогнози AlphaFold є лише відправною точкою для майбутніх досліджень.

Які інші чудові інструменти?

RoseTTAFold

RoseTTAFold, створений дослідниками Університету Вашингтона, також використовує алгоритми глибокого навчання для прогнозування білкових структур, але він також інтегрує новий підхід, відомий як «симуляція кутової динаміки кручення», для покращення прогнозованих структур.

Цей метод дав обнадійливі результати і може бути корисним для подолання обмежень існуючих інструментів для згортання білка ШІ.

trRosetta

Інший інструмент, trRosetta, передбачає згортання білків за допомогою a нейронної мережі навчався мільйонам білкових послідовностей і структур.

Він також використовує техніку «моделювання на основі шаблонів» для створення більш точних прогнозів шляхом порівняння цільового білка з порівнянними відомими структурами.

Було продемонстровано, що trRosetta здатний передбачати структури крихітних білків і білкових комплексів.

DeepMetaPSICOV

DeepMetaPSICOV — це ще один інструмент, який фокусується на прогнозуванні карт контакту білка. Вони використовуються як орієнтир для прогнозування згортання білка. Це використовує глибоке навчання підходи до прогнозування ймовірності взаємодій залишків всередині білка.

Згодом вони використовуються для прогнозування загальної карти контактів. DeepMetaPSICOV продемонстрував потенціал у передбаченні білкових структур з високою точністю, навіть якщо попередні підходи виявилися неефективними.

Що має майбутнє?

Майбутнє згортання білка ШІ світле. Алгоритми на основі глибокого навчання, зокрема AlphaFold2, нещодавно досягли значного прогресу в надійному прогнозуванні білкових структур.

Це відкриття має потенціал трансформувати розробку ліків, дозволяючи вченим краще зрозуміти структуру та функції білків, які є звичайними терапевтичними цілями.

Тим не менш, залишаються проблеми, такі як прогнозування білкових комплексів і виявлення реального функціонального стану очікуваних структур. Потрібні додаткові дослідження, щоб вирішити ці проблеми та підвищити точність і надійність алгоритмів згортання білка ШІ.

Проте потенційні переваги цієї технології величезні, і вона може призвести до виробництва більш ефективних і точних ліків.

Від послідовності до структури: як AI трансформує згортання білків

Розкриття таємниці згортання білка

Чи можуть машини працювати краще?