人工知能を使用して、生命の最大の謎の XNUMX つであるタンパク質の折り畳みに答えられるとしたら? 科学者たちは何十年もの間、これに取り組んできました。
マシンは、ディープ ラーニング モデルを使用して驚異的な精度でタンパク質構造を予測できるようになり、医薬品開発、バイオテクノロジー、および基本的な生物学的プロセスに関する私たちの知識を変えています。
最先端のテクノロジーが生命そのものの複雑さと衝突する AI タンパク質フォールディングの興味深い領域への探求に参加してください。
タンパク質フォールディングの謎を解明
タンパク質は私たちの体内で小さな機械のように働き、食物の分解や酸素の輸送などの重要なタスクを実行します. 効果的に機能させるには、正しく折りたたむ必要があります。ちょうど、鍵を正しく切って錠前に合わせる必要があるのと同じです。 タンパク質が作られるとすぐに、非常に複雑な折り畳みプロセスが始まります。
タンパク質の折り畳みは、タンパク質のビルディング ブロックであるアミノ酸の長い鎖が、タンパク質の機能を決定する XNUMX 次元構造に折り畳まれるプロセスです。
正確な形に注文する必要がある長いビーズの列を考えてみましょう。 これは、タンパク質が折り畳まれるときに起こることです。 しかし、ビーズとは異なり、アミノ酸には独自の特徴があり、さまざまな方法で互いに相互作用するため、タンパク質の折り畳みは複雑で敏感なプロセスになります。
ここの写真は、よく知られている折りたたまれたタンパク質であるヒト ヘモグロビンを表しています。
タンパク質は速く正確に折り畳まれなければなりません。 それはアルツハイマー病やパーキンソン病などの病気につながる可能性があります. 温度、圧力、および細胞内の他の分子の存在はすべて、折りたたみプロセスに影響を与えます。
何十年にもわたる研究の後、科学者たちはまだタンパク質がどのように折り畳まれるかを正確に理解しようとしています.
ありがたいことに、人工知能の進歩により、この分野の開発が改善されています。 科学者は、これまで以上に正確にタンパク質の構造を予測できます。 機械学習アルゴリズム 膨大な量のデータを調べる。
これにより、医薬品の開発が変化し、病気に関する分子の知識が増える可能性があります。
機械はより良いパフォーマンスを発揮できますか?
従来のタンパク質折りたたみ技術には限界があります
科学者たちは何十年もの間、タンパク質の折り畳みを解明しようとしてきましたが、プロセスが複雑であるため、これは困難な課題となっています.
従来のタンパク質構造予測アプローチは、実験的方法論とコンピューター モデリングの組み合わせを使用しますが、これらの方法にはすべて欠点があります。
X 線結晶構造解析や核磁気共鳴 (NMR) などの実験技術は、時間と費用がかかる可能性があります。 また、コンピュータ モデルは単純な仮定に依存する場合があり、誤った予測につながる可能性があります。
AIはこれらの障害を克服できます
幸いなことに、 人工知能 は、より正確で効率的なタンパク質構造予測に新たな可能性をもたらしています。 機械学習アルゴリズムは、大量のデータを調べることができます。 そして、人々が見落としがちなパターンを明らかにします。
これにより、比類のない精度でタンパク質構造を予測できる新しいソフトウェア ツールとプラットフォームが作成されました。
タンパク質構造予測のための最も有望な機械学習アルゴリズム
Google が構築した AlphaFold システム ディープマインド チームは、この分野で最も有望な進歩の XNUMX つです。 を使用することで、近年大きな進歩を遂げています。 深層学習アルゴリズム アミノ酸配列に基づいてタンパク質の構造を予測します。
ニューラル ネットワーク、サポート ベクター マシン、ランダム フォレストは、タンパク質構造の予測に有望な機械学習手法の XNUMX つです。
これらのアルゴリズムは、膨大なデータセットから学習できます。 そして、異なるアミノ酸間の相関関係を予測することができます。 それでは、それがどのように機能するか見てみましょう。
共進化分析と最初の AlphaFold 世代
の成功 アルファフォールド は、共進化分析を利用して開発されたディープ ニューラル ネットワーク モデルに基づいて構築されています。 共進化の概念は、タンパク質内の XNUMX つのアミノ酸が互いに相互作用する場合、それらは機能的なリンクを維持するために一緒に発達することを示しています。
研究者は、多数の類似したタンパク質のアミノ酸配列を比較することにより、3D 構造で接触している可能性が高いアミノ酸のペアを検出できます。
このデータは、AlphaFold の最初の反復の基礎として機能します。 アミノ酸ペア間の長さ、およびそれらをリンクするペプチド結合の角度を予測します。 この方法は、配列からタンパク質構造を予測するための以前のすべてのアプローチよりも優れていましたが、明らかなテンプレートを持たないタンパク質の精度は依然として制限されていました。
AlphaFold 2: 根本的に新しい方法論
AlphaFold2 は DeepMind によって作成されたコンピューター ソフトウェアで、タンパク質のアミノ酸配列を使用してタンパク質の 3D 構造を予測します。
タンパク質の構造がその機能を決定するため、これは重要であり、その機能を理解することは、科学者がタンパク質を標的とする医薬品を開発するのに役立ちます.
AlphaFold2 ニューラル ネットワークは、入力としてタンパク質のアミノ酸配列と、その配列がデータベース内の他の配列とどのように比較されるかについての詳細を受け取ります (これは「配列アラインメント」と呼ばれます)。
ニューラル ネットワークは、この入力に基づいてタンパク質の 3D 構造を予測します。
AlphaFold2 との違いは何ですか?
他のアプローチとは対照的に、AlphaFold2 は、アミノ酸のペア間の分離またはそれらを接続する結合間の角度 (以前のアルゴリズムが行ったように) ではなく、タンパク質の実際の 3D 構造を予測します。
ニューラル ネットワークが完全な構造を一度に予測できるように、構造はエンドツーエンドでエンコードされます。
AlphaFold2 のもう XNUMX つの重要な特徴は、予測の信頼度を推定できることです。 これは、予想される構造の色分けとして表示されます。赤は信頼度が高く、青は信頼度が低いことを表します。
これは、予測の安定性について科学者に知らせるので便利です。
複数の配列の結合構造の予測
Alphafold Multimer として知られる Alphafold2 の最新の拡張では、いくつかのシーケンスの結合構造が予測されます。 以前の手法よりもはるかに優れたパフォーマンスを発揮するにもかかわらず、依然として高いミス率があります。 25 のタンパク質複合体のうちわずか 4500% が正常に予測されました。
接触形成の大まかな領域の 70% は正しく予測されましたが、30 つのタンパク質の相対的な向きは正しくありませんでした。 アラインメント深度の中央値が約 XNUMX シーケンス未満の場合、Alphafold マルチマー予測の精度は大幅に低下します。
Alphafold 予測の使用方法
AlphaFold からの予測モデルは、同じファイル形式で提供され、実験構造と同じ方法で使用できます。 誤解を避けるために、モデルで提供される精度の見積もりを考慮することが重要です。
これは、織り込まれたホモマーやタンパク質のような複雑な構造の場合に特に役立ちます。
未知のリガンド。
いくつかの課題
予測された構造を使用する際の主な問題は、タンパク質や生物物理学的データにアクセスせずに、結合のダイナミクス、リガンド選択性、制御、アロステリー、翻訳後変化、動力学を理解することです。
機械学習 そして、物理学に基づく分子動力学研究を利用して、この問題を克服することができます。
これらの調査は、専門的で効率的なコンピューター アーキテクチャの恩恵を受ける可能性があります。 AlphaFold はタンパク質構造の予測において多大な進歩を遂げましたが、構造生物学の分野ではまだ学ぶことが多く、AlphaFold の予測は将来の研究の出発点に過ぎません。
その他の注目すべきツールは何ですか?
ローズTTAフォールド
ワシントン大学の研究者によって作成された RoseTTAFold は、同様に深層学習アルゴリズムを使用してタンパク質構造を予測しますが、予測された構造を改善するために「ねじれ角ダイナミクス シミュレーション」として知られる新しいアプローチも統合しています。
この方法は有望な結果をもたらしており、既存の AI タンパク質フォールディング ツールの限界を克服するのに役立つ可能性があります。
trロゼッタ
別のツールである trRosetta は、 ニューラルネットワーク 何百万ものタンパク質配列と構造について訓練されています。
また、「テンプレートベースのモデリング」技術を使用して、標的タンパク質を同等の既知の構造と比較することにより、より正確な予測を作成します。
trRosetta は、小さなタンパク質やタンパク質複合体の構造を予測できることが実証されています。
ディープメタPSICOV
DeepMetaPSICOV は、タンパク質接触マップの予測に焦点を当てた別のツールです。 これらは、タンパク質のフォールディングを予測するためのガイドとして使用されます。 それは使用しています 深い学習 タンパク質内の残基相互作用の可能性を予測するアプローチ。
これらはその後、全体的な接触マップを予測するために使用されます。 DeepMetaPSICOV は、以前のアプローチが失敗した場合でも、タンパク質構造を非常に正確に予測できる可能性を示しています。
未来は何を保持しますか?
AI タンパク質フォールディングの未来は明るいです。 ディープ ラーニング ベースのアルゴリズム、特に AlphaFold2 は、最近、タンパク質構造の信頼性の高い予測において大きな進歩を遂げました。
この発見は、科学者が一般的な治療標的であるタンパク質の構造と機能をよりよく理解できるようにすることで、医薬品開発を変革する可能性を秘めています。
それにもかかわらず、タンパク質複合体の予測や、予想される構造の実際の機能状態の検出などの問題は残っています。 これらの問題を解決し、AI タンパク質フォールディング アルゴリズムの精度と信頼性を高めるには、さらなる研究が必要です。
しかし、この技術の潜在的な利点は計り知れず、より効果的で正確な医薬品の製造につながる可能性があります。
コメントを残す