MetaのAIはタンパク質構造の研究方法に革命を起こす可能性がある

MetaのAIはタンパク質構造の研究方法に革命を起こす可能性がある

タンパク質は生物の活動を維持するために不可欠な要素です。細胞の修復、老廃物の除去、体の端から端への伝達を助けます。

科学者の間ではタンパク質の構造と機能を解明するための研究が盛んに行われており、この目的のために、Meta の AI 研究チームは本日、アミノ酸配列に基づいてタンパク質の 3D 構造を予測できるモデルを使用したことを発表しました。DeepMind などのこの分野でのこれまでの研究とは異なり、Meta の AI は形状と配列のマッチング アルゴリズムではなく、言語学習モデルに基づいています。Meta はこの研究に関するプレプリント論文を公開するだけでなく、モデルとタンパク質のデータベースの両方を研究コミュニティと業界に公開する予定です。

まず、タンパク質の形状を理解することの重要性を説明するために、簡単な生物学のレッスンを紹介します。遺伝子の特定のヌクレオチドのトリプレット配列は、細胞内のリボソームと呼ばれる分子によってアミノ酸に変換されます。タンパク質は、独自の形状と構成に自己分類されたアミノ酸の鎖です。メタゲノミクスと呼ばれる新しい科学分野では、遺伝子配列を使用して自然界の新しいタンパク質を発見、カタログ化、注釈付けしています。

Meta の AI モデルは、大規模言語モデルにヒントを得た新しいタンパク質折り畳みアプローチであり、メタゲノミクス データベース内の何億ものタンパク質配列の構造を予測することを目的としています。これらのタンパク質が形成する形状を理解することで、研究者はタンパク質がどのように機能し、どの分子と相互作用するかについての手がかりを得ることができます。

[関連: Meta は新しい AI ツールで Wikipedia の精度を高めることができると考えている]

「メタゲノミクスタンパク質の初めての大規模な特性評価を作成しました。タンパク質構造の予測が 6 億件以上あるデータベースをオープン サイエンス リソースとして公開します」と Meta AI の研究科学者アレックス リヴス氏は言います。「これは、世の中で最も理解されていないタンパク質のいくつかをカバーしています。」

歴史的に、計算生物学者は進化のパターンを利用してタンパク質の構造を予測してきました。タンパク質は、折り畳まれる前は、アミノ酸の線状鎖です。タンパク質が複雑な構造に折り畳まれると、線状鎖では離れているように見える特定の配列が、突然互いに非常に近くなる可能性があります。

「これは、パズルの 2 つのピースが合わさってできていると考えることができます。進化は、これらの 2 つの位置を独立して選択することはできません。間違ったピースがここにあると、構造が崩れてしまうからです」と Rives 氏は言います。「つまり、タンパク質配列のパターンを見ると、配列内の異なる位置が互いに共変するため、折り畳まれた構造に関する情報が含まれているということです。これは、タンパク質の根本的な生物学的特性に関する何かを反映することになります。」

一方、2018年に初めて登場したディープマインドの革新的なアプローチは、主に多重配列アライメントと呼ばれる手法に依存している。基本的には、タンパク質配列の大規模な進化データベースを検索し、予測対象のタンパク質に関連するタンパク質を見つける。

「私たちのアプローチが他と違うのは、複数の関連タンパク質のセットから予測してパターンを見るのではなく、アミノ酸配列から直接予測を行っていることです」と Rives 氏は言います。「言語モデルはこれらのパターンを別の方法で学習しました。つまり、この配列セットを処理する必要がなく、関連配列を検索する必要がないため、構造予測アーキテクチャを大幅に簡素化できるということです。」

これらの要素により、この分野の他の技術と比較して、彼らのモデルはより高速になる、とリヴス氏は主張する。

[関連: Meta は人間の脳を研究することで AI を改良したいと考えている]

このモデルをこのタスクを実行できるようにどのようにトレーニングしたのでしょうか。2 つのステップを踏みました。まず、構造が異なり、さまざまなタンパク質ファミリーに属し、進化のタイムライン全体にわたって得られた多数のタンパク質で言語モデルを事前トレーニングする必要がありました。彼らはマスク言語モデルのバージョンを使用し、アミノ酸配列の一部を空白にして、その空白を埋めるようにアルゴリズムに指示しました。「言語トレーニングは教師なし学習で、配列のみでトレーニングされます」と Rives 氏は説明します。「これを行うと、このモデルは数百万のタンパク質配列にわたってパターンを学習します。」

次に、言語モデルをフリーズし、その上でフォールディング モジュールをトレーニングしました。トレーニングの第 2 段階では、教師あり学習を使用します。教師あり学習データセットは、世界中の研究者が提出したタンパク質データバンクの構造のセットで構成されています。次に、AlphaFold (DeepMind のテクノロジー) を使用して作成された予測で補強されます。「このフォールディング モジュールは、言語モデルの入力を受け取り、基本的にタンパク質の 3D 原子座標を [アミノ酸配列から] 出力します」と Rives 氏は言います。「これにより、これらの表現が生成され、フォールディング ヘッドを使用して構造に投影されます。」

リヴス氏は、このモデルは、タンパク質の活性部位の機能を生化学レベルで理解するなどの研究用途に使用できると考えています。これは、新薬の開発や発見に非常に役立つ情報です。また、将来的には、この AI を使って新しいタンパク質を設計できるとも考えています。

<<:  今週末は流星群とハンターズムーンが夜空を照らすだろう

>>:  レモン汁をもっと搾る方法と、電子レンジを使った8つの天才的な裏ワザ

推薦する

これら6つの銀河は非常に巨大で、「宇宙破壊者」というニックネームが付けられています。

ジェイムズ・ウェッブ宇宙望遠鏡(JWST)によって公開された最初のデータセットを使用して、国際的な科...

イーロン・マスクの火星植民地化計画に関する4つの疑問

イーロン・マスク氏は、ロケットの爆発のような些細なことで大きな夢を諦めたりはしない。スペースX社のフ...

ボイジャー2号はついに太陽系を取り囲む希薄なプラズマを調査できる

ボイジャー2号は太陽風の影響を離れたボイジャー1号と合流した。NASA/JPL-Caltech小さな...

今週学んだ最も奇妙なこと: マラリアで梅毒を治す、飛行機からクマを追い出す、新しいビール酵母を発見

今週あなたが学んだ最も奇妙なことは何ですか? それが何であれ、PopSci の最新のポッドキャストを...

致命的でおいしい:これらの6つの食べ物は実際にあなたを殺す可能性があります

一般的に言えば、人間はどんなものでも少なくとも一度は食べようとします。先史時代の人々は試行錯誤しなが...

新しい要素の作成

昨年、ドイツの科学者たちは宇宙で最も重い既知の元素、119番元素を作ろうと試みた。5か月間、彼らは2...

亀、神話、伝説:ジョナサンが190歳に

週末、とても特別な爬虫類の、3日間にわたる誕生日のお祝いが始まりました。カメのジョナサンは昨日190...

地球を全視野衛星で囲む競争が始まる

昨年、3 つのスタートアップ企業が、衛星画像の王者 Google Earth の座を奪うべく、激しい...

7 種類の科学愛好家のための 11 のギフト

この Web サイトにアクセスしているということは、おそらくあなたは科学が好きか、少なくとも科学が好...

地質学者:我々は火山への備えができていない

人類は何世紀にもわたり、火山の驚異的な力に驚嘆してきた。今月初め、レイキャネス半島の割れ目噴火から流...

スーパーヒーロースタイルの宇宙服は宇宙飛行士にとって重要な圧迫を提供する可能性がある

この新しいスパイダーマン スタイルのスーツは、宇宙飛行士にファッションの殿堂入りをもたらすことはない...

平均的なアメリカのポルノスターの見た目 [インフォグラフィック]

平均的なアメリカ人ポルノスターは、カリフォルニア生まれのニッキー・リーという名の茶色い髪の女性である...

2024年現在までに撮影された最も素晴らしいJWST画像8枚

地球から約100万マイル離れた場所にあるジェイムズ・ウェッブ宇宙望遠鏡は宇宙を研究しています。 20...

ブルーオリジン、再使用型ロケットの着陸でスペースXに勝利

https://www.youtube.com/watch?v=9pillaOxGCo?アマゾンの...

ブリリアント 10: パターン メーカー、イアン カズン

鳥の旋回、逃げる魚の銀色の閃光など、生命の営みは神秘的に秩序立っているように見える。自然界の集団行動...