MetaのAIはタンパク質構造の研究方法に革命を起こす可能性がある

MetaのAIはタンパク質構造の研究方法に革命を起こす可能性がある

タンパク質は生物の活動を維持するために不可欠な要素です。細胞の修復、老廃物の除去、体の端から端への伝達を助けます。

科学者の間ではタンパク質の構造と機能を解明するための研究が盛んに行われており、この目的のために、Meta の AI 研究チームは本日、アミノ酸配列に基づいてタンパク質の 3D 構造を予測できるモデルを使用したことを発表しました。DeepMind などのこの分野でのこれまでの研究とは異なり、Meta の AI は形状と配列のマッチング アルゴリズムではなく、言語学習モデルに基づいています。Meta はこの研究に関するプレプリント論文を公開するだけでなく、モデルとタンパク質のデータベースの両方を研究コミュニティと業界に公開する予定です。

まず、タンパク質の形状を理解することの重要性を説明するために、簡単な生物学のレッスンを紹介します。遺伝子の特定のヌクレオチドのトリプレット配列は、細胞内のリボソームと呼ばれる分子によってアミノ酸に変換されます。タンパク質は、独自の形状と構成に自己分類されたアミノ酸の鎖です。メタゲノミクスと呼ばれる新しい科学分野では、遺伝子配列を使用して自然界の新しいタンパク質を発見、カタログ化、注釈付けしています。

Meta の AI モデルは、大規模言語モデルにヒントを得た新しいタンパク質折り畳みアプローチであり、メタゲノミクス データベース内の何億ものタンパク質配列の構造を予測することを目的としています。これらのタンパク質が形成する形状を理解することで、研究者はタンパク質がどのように機能し、どの分子と相互作用するかについての手がかりを得ることができます。

[関連: Meta は新しい AI ツールで Wikipedia の精度を高めることができると考えている]

「メタゲノミクスタンパク質の初めての大規模な特性評価を作成しました。タンパク質構造の予測が 6 億件以上あるデータベースをオープン サイエンス リソースとして公開します」と Meta AI の研究科学者アレックス リヴス氏は言います。「これは、世の中で最も理解されていないタンパク質のいくつかをカバーしています。」

歴史的に、計算生物学者は進化のパターンを利用してタンパク質の構造を予測してきました。タンパク質は、折り畳まれる前は、アミノ酸の線状鎖です。タンパク質が複雑な構造に折り畳まれると、線状鎖では離れているように見える特定の配列が、突然互いに非常に近くなる可能性があります。

「これは、パズルの 2 つのピースが合わさってできていると考えることができます。進化は、これらの 2 つの位置を独立して選択することはできません。間違ったピースがここにあると、構造が崩れてしまうからです」と Rives 氏は言います。「つまり、タンパク質配列のパターンを見ると、配列内の異なる位置が互いに共変するため、折り畳まれた構造に関する情報が含まれているということです。これは、タンパク質の根本的な生物学的特性に関する何かを反映することになります。」

一方、2018年に初めて登場したディープマインドの革新的なアプローチは、主に多重配列アライメントと呼ばれる手法に依存している。基本的には、タンパク質配列の大規模な進化データベースを検索し、予測対象のタンパク質に関連するタンパク質を見つける。

「私たちのアプローチが他と違うのは、複数の関連タンパク質のセットから予測してパターンを見るのではなく、アミノ酸配列から直接予測を行っていることです」と Rives 氏は言います。「言語モデルはこれらのパターンを別の方法で学習しました。つまり、この配列セットを処理する必要がなく、関連配列を検索する必要がないため、構造予測アーキテクチャを大幅に簡素化できるということです。」

これらの要素により、この分野の他の技術と比較して、彼らのモデルはより高速になる、とリヴス氏は主張する。

[関連: Meta は人間の脳を研究することで AI を改良したいと考えている]

このモデルをこのタスクを実行できるようにどのようにトレーニングしたのでしょうか。2 つのステップを踏みました。まず、構造が異なり、さまざまなタンパク質ファミリーに属し、進化のタイムライン全体にわたって得られた多数のタンパク質で言語モデルを事前トレーニングする必要がありました。彼らはマスク言語モデルのバージョンを使用し、アミノ酸配列の一部を空白にして、その空白を埋めるようにアルゴリズムに指示しました。「言語トレーニングは教師なし学習で、配列のみでトレーニングされます」と Rives 氏は説明します。「これを行うと、このモデルは数百万のタンパク質配列にわたってパターンを学習します。」

次に、言語モデルをフリーズし、その上でフォールディング モジュールをトレーニングしました。トレーニングの第 2 段階では、教師あり学習を使用します。教師あり学習データセットは、世界中の研究者が提出したタンパク質データバンクの構造のセットで構成されています。次に、AlphaFold (DeepMind のテクノロジー) を使用して作成された予測で補強されます。「このフォールディング モジュールは、言語モデルの入力を受け取り、基本的にタンパク質の 3D 原子座標を [アミノ酸配列から] 出力します」と Rives 氏は言います。「これにより、これらの表現が生成され、フォールディング ヘッドを使用して構造に投影されます。」

リヴス氏は、このモデルは、タンパク質の活性部位の機能を生化学レベルで理解するなどの研究用途に使用できると考えています。これは、新薬の開発や発見に非常に役立つ情報です。また、将来的には、この AI を使って新しいタンパク質を設計できるとも考えています。

<<:  今週末は流星群とハンターズムーンが夜空を照らすだろう

>>:  レモン汁をもっと搾る方法と、電子レンジを使った8つの天才的な裏ワザ

推薦する

この星にエイリアンの巨大構造物が隠れているかどうか科学者が調べるのを手伝ってください

地球から1,480光年離れた星は、その奇妙な光のパターンが周囲に知的生命体が存在することを示している...

公衆衛生に関する最も危険な誤解

2024年には、ニューヨーク市ではコレラで亡くなった人は誰もいません。しかし、1830年代から185...

木星の奇妙な脈動するオーロラは私たちが思っていた以上に謎に満ちている

大気圏の高いところで輝く北極光と南極光は、柔らかく、明るく輝いています。そして木星では、奇妙な輝きを...

ついに科学者たちはペンギンの視点で世界を見ることができるようになった

ペンギンの目線で海を眺めることが、今や現実のものとなった。国際的な研究チームが、ペンギンがどれだけの...

NASAはミッシー・エリオットの「The Rain (Supa Dupa Fly)」を彼女のお気に入りの惑星に送信した

音楽界のレジェンド、ミッシー・“ミスディミナー”・エリオットのお気に入りの惑星は金星。だから、業界で...

NASAのニューホライズンズは大晦日に非常に神秘的な宇宙球を見つめることになる

NASA のニューホライズンズ宇宙船は、ピアノほどの大きさのこの小さな宇宙船が冥王星までたどり着く ...

人間の祖先はチンパンジーと人間の中間に復元される

2008年、研究者らは南アフリカの洞窟で数体の人類に似た初期の生物の遺骨を発見した。現在、研究者らは...

ニューヨーク植物園が生物多様性の歴史をデジタル化

ギャラリーに入るにはここをクリック世の中には生物多様性に関する情報が山ほどあるが、その多くは自然史コ...

アラスカで捨てられた太平洋セイウチの子が救出される

アラスカシーライフセンター(ASLC)のチームは現在、太平洋セイウチの赤ちゃんの世話をしている。この...

朗報:電子レンジで温めた卵は聴力を永久に損なうことはない

今年初め、ある人がレストランで固ゆで卵を食べていた。卵は冷たかった。レストランの客はウェイターに食べ...

ハリケーンを空から核爆弾で撃ち落とすのは「全く意味がない」

毎年、熱帯地方で発生する雨天のうち、いくつかはハリケーンに発展します。これらの巨大な嵐は海岸線に激突...

馬のクローン:セクレタリアト II?

これまでにクローン化した馬は、チャンピオンシップ カッティング ホースです。カッティング (馬が牛の...

「ガラス状ゲル」は、強くて伸縮性があり粘着性のある新しい種類の材料です。

イオン性溶媒とポリマーから作られた超弾性の自己修復性「ガラス状ゲル」は、将来的には 3D プリントや...

ジュノーは依然として木星の周りの間違った軌道に留まっている

物事は本当にジュノの思い通りには進んでいません。この宇宙船は昨年7月4日に木星に無事到着し、すぐに安...

6月の天体観測: 話題の「惑星パレード」は忘れて、ストロベリームーン/至点ムーンをチェック

6月1日三日月と火星6月5日球状星団メシエ10 よく配置6月20日夏至6月20日と21日ストロベリー...