AlphaFold

構造生物学におけるAI革命の深層分析

画像クリックでインフォグラフィックサイトに遷移します

第1章 壮大なる挑戦:プロテオームの三次元設計図を解き明かす

1.1 タンパク質構造の中心性:配列から機能へ

生命の分子機械であるタンパク質は、神経細胞の情報伝達から心臓の拍動に至るまで、生命活動のあらゆる側面を支えている 1。この驚異的な機能多様性は、タンパク質を構成するアミノ酸の一次元的な配列が、物理化学的な法則に従って折り畳まれ(フォールディング)、固有の三次元(3D)立体構造を形成することによって生まれる。この「配列-構造-機能」というパラダイムは、現代生物学の中心的な教義であり、タンパク質の構造を理解することが、その機能を解明するための鍵となる 1

しかし、このフォールディング過程が正常に行われない場合、深刻な結果を招く。誤って折り畳まれたタンパク質(ミスフォールディング)は、凝集して毒性を持つアミロイド線維などを形成し、アルツハイマー病やパーキンソン病といった神経変性疾患の主要な原因となる 1。同様に、嚢胞性線維症やリソソーム蓄積症など、多くの疾患がタンパク質のミスフォールディングに関連している 1。したがって、タンパク質がどのようにして正しい構造に折り畳まれるのかを理解することは、これらの疾患の根本的なメカニズムを解明し、新たな治療法を開発するために不可欠である。

この医学的な重要性にもかかわらず、AlphaFoldが登場するまで、我々の知識には巨大なギャップが存在した。ヒトの体内には少なくとも20,000種類のタンパク質が存在するとされるが、そのうち実験的に構造が決定されていたのは、ヒトプロテオーム全体のわずか17%に過ぎなかった 1。この知識のボトルネックは、X線結晶構造解析やクライオ電子顕微鏡法といった従来の構造決定法が、多大な時間と費用、そして高度な専門知識を要求する、労働集約的なプロセスであったことに起因する 1。この構造データの欠如は、数十年にわたり生物学研究の進展を妨げる根本的な制約となっていた 1。AlphaFoldの真の意義は、単に形状を予測する能力にあるのではなく、分子生物学の全分野をこの根源的な制約から解放した点にある。それは、分子生物学にとっての顕微鏡の発明にも匹敵する、全く新しいスケールの研究を可能にするツールの登場を意味していた。

1.2 「タンパク質フォールディング問題」:50年来の科学的難問

タンパク質の立体構造予測という課題は、「タンパク質フォールディング問題」として知られ、50年以上にわたり生物学における最も困難な挑戦の一つとされてきた 5。この問題の根源は、1960年代のクリスチャン・アンフィンセンの研究に遡る。彼は、リボヌクレアーゼというタンパク質を用いて、一度変性させて立体構造を失わせても、適切な条件下に戻せば自発的に元の機能的な構造に再フォールディングすることを示した 7。この発見は、「アンフィンセンのドグマ」として知られ、タンパク質の最終的な3D構造を決定するために必要なすべての情報は、そのアミノ酸配列自体に含まれていることを明らかにした 7。これにより、「配列さえわかれば、構造を計算で予測できるはずだ」という重大な問いが提起された 7

しかし、この問いに答えることは、計算論的に極めて困難であることがすぐに判明した。サイラス・レヴィンタールが提唱した「レヴィンタールのパラドックス」は、その困難さを見事に説明している。たとえ小さなタンパク質であっても、そのペプチド結合が取りうるコンフォメーション(立体配座)の数は天文学的な数字にのぼる。もしタンパク質が最もエネルギー的に安定な構造を探すために、考えうるすべてのコンフォメーションを一つずつ試しているとすれば、宇宙の年齢よりも長い時間がかかってしまう 10。現実には、タンパク質はマイクロ秒から秒単位で自発的に折り畳まれるため、このパラドックスは、フォールディングがランダムな探索ではなく、何らかの物理的な経路に沿って進行することを示唆している。この複雑さが、フォールディング問題を長年の未解決問題たらしめていた。

この難問に挑むため、1994年にタンパク質構造予測技術評価国際会議(CASP: Critical Assessment of protein Structure Prediction)が設立された 6。CASPは、まだ公開されていない実験的に決定された構造を「お題」として、世界中の研究チームがその構造を予測し、その精度を競うという、厳格なブラインドテスト形式のコンペティションである 7。この客観的なベンチマークの存在が、予測手法の開発を促進し、分野全体の進歩を測るための共通の尺度を提供した。後にAlphaFoldがその驚異的な性能を証明し、科学界に衝撃を与えたのも、このCASPという舞台であった 6

1.3 AI以前の時代:基礎的努力と根強い限界

深層学習が構造予測の世界を席巻する以前、研究者たちは様々な計算手法を用いてフォールディング問題に取り組んできた。これらの手法は、後のAI革命の土台を築いたが、精度の面で根本的な限界を抱えていた。

主要なアプローチの一つはホモロジーモデリングであった 7。これは、予測したいタンパク質(ターゲット)とアミノ酸配列が類似しており、かつ実験的に構造が決定されているタンパク質(テンプレート)をタンパク質データバンク(PDB)から探し出し、その構造を鋳型としてターゲットの構造を構築する手法である。配列類似性が高い場合には比較的良い予測が可能であったが、適切なテンプレートが見つからない場合には適用できなかった。

もう一つのアプローチはフラグメントベース法であり、既知のタンパク質構造から短いアミノ酸断片(フラグメント)の構造ライブラリを作成し、それらをジグソーパズルのように組み合わせてターゲットの全体構造を構築するものであった 7

さらに、ワシントン大学のデビッド・ベイカーらが開発したRosettaのようなプログラムは、物理化学的なエネルギー関数を用いて、タンパク質が取りうるコンフォメーションの中から最もエネルギー的に安定な状態を探索しようと試みた 2。これはフォールディングの物理的原理に迫るアプローチであり、目覚ましい進歩をもたらしたが、計算コストが非常に高く、精度も限定的であった 2

これらの手法は着実に進歩を遂げたものの、その予測精度は「精度のプラトー」に達していた。特に、適切なテンプレートが存在しない「自由モデリング(free-modelling)」カテゴリのターゲットに対して、実験構造に近い精度を達成することは極めて稀であった。CASPでは、予測精度を評価するためにグローバル距離テスト(GDT_TS)スコアが用いられる。これは、予測構造と実験構造がどれだけ一致しているかを0から100の数値で示すもので、スコア90以上が実験構造に匹敵する精度の一つの目安とされる 6。AI以前の時代において、このスコア90の壁を越えることはほとんどなく、これがAlphaFold登場前の分野の状況を象徴していた 7。この長年の停滞が、AlphaFoldのブレークスルーの劇的なインパクトを際立たせる背景となった。そして、このブレークスルーは、1971年に設立されたPDB 15 が提供する膨大な訓練データと、CASP 7 が提供する厳格な評価基準という、数十年にわたるコミュニティ全体の努力によって築かれたオープンデータとベンチマーキングの基盤なしには成し得なかった。AI革命は、この科学的インフラの上に花開いたのである。

第2章 AlphaFold革命:構造予測におけるパラダイムシフト

AlphaFoldの登場は、単なる技術的な改良ではなく、タンパク質構造予測の分野における根本的なパラダイムシフトであった。本章では、そのAIアーキテクチャを詳細に分析し、データ駆動型のアプローチを解き明かし、有望な挑戦者から分野を支配する力へと進化していく過程を追う。

2.1 創生と進化:AlphaFold 1からAlphaFold 3へ

DeepMindによるタンパク質構造予測への挑戦は、段階的な進化を遂げてきた。各バージョンは、技術的な飛躍と予測範囲の拡大を象徴している。

AlphaFold 1 (CASP13, 2018年): DeepMindがこの分野に参入した最初のバージョンである。2018年のCASP13で初登場し、他のすべてのチームを上回る成績で総合1位を獲得した 11。特に、利用可能なテンプレート構造が存在しない最も困難な「自由モデリング」ターゲットにおいて、その性能は際立っていた 11。AlphaFold 1は、深層学習を用いてアミノ酸残基間の距離を予測するアプローチをとったが、そのアーキテクチャは後継機とは大きく異なっていた 11。この勝利は大きな注目を集めたが、公開されたコードは一般の研究者が任意のタンパク質配列の構造を予測するために使用できるものではなく、その直接的な影響は限定的であった 11

AlphaFold 2 (CASP14, 2020年): これが科学界に激震を走らせたバージョンである。「完全に再設計された」12 AlphaFold 2は、2020年のCASP14において、「実験構造に匹敵する精度」を叩き出した 12。ターゲットの約3分の2でGDTスコア90以上を達成し、これは多くの研究者によってフォールディング問題が実質的に解決されたことを意味する水準であった 6。その圧倒的な性能は、長年この問題に取り組んできた科学者たちを驚かせた 10

AlphaFold-Multimer (2021年): AlphaFold 2の成功を受けて、2021年10月にリリースされたアップデートである。これにより、単一のポリペプチド鎖の予測から、複数のタンパク質が相互作用して形成される複合体(タンパク質間相互作用)の構造予測へと能力が拡張された 7。約70%のケースで正確な複合体構造を予測できると報告されている 11

AlphaFold 3 (2024年): Alphabet傘下のIsomorphic Labsと共同開発され、2024年5月に発表された最新バージョンは、さらなる飛躍を遂げた。その予測範囲はタンパク質を越え、DNA、RNA、低分子リガンド、イオン、さらには翻訳後修飾といった、生命を構成するほぼすべての分子間の相互作用をモデル化できるようになった 11。アーキテクチャも刷新され、AlphaFold 2の中核であったEvoformerモジュールはよりシンプルなPairformerに置き換えられ、3D構造を生成するStructure Moduleは、原子座標を直接予測する拡散モデル(Diffusion module)に取って代わられた 22


表1: AlphaFoldシステムの進化

バージョン発表年主要ベンチマーク中核技術主要な予測範囲主な貢献
AlphaFold 12018CASP13深層学習による距離ヒストグラム予測単鎖タンパク質構造深層学習を用いてCASPで初優勝
AlphaFold 22020CASP14Evoformer + Structure Module単鎖タンパク質構造(高精度)実験に匹敵する精度を達成
AlphaFold-Multimer2021N/Aタンパク質複合体データで訓練タンパク質間複合体タンパク質複合体の予測を可能に
AlphaFold 32024PoseBustersPairformer + Diffusion Moduleタンパク質、DNA、RNA、リガンド、イオンの相互作用生命分子全体のモデリングへ移行

2.2 アーキテクチャの深層:AlphaFold 2のエンジン

AlphaFold 2の驚異的な精度は、その革新的なニューラルネットワークアーキテクチャに起因する。それは、物理学的なシミュレーションから、進化情報の中に埋め込まれたパターンの認識へと、問題解決の哲学を根本的に転換させるものであった。

全体哲学: AlphaFold 2は、**エンドツーエンドで微分可能な(end-to-end differentiable)**ニューラルネットワークとして設計されている 24。これは、入力から最終的な出力までのすべての構成要素が同時に訓練されることを意味し、システム全体が構造予測という一つのタスクに対して最適化される。このアプローチは、物理的・生物学的な知識を深層学習アルゴリズムの設計自体に組み込むという思想に基づいている 12

入力処理: システムは、まず入力として与えられた単一のアミノ酸配列から、2つの重要な情報ストリームを巨大なデータベース群から収集する 5

  1. 多重配列アライメント (MSA): ゲノムデータベースを検索し、ターゲット配列と進化的に関連のある多数の相同タンパク質配列を収集・整列させる。MSAの中で、ある2つのアミノ酸残基が進化の過程で共変異(一方が変異すると、もう一方も協調して変異)する傾向がある場合、それらは3D構造上で物理的に近接している可能性が高い。この共進化の情報が、構造を決定づける強力な手がかりとなる 26
  2. 構造テンプレート: PDBを検索し、配列が類似したタンパク質の既知構造をテンプレートとして利用する。ただし、AlphaFold 2は適切なテンプレートが存在しない場合でも、MSA情報のみから高精度な予測が可能である 5

Evoformerモジュール: AlphaFold 2の核心的なイノベーションであり、その性能の源泉である 5。これは、自然言語処理のために開発されたTransformerアーキテクチャ 27 を基盤とする、全く新しいモジュールである。Evoformerは、MSA情報(1次元的な配列情報の集合)とペア表現(アミノ酸ペア間の関係性に関する2次元的な情報)という2つのデータ表現を並行して処理し、反復的に情報を交換させながら両者を洗練させていく 5。このデュアルトラック構造により、1次元の進化情報と2次元の空間的関係性の間での情報の流れが生まれ、モデルはより深いレベルで構造的制約を学習できる。

  • アテンション機構: Evoformerが効果的に機能する上で中心的な役割を果たすのが、アテンション(Attention)機構である 11。これは、入力データの中から、予測に最も重要な部分に「注意」を向け、その重みを動的に調整する深層学習技術である。タンパク質の場合、構造は隣接するアミノ酸だけでなく、配列上は遠く離れていても空間的には近接する残基間の相互作用によって決まる。アテンション機構は、このような長距離の依存関係を効率的に捉えることを可能にする 27。そのプロセスは、人がジグソーパズルを組む際に、まず小さな塊(アミノ酸のクラスター)を作り、次にそれらの塊を繋ぎ合わせて全体像を完成させる様に例えられる 11

Structure Module: Evoformerによって高度に洗練されたペア表現は、次にStructure Moduleへと渡される 5。このモジュールは、ペア表現にエンコードされた幾何学的な制約(残基間の距離や角度など)を3D空間における原子の座標へと直接変換する役割を担う 26。タンパク質をアミノ酸をノード、残基間の関係性をエッジとするグラフとして扱い、このグラフを3D空間に配置することで、最終的な立体構造を出力する 26

リサイクリングと精密化: システムは、一度出力した予測構造を再びEvoformerモジュールの入力に戻し、このプロセスを数回繰り返す(リサイクリング)ことができる 24。この反復的な精密化のサイクルを通じて、予測構造の精度は段階的に向上していく。

このアーキテクチャ全体が、AlphaFoldが物理法則をシミュレートするのではなく、進化の歴史という膨大なデータの中に記録された「構造の設計図」を読み解く、極めて洗練された「フォールド認識アルゴリズム」 29 として機能することを可能にした。その成功は、進化の記録が最終構造を決定するのに十分な情報を含んでいるという発見と、その情報を効率的に抽出・統合するAIアーキテクチャの発明という、二つのブレークスルーの結晶であった。

2.3 性能と検証:ブレークスルーの定量化

AlphaFold 2のブレークスルーは、CASP14における客観的な数値によって裏付けられている。その性能は、過去のどの手法とも比較にならないレベルに達していた。

CASP14における評価指標: CASP14において、AlphaFold 2が全ターゲットで達成したGDT_TSスコアの中央値は92.4であった。これは、予測構造の原子の大部分が、実験構造の原子からわずか1.5Å(オングストローム、1Åは0.1ナノメートル)以内のずれに収まっていることを意味する 30。特に、最も困難とされる自由モデリングカテゴリにおいても、そのスコア中央値は87.0に達し、これは過去のCASPで次点のメソッドが達成した約40というスコアから驚異的な飛躍であった 6

実験精度への到達: 多くの予測において、その精度は原子レベルの分解能に迫り、誤差は1Å未満であった 8。これは、構造ベースの創薬など、多くの生物学的応用において十分な精度である 31。このレベルの精度は、計算による予測が、もはや単なる大まかなモデルではなく、実験データに代わる、あるいはそれを補完する信頼性の高い情報源となりうることを示した。

OpenFoldによる独立検証: AlphaFold 2のアーキテクチャの堅牢性は、独立した研究グループによって開発されたOpenFoldによっても証明された 32。OpenFoldは、AlphaFold 2の論文に基づいてゼロから訓練可能なオープンソース実装であり、元のAlphaFold 2と同等の精度を達成することに成功した 32。さらに、OpenFoldを用いた研究は、モデルがどのようにしてフォールディングを学習するのかについての洞察も提供した。例えば、モデルはまずαヘリックスやβシートといった二次構造の形成を学習し、その後、それらを組み合わせて全体のフォールドを構築するという、階層的な学習プロセスを経ることが示唆された 32

この一連の検証は、AlphaFold 2の成功が単なる偶然や特定のデータセットへの過剰適合ではなく、その根底にあるアーキテクチャの普遍的な能力によるものであることを強く示している。そして、AlphaFold 2からAlphaFold 3への急速な進化は、DeepMindの野心が単一のタンパク質構造問題の解決に留まらず、細胞内の分子機械全体の動的な相互作用をモデル化するという、より広範な計算システム生物学へと向かっていることを示唆している。個々の部品(タンパク質)の設計図から、それらがどのように組み合わさり、他の分子(DNA、RNA、リガンド)と相互作用して生命システムを構築するのか、その全体像の解明が次の目標となっているのである。

第3章 構造生物学の民主化:AlphaFold Protein Structure Database (AlphaFold DB)

AlphaFoldの技術的ブレークスルーが科学界に与えたインパクトは、その予測結果が普遍的にアクセス可能な形で公開されたことによって、爆発的に増幅された。本章では、AlphaFoldの予測を現代生物学の基本的な研究リソースへと昇華させたAlphaFold DBの創設、規模、そしてその利用法について詳述する。

3.1 グローバルなオープンアクセスリソース

AlphaFold DBの創設は、単なるデータ公開以上の意味を持つ、戦略的な決断であった。それは、最先端のAI技術の成果を、一部の研究者のためのツールから、全世界の科学コミュニティのための公共財へと転換させる試みであった。

DeepMindとEMBL-EBIのパートナーシップ: AlphaFold DBは、Google DeepMindと、欧州バイオインフォマティクス研究所(EMBL-EBI)という、AIのトップランナーと生命科学データインフラの世界的権威との画期的な協力関係によって実現した 13。DeepMindが予測を生成し、EMBL-EBIがその膨大なデータをホストし、安定的に提供・維持するという役割分担は、このプロジェクトの成功に不可欠であった 13

ライセンスとアクセシビリティ: データベースで公開されているすべての構造データは、CC-BY-4.0ライセンスの下で提供されている 13。これは、学術利用だけでなく商業利用も可能であり、帰属表示さえすれば誰でも自由に利用、改変、再配布できる非常に寛容なライセンスである。このオープンアクセスポリシーが、AlphaFoldの予測が驚異的な速さで世界中の研究室に浸透した最大の駆動力となった 13

主要データリソースとの統合: AlphaFold DBの価値は、そのデータが他の主要な生物学データベースと緊密に連携していることによってさらに高められている。タンパク質配列の標準的なリポジトリであるUniProtや、遺伝子情報データベースのEnsembl、タンパク質ファミリーデータベースのInterProなどにAlphaFoldの予測構造が統合された 18。これにより、研究者がUniProtで特定のタンパク質配列を検索すると、そのページから直接、予測された3D構造をシームレスに閲覧できるようになった。この統合は、構造情報がもはや一部の専門家だけが扱う特殊なデータではなく、配列情報と同様に誰もが利用できる基本的なアノテーション(注釈情報)へと変化したことを意味する。この「データの民主化」こそが、アルゴリズム自体の発明と同じくらい、あるいはそれ以上に、科学の進め方に革命をもたらしたのである。

3.2 前例のない規模と範囲

AlphaFold DBの登場は、我々が利用できるタンパク質構造情報の量を、文字通り桁違いに増大させた。

爆発的な成長: データベースは2021年7月に、ヒトプロテオームを含む21のモデル生物の約36万構造という規模で公開された 7。その後、指数関数的な成長を遂げ、現在ではUniProtデータベースにカタログ化されているほぼすべてのタンパク質を網羅する、2億1400万以上の構造予測を収蔵している 2

17%から98.5%へのカバレッジ拡大: この拡大により、例えばヒトプロテオームにおける構造情報のカバレッジは、実験的に決定された約17%から、予測を含めると**98.5%**へと劇的に向上した 1。これは、これまで構造が未知であったために研究が進まなかった何万ものタンパク質に対して、構造に基づいた仮説を立て、研究を開始することを可能にした。事実上、ほとんどの研究プロジェクトにおいて、構造データがないというボトルネックは解消されたのである 1

研究時間とコストへのインパクト: この膨大な構造データの無償提供は、科学研究の経済性と速度に計り知れない影響を与えている。もしこれらの構造を実験的に決定しようとすれば、推定で「数億年の研究時間」と数百万ドル以上の費用が必要だったと試算されている 20。AlphaFold DBは、これらの時間とコストを劇的に削減し、研究者がより創造的で、より高次の生物学的問題に集中することを可能にした。このデータベースが持つ「データ重力」効果は絶大で、他のすべての生物学データベースをその軌道に引き込み、構造情報をバイオインフォマティクスのユビキタスな特徴へと変貌させた。科学における前提が、「構造は稀で、苦労して手に入れるもの」から、「構造はデフォルトで、いつでも手に入るデータ」へと根本的に覆ったのである。

3.3 実践ガイド:モデルの信頼性の解釈

AlphaFoldの予測は、あくまで「仮説」であり、その精度は一様ではない。したがって、予測構造を利用するすべての研究者は、提供されている信頼性指標を批判的に評価し、その意味を正しく理解することが不可欠である 6。AlphaFold DBは、この評価を助けるために、主に2つの指標を提供している。

pLDDT (predicted Local Distance Difference Test): これは、0から100までのスコアで、各アミノ酸残基とその近傍の局所的な構造予測に対する信頼度を色分けして示す指標である 7

  • pLDDT > 90 (非常に高い信頼性): 予測された主鎖構造は非常に正確で、実験構造に匹敵するレベル。原子レベルでの詳細な分析に利用可能 9
  • 70 < pLDDT < 90 (高い信頼性): 主鎖のフォールドは正しく予測されている可能性が高い。創薬のターゲットモデリングなどに応用可能 29
  • 50 < pLDDT < 70 (低い信頼性): 予測には注意が必要。大まかなトポロジーが正しい可能性はあるが、詳細は信頼できない。
  • pLDDT < 50 (非常に低い信頼性): この領域は、構造が定まっていない、いわゆる**天然変性領域(Intrinsically Disordered Region, IDR)**である可能性が高い 19

このpLDDTスコアの興味深い点は、単なるエラーバーではないことである。モデルの「不確かさ」自体が、生物学的に意味のある情報、すなわち構造の不定性を予測しているのである。これにより、AlphaFoldは構造予測ツールであると同時に、タンパク質の機能制御に重要な役割を果たす天然変性領域を特定するための最先端ツールとしても機能する 19

PAE (Predicted Aligned Error): これは、2次元のヒートマップとして提供され、ある残基(i)に構造を重ね合わせた(アラインした)場合に、別の残基(j)の位置がどれだけずれるかの予測誤差を示す 7

  • 機能: PAEは、タンパク質内の異なるドメインやサブユニット間の相対的な配置や向きに対する信頼性を評価するために極めて重要である。2つのドメイン間のPAE値が低い(ヒートマップ上で濃い緑色)場合、たとえそれらを繋ぐリンカー領域のpLDDTが低くても、AlphaFoldはそれらのドメインの相対配置に自信を持っていることを示す。逆に、PAE値が高い(薄い色)場合は、ドメイン間の相対的な位置関係が不確かであり、それらが柔軟に動く可能性を示唆している 7

これらの信頼性指標を正しく使いこなすことで、研究者はAlphaFoldの予測を盲信するのではなく、情報に基づいた科学的判断を下し、その予測を強力な仮説生成ツールとして最大限に活用することができる。

第4章 生物医学研究の変革:応用とケーススタディ

本章では、AlphaFoldという技術そのものから、それが現実世界でどのように応用され、医学と生物学の重要な問題を解決しているかへと焦点を移す。AlphaFoldが発見の触媒として機能している具体的な事例を通じて、そのインパクトを明らかにする。

4.1 構造ベース創薬の加速

創薬プロセスにおいて、標的となるタンパク質の3D構造は、効果的な薬剤を設計するための出発点となる。AlphaFoldは、このプロセスを根本から変革した。

標的同定の新たなパラダイム: これまで、創薬研究における大きな障害の一つは、有望な標的タンパク質の3D構造が得られないことであった。AlphaFoldは、この障壁を事実上取り除いた。現在では、疾患に関与するほぼすべてのタンパク質について、高品質な構造モデルを数分から数時間で入手できるようになった 1。これにより、研究者は標的の「創薬可能性(druggability)」を迅速に評価し、その活性部位に結合する分子の設計を開始できるようになった 1。これにより、創薬パイプラインは「標的構造が限定要因」の時代から、「機能的な検証が限定要因」の時代へと移行した。ボトルネックは構造を得ることではなく、予測された構造が細胞内環境で正しいか、そしてその機能を薬剤で制御することが望ましい治療効果をもたらすかを検証することへと移ったのである。

インシリコスクリーニング: 標的タンパク質の正確な3Dモデルがあれば、研究者はコンピュータ上で大規模な化合物ライブラリをスクリーニングし、標的の活性部位に結合する可能性のある薬剤候補を効率的に探索できる(バーチャルスクリーニング)31。結合親和性を正確に予測する分子ドッキングシミュレーションには依然として課題が残るものの 40、AlphaFoldは、その不可欠な出発点となる高品質な構造モデルを提供する。

病原体タンパク質の解明: AlphaFoldは、実験データが乏しい病原体の研究において特に価値が高い。例えば、ヒトに感染するE型肝炎ウイルスの複製酵素複合体(レプリカーゼ)全体をモデル化するために利用され、抗ウイルス薬開発のための複数の新規標的が提示された 31

4.2 ケーススタディ:薬剤耐性(AMR)との闘い

薬剤耐性菌の出現は、現代医療が直面する最も深刻な脅威の一つである。この危機に対抗するためには、既存の抗生物質とは異なる新しい作用機序を持つ薬剤の開発が急務である 40

AlphaFoldの役割: 研究者たちは、これまで標的とされてこなかった細菌の必須タンパク質の構造をAlphaFoldで予測し、新たな創薬標的として探索している 40。コロラド大学の研究チームは、AlphaFoldを用いて薬剤耐性に関与するタンパク質の構造を研究し、結晶構造解析による実験的な検証へと繋げることに成功している 37

ドッキングにおける課題: 一方で、MITの研究チームによる研究は、このアプローチの現状の課題を浮き彫りにした 40。彼らは、AlphaFoldが提供する優れた構造モデルを用いても、標準的な分子ドッキングシミュレーションでは、薬剤と標的タンパク質の真の相互作用を正確に予測することができず、その性能はランダムな推測と大差ないことを示した 40。しかし、彼らはそこで終わらず、ドッキングの結果をフィルタリングするために機械学習モデルを適用することで、真陽性率を大幅に向上させられることも見出した 40。このケーススタディは、AlphaFoldが創薬に大きな可能性をもたらす一方で、そのポテンシャルを最大限に引き出すためには、ドッキングのような周辺技術のさらなる進歩が必要であることを示している。

4.3 ケーススタディ:新規マラリアワクチンの設計

標的:Pfs48/45: マラリアの伝播を阻止する「伝播阻害ワクチン」の有力な候補として、マラリア原虫の表面に存在するPfs48/45というタンパク質が注目されている。このタンパク質は、原虫が蚊の体内で生存・増殖するために不可欠であり、Pfs48/45に対する抗体を持つ血液を吸った蚊は、マラリアを媒介できなくなる 41

課題: ワクチン開発のためにはPfs48/45の完全長の立体構造情報が不可欠であったが、このタンパク質は実験的に構造を決定することが非常に困難であった 41

AIと実験の相乗効果: オックスフォード大学と米国国立アレルギー・感染症研究所(NIAID)の研究チームは、この難問を解決するために、AlphaFoldによる予測とX線結晶構造解析という実験データを組み合わせるハイブリッドアプローチを採用した 37。AlphaFoldが提供した高品質な構造モデルが、実験データの解析を導き、史上初となるPfs48/45の完全長構造の決定に成功した 37。この構造から、タンパク質の3つのドメインからなる全体構造だけでなく、最も効果の高い伝播阻害抗体がどこに結合するのかという、ワクチン設計において最も重要な情報が明らかになった 41。この詳細な構造マップは現在、最も効果的な抗体応答を誘導するように設計された次世代ワクチンの開発を強力に推進している 20。この事例は、AlphaFoldが単独で使われるのではなく、実験データと緊密に統合されることで、その価値が飛躍的に高まることを示す典型例である。

4.4 疾患メカニズムと遺伝的バリアントの解明

AlphaMissense: DeepMindは、AlphaFold 2の基盤技術を応用し、AlphaMissenseという新たなAIモデルを開発した 13。これは、たった一つのアミノ酸が変化する「ミスセンス変異」が、疾患を引き起こす可能性が高い(likely pathogenic)か、無害である可能性が高い(likely benign)か、あるいは不確か(uncertain)かを分類するツールである。

ゲノムの解釈: AlphaMissenseは、ヒトプロテオーム全体で考えうる2億1600万通りすべての単一アミノ酸置換の影響を予測するために用いられた 13。これは、遺伝学者や臨床医にとって非常に強力なツールとなる。患者から未知の遺伝的バリアントが発見された際に、そのバリアントが疾患の原因である可能性を評価するための重要な情報を提供するからである 13

疾患研究への応用: AlphaFoldの構造モデルは、様々な疾患における変異の構造的影響を理解するためにも利用されている。パーキンソン病の研究では、神経保護因子として機能するSTIP1タンパク質の構造モデリングに貢献した 37。また、リソソーム蓄積症のようなタンパク質のミスフォールディングに起因する疾患のメカニズム解明にも役立てられている 1。AlphaMissenseのような派生モデルの登場は、AlphaFoldのアーキテクチャが、単に3D構造を予測するだけでなく、タンパク質の「言語」を学習し、機能や安定性、変異の影響といった関連する生物学的問題を解決するための汎用的なプラットフォーム技術であることを示している。

第5章 実験手法との相乗効果と性能比較

AlphaFoldの登場は、構造生物学の風景を一変させた。しかし、それは既存の実験手法を時代遅れにするものではない。本章では、単純な「AI対実験」という対立構造を超え、両者がいかにして互いを補強し、相乗効果を生み出しているのかを分析する。また、各手法の長所と短所を客観的に比較し、AlphaFoldが構造生物学という広大な分野の中で占める位置を明確にする。

5.1 実験の代替ではなく、発見の触媒として

AlphaFoldは、実験手法を不要にするのではなく、むしろそれらを加速させ、その能力を拡張する強力な触媒として機能している。その結果、構造生物学の伝統的なワークフローは「実験して、モデルを立てる」から「モデルを立てて、実験で検証する」へと逆転した。

X線結晶構造解析の加速: 結晶構造解析における最大の難関の一つに、回折データから電子密度マップを再構成する際の「位相問題」がある。この問題を解決する一般的な手法である分子置換法は、精度の高い探索モデルを必要とする。AlphaFoldの予測モデルは、この探索モデルとして極めて有効であり、これまで他のあらゆるモデルで失敗していた困難なケースでも位相問題を解決することに成功している 7。これにより、回折データの取得から最終的な構造決定までの時間が劇的に短縮された。

クライオ電子顕微鏡(cryo-EM)の能力向上: クライオEMでは、特に解像度が低い領域において、電子密度マップに原子モデルをフィッティングさせる作業が困難を伴う。AlphaFoldの高品質なモデルは、このフィッティング作業の信頼性の高いガイドとして機能する 7。この組み合わせにより、例えば巨大で複雑な核膜孔複合体のような超分子複合体において、クライオEMで決定された全体的な形状の中に、AlphaFoldで予測された個々のドメイン構造を正確に配置し、完全な原子モデルを構築することが可能になった 7

NMR分光法の補完: 複数の研究により、AlphaFoldの予測モデルが、実験的に得られたNMRデータに対して、NMR実験から導出された最終的な構造モデルと同等か、場合によってはそれ以上に良く適合することが示されている 30。これは、AlphaFoldが溶液中のタンパク質構造を正確にモデル化できないという一部の誤解を覆すものである 30。さらに、この事実は、AIによる予測が、実験データの解釈を再検討し、より精度の高い最終構造へと導くための客観的な「セカンドオピニオン」として機能しうることを示唆している。このように、AlphaFoldは実験手法そのものの品質管理ツールとなりつつある。

5.2 構造決定手法の比較分析

AlphaFoldと主要な実験手法は、それぞれ異なる原理に基づいており、得意とする領域や提供できる情報が異なる。研究者は、自身の研究目的に応じて最適な手法を選択する必要がある。


表2: 構造決定手法の比較

項目AlphaFoldX線結晶構造解析クライオ電子顕微鏡 (Cryo-EM)NMR分光法
原理AI/深層学習による予測結晶からのX線回折急速凍結試料の電子顕微鏡観察溶液中での核磁気共鳴
典型的な速度数分~数時間数ヶ月~数年数週間~数ヶ月数ヶ月~数年
相対コスト低(計算コスト)高(実験コスト)非常に高い(装置コスト)高い(装置コスト)
試料要件アミノ酸配列のみ高純度で結晶化可能なタンパク質高純度で安定なタンパク質高純度で溶解性が高く安定なタンパク質
サイズ制限非常に長い配列では計算負荷大。原理的にはサイズ制限なしサイズ制限なし。ただし巨大・柔軟なタンパク質の結晶化は困難巨大複合体(>100 kDa)に最適小~中サイズ(<30 kDa)のタンパク質に最適
主な強みあらゆるタンパク質に対する圧倒的な速度とアクセシビリティ真の原子分解能を達成可能巨大で柔軟な複合体を自然に近い状態で捉える溶液中でのタンパク質の動的な情報を提供
主な限界単一の静的構造を予測。非タンパク質成分はモデル化不可(AF2)良質な結晶が必要。結晶パッキングによるアーティファクトの可能性解像度が限定的である場合がある。計算負荷が高い小さな可溶性タンパク質に限定。構造はアンサンブル平均

この比較から明らかなように、AlphaFoldと実験手法は競合するものではなく、相互補完的な関係にある。AlphaFoldが提供する速度と網羅性は、実験が提供する高解像度の「グラウンドトゥルース(正解データ)」や動的な情報と組み合わさることで、その真価を発揮する。これはゼロサムゲームではなく、分野全体の発見のペースを加速させる、ポジティブサムの相乗効果なのである。

5.3 継続的な検証:科学的プロセスの実践

AlphaFoldの予測は、科学コミュニティによって常に検証され続けている。新しい実験構造がPDBに登録されるたびに、それはAlphaFoldの予測精度を評価するための新たなデータポイントとなる 7

ある大規模な検証研究では、最近PDBに登録された215の構造と、それに対応するAlphaFoldの予測が比較された。その結果、主鎖のCα原子の二乗平均平方根誤差(RMSD)の中央値はわずか1.0Åという驚異的な一致を示した 9。一方で、この研究は、予測された側鎖の20%が実験データと大きく異なっていることも指摘しており、原子レベルでの完全な一致ではないことも明らかにしている 9

現在、科学界におけるコンセンサスは、AlphaFoldの予測は「価値ある仮説」であり、「実験的な構造決定を加速させるが、それに取って代わるものではない」というものである 9。それは、前例のないほど正確な出発点を提供するが、最終的な「真実」として受け入れるためには、実験による検証が依然として不可欠なのである 14

第6章 フロンティアと未解決の課題

AlphaFoldが成し遂げた成功を称賛する一方で、その現在の限界を厳密に検証し、科学の歴史におけるその最終的な位置づけを議論することは、次世代の研究を方向づける上で極めて重要である。本章では、AlphaFoldが直面するフロンティアと、未解決の課題について批判的かつ未来志向の視点から考察する。

6.1 静的なスナップショットを超えて:タンパク質ダイナミクスの挑戦

静的構造の限界: AlphaFold 2の最も根本的な限界は、それが予測するのが単一の、静的な3D構造であるという点にある 19。しかし、タンパク質は硬直した物体ではなく、機能を発揮するためにしばしば重要なコンフォメーション変化(構造変化)を経る動的な分子機械である。AlphaFoldは、この動的な構造アンサンブルを本質的に捉えることができない 23

代替状態のモデリング: デフォルトでは単一構造しか予測しないが、研究者たちはMSAの入力データを工夫したり、特殊なプロトコルを用いることで、AlphaFoldに異なる機能状態(例:活性型と不活性型)を予測させることができる場合があることを発見している。しかし、これは標準的な機能ではなく、常に成功するとは限らない 19

天然変性領域(IDR): 前述の通り、AlphaFoldは低いpLDDTスコアを通じてIDRを「特定」することには長けているが、これらの柔軟な領域が取りうる構造アンサンブルを予測することはできない 19。IDRは細胞内のシグナル伝達や制御において中心的な役割を果たしており、その動的な挙動の解明は、計算生物学における次の大きなフロンティアである。AlphaFoldの成功は、静的な構造予測という課題をクリアしたことで、この次なる、より複雑な課題である「動的アンサンブルと機能的帰結の予測」を鮮明に浮かび上がらせた。

6.2 細胞内環境の複雑さ:リガンド、イオン、そして修飾

欠落した文脈: AlphaFold 2は、PDBに登録されている純粋なタンパク質の構造データのみを学習しているため、タンパク質の構造と機能に不可欠な非タンパク質成分を「認識」していない。これには、薬剤や代謝物などのリガンド、金属イオン、補因子、核酸(DNA/RNA)、そしてリン酸化や糖鎖修飾といった**翻訳後修飾(PTM)**が含まれる 19

AlphaFold 3の可能性: 最新のAlphaFold 3は、まさにこのギャップを埋めるために設計された。タンパク質だけでなく、DNA、RNA、リガンド、イオンなど、広範な生体分子との相互作用をモデル化する能力を持つ 11。特に、タンパク質とリガンドの結合ポーズ予測においては、従来のドッキングソフトウェアを上回る性能を示すことが報告されている 22

AlphaFold 3の新たな課題: しかし、この進歩にもかかわらず、AlphaFold 3には新たな課題も存在する。モデルの出力は、時に物理法則を無視することがあり、原子のキラリティー(右手系と左手系の区別)が不正であったり、原子同士が不自然に衝突したりする構造を生成することがある 23。また、天然変性領域において、実際には存在しない秩序だった構造を「幻覚(hallucination)」のように生成する傾向も指摘されている 23。さらに、その性能は訓練データに依存するため、全く新しい構造を持つリガンドに対する予測精度は未知数である。そして、AlphaFold 2がそのオープンなアクセス性によって科学界に革命をもたらしたのに対し、AlphaFold 3の完全なモデルへのアクセスは現在制限されており、そのインパクトが限定的になる可能性が懸念されている 23。この技術の進歩とアクセシビリティの間の緊張関係は、科学におけるAIの未来を形作る重要な要素となるだろう。

6.3 「問題は解決されたか」論争:予測と理解の狭間

地殻変動: AlphaFoldが、特に単一ドメインタンパク質の構造「予測」問題を、多くの研究者が生涯のうちに目にすることはないと考えていたレベルで解決し、科学に「地殻変動」をもたらしたことに疑いの余地はない 10

予測はフォールディングではない: しかし、多くの研究者は、これによりタンパク質の「フォールディング」問題そのものが「解決された」と宣言することには警鐘を鳴らしている 11。AlphaFoldの成功は、第一原理に基づいた物理的なフォールディング経路のシミュレーションではなく、あくまでデータ内のパターン学習に基づいている。それは、タンパク質が最終的にどのような構造になるか(What)を教えてくれるが、なぜ、そしてどのようにしてその構造に至るのか(Why/How)という根本的なメカニズムを解き明かすものではない 11

「解決済み」という言葉の危険性: この問題を「解決済み」と見なすことは、「危険」であると一部の研究者は主張する 47。なぜなら、それはフォールディングの物理化学、タンパク質のダイナミクス、そして機能に関する未解決の根本的な問いへの研究資金や探求心を削いでしまう可能性があるからだ。この論争は、科学的理解の本質、すなわち「予測能力」と「説明能力」の違いを巡る哲学的な問いを提起している。AlphaFoldは、AI駆動型の現代科学の最前線に、この根源的な問いを突きつけているのである。

6.4 未来への軌跡:計算システム生物学へ

AlphaFold 2からAlphaFold 3への進化の軌跡は、個々の分子部品の予測から、生体分子システム全体の複雑な相互作用をモデル化するという、明確で壮大な野心を示している 11

次の壮大なる挑戦: 次のフロンティアは、もはや静的な構造を予測することではない。混雑し、複雑な生細胞の環境内で、それらの分子がどのように動的に振る舞い、相互作用するのかをシミュレーションすることである。これには、コンフォメーションアンサンブルの予測、結合親和性の定量化、そして分子間相互作用の速度論の解明が含まれる。

統合と未来: 究極的な目標は、数百万もの分子の相互作用をインシリコでシミュレーションできる「仮想細胞(virtual cell)」の構築であろう。AlphaFoldとその継承者たちは、この壮大な目標に向けた基礎的な一歩である。それらは、計算生物学が単に構造を予測するだけでなく、生命現象そのものを予測し、設計することさえ可能になるかもしれない、新しい時代の到来を告げている。

結論

AlphaFoldは、50年来の科学的難問であったタンパク質フォールディング問題に対して、深層学習というアプローチで歴史的なブレークスルーを達成した。その中核であるAlphaFold 2は、進化情報と革新的なAIアーキテクチャ「Evoformer」を組み合わせることで、多くのタンパク質に対して実験に匹敵する精度での構造予測を可能にし、構造生物学におけるパラダイムシフトを引き起こした。

この技術革命のインパクトは、DeepMindとEMBL-EBIの協力により設立されたAlphaFold Protein Structure Database (AlphaFold DB)を通じて、予測データが全世界にオープンアクセスで提供されたことで決定的なものとなった。2億を超える予測構造を収蔵するこのデータベースは、構造情報を一部の専門家の手から解放し、あらゆる生物学研究者が利用できる基本的なリソースへと変貌させた。これにより、創薬、ワクチン開発、疾患メカニズムの解明といった生物医学研究は劇的に加速している。

しかし、AlphaFoldは万能ではない。その予測は静的な単一構造に限定され、タンパク質の動的な性質や、リガンド、イオン、翻訳後修飾といった細胞内環境の複雑さを完全には捉えきれていない。これらの限界は、AlphaFoldが実験手法の代替ではなく、むしろそれらを加速・補完する強力な触媒であることを示している。AIによる高品質な「仮説」と、実験による厳密な「検証」との相乗効果こそが、現代の構造生物学を前進させる新たなワークフローとなっている。

AlphaFold 3の登場は、タンパク質単体から、DNA、RNA、リガンドを含む生体分子システム全体へと予測の範囲を広げ、計算システム生物学という次なるフロンティアへの道を切り拓いた。一方で、その成功は「予測」と「理解」の違いを浮き彫りにし、科学的発見の本質とは何かという根源的な問いを我々に投げかけている。

総じて、AlphaFoldは単なる予測ツールではなく、生物学研究のあり方を根本から変革するプラットフォーム技術である。その登場によって解決された課題と、新たに浮かび上がった課題の両方が、今後数十年の生命科学研究の方向性を定義づけていくだろう。AlphaFoldが拓いた地平の先には、生命の複雑な分子ネットワークを原子レベルで理解し、操作する未来が待っている。

引用文献

  1. DeepMind AlphaFold: Revolutionizing Protein Folding Predictions – Gain Therapeutics https://gaintherapeutics.com/perspectives/deepmind-alphafold-protein-folding-structure-prediction-everything-we-know-till-now/
  2. How AI Solved Biology’s Biggest Mystery – Connecticut College https://www.conncoll.edu/news/cc-magazine/past-issues/2025-issues/winter-2025/how-ai-solved-biologys-biggest-mystery/
  3. Highly accurate protein structure prediction for the human proteome – PubMed https://pubmed.ncbi.nlm.nih.gov/34293799/
  4. Has DeepMind’s AlphaFold solved the protein folding problem? – PubMed https://pubmed.ncbi.nlm.nih.gov/35118884/
  5. Highly accurate protein structure prediction with AlphaFold | by Loghman Samani – Medium https://medium.com/@samaniloqman91/highly-accurate-protein-structure-prediction-with-alphafold-9e4cc8b6c692
  6. Highly accurate protein structure prediction with AlphaFold – DISCO https://disco.ethz.ch/courses/fs23/seminar/talks/21_03_AlphaFold.pdf
  7. AlphaFold two years on: validation and impact – arXiv https://arxiv.org/pdf/2403.02124
  8. AlphaFold developers Demis Hassabis and John Jumper share the 2023 Albert Lasker Basic Medical Research Award – JCI https://www.jci.org/articles/view/174915
  9. AlphaFold two years on: Validation and impact – PNAS https://www.pnas.org/doi/10.1073/pnas.2315002121
  10. AI revolutions in biology: The joys and perils of AlphaFold – PMC https://pmc.ncbi.nlm.nih.gov/articles/PMC8567224/
  11. AlphaFold – Wikipedia https://en.wikipedia.org/wiki/AlphaFold
  12. Highly accurate protein structure prediction with AlphaFold – PubMed https://pubmed.ncbi.nlm.nih.gov/34265844/
  13. AlphaFold Protein Structure Database https://alphafold.ebi.ac.uk/
  14. The power and pitfalls of AlphaFold2 for structure prediction beyond rigid globular proteins https://pmc.ncbi.nlm.nih.gov/articles/PMC11956457/
  15. Protein Data Bank: the single global archive for 3D macromolecular structure data | Nucleic Acids Research | Oxford Academic https://academic.oup.com/nar/article/47/D1/D520/5144142
  16. en.wikipedia.org https://en.wikipedia.org/wiki/Protein_Data_Bank
  17. [PDF] Highly accurate protein structure prediction with AlphaFold | Semantic Scholar https://www.semanticscholar.org/paper/Highly-accurate-protein-structure-prediction-with-Jumper-Evans/dc32a984b651256a8ec282be52310e6bd33d9815
  18. Case study: AlphaFold uses open data and AI to discover the 3D protein universe | EMBL https://www.embl.org/news/science/alphafold-using-open-data-and-ai-to-discover-the-3d-protein-universe/
  19. Strengths and limitations of AlphaFold 2 | AlphaFold – EMBL-EBI https://www.ebi.ac.uk/training/online/courses/alphafold/an-introductory-guide-to-its-strengths-and-limitations/strengths-and-limitations-of-alphafold/
  20. AlphaFold – Google DeepMind https://deepmind.google/science/alphafold/
  21. AlphaFold Server https://alphafoldserver.com/
  22. AlphaFold3: An Overview of Applications and Performance Insights – MDPI https://www.mdpi.com/1422-0067/26/8/3671
  23. AlphaFold 3: Exciting Advance yet Unresolved Major Issues Remain – Deep Origin https://www.deeporigin.com/blog/alphafold-3-exciting-advance-yet-unresolved-major-issues-remain
  24. AlphaFold: Predicting Protein Structures with Deep Learning – GeeksforGeeks https://www.geeksforgeeks.org/deep-learning/alphafold-predicting-protein-structures-with-deep-learning/
  25. Protein structure prediction by AlphaFold2: are attention and symmetries all you need? https://pmc.ncbi.nlm.nih.gov/articles/PMC8329862/
  26. AlphaFold 2: Attention Mechanism for Predicting 3D Protein Structures – PI IP LAW https://piip.co.kr/en/blog/AlphaFold2_Architecture_Improvements
  27. AlphaFold 2 Through the Context of BERT – Towards Data Science https://towardsdatascience.com/alphafold-2-through-the-context-of-bert-78c9494e99af/
  28. Understanding AlphaFold · GitHub https://gist.github.com/MikeyBeez/abd09b5510b5a08722da4f7cd9eeefaf
  29. AlphaFold 2: Why It Works and Its Implications for Understanding the Relationships of Protein Sequence, Structure, and Function – PMC https://pmc.ncbi.nlm.nih.gov/articles/PMC8592092/
  30. AlphaFold Models of Small Proteins Rival the Accuracy of Solution NMR Structures https://www.frontiersin.org/journals/molecular-biosciences/articles/10.3389/fmolb.2022.877000/full
  31. Alphafold2 protein structure prediction : Implications for drug discovery – PMC https://pmc.ncbi.nlm.nih.gov/articles/PMC7614146/
  32. OpenFold: retraining AlphaFold2 yields new insights into its learning mechanisms and capacity for generalization https://experiments.springernature.com/articles/10.1038/s41592-024-02272-z
  33. AlphaFold Protein Structure Database – Marketplace – Google Cloud Console https://console.cloud.google.com/marketplace/product/bigquery-public-data/deepmind-alphafold
  34. AlphaFoldDB | Cross-referenced databases | UniProt https://www.uniprot.org/database/DB-0262
  35. AlphaFold Protein Structure Database in 2024: providing structure coverage for over 214 million protein sequences – PubMed https://pubmed.ncbi.nlm.nih.gov/37933859/
  36. AlphaFold Protein Structure Database: massively expanding the structural coverage of protein-sequence space with high-accuracy models | Nucleic Acids Research | Oxford Academic https://academic.oup.com/nar/article/50/D1/D439/6430488
  37. 7 case studies highlighting the potential of DeepMind’s AlphaFold https://www.drugdiscoverytrends.com/7-ways-deepmind-alphafold-used-life-sciences/
  38. AlphaFold predictions are valuable hypotheses and accelerate but do not replace experimental structure determination – University of Cambridge https://www.repository.cam.ac.uk/server/api/core/bitstreams/326f82fb-13e6-4e56-b085-754ca9c69efc/content
  39. AlphaFold2 for Protein Structure Prediction: Best Practices and Critical Analyses https://experiments.springernature.com/articles/10.1007/978-1-0716-4007-4_13
  40. Analyzing the potential of AlphaFold in drug discovery | MIT News https://news.mit.edu/2022/alphafold-potential-protein-drug-0906
  41. Structure of the malaria vaccine candidate Pfs48/45 and its recognition by transmission blocking antibodies | Spotlight https://www.spotlightnsp.co.za/wp-content/uploads/2024/08/structure-of-the-malaria-vaccine-candidate-pfs4845-and-its-recognition-by-transmission-blocking-antibodies.pdf
  42. Structure of the malaria vaccine candidate Pfs48/45 and its recognition by transmission blocking antibodies – ResearchGate https://www.researchgate.net/publication/363812276_Structure_of_the_malaria_vaccine_candidate_Pfs4845_and_its_recognition_by_transmission_blocking_antibodies
  43. A Reproducible and Scalable Process for Manufacturing a Pfs48/45 Based Plasmodium falciparum Transmission-Blocking Vaccine – Frontiers https://www.frontiersin.org/journals/immunology/articles/10.3389/fimmu.2020.606266/full
  44. Our malaria vaccine work highlighted by AlphaFold – Higgins Lab https://higginslab.web.ox.ac.uk/our-malaria-vaccine-work-highlighted-alphafold
  45. Accelerating crystal structure determination with iterative AlphaFold prediction – PMC https://pmc.ncbi.nlm.nih.gov/articles/PMC9986801/
  46. Comparison Of Structural Techniques: X-ray, NMR, Cryo-EM | Peak Proteins https://peakproteins.com/a-comparison-of-the-structural-techniques-used-at-sygnature-discovery-x-ray-crystallography-nmr-and-cryo-em/
  47. AlphaFold and Protein Folding: Not Dead Yet! The Frontier Is Conformational Ensembles https://www.annualreviews.org/content/journals/10.1146/annurev-biodatasci-102423-011435
  48. AlphaFold 3: an unprecedent opportunity for fundamental research and drug development – Oxford Academic https://academic.oup.com/pcm/article/8/3/pbaf015/8180385