DiffDock@Colabで遊んでみよう

最近diffusionなんとかで色々オープンソースソフトウェアが報告されてます。
DiffDockというドッキングツールもその一つで、git hubgoogle colabを使って試してみることができます。
いやはや凄い時代ですよね。
そんなわけでミーハーとしてはGoogle colabで早速遊んでみました。
(M1 Macでは色々あって私では動かせませんでした。)

試したこと

Google Colabは細かい設定できなかったので、これまで自分が見たことある複合体8個ほどについてRedockしてみました。
今回はこちらを参考にPDB : 7VU6を紹介してみようと思います。

結果まとめ

  • 6/8はオリジナルと同じ結合ポケットを予測
    (ただし予測結果が40個出力され、その全てが正しいわけではない)
  • 4/8はDocking Poseも近い。置換基の位置関係が揃っているくらいの感じ。
  • 2/8は相互作用も再現した。これは見事。
  • 結晶構造の2量体間隙にDockingされたものもあった(artifact?)
  • 水を考慮してDockingしていた。深層学習でこれを考慮するのは非常に興味深い。

SARS-CoV2 3CL protease

実は以前このブログでも取り上げていました。最近は治療薬のニュースで非常にホットな標的と言っていいでしょう。
この3CL proteaseのタンパクは確か2量体で機能するんですが、結晶構造の2量体もおそらく同様の構造をとっているのではないでしょうか。
chian Aを赤、chain Bをピンクで示しました。なんかハート型に見えるところがなんとも悍ましいというか忌々しいというか不思議な見た目です。 緑で示したEnsitrelvirをはじめとする治療薬がコロナウイルスの楔になるの乞うご期待ですね。
あ、HUNTER x HUNTER再開楽しみです。

Docking site

Defaultのsettingだと40poseが表示されます。
最初のESM(何なのかはわかってませんすみません)作成に少し時間がかかるくらいで、2回目以降は読み込むPDBを変えても非常に計算が早かったです。さすがはGPU
よくあるDocking ProgramのGlideやVinaはDockingする範囲をGridで指定することが多いと思いますが、DiffDockはGlobal searchするみたいです。
2 min/40 pose/ligandなので、体感的にはGlideやVinaより早い印象です(マシンスペックが違うので実際比べると違うかもしれませんが)。
結果は下記の通りで、オリジナルの位置とほぼ相違なく収束しました。

他の結晶構造では、

  • オリジナルを再現しないものも2例ありました。
  • 7VU6では見られませんでしたが、2量体間隙にdockingされるケースもありました。
  • rank 1が必ずしも正解するわけではありませんでした。

Docking pose

緑がオリジナル、水色がrank1のposeです。
母核、置換機の位置は概ねあっていると言えそうです。
rank10くらいまではいい感じの結果でしたが、以降はposeが外れてるものも増えてくる感じでした。
他の結晶構造では正解poseが一つも含まれないものもありましたが、そういう場合のRMSDがどんな値になるか気になりました。

Ligand-Receptor Interaction

7VU6では完璧な再現はできませんでしたが、相互作用まで再現した結晶構造も2つありました。
あんな短時間のGlobal search (じゃないのかもしれませんが)で辿り着けるのは脱帽でした。
興味深い・気になった点として、

  • ここまでposeを再現したにも関わらず相互作用距離に届かないものが結構多い
    (つまり相互作用を計算しているわけではない。そもそもそういうコンセプトか)
  • 水もDockingの対象になっている
    (今回は未設定なので、考慮すれば精度は上がるかも)

他にはKdの強弱が精度とどれくらい相関しそうかとか、気になることは尽きないなーと思いました。

DiffDockといいColabといいAlphaFold2といい、いやーほんと凄い時代ですね。
むしろwetの需要が上がるよね?って違うのかな?

おしまい。