Grüezi,
コロナ騒動がおさまりませんが,私はグラント応募の準備がひと段落したのでKNIME遊びを更新しました.
今回のUpdateはこんな感じです.
- PDB Downloader WorkFlow
- PDB Connector
- Group Loop Start
- Column Resorter
- Excel Sheet Appender (XLS)
- Variable Loop End
前回までにPDB Connetctorで取ってきたPDBと,その付随情報をエクセルで取得するWorkFlowを紹介しました.
今回はLoopを使って,このExcelファイルをもう少し体裁よくします.
Loopを回した結果はこんな感じです.
私はケミストなんでリガンドの構造情報が先頭にある方が親近感が湧きます.
阻害剤であればIC50の情報なんかもあると参考になります.
あとはアブストラクトなんかも取得しておくといいかもしれません.
この上から2番目の構造は,Scienceに報告された共有結合性阻害剤で,c&enなんかでも紹介されていました.
ターゲットやキーワードからPDBを検索した時に,リガンドの構造や阻害活性の情報,アブストラクトなんかを俯瞰できると便利かなと思います.今回はやたら検索結果が出てきたので,もう少しうまく絞り込んだ方が良さげですが...
PDB Downloader WorkFlow
まずはWorkFlowをまんま載せるとこんな感じです.
PDB Connector
内容は前回紹介した通りなんで割愛しますが,今回は少し広めのSARS-CoVで検索をかけてみたいと思います.
Group Loop Start
一つ前のRenderer to ImageというNodeでは下のような結果が得られます.一つの文献の中で複数のリガンドが報告されることはよくあることですが,このままExcelに吐き出してしまうと情報量が多くて,個人的には見る気が湧きません.
そこで,Group Loop Start Nodeを使って文献ごとにグループ化して,その結果をシートで分けてしまおう,というお話です.
設定からはGroup化したい項目を選択します.複数選択するとより細かくGroupingされます.今回はシートが増えてかえって見づらくなるので,シンプルにStructure Titleだけにしました.
Column Resorter
カラムの並びを好みの順番にします.この辺は好みにあわせて変えるといいと思います.
Excel Sheet Appender (XLS)
このNodeでGroupingの結果をエクセルの新規シートとしてAppendします.
Sheet nameの右端にあるvのボタンを押しすことで,前項のGroup Loop Startの結果を変数として扱うことが出来ます.Use Variableにチェックを入れて,どの項目でGroup化するかを選択します.今回はStructure Titleです.
Add names and IDsのadd column headersにもチェックを入れておくと,実行結果のExcelが見やすくなります.
Variable Loop End
最後にここがLoopの終わりだよと宣言するNodeです.特に何も設定してません.
KNIMEを使い始めた頃,「Loop系のnodeは繰り返し処理に使う」というのは知ってはいたんですが,イマイチ使いこなせていませんでした.こういう簡単な処理でLoopを使ってみるのが理解を早めてくれますね.
最後になりますが,今回のWorkFlowはこちらの記事を参考に作成しました.
先人にはいつも大変にお世話になってます.この場を借りて感謝申し上げます.
SDFファイルやPDBファイルも文献ごとにフォルダ分け出来ないかも勉強中です.
KNIMEのVersionあげたら動かなくなったNodeもあって四苦八苦してますが,実験が出来ないので,いい機会だから色々試してみようと思います.
それではWiedersehen.