抗体-抗原对接¶
抗体-抗原对接(Antibody-Antigen Docking)是根据抗原和抗体的序列来预测抗体-抗原复合物结构的功能,帮助用户了解抗体-抗原以何种方式结合、结合位点的位置等信息。
实际应用中,由于算法对结构的预测存在误差,我们会返回预测得分最高前5~10个预测结果,并提供每个预测结构的质控指标供用户参考。
功能亮点¶
蛋白质系统的巨大尺寸使得确定两个蛋白质的最佳排列变得非常困难。而且,在对接过程中,两个蛋白质的灵活区域通常会发生构象变化。GeoBiologics 中的抗体-抗原对接模块具有如下优势:
-
先进算法: 通过利用最新的几何深度学习技术和大规模结构预训练,GeoFlow 在抗体-抗原对接方面展现出强大且稳健的性能,成功率比 AlphaFold2 提高了93%。
-
支持柔性对接: GeoFlow 考虑了在对接过程中柔性区域的构象变化。它还支持生成多个候选姿态并对它们进行评分。与刚体对接相比,它更适合实际应用场景。
-
易用:只需要抗原和抗体序列即可进行对接。平台会自动为您对齐所有预测的结构并聚类,让您更清晰地了解预测结构的表位分布。
任务输入¶
要提交抗体-抗原对接任务,请打开项目编辑器并从"结构建模"(Structure Modeling)下拉菜单中选择"抗体-抗原对接"(Antibody-Antigen Docking)。将会出现如下任务提交表单:
-
Complex(复合物): 抗原-抗体复合物序列。序列有多种输入方式
-
点击 "" 等结尾。}" 按钮上传您自己的抗原-抗体复合物(一个 .FASTA 文件)。文件中只能存在一个抗原-抗体复合物,各链的 FASTA 标签必须具有相同的前缀且以 "_{chain_id
-
直接在序列输入框中复制 FASTA 字符串内容,平台会自动解析并创建多链序列。FASTA 字符串同样需要满足上述要求。您可以将以下序列复制到序列输入框中以测试此功能:
>6xc3_C NLCPFGEVFNATRFASVYAWNRKRISNCVADYSVLYNSASFSTFKCYGVSPTKLNDLCFTNVYADSFVIR GDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVNYNYLYRLFRKSNLKPFERDISTEIYQA GSTPCNGVEGFNCYFPLQSYGFQPTNGVGYQPYRVVVLSFELLHAPATVCGPK >6xc3_H QMQLVQSGTEVKKPGESLKISCKGSGYGFITYWIGWVRQMPGKGLEWMGIIYPGDSETRYSPSFQGQVTI SADKSINTAYLQWSSLKASDTAIYYCAGGSGISTPMDVWGQGTTVTVSS >6xc3_L DIQLTQSPDSLAVSLGERATINCKSSQSVLYSSINKNYLAWYQQKPGQPPKLLIYWASTRESGVPDRFSG SGSGTDFTLTISSLQAEDVAVYYCQQYYSTPYTFGQGTKVEIK
- 在序列输入框中一次输入每条链的序列。注意链的标号固定为 ABCDEF。
-
-
Antigen Chain(抗原链): 选择哪些链属于抗原,剩下的链默认属于抗体。
链类型识别
GeoBiologics 会自动识别并标出结构中的 V-结构域,包括抗体重链(heavy)、抗体轻链(light)、TCR 重链(alpha)、TCR 轻链(beta)。
-
Job Name(任务名称): 任务的名称。请注意,任务名称必须在项目内唯一。
模型 & 参数¶
点击Show Parameters按钮展开模型和参数设置。
您可以使用我们自研的 GeoAbDockv4 模型来运行本任务。此模型的参数如下:
- Mode(模式): 您可以在 “fast(快速)“ 和 ”accurate(精确)“ 之间选择,前者速度更快,后者会进行更多对接姿态的采样,对接成功率更高。
结果¶
结构聚类¶
"Clustermap of predicted structures(预测结构聚类图)"这一节展示了预测的10个结构的聚类结果。 每个方块内标注了两个结构之间的 DockQ 值(在0-1之间),数值越大,表示两个结构越相似。 通过这张图,您可以轻松了解哪几个结构是相似的,哪几个结构是不同的。从而减少查看结构的工作量。
汇总表格¶
汇总表格中展示了预测的10个结构的置信度和质控指标,具体包括:
- rank(排名): 从 0 开始的样本排名,按照 wpTM 评分降序排列。
- score(置信度打分):预测结构的 wpTM 打分(范围从 0 到 1),表示对预测的置信度。一般来说,如果 wpTM > 0.8,则认为预测的结构是可靠的;如果 wpTM < 0.5,则认为预测的结构不太可靠。
- efinal(最终能量):AMBER99模型预测的最终能量,数值越低越好。
- Buried ASA(埋藏的溶剂可及表面积):因抗原抗体结合减少的溶剂可及表面积,数值大于1200为宜。
- #clash(碰撞氨基酸个数):抗体中与抗原有碰撞(距离过近)的氨基酸数目,数值越少越好。
- #paratope(互补位氨基酸个数):抗体中与抗原空间位置接近的氨基酸总数,10个以上为宜。
上述汇总表可以通过点击表格右上角的""按钮下载。
右侧的操作栏(Ops)中,您可以点击 "" 按钮查看复合物结构。点击后将自动跳转到 Mol* 查看器,并打开界面可视化工具,让您查看预测的复合物结构与界面情况。
所有预测的结构中的抗原已经提前为您对齐,您可以打开多个结构比较它们抗体位置的差异。如您需要对齐预测和真实的复合物结构,请参见结构对齐任务文档。
相关链接¶
基于预测的抗原-抗体复合物结构,您可以执行基于结构的亲和力优化,以提高/降低您的抗体-抗原复合物的亲和力。