蛋白质结构设计¶
蛋白质结构设计是创建具有期望功能的新型蛋白质结构的过程。结合蛋白质序列设计,它是以下应用的强大工具:
- 模体支架设计:给定特定的结合、催化、免疫原性模体,设计带有这些模体的新颖蛋白质。
- 蛋白界面设计:重新设计蛋白质-蛋白质界面,以改善两种蛋白质之间的相互作用。
- 结合蛋白从头设计:从零开始设计针对特定目标蛋白质的结合蛋白(binder)。
功能亮点¶
-
经验证的算法:RFDiffusion 算法已在 Nature 杂志发表,经多个设计实验验证,并被广泛用于蛋白质结构设计。
-
灵活的设计选项:完全自定义您的设计区域。对于每个位点,您可以精确指定是否设计序列、结构。
-
云端批量设计:该算法部署在我们的云平台上,支持大规模运行。
输入¶
要提交蛋白质结构设计任务,请打开项目编辑器,并点击左侧边栏中的"New Job(新建任务)"按钮,然后选择"Protein Design(蛋白设计)"任务组中的"Protein Structure Design(蛋白质结构设计)"。任务提交表单将在新标签页中打开。
-
初始结构(Initial Structure):作为设计起点的模板结构,以 PDB/mmCIF 格式表示。结构可以从本地机器上传,从云数据库导入(参见向项目添加文件获取说明),或通过另一个 GeoBiologics 任务生成。
初始结构的要求
初始结构中不能出现插入码或UNK 残基。
-
设计片段(Design Contigs):描述待设计结构的字符串。待设计结构中不同的链由"/0 "分隔,每条链由多个固定或设计片段组成,片段之间以"/"分隔。
- 固定片段(Fixed contig):从初始结构文件的指定片段复制序列和结构。表示为
{链ID}:{起始残基ID}-{结束残基ID}
或简写为{链ID}:{残基ID}
。 - 设计片段(Designed contig):从头设计指定长度的蛋白质片段的序列和结构。表示为
{最小长度}-{最大长度}
或简写为{长度}
。
- 固定片段(Fixed contig):从初始结构文件的指定片段复制序列和结构。表示为
-
标注:您可以向设计片段添加标注,为模型设计蛋白提供指示。
- 隐藏序列(Seq-masked sites):在固定片段中固定结构的同时隐去这些位点的序列。表示为
{链ID}:{起始残基ID}-{结束残基ID}
,或简写为{链ID}:{残基ID}
。 - 隐藏结构(Struct-masked sites):在固定片段中固定序列的同时隐藏这些位点的结构,要求模型重新生成。受体上的配体结合位点附近常常使用此标注,因为我们往往需要固定受体的序列,但其结构往往因与配体结合发生变化。格式与上一个参数相同。
- 界面(Interface):将某个位于"受体链"(完全由固定片段组成的链)上的氨基酸标记为界面氨基酸。格式与前相同。
设计片段和注释的图例 - 隐藏序列(Seq-masked sites):在固定片段中固定结构的同时隐去这些位点的序列。表示为
-
任务名称:任务的名称。请注意,任务名称必须在项目内唯一。
模型 & 参数¶
我们推荐您使用RFDiffusion 模型进行蛋白质结构设计。这个模型有以下参数可供配置:
-
设计分子数(# designs):要生成的设计数量。默认为 10。对于实际的蛋白设计项目,我们建议您至少生成 100 个设计,用于后续的序列设计和虚拟筛选。
-
噪声尺度(Noise scale):控制生成设计的多样性。可以从 0 到 1 变化,默认为 1。较高的噪声会增加多样性,但可能降低设计的质量。
-
扩散比例(Diffuse ratio%): 当设计与初始结构对齐时,您可以使用部分(低于100%)扩散,使设计更接近初始结构。默认值为 100%,表示完全扩散。
结果¶
摘要表格简单地包含设计结构的列表。
每个设计都可以直接在界面中以 3D 方式可视化,结构可以以 PDB 格式下载,用于进一步分析或实验验证。