抗体优化¶
本任务可以帮助您使用强大、专业的 AI 模型,进行抗体评价、筛选和优化。
如您当前有一条先导抗体,您可以用本任务对其进行一键人源化,随后对生成的序列进行虚拟筛选,选出最佳的分子进行湿实验验证。
如您当前有多条先导抗体,您可以使用本任务对它们的人源性、表面电荷、疏水性、等电点、表达量、结构稳定性、PTM 风险等指标进行综合打分,并根据打分结果进行分子的排序、筛选。氨基酸级别的打分高低会在序列和结构上用颜色直观展示出来。
如您需要改造任何已有或 AI 生成的抗体,本任务中的抗体突变助手会为您智能推荐突变方案,提示突变方向,助您高效进行抗体改造。
输入¶
要提交抗体优化任务,请打开项目编辑器 并从"Antibody Design(抗体设计)"下拉菜单中选择"Antibody Optimization(抗体优化)"。
- Antibodies(抗体): 待优化/评价/筛选的一条或多条抗体。您可以在输入框中输入序列,也可以上传 FASTA 文件 (点击 "" 按钮)。
- Antibody Name(抗体名称): 抗体的名称。默认为“Antibody”。要更改名称,请将鼠标悬停在抗体名称上,然后点击 "" 按钮.
- Sequence(序列): 输入每条抗体的 VH/VL 区序列。
- (上传序列): 点击 "" 按钮上传您自己的抗体(一个 .FASTA 文件)。您的抗体必须有两条链,且标签必须具有相同的前缀且分别以 "_H" 和 "_L" 结尾。参见以上示例。
- Job Name(任务名称): 任务的名称。请注意,任务名称必须在项目内唯一。
参数¶
您可以单击任务提交表单下方的“Show Parameters”按钮展开参数列表,并编辑任务参数。本任务的参数包括:
- Scheme(编号方案): 为抗体每个氨基酸进行编号,使不同抗体的等效氨基酸互相对齐的方案。可选“Kabat”、“IMGT”、“Chothia”或“AHo”。
- CDR def.(CDR 定义): CDR 区域的定义,会影响 CDR 嫁接和一键人源化的结果。可选“Kabat”、“IMGT”、“Chothia”或“North”。这里对比了不同定义方案的区别。当您需要进行一键人源化时,推荐使用“North”。
- Mutator(突变方案):用于突变起始序列的方案。只有当输入序列只有一条时,才能进行突变。可选的突变方案包括:
结果面板¶
在文件与任务管理器面板中点击您之前创建过的任务名,即可查看任务结果。
结果总表¶
在结果面板(上图)的 Antibody Properties(抗体性质)表格中,列出了任务中的所有抗体分子的 ID、Comment(备注)及其性质。这些抗体可能来自任务输入,也可能是由突变算法生成的,还可能是您在编辑页上编辑产生的结果。表格中列出的性质包括:
结果总表中的抗体性质
- Humanness (percentile):抗体的人源性评分及其在抗体库中的百分位。一般认为,百分位低于10%的抗体有较高的免疫原性风险。
- Germline content:抗体中与胚系基因序列相同的氨基酸的占比。一般需要大于80%。
- FR Germline content:抗体 FR 区中与胚系基因序列相同的氨基酸的占比。一般需要大于85%。
- Germline allele:抗体的胚系基因。轻重链基因用“|“分隔,如“IGHV1-2*02 | IGKV4-1*01”。
- Optimal pH:抗体结构稳定性最高的 pH 值。
- pI:根据结构计算的抗体等电点。
- Positive patch (percentile):抗体表面正电荷块的数量及其百分位。百分位超过 90%,表示分子有较高的聚集性风险。
- Negative patch (percentile):抗体表面负电荷块的数量及其百分位。百分位超过 90%,表示分子有较高的聚集性风险。
- Charge symmetry (percentile):抗体 VH 和 VL 的电荷对称性(表面氨基酸净电荷之积)。百分位小于 10%,表示分子有较高的聚集性风险。
- Hydrophobic patch (percentile):抗体表面疏水氨基酸块的数量。百分位小于 10% 或大于 90%,表示分子有较高的聚集性风险。
- Expression (percentile):抗体在 CHO 细胞中的表达量。百分位小于 10%,表示表达量较低。
- Purity (percentile):抗体一步 A 柱后的纯度(以SEC-HPLC检测)。百分位小于 10%,表示纯度较低。
- #liabilities:抗体翻译后修饰(PTM)、非特异性结合风险位点的数量。
- Energy (Amber14SB):使用 Amber14SB 力场计算的抗体结构能量。
- plDDT:模型预测的、整个抗体的 lDDT(局部距离差异测试)值,在 0-100 之间。值越大,抗体结构预测的置信度越高。与结构稳定性有一定正相关性。
- CDR plDDT:模型预测的、抗体 CDR 区域的 lDDT 值,在 0-100 之间。值越大,抗体 CDR 区域的结构预测的置信度越高。
- wpTm:模型预测的加权 TM 值,在 0-1 之间。值越大,抗体 VH-VL 复合物的结构预测的置信度越高。与轻重链配对倾向有一定正相关性。
- RMSD to {{ref}}:抗体结构与参考结构之间的 RMSD。
- CDR RMSD to {{ref}}:抗体 CDR 结构与参考 CDR 结构之间的 RMSD。
以上两列默认不会出现。您点击表格上方的“”并指定参考结构、列名中{{ref}}占位符的内容后,这两列才会出现。
每个性质列都包含两个操作按钮:
- 排序:点击上下两个三角可以对当前列按数值大小进行升序、降序排序。
- 过滤:点击后可以对当前列数值进行过滤。
表格上方有四个操作按钮:
- (自定义列):由于计算的性质多种多样,您可能希望表格中只显示某些特定的性质。点击 Columns 后,您可以在弹出的窗口中自定义表格中列出的性质及其顺序。
- (批量操作):点击后可以对表格中您选中的的多个抗体进行批量操作。目前支持的操作包括:
- Copy as FASTA:将表格中选中的抗体序列以 FASTA 格式复制到剪贴板。
- Export to CSV:将表格中选中的抗体的序列和各项性质以 CSV 格式导出到本地。
- (对齐结构):点击后可以将表格中所有的抗体分子(和未来加入的抗体分子)对齐到您指定的抗体结构。您点击确认后,表格中会增加与结构相似性相关的两列:RMSD to {{ref}} 和 CDR RMSD to {{ref}}。
- (对比序列):对齐并对比您选中的抗体序列。点击后将跳转到对比页,展示各抗体的分子级别打分和氨基酸级别打分。
对比页¶
本页(“Antibody Property Comparison”)会对您选中的抗体进行序列对齐,并对比其分子打分和氨基酸打分。
点击标题上方的面包屑中的任务名,或者标题左边的左箭头“←”(上图中红框部分),可以返回结果总表。点击标题右边的按钮,可以更换被对比的抗体。
本页由“分子级别打分”和“氨基酸级别打分”两部分组成。
分子级别打分¶
在“Antibody Properties”一节中,以表格形式列出了抗体的各项性质。和结果总表中一样,您可以点击按钮自定义表格中展示的性质及其顺序,也可以点击按钮对选中的抗体进行批量操作,如复制 FASTA 序列、导出 CSV 表格。
氨基酸级别打分¶
在“Per-residue scores”一节中,对齐展示了您选中的抗体序列及模型对每个氨基酸的多维度评分。用于打分的模型可以在选项卡中切换。
- CDR 区氨基酸用深灰色下划线标出,Vernier 区、VH-VL界面区氨基酸用浅灰色标出。
- 每个氨基酸残基的背景颜色展示了当前选项卡对应的模型对该残基的评分。
区域右上角的按钮可以切换显示重链/轻链。 鼠标悬浮在某个氨基酸残基上时,该位置会显示该残基的详细打分信息,如“H113 (IMGT) | CDR3 | GeoHumanness: 0.889”。
氨基酸打分的上色方案
展示氨基酸在人体中引起免疫原性的风险。无风险则为白色;红色越深,免疫原性风险越高。
具体地说,如果一个 9-肽片段在抗体数据库中在低于 10% 的人类中出现,则该片段被认为是高风险肽段。氨基酸属于越多高风险肽段,其红色越深。
展示基于结构计算的氨基酸侧链的 pKa。蓝色越深,pKa 越高(酸性越弱);红色越深,pKa 越低(酸性越强)。
展示基于结构计算的氨基酸的表面净电荷。正值为蓝色,负值为红色。
展示基于结构计算的抗体 CDR 区(IMGT定义)及邻域的表面净电荷块大小。默认为白色;同性净电荷块越大,由电荷导致的聚集性风险越高,红色越深。
展示氨基酸的疏水性。黄色越深,疏水性越高;青色越深,疏水性越低。
展示基于结构计算的抗体 CDR 区(IMGT定义)及邻域的疏水块大小。默认为白色;疏水块越大,由疏水导致的聚集性风险越高,红色越深。
展示基于序列和结构计算的抗体翻译后修饰(PTM)和非特异结合位点。默认为白色;PTM/非特异结合风险越高,红色越深。
编辑页¶
本页(“Editing {antibody_name}”)允许您在 AI 辅助下编辑某条抗体序列,产生各项性质更优的抗体分子,并将其保存到结果总表中。
点击标题上方的面包屑中的任务名,或者标题左边的左箭头“←”(上图中红框部分),可以返回结果总表。
分子级别打分¶
在“Antibody Properties”一节中,以表格形式列出了编辑前和当前(current)抗体的各项性质。和结果总表中一样,您可以点击按钮自定义表格中展示的性质及其顺序。
氨基酸级别打分¶
在“Per-residue scores”一节中,对齐展示了编辑前(Parental, wt)和当前(Current, mt)的抗体序列及模型对每个氨基酸的多维度评分。用于打分的模型可以在选项卡中切换。 您可以通过点击节标题右方的按钮查看当前模型的配色方案。想查看所有配色方案的详细说明,参见此处的说明。
- CDR 区氨基酸用深灰色下划线标出,Vernier 区、VH-VL界面区氨基酸用浅灰色标出。这些氨基酸在突变时可能影响与抗原结合或 VH-VL 稳定性,请谨慎修改。
- 如您开启了“Show PTM Risk”,有翻译后修饰(PTM)或非特异性结合风险的氨基酸残基会用橙色波浪线标出。鼠标悬停在相应风险位点时,还会显示风险名称和风险发生频次(频次越高,代表该风险点在该位点出现得越多),如“Asn deamidation (3.2%)。
- 如您开启了“Show solvent accessibility”,氨基酸的溶剂可及性会用字符颜色深浅表示。黑色表示氨基酸完全暴露在溶剂中,浅灰色表示完全不暴露。
区域右上角的按钮可以切换显示重链/轻链。按钮可以打开设置浮窗(如下图),您可以在其中修改如下配置项:
- Show PTM Risk(显示/隐藏序列风险)
- Show solvent accessibility(显示/隐藏溶剂可及性)
- Mutation advisor(突变助手):配置您的突变助手(下一节会详细介绍)。
突变助手¶
突变助手为您改造抗体序列提供建议。您可以点击按钮打开设置浮窗,在“Mutation advisor”配置项中选择您的突变助手。可选的选项包括:
突变助手设置项
AI 助手会根据您当前的抗体序列,为每个位点给出至多 5 个突变建议(当前氨基酸也会参与排名)。每个位置所有氨基酸的打分之和为 1。氨基酸背景的紫色越深,代表模型认为其在该位置的倾向性越高,如下图。 为了使突变建议更清晰、易读,突变建议中当前序列中的氨基酸残基以点号("·")表示,置信度低于 1% 的氨基酸将被省略。 可选的助手模型(Copilot model)有:
- ESM1v-650M:专门用于预测变异影响的语言模型。
- ESM2-3B:更新、更强大的通用蛋白质语言模型。
- GeoHumAb:我们的专有算法,用于抗体的人源化。
展示与当前序列最接近的五条胚系基因序列。其中,带淡蓝色背景的氨基酸与当前序列相同,如下图。您可采用将氨基酸突变到胚系基因序列中对应位置的氨基酸的方式,降低当前序列的免疫原性。
您可在设置中自定义胚系基因的来源物种(Species),可选项包括:Human(人)、Cat(猫)、Mouse(小鼠)、Rat(大鼠)、Rabbit(兔)、Alpaca(羊驼)、Pig(猪)、Rhesus(猕猴)。默认值为 Human。
当您将鼠标悬停在突变建议上时,突变建议的详细信息将显示在序列查看器右下角。包括:
- Position(位置):您悬停的氨基酸所在位置的编号。格式为“{链类型}{残基编号}{插入代码}”,例如“H52A”。
- Region(区域):该位置所属的抗体区段,值可能为 FR1-4 或 CDR1-3。Vernier 区、VH-VL 界面区也会被标出。
- Advisor confidence(突变建议的置信度):排名前 10 的突变建议及其置信度,鼠标悬停处的氨基酸残基以蓝色高亮显示。置信度越高,代表该突变越有可能改善抗体性质。
编辑当前序列
如果您想采纳某个突变建议,只需点击该突变建议,随后在弹出窗口中点击“Confirm”按钮即可。例如,下图中,我们参考了最接近的胚系基因,将 H64 位点由 E 突变为 N。
如您想对序列进行自定义单点突变,您可以点击“Current (mt)”序列中您想突变的氨基酸残基,在弹出窗口中选择一个突变,随后点击“Confirm”按钮。
您可以在“Mutations”区域中查看您已经应用的突变。点击”“按钮可以勾选需要撤销的突变。
结构查看器¶
结构查看器显示了当前抗体的结构。 当本任务的结果面板打开时,结构对象面板将自动同步于此面板中的结构。
结构中的氨基酸残基会按照与序列相同的方案进行着色,以反映当前模型对每个氨基酸的评分。
致谢¶
本任务由以下模型提供支持: