抗体编号方案1¶
IMGT¶
IMGT23 为所有抗原受体类型(免疫球蛋白 Ig 和 T-细胞受体 TCR)提供了 128 个位置编号。一般认为,这些位置在结构上是等价的。理论上,这些位置能够覆盖 Ig 和 TCR 中所有可能出现的位置,唯一的插入位点在 CDR3 区的 111 和 112 号氨基酸之间,在 CDR3 长度超过 13 个氨基酸时会发生插入,例如 111-ABCD DCBA-112
。
随着 CDR 区域长度的增加,新增氨基酸的 IMGT 编号不会按自然顺序递增。例如,对于长度为 5 的 HCDR1,编号为 "27 28 29 37 38"。每继续添加一个残基,编号遵循 "36 30 35 31 34 32 33" 的顺序,而不是 "30 31 32 33 34 35 36"。因此,对于长度为 6 的 HCDR1,正确的编号是 "27 28 29 36 37 38 39"。
下表展示了各 CDR 区域的最短序列编号,以及随着长度增加新增氨基酸的编号方式。在最短序列编号的基础上添加氨基酸时,大编号优先于小编号(例如,36 优先于 30,112A 优先于 111A)。
区域 | 长度范围 | 最短序列编号 | 新增氨基酸的编号顺序 |
---|---|---|---|
CDR1 | 5-12 | 27 28 29 -- 37 38 | 36 30 35 31 34 32 33 |
CDR2 | 0-10 | -- | 56 65 57 64 58 63 59 62 60 61 |
CDR3 | 5-91 | 105 106 107 -- 116 117 | 115 108 114 109 113 110 112 111 112A 111A 112B 111B ... |
Kabat¶
Kabat4 仅适用于抗体重链和轻链。两个链类型的位置并不等价。重链的最大编号是 113,轻链的最大编号是 109。插入位点出现在特定的框架区和 CDR 区位点,插入的氨基酸从 A 到 Z 进行编号,例如 100ABCDEFGHIJK 101
。
区域 | 编号 | 可能的插入代码 |
---|---|---|
[H]CDR1 | 35 | ABCD |
[H]CDR2 | 52 | ABC |
[H]FR3 | 82 | ABC |
[H]CDR3 | 100 | ABCDEFGHIJK |
[L]CDR1 | 27 | ABCDEF |
[L]CDR3 | 95 | ABCDEF |
[L]FR4 | 106 | A |
尽管 Kabat 方案在全球范围内广受欢迎,但它已被证明存在如下局限性:
-
未定义的 HCDR3 长度:Kabat 编号的 HCDR3 插入位点位于残基 H100 和 H101 之间,可能的插入码为字母 A-K(即 100ABCDEFGHIJK 101)。最近科学家发现,HCDR3 区还可能有更多的残基,但它们的编号在 Kabat 方案中是未定义的。
-
未考虑抗体结构:Kabat 编号方案是基于有限的序列数据集开发的,没有用到结构信息。人们后来发现,LCDR1 和 HCDR1 中插入位点的位置与结构上插入的位置并不匹配。因此,这些区域中结构上等效的残基并没有得到相同的编号。
Chothia¶
Chothia5 仅适用于抗体重链和轻链,两个链类型的位置并不等价。和 Kabat 一样,重链的最大编号是 113,轻链的最大编号是 109。插入位点出现在特定的框架区和 CDR 区位点,插入的氨基酸从 A 到 Z 进行编号,例如 100ABCDEFGHIJK 101
。
Chothia 编号方案基于 Kabat,但在重链的 CDR-L1 和 CDR-H1 中将插入位点放在结构上正确的位置。这意味着这些区域中结构上等效的残基会得到相同的编号。
区域 | 编号 | 可能的插入代码 |
---|---|---|
[H]CDR1 | 31 | AB |
[H]CDR2 | 52 | ABC |
[H]FR3 | 82 | ABC |
[H]CDR3 | 100 | ABCDEFGHIJK |
[L]CDR1 | 30 | ABCDEF |
[L]CDR3 | 95 | ABCDEF |
[L]FR4 | 106 | A |
AHo¶
AHo 为所有抗原受体类型(Ig 和 TCR)提供了 149 个位置编号。这些位置在结构上大致是等价的。AHo 方案的编号数目庞大,这样在绝大多数情况下,编号中不会出现插入码。
和 IMGT 方案类似,AHo 编号中插入和删除的位点,不是从单个方向增长,而是围绕关键的位点对称放置的。例如,63 是抗体 CDR2 区的一个关键位点,因而 VL 域中会出现 L59-L66(对应 Kabat 中 L50 和 L51 之间的位置)8 个残基缺口,VH 域最大可能出现 H61-H64 的 4 个残基缺口(对应 Kabat 中的 H52ABCD)。更多详细信息,请参阅 AHo 官方网站。
AHo 1-33 和 IMGT 1-33 对齐,AHo 36-119 和 IMGT 34-117 对齐,AHo 139-149 和 IMGT 118-128 对齐。
CDR 区定义对比¶
注意,这些编号包括了带有插入代码的残基,例如 Kabat HCDR1 (31-35
) 包括残基 31-34 35ABCD
。
方案 | HCDR1 | HCDR2 | HCDR3 | LCDR1 | LCDR2 | LCDR3 |
---|---|---|---|---|---|---|
IMGT | 27-38 | 56-65 | 105-117 | 27-38 | 56-65 | 105-117 |
IMGT (Chothia编号) | 26-35 | 51-57 | 93-102 | 27-32 | 50-52 | 89-97 |
Kabat | 31-35 | 50-65 | 95-102 | 24-34 | 50-56 | 89-97 |
Chothia | 26-32 | 52-56 | 96-101 | 26-32 | 50-52 | 91-96 |
North (Chothia编号) | 23-35 | 50-58 | 93-102 | 24-34 | 49-56 | 89-97 |
你可以在 IMGT 网站上找到 IMGT 和 Kabat/Chothia 方案的 CDR 区编号的详细比较,涵盖 VH, VK 和 VL 基因。这里 以实际序列展示了不同编号方案/CDR 区定义的对比。
CDR 区周围的保守氨基酸¶
下列规则可以帮助您根据保守氨基酸在抗体序列中定位 CDR 区。
区域 | IMGT | Kabat/Chothia | 氨基酸 |
---|---|---|---|
HCDR1 前方 | 23 | 22 | C |
HCDR1 后方 | 41-42 | 36-37 | WV, WI, WA |
HCDR2 前方 | 50-54 | 45-49 | LEWIG |
HCDR2 后方 | 75-77 | 66-68 | K/R - L/I/V/F/T/A - T/S/I/A |
HCDR3 前方 | 104-106 | 92-94 | CAR, CXX |
HCDR3 后方 | 118-121 | 103-106 | WGXG |
LCDR1 前方 | 23 | 23 | C |
LCDR1 后方 | 41-43 | 35-37 | WYQ, WLQ, WFQ, WYL |
LCDR2 前方 | 54-55 | 48-49 | IY, VY, IK, IF |
LCDR2 后方 | |||
LCDR3 前方 | 104 | 88 | C |
LCDR3 后方 | 118-121 | 98-101 | FGXG |
表格中加粗的氨基酸为绝大多数情况下保守的氨基酸,斜体氨基酸为相对不那么常见的氨基酸。
Vernier 区¶
Vernier 区9是框架区内支撑互补决定区(CDR)的氨基酸集合。这些残基可能影响 CDR 区的构象,因而在 CDR 移植过程中被回复突变,以维持抗体亲和力。
区域 | Kabat/Chothia | IMGT |
---|---|---|
HCDR1 前方 | H2,27-30 | H2,28-31 |
HCDR1 后方 | H47-49 | H52-54 |
HCDR2 后方 | H67,69,71,73 | H76,78,80,82 |
HCDR3 前方 | H93-94 | H105-106 |
HCDR3 后方 | H103-104 | H118-119 |
LCDR1 前方 | L2,L4 | L2,L4 |
LCDR1 后方 | L46-49 | L52-55 |
LCDR2 后方 | L64,66,67,69,71 | L78,80,84,85,87 |
LCDR3 后方 | L98 | L118 |
-
本文件改编自 ANARCI 文档 和 Andrew Martin 教授课题组撰写的文档 ↩
-
V-区域的 IMGT 编号:Lefranc, M.-P. et al., Dev. Comp. Immunol., 27, 55-77 (2003) PubMed pdf ↩
-
V-结构域的 IMGT 编号:Lefranc, M.-P. et al., Dev. Comp. Immunol., 27, 55-77 (2003) PubMed pdf ↩
-
Kabat, E.A. et al., In: Sequences of Proteins of Immunological Interest, NIH Publication, 91-3242 (1991). ↩
-
Chothia, C. and Lesk, A.M., J. Mol. Biol., 196, 901-917 (1987). ↩
-
Chothia, C. et al., Nature, 342, 877-883 (1989). ↩
-
Al-Lazikani, B. et al., J. Mol. Biol., 273, 927-948 (1997). ↩
-
A. Honegger & A. Plückthun. J. Mol. Biol, 309 (2001)657-670. PubMed pdf ↩
-
Jefferson Foote; Greg Winter, J. Mol. Biol. 224, 487-499 (1992). ↩