本申请要求于2007年6月25日提交的美国临时申请序列号60/937,112的优先权,所述美国临时申请的名称为“Sequence BasedEngineering and Optimization of Single Chain Antibodies”。本申请还要求于2008年3月12日提交的美国临时申请序列号61/069,056的优先权,所述美国临时申请的名称为“Methods of Modifying Antibodies,and Modified Antibodies with Improved Functional Properties”。
附图简述
图1是概括根据本发明的方法的scFv的一般的基于序列的分析的流程图。
在第一个步骤中,提供了待在溶解性和稳定性方面进行改善的scFv的序列(框1),其随后与抗体序列数据库进行比较(框2),例如开放源种系序列数据库(例如,Vbase,IMGT;框3)、开放源成熟抗体序列数据库(例如,KDB;框4)或全长人稳定和可溶scFv片段的数据库(例如,QC;框5)。
应用例如框3中描述的开放源种系序列数据库允许鉴定高度保守的位置,其在进化过程中进行选择,并且因此被认为促成全长抗体背景中的可变结构域的稳定性(框3’)。针对开放源成熟抗体序列数据库4的比较允许鉴定这样的模式,其代表不依赖于各自的CDR的稳定性、溶解性和/或结合的改善(框4’)。此外,针对全长人稳定和可溶scFv片段的数据库(框5)的比较导致鉴定对于稳定性和/或溶解性关键的残基(特别是在scFv形式中),以及鉴定这样的模式,其代表特别是在scFv形式,例如VL和VH组合中不依赖于各自的CDR的稳定性、溶解性和/或结合的改善(框5’)。
在下一个步骤中(框6),用各个数据库中鉴定的最频繁的合适氨基酸置换关键残基。
最后(框7),可以在酵母QC系统中进行关键残基的随机或偏好性诱变并且随后就改善的稳定性和/或溶解性进行筛选。突变体可以再次经历上文描述的操作(至框2的箭头)。
图2是用于scFv的基于序列的分析的示例性多步骤方法的流程图。
在第一个步骤中(框1),基于生物信息学工具提供的结果,通过比较每个位置处不同氨基酸的出现情况,测定每一个残基在构架中的频率。在第二个步骤中,例如通过使用用式D=∑ni(ni-1)/N (N-1)计算的辛普森(Simpson′s)指数,定义每个位置处的保守程度。在第三个步骤中,测定了使总体自由能降到最低的最佳置换(例如,通过应用玻尔兹曼(Boltzmann′s)定律:ΔΔGth=-RTln(f亲本/f共有区))。最后(步骤4),测定潜在的稳定性突变的作用。为了这个目的,可以考虑因素例如局部和非局部相互作用、规范残基(canonical residue)、界面、暴露程度和β-转角倾向。
图3是用于在酵母中选择稳定和可溶scFv的示例性质量控制(QC)系统的示意图。利用这个系统,通过诱导型报告构建体的存在(所述构建体的表达依赖于稳定和可溶scFv-AD-Gal11p融合蛋白的存在)选择在还原环境中能够表达稳定和可溶scFv的宿主细胞。融合蛋白与Gal4(1-100)的相互作用形成激活可选标记的表达的功能转录因子(参见图3A)。不稳定和/或不溶性scFv无法形成功能转录因子并且诱导可选标记的表达,并且因此从选择中排除(图3B)。即使在其中二硫键不折叠的还原条件下,所选择的scFv也能够获得稳定和可溶的蛋白质折叠,而不稳定和/或不溶性scFv趋于去折叠、聚集和/或降解。在氧化条件下,所选择的scFv仍展现优良的溶解性和稳定性特征。
图4是另一个示例性质量控制(QC)系统的示意图。用于选择可溶和稳定scFv的总体概念与图3描述的相同,然而,在这个形式中,scFv与包含活化结构域(AD)和DNA结合结构域(DBD)的功能转录因子直接融合。图4A描述了示例性可溶和稳定scFv,其当与功能转录因子融合时,不阻碍可选标记的转录。相比之下,图4B描述了其中不稳定scFv与转录因子融合而产生无功能融合构建体的情形,所述构建体无法激活可选标记的转录。
图5是体细胞突变前在天然种系序列内的特定构架(FW)位置处(图5A),和在QC系统中选择的体细胞突变后在成熟抗体序列内的相应FW位置处(图5B)的变异性分析的示意图。可以赋予种系和QC序列内分别的FW位置(例如,高度可变构架残基(“hvFR”))不同的变异性值(即,分别为“G”和“Q”值)。如果对于特定位置G>Q,那么在那个位置处存在有限数目的合适的稳定FW残基。如果对于特定位置G<Q,那么这可能表明该残基已就最佳溶解性和稳定性进行了天然选择。
图6描述了在25-95℃下的热诱导胁迫后对于ESBA105变体观察到的变性曲线图。虚线表示具有至种系共有残基的回复突变(V3Q、R47K或V103T)的ESBA-105变体。实线表示包含通过本发明的方法鉴定的优选置换的变体(QC11.2、QC15.2和QC23.2)。
图7描述了包含共有序列回复突变(S-2、D-2、D-3)、至丙氨酸(D-1)或QC残基(QC7.1、QC11.2、QC15.2、QC23.2)的突变的一组ESBA105变体的热稳定性的比较。提供了每种变体的热稳定性(以任意去折叠单位表示)。
图8描述了在25-95℃下的热诱导胁迫后对于ESBA212变体观察到的变性曲线图。虚线表示具有至种系共有残基的回复突变(V3Q或R47K)的ESBA-212变体。实线表示亲本ESBA212分子。
图9举例说明了VH1a家族的scFv构架支架。第一行显示使用Kabat系统的重链可变区编号。第二行显示使用AHo系统的重链可变区编号。第三行显示scFv构架支架序列(SEQ ID NO:1),其中在标记为“X”的那些位置处,该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“x”的位置以及标记为CDR1 H1、CDR H2和CDR H3的区域可以由任何氨基酸占据。
图10举例说明了VH1b家族的scFv构架支架。第一行显示使用Kabat系统的重链可变区编号。第二行显示使用AHo系统的重链可变区编号。第三行显示scFv构架支架序列(SEQ ID NO:2),其中在标记为“X”的那些位置处,该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“x”的位置以及标记为CDR1H1、CDR H2和CDR H3的区域可以由任何氨基酸占据。
图11举例说明了VH3家族的scFv构架支架。第一行显示使用Kabat系统的重链可变区编号。第二行显示使用AHo系统的重链可变区编号。第三行显示scFv构架支架序列(SEQ ID NO:3),其中在标记为“X”的那些位置处,该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“x”的位置以及标记为CDR1H1、CDR H2和CDR H3的区域可以由任何氨基酸占据。
图12举例说明了Vκ1家族的scFv构架支架。第一行显示使用Kabat系统的轻链可变区编号。第二行显示使用AHo系统的轻链可变区编号。第三行显示scFv轻链构架支架序列(SEQ ID NO:4),其中在标记为“X”的那些位置处,该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“.”的位置以及标记为CDR1L1、CDR L2和CDRL3的区域可以由任何氨基酸占据。
图13举例说明了Vκ3家族的scFv构架支架。第一行显示使用Kabat系统的轻链可变区编号。第二行显示使用AHo系统的轻链可变区编号。第三行显示scFv轻链构架支架序列(SEQ ID NO:5),其中在标记为“X”的那些位置处,该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“.”的位置以及标记为CDR1L1、CDR L2和CDRL3的区域可以由任何氨基酸占据。
图14举例说明了VL1家族的scFv构架支架。第一行显示使用Kabat系统的轻链可变区编号。第二行显示使用AHo系统的轻链可变区编号。第三行显示scFv轻链构架支架序列,其中在标记为“X”的那些位置处,该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“.”的位置以及标记为CDR1L1、CDR L2和CDR L3的区域可以由任何氨基酸占据。在特定的优选实施方案中,在CDR L1内的AHo位置58和67-72分别由下述残基占据:D和NNQRPS。
图15描述了野生型ESBA105及其可溶性变体的PEG沉淀溶解度曲线。
图16描述了如在广泛温度范围(25-96℃)下的热攻击后测量的野生型ESBA105及其可溶性变体的热变性曲线图。
图17描述了SDS-PAGE凝胶,其显示了在热胁迫条件下温育2周后各种ESBA105可溶性突变体的降解行为。
发明详述
本发明涉及用于免疫结合剂性质,特别地scFv性质(包括但不限于稳定性、溶解性和/或亲和力)的基于序列的改造和优化的方法。更具体地,本发明公开了使用抗体序列分析鉴定scFv中待突变的氨基酸位置来优化scFv抗体,从而提高scFv的一个或多个物理性质的方法。本发明还涉及按照本发明的方法产生的或可获得的经改造的免疫结合剂例如scFv。
本发明至少部分基于抗体序列的多个数据库中的各重链和轻链构架位置上的氨基酸频率的分析。特别地,已将抗体序列数据库(例如,种系抗体序列数据库或成熟抗体数据库,例如Kabat数据库)的频率分析与因具有期望的功能性质而被选择的scFv序列的数据库的频率分析相比较。通过给各构架位置的变异性程度赋值(例如,通过使用辛普森指数)和通过比较不同类型的抗体序列数据库中的各构架位置上的变异性程度,现已能够鉴定对于scFv的功能性质(例如,稳定性、溶解性)是重要的构架位置。这现允许对构架氨基酸位置定义“功能共有区”,其中已鉴定了比免疫球蛋白序列(例如种系或成熟免疫球蛋白序列)中的相应位置更耐受变异性或更不耐受变异性的构架位置。因此,本发明提供基于功能性选择的scFv序列的数据库的使用的“功能共有区”方法并证明了其优点。此外,本发明提供了通过突变使用本文中描述的“功能共有区”方法鉴定的特定构架氨基酸位置来对免疫结合剂(例如,scFv)进行改造的方法。
首先定义某些术语,这样可使本发明更容易被理解。除非另外指出,本文中使用的所有技术和科学术语具有与本发明所属领域内的技术人员通常理解的意义相同的意义。虽然与本文中描述的方法和材料相似或等同的方法和材料可用于本发明的实践或试验中,但下面描述了适当的方法和材料。本文中提及的所有公开物、专利申请、专利和其他参考资料以它们的全文通过引用合并入本文。在矛盾的情况下,以本说明书(包括定义)为准。此外,材料、方法和实施例只是举例说明性的而非限定性的。
本文中使用的术语“抗体”是免疫球蛋白的同义词。根据本发明的抗体可以是完整的免疫球蛋白或其片段,其包括免疫球蛋白的至少一个可变结构域,例如单个可变结构域,Fv(Skerra A.和Plückthun,A.(1988)Science 240:1038-41)、scFv(Bird,R.E.等人(1988)Science 242:423-26;Huston,J.S.等人(1988;Proc.Natl.Acad.Sci.USA 85:5879-83),Fab、(Fab′)2、或本领域技术人员熟知的其他片段。
本文中使用的术语“抗体构架(antibody framework)”是指可变结构域VL或VH的一部分,其用作该可变结构域的抗原结合环的支架(Kabat,E.A.等人,(1991)Sequences of proteins of immunologicalinterest.NIH Publication 91-3242)。
本文中使用的“抗体CDR”是指抗体的互补决定区,其如KabatE.A.等人,(1991)Sequences of proteins of immunological interest.NIHPublication 91-3242)定义的由抗原结合环组成。抗体Fv片段的两个可变结构域中的每一个包含例如3个CDR。
术语“单链抗体”或“scFv”意指包含通过接头连接的抗体重链可变区(VH)和抗体轻链可变区(VL)的分子。此类scFv分子可具有一般结构:NH2-VL-接头-VH-COOH或NH2-VH-接头-VL-COOH。
如本文中所使用的,“同一性”是指两个多肽、分子之间或两个核酸之间匹配的序列。当两个进行比较的序列中的位置都被相同的碱基或氨基酸单体亚单元占据(例如,如果两个DNA分子的每一个中的位置都被腺嘌呤占据,或两个多肽的每一个中的位置都被赖氨酸占据)时,各个分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目再乘以100的函数。例如,如果两个序列的10个位置中有6个匹配,那么这两个序列具有60%的同一性。例如,DNA序列CTGACT和CAGGTT共有50%的同一性(总共6个位置中有3个位置匹配)。通常,在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用,例如,通过计算机程序例如Align程序(DNAstar,Inc.)方便地进行的Needleman等人(1970)J.Mol.Biol.48:443-453的方法来提供。
“相似的”序列是当比对时共有相同和相似氨基酸残基的序列,其中相似的残基是进行比对的参照序列中的相应氨基酸残基的保守置换。在这点上,参照序列中的残基的“保守置换”是用在物理或功能上与相应的参照残基相似(例如具有相似大小、形状、电荷、化学性质,包括形成共价键或氢键的能力等)的残基进行的置换。因此,“经保守置换修饰的”序列是与参照序列或野生型序列相异在于存在一个或多个保守置换的序列。两个序列之间的“百分数相似性”是包含由两个序列共有的匹配残基或保守置换的位置数目除以进行比较的位置数目再乘以100的函数。例如,如果两个序列的10个位置中有6个匹配以及10个位置中有2个包含保守置换,那么这两个序列具有80%的正相似性。
本文中使用的“氨基酸共有序列”是指可使用至少两个,优选更多的进行比对的氨基酸序列的矩阵产生的氨基酸序列(允许在比对中出现缺口),其使得可能确定各位置上出现频率最高的氨基酸残基。共有序列是包含在各位置上出现频率最高的氨基酸的序列。如果两个或更多个氨基酸等同地出现在单个位置上,那么共有序列包括两个或所有此类氨基酸。
可在不同水平上分析蛋白质的氨基酸序列。例如,可在单个残基水平、多个残基水平、具有缺口的多个残基水平等上展示保守性或变异性。残基可展示相同残基的保守性或可在种类水平上保守。氨基酸种类的实例包括极性但不带电荷的R组(丝氨酸、苏氨酸、天冬酰胺和谷氨酰胺);带正电荷的R组(赖氨酸、精氨酸和组氨酸);带负电荷的R组(谷氨酸和天冬氨酸);疏水R组(丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、缬氨酸和酪氨酸);以及特殊氨基酸(半胱氨酸、甘氨酸和脯氨酸)。其他种类对于本领域技术人员来说是已知的并且可使用结构测定法或其他数据来定义以估量可置换性。在该意义上,可置换的氨基酸可以指可在该位置上进行置换并且保持功能保守性的任何氨基酸。
如本文中所使用的,当一个氨基酸序列(例如,第一VH或VL序列)与一个或多个另外的氨基酸序列(例如,数据库中的一个或多个VH或VL序列)比对时,可将一个序列(例如,第一VH或VL序列)中的氨基酸位置与一个或多个另外的氨基酸序列中的“相应位置”相比较。如本文中所使用的,“相应位置”表示当对序列进行最优比对时,即当序列进行比对以获得最高百分数同一性或百分数相似性时进行比较的序列中的等同位置。
如本文中所使用的,术语“抗体数据库”是指两个或更多个抗体氨基酸序列(“多个”序列)的集合,通常是指数十个、数百个或甚至数千个抗体氨基酸序列的集合。抗体数据库可存储例如抗体VH区、抗体VL区或两者的集合的氨基酸序列,或可存储由VH和VL区域组成的scFv序列的集合。优选,可将数据库存储在可检索的、固定的介质中,例如计算机上可检索的计算机程序中。在一个实施方案中,抗体数据库是包含或由种系抗体序列组成的数据库。在另一个实施方案中,抗体数据库是包含或由成熟(即,表达的)抗体序列组成的数据库(例如,成熟抗体序列的Kabat数据库,例如KBD数据库)。在另一个实施方案中,抗体数据库包含或由功能性选择的序列(例如,根据QC测定选择的序列)组成。
术语“免疫结合剂”是指分子,所述分子包含抗体的全部或部分抗原结合位置,例如重链和/或轻链可变结构域的全部或一部分,这样免疫结合剂能够特异性识别靶抗原。免疫结合剂的非限定性实例包括全长免疫球蛋白分子和scFv,以及抗体片段,包括但不限于(i)Fab片段,由VL、VH、CL和CH1结构域组成的单价片段;(ii)F(ab′)2片段,包含通过铰链区上的二硫桥连接的两个Fab片段的二价片段,(iii)Fab′片段,其基本上是具有铰链区的一部分的Fab(参见,FUNDAMENTAL IMMUNOLOGY(Paul编辑,3.sup.rd ed.1993);(iv)由VH和CH1结构域组成的Fd片段;(v)由抗体的单臂的VL和VH结构域组成的Fv片段;(vi)单结构域抗体例如Dab片段(Ward等人,(1989)Nature 341:544-546),其由VH或VL结构域组成,Camelid(参见Hamers-Casterman,等人,Nature 363:446-448(1993)和Dumoulin等人,Protein Science 11:500-515(2002))或Shark抗体(例如,shark Ig-NARs);和(vii)纳米抗体(Nanobody),包含单个可变结构域和两个恒定结构域的重链可变区。
如本文中所使用的,术语“功能性质”是例如为了提高多肽的生产性质或治疗功效,其提高(例如相对于常规多肽)对于本领域技术人员来说是期望的和/或有利的多肽(例如,免疫结合剂)的性质。在一个实施方案中,功能性质是提高的稳定性(例如,热稳定性)。在另一个实施方案中,功能性质是提高的溶解性(例如,在细胞条件下)。在另一个实施方案中,功能性质是非聚集性。在另一个实施方案中,功能性质是表达(例如,在原核细胞中)的提高。在另一个实施方案中,功能性质是在内含体纯化方法后重折叠产量的提高。在某些实施方案中,功能性质不是抗原结合亲和力的提高。
scFv的基干序列的公析
本发明提供了用于分析scFv序列的方法,其允许鉴定scFv序列中选择用于突变的氨基酸位置。选择用于突变的氨基酸位置是经预测影响scFv的功能性质例如溶解性、稳定性和/或抗原结合的氨基酸位置,其中预测该位置上的突变提高scFv的性能。因此,本发明允许对scFv进行比简单随机突变scFv序列中的氨基酸位置更集中的改造以优化性能。
在图1的流程图中示意性地图解了scFv序列的基于序列的分析的某些方面。如该图中所示的,将要优化的scFv序列与一个或多个抗体数据库(包括由因稳定和可溶而被选择的scFv序列组成的抗体数据库)中的序列相比较。这可允许鉴定特别地scFv形式中对于稳定性和/或溶解性至关重要的残基,以及鉴定特别地在scFv形式(例如,VL和VH的组合)中显示不依赖于各自CDR的稳定性、溶解性和/或结合的提高的模式。在鉴定了至关重要的残基后,它们就可用例如在各自数据库中鉴定的出现频率最高的适当的氨基酸进行置换,和/或通过随机或偏好性诱变进行置换。
因此,在一个方面,本发明涉及鉴定单链抗体(scFv)中用于突变的氨基酸位置的方法,所述scFv具有VH和VL氨基酸序列,该方法包括:
a)将scFv VH、VL或VH和VL氨基酸序列输入包含许多抗体VH、VL或VH和VL氨基酸序列的数据库,以使scFv VH、VL或VH和VL氨基酸序列与数据库的抗体VH、VL或VH和VL氨基酸序列比对;
b)将scFv VH或VL氨基酸序列中的氨基酸位置与数据库的抗体VH或VL氨基酸序列中的相应位置相比较;
c)确定scFv VH或VL氨基酸序列中的氨基酸位置是否被在数据库的抗体VH或VL氨基酸序列中的相应位置上保守的氨基酸残基占据;和
d)当氨基酸位置被在数据库的抗体VH或VL氨基酸序列中的相应位置上不保守的氨基酸残基占据时,将scFv VH或VL氨基酸序列中的氨基酸位置鉴定为用于突变的氨基酸位置。
因此,在本发明的方法中,将目的scFv的序列(即,VH、VL或两者的序列)与抗体数据库的序列相比较,然后确定目的scFv中的氨基酸位置是否被在数据库中的序列的相应位置上“保守的”氨基酸残基占据。如果scFv序列的氨基酸位置被在数据库的序列中的相应位置上不“保守的”氨基酸残基占据,则scFv的该氨基酸位置选择用于突变。优选,被分析的氨基酸位置是目的scFv中的构架氨基酸位置。更优选,可分析目的scFv中的每一个构架氨基酸位置。在备选的实施方案中,可分析目的scFv的一个或多个CDR中的一个或多个氨基酸位置。在另外的实施方案中,可分析目的scFv中的各氨基酸位置。
为了确定氨基酸残基在抗体数据库的序列中的特定氨基酸位置(例如,构架位置)上是否“保守”,可计算在特定位置上的保守程度。存在许多不同的本领域内已知的可定量给定的位置上的氨基酸多样性的方法,其全都可用于本发明的方法。优选,使用辛普森多样性指数计算保守程度,该指数是多样性的量度。其考虑到存在于各位置上的氨基酸的数目,以及各氨基酸的相对丰度(abundance)。辛普森指数(S.I.)代表两个随机选择的抗体序列在某些位置包含相同的氨基酸的概率。当测量保守性时,辛普森指数考虑了两个主要因素,丰富度(richness)和均匀度(evenness)。如本文中所使用的,“丰富度”是存在于特定位置上的氨基酸的不同种类的数目的量度(即,数据库中在该位置上显示的不同氨基酸残基的数目是丰富度的量度)。如本文中所使用的,“均匀度”是存在于特定位置上的氨基酸中的每一个的丰度的量度(即,数据库的序列中氨基酸残基在该位置上发生的频率是均匀度的量度)。
虽然残基丰富度独自可用作检查特定位置上的保守程度的量度,但其没有考虑存在于某些位置上的各氨基酸残基的相对频率。其对在数据库的序列中的特定位置上极少发生的氨基酸残基与对在相同位置以极高的频率发生的残基给予同样的权重。均匀度是组成位置的丰富度的不同氨基酸的相对丰度的量度。辛普森指数将两者(丰富度和均匀度)都考虑到了,从而是按照本发明定量保守程度的优选方法。特别地,在非常保守的位置上的低频率残基被认为是潜在有问题的,从而其可选择用于突变。
辛普森指数的公式为D=∑ni(ni-1)/N(N-1),其中N是调查的序列(例如,在数据库中)的总数,ni是各氨基酸残基在被分析的位置上的频率。氨基酸事件(i)在数据库中的频率是氨基酸在数据库中发生的次数(ni)。计数ni本身以相对频率给出,其表示它们按照事件的总数进行了标准化。当最大多样性发生时,S.I.值是0,当最小多样性发生时,S.I.值是1。因此S.I.的范围是0至1,多样性和指数值呈负相关。
在图2中更详细地描述了概述用于分析数据库的序列中的构架氨基酸位置的多个步骤的流程图。
因此,在上述方法的优选实施方案中,使用辛普森指数给数据库的抗体VH或VL氨基酸序列中的相应位置的保守程度赋值。该相应位置的S.I.值可用作该位置的保守性的指标。
在其他实施方案中,将密切相关的抗体序列的可信比对(trustedalignment)(即,考虑蛋白质结构相似性的序列比对),用于本发明以产生氨基酸的相对丰度和确定的位置的保守程度的矩阵。这些矩阵经设计用于抗体-抗体数据库比较。计算各残基的观察到的频率,并且将其与预期的频率(其基本上是数据集中各残基对于各位置的频率)相比较。
使用所述方法对给定的scFv抗体进行的分析提供了关于给定的scFv抗体中的某些位置上的生物学上允许的突变和罕见残基的信息,以及允许预测其构架中的潜在弱点。可将常规技术用于对“最佳”拟合一组氨基酸-频率数据的氨基酸置换进行工程设计(使用S.I.值和相对频率作为标准)。
上述基于序列的分析可用于scFv的VH区域,scFv的VL区域或两者。因此,在一个实施方案中,将scFv VH氨基酸序列输入数据库并且与数据库的抗体VH氨基酸序列比对。在另一个实施方案中,将scFv VL氨基酸序列输入数据库并且与数据库的抗体VL氨基酸序列比对。在另一个实施方案中,将scFv VH和VL氨基酸序列输入数据库并且与数据库的抗体VH和VL氨基酸序列比对。用于将一个序列与数据库中的其他序列的集合进行比对的算法在本领域内已良好地建立。将序列进行比对以获得序列之间的最高百分数同一性或相似性。
本发明的方法可用于分析scFv序列中的一个目的氨基酸位置或更优选,可用于分析多个目的氨基酸位置。因此,在上述方法的步骤b)中,可将scFv VH或VL氨基酸序列中的多个氨基酸位置与数据库的抗体VH或VL氨基酸序列中的相应位置相比较。要分析的优选位置是scFv的VH和/或VL序列中的构架位置(例如,可分析各VH和VL构架位置)。另外或备选地,可分析scFv的一个或多个CDR中的一个或多个位置(虽然突变CDR中的氨基酸位置可能不是优选的,因为CDR中的突变比构架区中的突变更可能影响抗原结合活性)。此外,本发明的方法允许分析scFv VH、VL或VH和VL氨基酸序列中的各氨基酸位置。
在本发明的方法中,可将目的scFv的序列与多种不同类型的抗体序列数据库的一种或多种中的序列相比较。例如,在一个实施方案中,数据库的抗体VH、VL或VH和VL氨基酸序列是种系抗体VH、VL或VH和VL氨基酸序列。在另一个实施方案中,数据库的抗体VH、VL或VH和VL氨基酸序列是重排的亲和力成熟的抗体VH、VL或VH和VL氨基酸序列。在另一个优选实施方案中,数据库的抗体VH、VL或VH和VL氨基酸序列是因具有至少一种期望的功能性质例如scFv稳定性或scFv溶解性而被选择(下面进一步论述的)的scFv抗体VH、VL或VH和VL氨基酸序列。
可从种系序列的序列比对或从天然发生的任何其他抗体序列获得、汇编和/或产生抗体序列信息。序列的来源可包括但不限于一种或多种下列数据库:
·Kabat数据库(.immuno.bme.nwu.Edu(到2007年10月为止);Johnson和Wu(2001)Nucleic Acids Res.29:205-206;Johnson和Wu(2000)Nucleic Acids Res.28:214-218)。来自2000年的原始数据可通过在美国的FTP和在英国的镜像获得。
·Kabatman包含允许用户就序列的罕见特征检索Kabat序列和使用户能够发现对于特定抗体序列中的CDR的正则分配(canonicalassignment)的数据库。
·AAAAA网站(www.bioc.unizh.ch/antibody/(到2007年10月为止)),由Annemarie Honegger制作的提供关于抗体的序列信息和结构数据的抗体网页。
·ABG:抗体的3D结构的目录(directory)-由Antibody Group(ABG)产生的目录允许用户访问汇编在Protein Data Bank(PDB)中的抗体结构。在该目录中,各PDB条目(entry)具有至原始来源的超链接,从而使重新获得全部信息变得容易。
·ABG:小鼠VH和VK种系区段的种系基因目录,在Instituto deBiotecnologia,UNAM(National University of Mexico)的AntibodyGroup的网页的一部分。
·,国际免疫遗传学信息系统(internationalImMunoGeneTics information)-由Marie-Paule Lefranc(UniversitéMontpellier II,CNRS)于1989年创建,IMGT是专门于人和其他脊椎动物物种的免疫系统的免疫球蛋白、T细胞受体和相关蛋白质的集成知识资源。IMGT由序列数据库(IMGT/LIGM-DB,来自人和其他脊椎动物的IG和TR的综合数据库,具有完全注释的序列的翻译,IMGT/MHC-DB,IMGT/PRIMER-DB)、基因组数据库(IMGT/GENE-DB)、结构数据库(IMGT/3Dstructure-DB)、网络资源(IMGT Repertoire)组成(IMGT,the international ImMunoGeneTicsinformation;imgt.cines.fr(到2007年10月为止);Lefranc等人(1999)Nucleic Acids Res.27:209-212;Ruiz等人(2000)NucleicAcids Res.28:219-221;Lefranc等人(2001)Nucleic Acids Res.29:207-209;Lefranc等人(2003)Nucleic Acids Res.31:307-310)。
·V BASE-从一千多个公开序列(包括目前从Genbank和EMBL数据库释放的序列)汇编的所有人种系可变区序列的综合目录。
在优选实施方案中,从scFv文库获得抗体序列信息,所述scFv文库具有已在还原性环境中就增强的稳定性和溶解性进行选择的确定的构架。更特别地,已描述了允许细胞内选择在还原性环境中具有增强的稳定性和溶解性的scFv构架的酵母质量控制(QC)-系统(参见例如,PCT公开号WO 2001/48017;美国申请号2001/0024831和US2003/0096306;美国专利7,258,985和7,258,986)。在该系统中,将scFv文库转化入能够表达特定的已知抗原并且只在抗原-scFv相互作用存在的情况下存活的宿主细胞。在适合抗原和scFv表达且只允许细胞在抗原-scFv相互作用存在的情况下存活的条件下培养转化的宿主细胞。因此,可分离在存活的细胞中表达的并且具有在还原性环境中是稳定的和可溶的确定的构架的scFv。因此,QC-系统可用于筛选大scFv文库,从而分离具有在还原性环境中是稳定的和可溶的构架的优选scFv,并且可将这些选择的scFv的序列汇编入scFv序列数据库。然后可使用本发明的方法将这样的scFv数据库用于与其他目的scFv序列的比较目的。在PCT公开号WO 2003/097697和美国申请号20060035320中更详细地描述了之前使用QC系统选择和确定的优选scFv构架序列。
原始QC-系统的变型在本领域内是已知的。在一个示例性实施方案中(在图3中对其进行了示意性举例说明),使scFv文库与Gal4酵母转录因子的激活结构域(activation domain)(AD)融合,所述激活结构域又融合至所谓的Gal11p蛋白(11p)的一部分。然后将scFv-AD-Gal11p融合构建体转化入表达Gal 4的前100个氨基酸,从而包含Gal4的DNA结合结构域(DBD;Gal4(1-100))的宿主细胞。Gal11p是已知直接结合Gal4(1-100)的点突变(参见Barberis等人,Cell,81:359(1995))。在这样的条件下培养转化的宿主细胞,所述条件适合于scFv融合蛋白表达并且只允许细胞在scFv融合蛋白足够稳定和可溶以与Gal4(1-100)相互作用,从而形成包含连接至DBD的AD的功能转录因子(图3A)的情况下存活。因此,可分离在存活的细胞中表达的且具有在还原性环境中是稳定的和可溶的确定的构架的scFv。该示例性QC系统进一步描述于Auf der Maur等人,Methods,34:215-224(2004)中。
在另一个示例性实施方案中,用于本发明的方法的QC-系统描述于图4中。在QC-系统的该形式中,将scFv或scFv文库直接融合至功能转录因子并且在包含选择标记的酵母株系中表达。选择标记将只在功能性scFv-转录因子融合物存在的情况下被激活,这表明作为整体的构建体需要是稳定的且可溶的(图4A)。在scFv不稳定的情况下,其将形成聚集体并且最终被降解,从而也引起融合至其的转录因子降解,这样其不再能够激活选择标记的表达(参见图4B)。
在本发明的方法中,可将目的scFv的序列与抗体数据库中的所有序列相比较,或备选地只将数据库中序列的选择部分用于比较目的。即,可将数据库只限定或限制于与目的scFv具有高百分数相似性或同一性的序列。因此,在本发明的方法的一个实施方案中,数据库是其中只有与scFv抗体VH、VL或VH和VL氨基酸序列具有高度相似性的抗体VH、VL或VH和VL氨基酸序列才被包括在数据库中的受限制的数据库。
在将目的scFv序列输入数据库并且将其与数据库中的抗体序列相比较后,分析序列信息以提供关于给定的位置的氨基酸的频率和变异性的信息和预测潜在有问题的氨基酸位置,特别地scFv的构架中潜在有问题的氨基酸位置。这样的信息还可用于设计提高scFv的性质的突变。例如,可通过用在该位置上频繁出现的亲水残基置换暴露于溶剂的疏水残基来提高抗体溶解性。
在本发明的方法中,存在许多可能类型的氨基酸残基,所述氨基酸残基在数据库的抗体序列中的特定位置上可以是“保守的”。例如,一个特定的氨基酸残基,可在该位置上以极高的频率被发现,表明该特定氨基酸残基在该特定位置上是优选的。因此,在该方法的一个实施方案中,在步骤c)中,在数据库的抗体VH或VL氨基酸序列中的相应位置上保守的氨基酸残基是这样的氨基酸残基,该氨基酸残基在数据库的抗体VH或VL氨基酸序列中的该位置上出现频率最高。在其他实施方案中,位置可以对于特定类型或种类的氨基酸残基(即,位置不是仅被单个特定氨基酸残基优先占据,而是被其各自为相同类型或种类的残基的几个不同氨基酸残基优先占据)是“保守的”。例如,在步骤c)中,数据库的抗体VH或VL氨基酸序列中的相应位置可对于:(i)疏水氨基酸残基、(ii)亲水氨基酸残基、(iii)能够形成氢键的氨基酸残基或(iv)具有形成β-折叠的倾向的氨基酸残基是保守的。
在方法的步骤d)中,当氨基酸位置被在数据库的抗体VH或VL氨基酸序列中的相应位置上不保守的氨基酸残基占据时,将scFv VH或VL氨基酸序列中的氨基酸位置鉴定为用于突变的氨基酸位置。存在许多可能的情况,其中将氨基酸位置鉴定为被“不保守”的氨基酸残基占据,从而将其鉴定为潜在有问题的。例如,如果数据库中的相应氨基酸位置对于疏水残基是保守的并且scFv中的位置被亲水残基占据,那么该位置在scFv中可能是潜在有问题的并且该位置可选择用于突变。同样,如果数据库中相应的氨基酸位置对于亲水残基是保守的并且scFv中的位置被疏水残基占据,那么该位置在scFv中可能是潜在有问题的,并且可选择该位置用于突变。在其他情况下,如果数据库中的相应氨基酸位置对于能够形成氢键或具有形成β-折叠的倾向的氨基酸残基是保守的,并且scFv中的位置分别被不能形成氢键或不具有形成β-折叠的倾向的残基占据,那么该位置在scFv中可能是潜在有问题的并且可选择该位置用于突变。
在优选实施方案中,可单独或组合地使用本发明中描述的方法以产生组合的氨基酸置换从而提高抗体单链片段的稳定性和/或溶解性。
协方差分析
本发明还涉及用于分析与数据库中的抗体序列相比scFv的序列中的协方差(covariance)的方法。共变的残基可以是例如,(i)构架区(FR)中的残基和CDR中的残基;(ii)一个CDR中的残基和另一个CDR中的残基;或(iii)VH中的残基和VL结构域中的残基。在抗体的三级结构中彼此相互作用的残基可共变,这样优选氨基酸残基可在共变对的两个位置上都是保守的,并且如果一个残基改变,则另一个残基也必须发生改变以维持抗体结构。用于对一组氨基酸序列进行协方差分析的方法在本领域内是已知的。例如,Choulier,L.等人(2000)Protein 41:475-484描述了将协方差分析用于人和小鼠种系Vκ和VH序列的比对。
可将协方差分析与用于分析保守氨基酸位置(上述方法中的步骤a)-d))的上述方法组合,这样该方法还可包括步骤
e)对数据库的抗体VH或VL氨基酸序列进行协方差分析以鉴定氨基酸位置的共变对;
f)将氨基酸位置的共变对与scFvVH或VL氨基酸序列中的相应位置相比较;
g)确定scFv VH或VL氨基酸序列中的相应位置是否被在数据库的抗体VH或VL氨基酸序列中的氨基酸位置的共变对上保守的氨基酸残基占据;和
h)当scFv中的相应位置中的一个或两个位置被在数据库的抗体VH或VL氨基酸序列中的氨基酸位置的共变对上不保守的氨基酸残基占据时,将scFv VH或VL氨基酸序列中的相应位置中的一个或两个位置鉴定为用于突变的氨基酸位置。
另外地或备选地,可独立地进行协方差分析,这样本发明提供了包括下列步骤的方法:
a)对数据库的抗体VH或VL氨基酸序列进行协方差分析以鉴定氨基酸位置的共变对;
b)将氨基酸位置的共变对与scFv VH或VL氨基酸序列中的相应位置比较;
c)确定scFv VH或VL氨基酸序列中的相应位置是否被在数据库的抗体VH或VL氨基酸序列中的氨基酸位置的共变对上保守的氨基酸残基占据;和
d)当scFv中的相应位置中的一个或两个位置被在数据库的抗体VH或VL氨基酸序列中的氨基酸位置的共变对上不保守的氨基酸残基占据时,将scFv VH或VL氨基酸序列中的相应位置中的一个或两个位置鉴定为用于突变的氨基酸位置。
本发明的协方差分析方法可用于分析一个共变对或多于一个共变对。因此,在本发明的一个实施方案中,鉴定了数据库的抗体VH或VL氨基酸序列中的多个氨基酸位置共变对,并且将其与scFv VH或VL氨基酸序列中的相应位置相比较。
该方法还可包括突变scFv中的被氨基酸残基(所述氨基酸残基在数据库的抗体VH或VL氨基酸序列中的氨基酸位置的共变对上是不保守的)占据的相应位置中的一个或两个位置。在一个实施方案中,用在共变对氨基酸位置上出现频率最高的氨基酸残基置换scFv中的被氨基酸残基(所述氨基酸残基在氨基酸位置的共变对上是不保守的)占据的相应位置中的一个位置。在另一个实施方案中,用在共变对氨基酸位置上出现频率最高的氨基酸残基置换scFv中的被氨基酸残基(所述氨基酸残基在氨基酸位置的共变对上是不保守的)占据的相应位置中的两个位置。
分子建模
可将用于就潜在有问题的残基分析scFv的本发明的基于序列的方法与本领域内已知的用于分析抗体结构/功能关系的其他方法组合。例如,在优选实施方案中,可将本发明的基于序列的分析方法与分子建模组合起来,鉴定另外的潜在有问题的残基。用于抗体结构包括scFv结构的计算机建模的方法和软件已在本领域中建立并且可与本发明的基于序列的方法组合。因此,在另一个实施方案中,步骤a)-d)中所示的上述基于序列的方法还包括步骤:
e)将scFv VH、VL或VH和VL氨基酸序列经历分子建模;和
f)在scFv VH、VL或VH和VL氨基酸序列中鉴定至少一个用于突变的另外的氨基酸位置。
该方法还可包括突变scFv VH、VL或VH和VL氨基酸序列中的通过分子建模鉴定用于突变的该至少一个另外的氨基酸位置。
“功能共有区”对“常规共有区(conventional consensus)”分析
在特别优选的实施方案中,在第一抗体序列数据库(例如,种系数据库(例如,Vbase和/或IMGT)或成熟抗体数据库(例如,KBD))与因具有一个或多个期望的性质而被选择的scFv的第二数据库(例如通过酵母中的QC筛选选择的scFv的数据库,即QC数据库)之间比较一个或多个构架位置上的变异性程度。如图5中所举例说明的,可将变异性值(例如,辛普森指数值)分配给第一(例如,种系)数据库中的构架位置,在图5中称为“G”值,和可将变异性值(例如,辛普森指数值)分配给第二数据库(例如,QC数据库)中的相应构架位置,在图5中称为“Q”值。当特定位置的G值大于Q值(即,在该位置种系序列的变异性比选择的scFv序列的变异性更大)时,表明在该位置上存在有限数目的稳定的scFv构架氨基酸残基,该稳定的scFv构架氨基酸残基可适合于与任何CDR一起使用。备选地,当特定位置的G值比Q值小(即,在该位置上选择的scFv序列的变异性比种系序列中的变异性更大)时,表明该特定位置在scFv中更耐受变异性,从而可代表在其上的氨基酸置换可优化scFv的稳定性和/或溶解性的位置。表A提供了在其上G大于Q或G小于Q的高可变构架残基(hvFR)和氨基酸位置的数目的一览表。如表A中所指出的,氨基酸总数目(Aa#)和高可变构架残基(hvFR)中的变异性在种系和QC-FW之间显著增加。进行分析以产生表A的序列是使用QC测定法选择的约90个scFv序列(如WO03097697中所述;本文称为“Q”)和在2007年10月从http://www.bioc.unizh.ch/antibody/Sequences/index.html处检索到的所有种系VH和VL序列(本文称为“G”)。对于表A的分析,VH和VL结构域未根据其亚型进行分组。
表A:一览表
|
|
Aa# |
G<Q(事件的#) |
G>Q(事件的#) |
X/Y |
#hvFR(辛普森<0.4) |
G<Q(事件的#) |
G>Q(事件的#) |
X/Y |
|
VL |
108 |
61 |
11 |
5.5 |
16 |
13 |
3 |
4.3 |
|
VH |
116 |
50 |
18 |
2.8 |
27 |
22 |
5 |
4.4 |
考虑到上述内容,在另一个方面,本发明提供了鉴定单链抗体(scFv)中的一个或多个用于突变的构架氨基酸位置的方法,所述scFv具有VH和VL氨基酸序列,该方法包括:
a)提供VH、VL或VH和VL氨基酸序列(例如,种系和/或成熟抗体序列)的第一数据库;
b)提供因具有至少一个期望的功能性质而被选择的scFv抗体VH、VL或VH和VL氨基酸序列的第二数据库;
c)测定第一数据库的各构架位置和第二数据库的各构架位置上的氨基酸变异性;
d)鉴定在其上氨基酸变异性程度在第一数据库和第二数据库之间不同的一个或多个构架位置,从而鉴定单链抗体(scFv)中用于突变的一个或多个构架氨基酸位置。
优选地,各构架位置上的氨基酸变异性通过使用辛普森指数给保守程度赋值来测定。在一个实施方案中,基于与第一数据库相比,在第二(scFv)数据库中具有更低的辛普森指数值的一个或多个构架氨基酸位置,鉴定用于突变的一个或多个构架氨基酸位置。在另一个实施方案中,基于与第一数据库相比,在第二数据库中具有更高的辛普森指数值的一个或多个构架氨基酸位置,鉴定用于突变的一个或多个构架氨基酸位置。
在下面的实施例2和3中更详细地描述了对于三个人VH家族和三个人VL家族的变异性分析和用于突变的残基的鉴定。
富集/排除分析
在另一个方面,本发明提供了用于在免疫结合剂中目的构架位置上选择优选氨基酸残基置换(或备选地,排除特定氨基酸置换)(例如,以提高功能性质例如稳定性和/或溶解性)的方法。本发明的方法将第一抗体序列数据库(例如,种系数据库例如Vbase和/或IMGT,或更优选,成熟抗体数据库例如Kabat数据库(KBD))中的目的构架位置上的氨基酸残基的频率与因具有一个或多个期望的性质而被选择的scFv的第二数据库(例如通过酵母中的QC筛选选择的scFv数据库,例如QC数据库)中相应氨基酸位置上的氨基酸残基的频率相比较。
如下面实施例4中详细描述的,可按照它们的Kabat家族亚型(例如,Vh1b、VH3等)将来自第一数据库(例如,成熟抗体序列的数据库)的抗体序列(例如,VH或VL序列)分组。在各序列亚型(即,亚家族)中,各氨基酸残基(例如,A、V等)在各氨基酸位置上的频率测定为该亚型所有被分析的序列的百分数。对第二数据库(例如,因具有一个或多个期望的性质而被选择的,例如通过QC筛选选择的scFv的数据库)的所有序列进行同样的测定。对于各亚型,在第一和第二数据库之间比较所得的各氨基酸残基在特定位置上的百分数(相对频率)。当某个氨基酸残基的相对频率相对于第一数据库(例如,Kabat数据库)在第二数据库(例如,QC数据库)中增加时,表示各自的残基被有利地选择(即,“富集的残基”)并且为序列提供有利的性质。相反地,当氨基酸残基的相对频率与第一数据库相比在第二数据库中减少时,表明各自的残基是不利的(即,“被排除的残基”)。因此,富集的残基对于提高免疫结合剂的功能性质(例如,稳定性和/或溶解性)是优选残基,然而优选避开被排除的残基。
鉴于前述内容,在一个实施方案中,本发明提供了鉴定用于免疫结合剂中的置换的优选氨基酸残基的方法,其包括:
a)提供已分组的VH或VL氨基酸序列(例如,按照Kabat家族亚型分组的种系和/或成熟抗体序列)的第一数据库;
b)提供已分组的因具有至少一个期望的功能性质而被选择(例如,根据QC测定)的scFv抗体VH或VL氨基酸序列的第二数据库;
c)测定在第一数据库的构架位置和第二数据库的相应的构架位置上的氨基酸残基的氨基酸频率;
d)当氨基酸残基相对于第一数据库在第二数据库中以更高的频率发生(即,富集的残基)时,将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的优选氨基酸残基。
可定量第二(scFv)数据库(例如,QC数据库)中氨基酸残基的富集度(enrichment)。例如,可测定第二数据库中残基的相对频率(RF2)与第一数据库中残基的相对频率(RF1)之间的比率。该比率(RF2:RF1)可称为“富集因子”(EF)。因此,在某些实施方案中,如果第一和第二数据库之间氨基酸残基的相对频率的比率(在本文中,“富集因子”)是至少1(例如,1、2、3、4、5、6、7、8、9或10),那么鉴定了步骤(d)中的氨基酸残基。在优选实施方案中,富集因子大于大约1.0(例如1.0、1.1、1.2、1.3、1.4或1.5)。在另一个优选实施方案中,富集因子是大约4.0至大约6.0(例如,4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9或6.0)。在另一个实施方案中,富集因子是大约6.0至大约8.0(例如,6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.3、7.4、7.5、7.6、7.7、7.8、7.9或8.0)。在其他实施方案中,富集因子大于10(例如,10、100、1000、104、105、106、107、108、109或更大)。在其他实施方案中,可以达到无限大的富集因子。
在另一个实施方案中,本发明提供了鉴定在特定位置处待从免疫结合剂中排除的氨基酸残基的方法,该方法包括:
a)提供已分组的VH或VL氨基酸序列(例如,按照Kabat家族亚型分组的种系和/或成熟抗体序列)的第一数据库;
b)提供已分组的因具有至少一个期望的功能性质而被选择(例如,根据QC测定)的scFv抗体VH或VL氨基酸序列的第二数据库;
c)测定在第一数据库的构架位置和第二数据库的相应的构架位置上的氨基酸残基的氨基酸频率;
d)当氨基酸残基相对于第一数据库在第二数据库中以更低的频率发生时,将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的不利氨基酸残基,其中所述氨基酸残基的类型是不利的氨基酸残基(即,被排除的残基)。在某些优选实施方案中,如果富集因子(EF)小于1,则鉴定了步骤(d)(同上)中的不利氨基酸残基。
scFv的突变
在本发明的方法中,当scFv中的一个或多个氨基酸位置已鉴定为对于scFv的功能性质是潜在有问题的时候,所述方法还可包括突变scFv VH或VL氨基酸序列中的此类一个或多个氨基酸位置。例如,经鉴定用于突变的氨基酸位置可用在数据库的抗体VH或VL氨基酸序列中的相应位置上保守或富集的氨基酸残基进行置换。
可使用在本领域中良好建立的几种可能的诱变方法之一突变经鉴定用于突变的氨基酸位置。例如,定点诱变可用于在目的氨基酸位置上进行特定的氨基酸置换。定点诱变还可用于产生一组突变的scFv,其中在目的氨基酸位置上导入了有限的氨基酸置换库集(repertoire)。
另外或备选地,可通过随机诱变或通过偏好性诱变突变经鉴定用于突变的氨基酸位置,从而产生突变的scFv文库,然后筛选突变的scFv的文库并选择scFv,优选选择具有至少一个提高的功能性质的scFv。在优选实施方案中,使用酵母质量控制-系统(QC-系统)(在上面更详细地描述的)筛选文库,该系统允许选择在还原性环境中具有增强的稳定性和/或溶解性的scFv构架。
用于筛选scFv文库的其他适当的选择技术已在本领域内进行了描述,包括但不限于展示技术例如噬菌体展示、核糖体展示和酵母展示(Jung等人(1999)J.Mol.Biol. 294:163-180;Wu等人(1999)J.Mol.Biol. 294:151-162;Schier等人(1996)J.Mol.Biol.255:28-43)。
在一个实施方案中,经鉴定用于突变的氨基酸位置用在数据库的抗体VH或VL氨基酸序列中的相应位置上最显著富集的氨基酸残基置换。在另一个实施方案中,数据库的抗体VH或VL氨基酸序列中的相应位置对于疏水氨基酸残基是保守的,并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体VH或VL氨基酸序列中的相应位置上最显著富集的疏水氨基酸残基进行置换。在另一个实施方案中,数据库的抗体VH或VL氨基酸序列中的相应位置对于亲水氨基酸残基是保守的,并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体VH或VL氨基酸序列中的相应位置上最显著富集的亲水氨基酸残基进行置换。在另一个实施方案中,数据库的抗体VH或VL氨基酸序列中的相应位置对于能够形成氢键的氨基酸残基是保守的,并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体VH或VL氨基酸序列中的相应位置上最显著富集的能够形成氢键的氨基酸残基进行置换。在另一个实施方案中,数据库的抗体VH或VL氨基酸序列中的相应位置对于具有形成β-折叠的倾向的氨基酸残基是保守的,并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体VH或VL氨基酸序列中的相应位置上最显著富集的具有形成β-折叠的倾向的氨基酸残基进行置换。
在一个实施方案中,选择使总自由能最小化的最佳置换作为在目的氨基酸位置上进行的突变。使总自由能最小化的最佳置换可使用玻尔兹曼定律(Boltzmann′s Law)来确定。玻尔兹曼定律的公式是ΔΔGth=RTln(f亲本/f共有区)。
潜在的稳定性突变的作用可通过检查例如局部和非局部相互作用、规范残基(canonical residue)、界面、暴露程度和β转角倾向来进一步确定。本领域内已知的分子建模方法可以用于例如进一步检查潜在的稳定性突变的作用。如果考虑一组可能的置换,则分子建模法还可用于选择“最适”氨基酸置换。
取决于特定氨基酸位置,可以进行进一步分析。例如,残基可参与重链和轻链之间的相互作用或可通过盐桥或氢键与其他残基相互作用。在这些情况下,可能需要特别的分析。在本发明的另一个实施方案中,可将对于稳定性潜在有问题的残基改变成与其在共变对中的配对物(counterpart)相容的残基。备选地,可对配对残基进行突变以与最初鉴定为有问题的氨基酸相容。
溶解性的优化
scFv抗体中对于溶解性潜在有问题的残基包括在scFv中暴露于溶剂但在全长抗体的背景中将包埋在可变和恒定结构域之间的界面处的疏水氨基酸。在经改造的缺乏恒定结构域的scFv中,参与可变结构域和恒定结构域之间的相互作用的疏水残基变成暴露于溶剂(参见例如,Nieba等人(1997)Protein Eng.10:435-44)。scFv表面上的此类残基倾向于引起聚集,从而引起溶解性问题。
已描述了替换scFv抗体上的暴露于溶剂的疏水氨基酸的许多策略。正如本领域技术人员所熟知的,在某些位置修饰残基会影响抗体的生物物理性质如稳定性、溶解性和亲和力。在许多情况下,这些性质是相关的,这表示一个单个氨基酸的改变可影响上面提及的性质中的若干性质。因此,以非保守方式突变暴露于溶剂的疏水残基可导致减少的稳定性和/或对其抗原的亲和力的丧失。
其他方法意欲通过详尽使用蛋白质展示技术和/或筛选努力来解决溶解性问题。然而,此类方法太耗时,通常不能产生可溶性蛋白质或导致更低的稳定性或抗体亲和力的减小。在本发明中,公开了使用基于序列的分析设计将暴露于溶剂的疏水残基突变成具有更高的亲水性的残基的突变的方法。可通过选择在确定的位置上出现频率最高的亲水氨基酸来替换潜在有问题的残基。如果发现残基与抗体中任何其他残基相互作用,那么潜在有问题的残基可不突变成出现频率最高的残基而是突变成与共变对的第二氨基酸相容的残基。备选地,还可突变共变对的第二氨基酸以恢复氨基酸的组合。此外,可将序列之间的相似性的百分数考虑进来以帮助发现两个相关氨基酸的最优组合。
使用几个方法(包括但不限于基于溶剂暴露、实验信息和序列信息的方法以及分子建模)来鉴定scFv表面上的疏水氨基酸。
在本发明的一个实施方案中,通过用数据库中存在于这些位置上的出现频率最高的亲水残基置换暴露于scFv抗体表面上的疏水残基来提高溶解性。该原理基于频繁发生的残基可能是没问题的事实。如本领域技术人员所认识到的,保守置换通常在破坏分子的稳定性中具有较小的影响,而非保守置换可能对scFv的功能性质是有害的。
有时抗体表面上的疏水残基可参与重链和轻链之间的相互作用或可通过盐桥或氢键与其他残基相互作用。在这些情况下,可能需要特别的分析。在本发明的另一个实施方案中,对于溶解性潜在有问题的残基可以不突变成频率最高的残基而是突变成与共变对相容的残基,或可进行第二突变来恢复共变氨基酸的组合。
可使用另外的方法来设计暴露于溶剂的疏水位置上的突变。在本发明的另一个实施方案中,公开了采用将数据库限制于显示与待修饰的scFv的最高相似性的序列的方法(上文更详细论述的)。通过使用这样的受限制的参照数据库,设计突变以使其与要优化的抗体的特定序列背景最相适。在该情况下,当与更大量的序列(即,不受限制的数据库)比较时,所选择的亲水残基实际上在其各自的位置上可能不具有良好的代表性。
稳定性的优化
单链抗体片段包含共价连接轻链和重链可变结构域的肽接头。虽然这样的接头有效地避免使可变结构域破裂,从而使scFv优于Fv片段,但与Fab片段或全长抗体(在这两者中VH和VL仅通过恒定结构域间接连接)相比,scFv片段仍然更易于去折叠和聚集。
scFv中另一个常见问题是scFv表面上疏水残基的暴露,这导致分子间聚集。此外,有时在亲和力成熟过程中获得的体细胞突变将亲水残基置于β-折叠的核心内。此类突变在IgG形式中或甚至Fab片段中可被良好耐受,但在scFv中,这很明显引起去稳定和随后的去折叠。
已知的引起scFv去稳定的因素包括:scFv抗体表面上暴露于溶剂的疏水残基;埋藏在蛋白质核心内的罕见亲水残基以及存在于重链和轻链之间的疏水界面中的亲水残基。此外,核心中的非极性残基之间的范德瓦尔斯嵌合作用(van der Waals packing interaction)已知在蛋白质的稳定性中起着重要作用(Monsellier E.和Bedouelle H.(2006)J.Mol.Biol.362:580-93,Tan等人(1998)Biophys.J.75:1473-82;A.和Plückthun A.(1998)Biochemistry 37:13120-7)。
因此,在一个实施方案中,为了增加scFv抗体的稳定性,鉴定了在非常保守的位置上的罕见和/或不利的氨基酸并且将其突变成在这些保守位置上更常见的氨基酸。此类罕见和/或不利的氨基酸包括:(i)scFv抗体表面上的暴露于溶剂的疏水残基;(ii)埋藏在蛋白质的核心中的罕见亲水残基;(iii)存在于重链和轻链之间的疏水界面中的亲水残基;和(iv)通过立体阻碍干扰VH/VL界面VH/VL的残基。
因此,在本发明的一个实施方案中,稳定性的增加可通过用在这些位置上出现频率最高的氨基酸置换在它们的位置上不具代表性的氨基酸来获得。出现频率通常提供了生物学接受性的指标。
残基可参与重链和轻链之间的相互作用或可通过盐桥、氢键或二硫键与其他残基相互作用。在这些情况下,可能需要特别的分析。在本发明的另一个实施方案中,可将对于稳定性潜在有问题的残基改变成与其共变对中的配对残基相容的残基。备选地,可突变配对残基以使之与最初鉴定为有问题的氨基酸相容。
可使用另外的方法设计提高稳定性的突变。在本发明的另一个实施方案中,公开了采用将数据库限制于显示与待修饰的scFv的最高相似性的序列的方法(上文更详细论述的)。通过使用这样的受限制的参照数据库,设计突变以使其与要优化的抗体的特定序列背景最相适。突变使用存在于所选择的数据库序列亚组中的出现频率最高的氨基酸。在该情况下,当与更大量的序列(即,不受限制的数据库)比较时,所选择的残基实际上可能在其各自的位置上不具有良好的代表性。
scFv组合物和制剂
本发明的另一个方面涉及按照本发明的方法制备的scFv组合物。因此,本发明提供了经改造的scFv组合物,其中与原始的目的scFv相比,已将一个或多个突变导入氨基酸序列,其中突变已被导入经预测影响一个或多个生物学性质例如稳定性或溶解性的位置,特别地一个或多个构架位置。在一个实施方案中,scFv已进行了改造,从而包含一个突变的氨基酸位置(例如,一个构架位置)。在其他实施方案中,scFv已进行了改造,从而包含2、3、4、5、6、7、8、9、10或多于10个突变的氨基酸位置(例如,构架位置)。
本发明的另一个方面涉及本发明的scFv组合物的药物制剂。此类制剂通常包含scFv组合物和药学上可接受的载体。如本文中所使用的,“药学上可接受的载体”包括生理上相容的任何和所有溶剂、分散介质、包衣、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂等。优选,载体适合于例如静脉内、肌内、皮下、胃肠外、脊柱、表皮施用(例如,通过注射或输注)、或局部施用(例如,至眼或皮肤)。取决于施用途径,可将scFv包被在材料中以保护化合物免受酸的作用和可使化合物失活的其他天然条件的损害。
本发明的药物化合物可包括一种或多种药学上可接受的盐。“药学上可接受的盐”是指保持亲本化合物期望的生物学活性并且不提供任何不想要的毒理学效应的盐(参见例如,Berge,S.M.等人(1977)J.Pharm.Sci.66:1-19)。此类盐的实例包括酸加成盐和碱加成盐。酸加成盐包括从无毒无机酸例如盐酸、硝酸、磷酸(phosphoric)、硫酸(sulfuric)、氢溴酸、氢碘酸、亚磷酸(phosphorous)等衍生的盐,以及从无毒有机酸例如脂肪族一羧酸和二羧酸、苯基取代的链烷酸、羟基链烷酸、芳香族酸、脂肪族和芳香族磺酸等衍生的盐。碱加成盐包括从碱土金属例如钠、钾、镁、钙等衍生的盐,以及从无毒有机胺例如N,N′-二苄基乙二胺、N-甲基葡糖胺、氯普鲁卡因、胆碱、二乙醇胺、乙二胺、普鲁卡因等衍生的盐。
本发明的药物组合物还可包含药学上可接受的抗氧化剂。药学上可接受的抗氧化剂的实例包括:(1)水溶性抗氧化剂,例如抗坏血酸、盐酸半胱氨酸、硫酸氢钠、焦亚硫酸钠(sodium metabisulfite)、亚硫酸钠等;(2)油溶性抗氧化剂例如抗坏血酸棕榈酸酯、丁羟基茴香醚(BHA)、丁羟甲苯(BHT)、卵磷脂、没食子酸丙酯、α-生育酚等和(3)金属螯合剂,例如柠檬酸、乙二胺四乙酸(EDTA)、山梨糖醇、酒石酸、磷酸等。
可用于本发明的药物组合物的适当的水性和非水性载体的实例包括水、乙醇、多元醇(例如丙三醇、丙二醇、聚乙二醇等)和其适当的混合物,植物油例如橄榄油,和可注射的有机酯例如油酸乙酯。可以例如通过使用包衣材料例如卵磷脂、在分散体的情况下通过维持需要的颗粒大小和通过使用表面活性剂维持恰当的流动性。
此类组合物还可包含佐剂例如防腐剂、湿润剂、乳化剂和分散剂。可通过灭菌方法(同上)和通过包含各种抗菌剂和抗真菌剂例如对羟基苯甲酸酯(paraben)、氯丁醇、苯酚、山梨酸等来确保防止微生物的存在。也可期望将等渗剂例如糖、氯化钠等包含入组合物。此外,可通过包含延迟吸收的试剂例如单硬脂酸铝和明胶来获得可注射药物形式的延长吸收。
药学上可接受的载体包括无菌水溶液或分散体以及用于临时制备无菌注射液或分散体的无菌粉剂。此类介质和试剂用于药物活性物质的用途在本领域内是已知的。除非任何常规介质或试剂与活性化合物不相容,否则预期其在本发明的药物组合物中的用途。还可将补充的活性化合物掺入组合物。
治疗性组合物通常必须是无菌的并且在生产和贮存的条件下是稳定的。可将组合物配制为溶液、微乳剂、脂质体或适合高药物浓度的其他有序结构。载体可以是包含例如水、乙醇、多元醇(例如丙三醇、丙二醇和液体聚乙二醇等)和其适当的混合物的溶剂或分散介质。可以例如通过使用包衣例如卵磷脂、在分散体的情况下通过维持需要的颗粒大小和通过使用表面活性剂来维持恰当的流动性。在许多情况下,优选在组合物中包含等渗剂,例如糖、多元醇例如甘露醇、山梨糖醇或氯化钠。可通过在组合物中包含延迟吸收的试剂例如单硬脂酸盐和明胶来获得可注射组合物的延长的吸收。
无菌注射液可通过将活性化合物以需要的量与上面例举的成分的一种或组合一起掺入适当的溶剂中,然后进行灭菌微过滤(如果需要的话)来制备。通常,通过将活性化合物掺入包含基本分散介质和需要的来自上面列举的成分的其他成分的无菌媒介物来制备分散体。在用于制备无菌注射液的无菌粉剂的情况下,制备的优选方法是从之前无菌过滤的溶液产生包含活性成分和任何额外的期望的成分的粉剂的真空干燥和冷冻干燥(冻干法(lyophilization))。
可与载体材料组合从而产生单个剂型的活性成分的量将随正在治疗的受试者以及施用的特定模式的变化而变化。可与载体材料组合从而产生单个剂型的活性成分的量通常是产生治疗效果的组合物的量。一般地,除百分之百外,该量将在大约0.01%至大约99%的活性成分,优选大约0.1%至大约70%,最优选大约1%至大约30%的活性成分的范围内(与药学上可接受的载体组合)。
调整给药方案以提供最佳的期望的应答(例如,治疗应答)。例如,可施用单个大丸剂,可在一段时间内施用几份分开的剂量或可根据治疗状况的紧急性的需要,按比例减少或增加剂量。特别有利地以单位剂型(dosage unit form)配制胃肠外组合物以便施用和保持剂量均一。本文中使用的单位剂型是指适合用作用于待治疗的受试者的单份剂量的物理上分开的单位;各单位包含经计算与需要的药物载体一起产生期望的治疗效果的预先确定量的活性化合物。本发明的单位剂型的规格(specification)受制于和直接取决于(a)活性化合物的独特特征和要获得的具体治疗效果,和(b)配制用于治疗个体的敏感性的此类活性化合物的领域中固有的限制。
基于“功能共有区”方法的免疫结合剂的改造
如实施例2和3中详细描述的,本文中描述的“功能共有区”方法(其中将因提高的性质而被选择的scFv序列的数据库用于分析构架位置变异性)允许鉴定氨基酸位置,所述氨基酸位置与种系数据库中的这些相同位置上的变异性相比,具有更高或更低的对变异性的耐受性。如实施例5和6中详细描述的,样品scFv中某些氨基酸位置至种系共有残基的回复突变具有中性或有害作用,而包含“功能共有区”残基的scFv变体展示与野生型scFv分子相比增加的热稳定性。因此,本文中通过功能共有区方法鉴定的构架位置对于为了改变,优选提高scFv的功能性质的scFv修饰是优选位置。如实施例3的表3至8中所示,下列构架位置已被鉴定为用于所指定的VH或VL序列中的修饰的优选位置(下面使用的编号是AHo编号系统;将AHo编号转换成Kabat系统编号的换算表(conversion table)示于实施例1的表1和2中):
VH3:氨基酸位置1、6、7、89和103;
VH1a:氨基酸位置1、6、12、13、14、19、21、90、92、95和98;
VH1b:氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107;
Vκ1:氨基酸位置1、3、4、24、47、50、57、91和103;
Vκ3:2、3、10、12、18、20、56、74、94、101和103;和
Vλ1:1、2、4、7、11、14、46、53、82、92和103。
因此,一个或多个此类氨基酸位置可选择用于免疫结合剂例如scFv分子的改造,从而产生免疫结合剂的变异(即,突变的)形式。因此,在另一个方面,本发明提供了对免疫结合剂进行改造的方法,该方法包括:
a)在免疫结合剂中选择一个或多个氨基酸位置用于突变;和
b)突变一个或多个选择用于突变的氨基酸位置,其中一个或多个选择用于突变的氨基酸位置选自:
(i)使用AHo编号的VH3氨基酸位置1、6、7、89和103(使用Kabat编号的氨基酸位置1、6、7、78和89);
(ii)使用AHo编号的VH1a的氨基酸位置1、6、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、6、11、12、13、18、20、79、81、82b和84);
(iii)使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48、66、67、71、75、76和93);
(iv)使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57、91和103(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49、73和85);
(v)使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94、101和103(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76、83和85);和
(vi)使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82、92和103(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66、74和85)。
在优选实施方案中,一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH3的氨基酸位置1、6、7、89和103(使用Kabat编号的氨基酸位置1、6、7、78和89)。
在另一个优选实施方案中,一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH1a的氨基酸位置1、6、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、6、11、12、13、18、20、79、81、82b和84);
在另一个优选实施方案中,一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48、66、67、71、75、76和93);
在另一个优选实施方案中,一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57、91和103(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49、73和85);
在另一个优选实施方案中,一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94、101和103(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76、83和85);
在另一个优选实施方案中,一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82、92和103(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66、74和85)。
在不同的实施方案中,1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或多于20个上述氨基酸位置被选择用于突变。
优选,免疫结合剂是scFv,但还可按照本方法对其他免疫结合剂例如全长免疫球蛋白、Fab片段或本文中描述的任何其他类型的免疫结合剂(例如,Dab或纳米抗体)进行改造。本发明还包括按照改造方法制备的免疫结合剂以及包含免疫结合剂和药学上可接受的载体的组合物。此外,本发明进一步延伸至根据本文公开的任何一种方法改造且以商业规模生产的免疫结合剂。
在特定示例性实施方案中,根据本发明的方法改造的免疫结合剂是本领域公认的免疫结合剂,其结合具有治疗重要性的靶抗原或包含衍生自具有治疗重要性的免疫结合剂的可变区(VL和/或VL区)或一个或多个CDR(例如,CDRL1、CDRL2、CDRL3、CDRH1、CDRH2和/或CDRH3)的免疫结合剂。例如,目前由FDA或其他管理机构批准的免疫结合剂可以根据本发明的方法进行改造。更具体而言,这些示例性免疫结合剂包括但不限于,抗CD3抗体例如莫罗单抗(OKT3;Johnson&Johnson,Brunswick,NJ;参见Arakawa等人J.Biochem,(1996)120:657-662;Kung和Goldstein等人,Science(1979),206:347-349)、抗CD11抗体例如依法珠单抗(,Genentech,South San Francisco,CA)、抗CD20抗体例如利妥昔单抗(/,Genentech,South SanFrancisco,CA)、托西莫单抗(,GlaxoSmithKline,London)或替伊莫单抗(,Biogen Idec,Cambridge MA)(参见美国专利号5,736,137;6,455,043;和6,682,734)、抗CD25(IL2Rα)抗体例如达克珠单抗(,Roche,Basel,Switzerland)或巴利昔单抗(,Novartis,Basel,Switzerland)、抗CD33抗体例如吉妥珠单抗(,Wyeth,Madison,NJ-参见美国专利号5,714,350和6,350,861)、抗CD52抗体例如阿仑珠单抗(,Millennium Pharmacueticals,Cambridge,MA)、抗GpIIb/gIIa抗体例如阿昔单抗(,Centocor,Horsham,PA)、抗TNFα抗体例如英利昔单抗(,Centocor,Horsham,PA)或阿达木单抗(,Abbott,Abbott Park,IL-参见美国专利号6,258,562)、抗IgE抗体例如奥马珠单抗(,Genentech,South San Francisco,CA)、抗RSV抗体例如帕利珠单抗(,Medimmune,Gaithersburg,MD-参见美国专利号5,824,307)、抗EpCAM抗体例如依决洛单抗(,Centocor)、抗EGFR抗体例如西妥昔单抗(,Imclone Systems,NewYork,NY)或帕木单抗(,Amgen,Thousand Oaks,CA)、抗HER2/neu抗体例如曲妥珠单抗(,Genentech)、抗α4整联蛋白抗体例如那他珠单抗(,BiogenIdec)、抗C5抗体例如依库珠单抗(,Alexion Pharmaceuticals,Chesire,CT)和抗VEGF抗体例如贝伐珠单抗(,Genentech-参见美国专利号6,884,879)或雷珠单抗(,Genentech)。
尽管描述了前述内容,但在多种实施方案中,某些免疫结合剂被排除用于本发明的改造方法和/或被排除成为通过改造方法产生的免疫结合剂组合物。例如,在多种实施方案中,存在附带条件,即免疫结合剂不是PCT公开号WO 2006/131013和WO 2008/006235中公开的任何scFv抗体或其变体,例如,PCT公开号WO 2006/131013和WO 2008/006235中公开的ESBA105或其变体,所述专利各自的内容明确地通过引用合并入本文。
在多种其他实施方案中,如果待按上述方法进行改造的免疫结合剂是PCT公开号WO 2006/131013或WO 2008/006235中公开的任何scFv抗体或其变体,那么可存在附带条件,即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置:Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。
在另外的多种其他实施方案中,对于待按照上述方法进行改造的任何免疫结合剂和/或按照上述方法产生的任何免疫结合剂,可存在附带条件,即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置:Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。
免疫结合剂在示例性和优选位置处的突变
如实施例7中详细描述的,本文描述的功能共有区方法已成功地用于鉴定在所选择的scFv(“QC”)数据库中被富集的特定氨基酸残基置换。例如,实施例7中的表13-18列出在VH3、VH1a、VH1b、Vκ1、Vκ3或Vλ1家族构架内的限定氨基酸位置处的示例性和优选氨基酸置换。示例性置换包括由种系(IMGT和Vbase)和成熟抗体(KDB)数据库的分析鉴定的共有残基,以及在所选择的scFv构架数据库(QC)中鉴定为优先富集的氨基酸残基。所鉴定的最优选置换是在所选择的scFv构架数据库(QC)中的该位置处显示最大富集的残基。
因此,本发明提供了其中将一个或多个特定氨基酸置换引入免疫结合剂例如scFv抗体内的改造方法。此种置换可以使用标准分子生物学方法例如定点诱变、PCR介导的诱变等来进行。
在一个实施方案中,本发明提供了改造免疫结合剂例如scFv抗体的方法,其中在一个或多个氨基酸位置处进行一个或多个氨基酸置换,其中用于置换到免疫结合剂内的氨基酸残基选自本文表13-18中鉴定的示例性和优选氨基酸残基。因此,本发明提供了改造免疫结合剂的方法,所述免疫结合剂包含(i)VH3、VH1a或VH1b家族的重链可变区或其片段,所述重链可变区包含VH构架残基,或(ii)Vκ1、Vκ3或Vλ1家族的轻链可变区或其片段,所述轻链可变区包含VL构架残基,所述方法包括:
A)选择在VH构架残基、VL构架残基或VH和VL构架残基内的一个或多个氨基酸位置用于突变;和
B)使选择用于突变的一个或多个氨基酸位置突变,
a)其中如果选择用于突变的一个或多个氨基酸位置在VH3家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)在使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)或谷氨酰胺(Q);
(ii)在使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酸(E)或谷氨酰胺(Q);
(iii)在使用AHo或Kabat编号系统的氨基酸位置7处的苏氨酸(T)、丝氨酸(S)或丙氨酸(A);
(iv)在使用AHo编号系统的氨基酸位置89(使用Kabat编号系统的氨基酸位置78)处的丙氨酸(A)、缬氨酸(V)、亮氨酸(L)或苯丙氨酸(F);和
(v)在使用AHo编号系统的氨基酸位置103(使用Kabat编号的氨基酸位置89)处的精氨酸(R)、谷氨酰胺(Q)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)或苯丙氨酸(F);
b)其中如果选择用于突变的一个或多个氨基酸位置在VH1a家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)在使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)或谷氨酰胺(Q);
(ii)在使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酸(E)或谷氨酰胺(Q);
(iii)在使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L)或缬氨酸(V);
(iv)在使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的甲硫氨酸(M)或赖氨酸(K);
(v)在使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)、谷氨酰胺(Q)或赖氨酸(K);
(vi)在使用AHo编号系统的氨基酸位置19(使用Kabat编号系统的氨基酸位置18)处的亮氨酸(L)或缬氨酸(V);
(vii)在使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I)或缬氨酸(V);
(viii)在使用AHo编号系统的氨基酸位置90(使用Kabat编号系统的氨基酸位置79)处的苯丙氨酸(F)、丝氨酸(S)、组氨酸(H)、天冬氨酸(D)或酪氨酸(Y);
(ix)在使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置81)处的天冬氨酸(D)、谷氨酰胺(Q)或谷氨酸(E);
(x)在使用AHo编号系统的氨基酸位置95(使用Kabat编号系统的氨基酸位置82b)处的甘氨酸(G)、天冬酰胺(N)、苏氨酸(T)或丝氨酸(S);和
(xi)在使用AHo编号系统的氨基酸位置98(使用Kabat编号的氨基酸位置84)处的苏氨酸(T)、丙氨酸(A)、脯氨酸(P)、苯丙氨酸(F)或丝氨酸(S);
c)其中如果选择用于突变的一个或多个氨基酸位置在VH1b家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)在使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)或谷氨酰胺(Q);
(ii)在使用AHo编号系统的氨基酸位置10(使用Kabat编号系统的氨基酸位置9)处的丙氨酸(A)、苏氨酸(T)、脯氨酸(P)、缬氨酸(V)或天冬氨酸(D);
(iii)在使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L)或缬氨酸(V);
(iv)在使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的赖氨酸(K)、缬氨酸(V)、精氨酸(R)、谷氨酰胺(Q)或甲硫氨酸(M);
(v)在使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)、赖氨酸(K)、精氨酸(R)或甲硫氨酸(M);
(vi)在使用AHo编号系统的氨基酸位置20(使用Kabat编号系统的氨基酸位置19)处的精氨酸(R)、苏氨酸(T)、赖氨酸(K)或天冬酰胺(N);
(vii)在使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I)、苯丙氨酸(F)、缬氨酸(V)或亮氨酸(L);
(viii)在使用AHo编号系统的氨基酸位置45(使用Kabat编号系统的氨基酸位置38)处的精氨酸(R)或赖氨酸(K);
(ix)在使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置40)处的苏氨酸(T)、脯氨酸(P)、缬氨酸(V)、丙氨酸(A)或精氨酸(R);
(x)在使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置43)处的赖氨酸(K)、谷氨酰胺(Q)、组氨酸(H)或谷氨酸(E);
(xi)在使用AHo编号的氨基酸位置55(使用Kabat编号的氨基酸位置48)处的甲硫氨酸(M)或异亮氨酸(I);
(xii)在使用AHo编号的氨基酸位置77(使用Kabat编号的氨基酸位置66)处的赖氨酸(K)或精氨酸(R);
(xiii)在使用AHo编号系统的氨基酸位置78(使用Kabat编号系统的氨基酸位置67)处的丙氨酸(A)、缬氨酸(V)、亮氨酸(L)或异亮氨酸(I);
(xiv)在使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置71)处的谷氨酸(E)、精氨酸(R)、苏氨酸(T)或丙氨酸(A);
(xv)在使用AHo编号系统的氨基酸位置86(使用Kabat编号系统的氨基酸位置75)处的苏氨酸(T)、丝氨酸(S)、异亮氨酸(I)或亮氨酸(L);
(xvi)在使用AHo编号系统的氨基酸位置87(使用Kabat编号系统的氨基酸位置76)处的天冬氨酸(D)、丝氨酸(S)、天冬酰胺(N)或甘氨酸(G);和
(xvii)在使用AHo编号系统的氨基酸位置107(使用Kabat编号系统的氨基酸位置93)处的天冬酰胺(N)、丝氨酸(S)或丙氨酸(A);
d)其中如果选择用于突变的一个或多个氨基酸位置在Vκ1家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)在使用AHo或Kabat编号系统的氨基酸位置1处的天冬氨酸(D)、谷氨酸(E)或异亮氨酸(I);
(ii)在使用AHo或Kabat编号系统的氨基酸位置3处的谷氨酰胺(Q)、缬氨酸(V)或异亮氨酸(I);
(iii)在使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)或甲硫氨酸(M);
(iv)在使用AHo或Kabat编号系统的氨基酸位置24处的精氨酸(R)或谷氨酰胺(Q);
(v)在使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置39)处的赖氨酸(K)、精氨酸(R)或异亮氨酸(I);
(vi)在使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置42)处的赖氨酸(K)、精氨酸(R)、谷氨酸(E)、苏氨酸(T)、甲硫氨酸(M)或谷氨酰胺(Q);
(vii)在使用AHo编号系统的氨基酸位置57(使用Kabat编号系统的氨基酸位置49)处的组氨酸(H)、丝氨酸(S)、苯丙氨酸(F)或酪氨酸(Y);
(viii)在使用AHo编号系统的氨基酸位置91(使用Kabat编号系统的氨基酸位置73)处的亮氨酸(L)或苯丙氨酸(F);和
(ix)在使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置85)处的苏氨酸(T)、缬氨酸(V)、丝氨酸(S)、甘氨酸(G)或异亮氨酸(I);
e)其中如果选择用于突变的一个或多个氨基酸位置在Vκ3家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置2处的异亮氨酸(I)或苏氨酸(T);
(ii)使用AHo或Kabat编号系统的氨基酸位置3处的缬氨酸(V)或苏氨酸(T);
(iii)使用AHo或Kabat编号系统的氨基酸位置10处的苏氨酸(T)或异亮氨酸(I);
(iv)使用AHo或Kabat编号系统的氨基酸位置12处的丝氨酸(S)或酪氨酸(Y);
(v)使用AHo或Kabat编号系统的氨基酸位置18处的丝氨酸(S)或精氨酸(R);
(vi)使用AHo或Kabat编号系统的氨基酸位置20处的苏氨酸(T)或丙氨酸(A);
(vii)使用AHo编号系统的氨基酸位置56(使用Kabat编号系统的氨基酸位置48)处的异亮氨酸(I)或甲硫氨酸(M);
(viii)使用AHo编号系统的氨基酸位置74(使用Kabat编号系统的氨基酸位置58)处的异亮氨酸(I)、缬氨酸(V)或苏氨酸(T);
(ix)使用AHo编号系统的氨基酸位置94(使用Kabat编号系统的氨基酸位置76)处的丝氨酸(S)或天冬酰胺(N);
(x)使用AHo编号系统的氨基酸位置101(使用Kabat编号系统的氨基酸位置83)处的苯丙氨酸(F)、酪氨酸(Y)或丝氨酸(S);和
(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的缬氨酸(V)、亮氨酸(L)或丙氨酸(A);和
f)其中如果选择用于突变的一个或多个氨基酸位置在Vλ1家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的亮氨酸(L)、谷氨酰胺(Q)、丝氨酸(S)或谷氨酸(E);
(ii)使用AHo或Kabat编号系统的氨基酸位置2处的丝氨酸(S)、丙氨酸(A)、脯氨酸(P)、异亮氨酸(I)或酪氨酸(Y);
(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)、甲硫氨酸(M)或亮氨酸(L);
(iv)使用AHo或Kabat编号系统的氨基酸位置7处的丝氨酸(S)、谷氨酸(E)、脯氨酸(P);
(v)使用AHo或Kabat编号系统的氨基酸位置11处的丙氨酸(A)或缬氨酸(V);
(vi)使用AHo或Kabat编号系统的氨基酸位置14处的苏氨酸(T)、丝氨酸(S)或丙氨酸(A);
(vii)使用AHo编号系统的氨基酸位置46(使用Kabat编号系统的氨基酸位置38)处的组氨酸(H)或谷氨酰胺(Q);
(viii)使用AHo编号系统的氨基酸位置53(使用Kabat编号系统的氨基酸位置45)处的赖氨酸(K)、苏氨酸(T)、丝氨酸(S)、天冬酰胺(N)、谷氨酰胺(Q)或脯氨酸(P);
(ix)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置66)处的精氨酸(R)、谷氨酰胺(Q)或赖氨酸(K);
(x)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置74)处的甘氨酸(G)、苏氨酸(T)、天冬氨酸(D)、丙氨酸(A);和
(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的天冬氨酸(D)、缬氨酸(V)、苏氨酸(T)、组氨酸(H)或谷氨酸(E)。
在一个优选实施方案中,免疫结合剂是scFv抗体。在其他实施方案中,免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。
本发明还包含根据上述方法制备的免疫结合剂。优选地,免疫结合剂是scFv抗体。在其他实施方案中,免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。本发明还包括包含一种或多种前述免疫结合剂和药学上可接受的载体的药物组合物。
在另一个实施方案中,本发明提供了改造免疫结合剂例如scFv抗体的方法,其中在一个或多个氨基酸位置处进行一个或多个氨基酸置换,其中用于置换到免疫结合剂内的氨基酸残基选自本文表13-18中鉴定的示例性和优选氨基酸残基,但不包括由种系(IMGT和Vbase)和成熟抗体(KDB)数据库的分析鉴定的共有氨基酸残基。即,置换选自在所选择的scFv数据库(QC)中显示富集的那些氨基酸残基。因此,在这个实施方案中,本发明提供了改造免疫结合剂的方法,所述免疫结合剂包含(i)VH3、VH1a或VH1b家族的重链可变区或其片段,所述重链可变区包含VH构架残基,或(ii)Vκ1、Vκ3或Vλ1家族的轻链可变区或其片段,所述轻链可变区包含VL构架残基,所述方法包括:
A)选择在VH构架残基、VL构架残基或VH和VL构架残基内的一个或多个氨基酸位置用于突变;和
B)使选择用于突变的一个或多个氨基酸位置突变,
a)其中如果选择用于突变的一个或多个氨基酸位置在VH3家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酰胺(Q);
(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酰胺(Q);
(iii)使用AHo或Kabat编号系统的氨基酸位置7处的苏氨酸(T)或丙氨酸(A);
(iv)使用AHo编号系统的氨基酸位置89(使用Kabat编号系统的氨基酸位置78)处的丙氨酸(A)、缬氨酸(V)或苯丙氨酸(F);和
(v)使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置89)处的精氨酸(R)、谷氨酰胺(Q)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)或苯丙氨酸(F);
b)其中如果选择用于突变的一个或多个氨基酸位置在VH1a家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E);
(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酸(E);
(iii)使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L);
(iv)使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的甲硫氨酸(M);
(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)或谷氨酰胺(Q);
(vi)使用AHo编号系统的氨基酸位置19(使用Kabat编号系统的氨基酸位置18)处的亮氨酸(L);
(vii)使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I);
(viii)使用AHo编号系统的氨基酸位置90(使用Kabat编号系统的氨基酸位置79)处的苯丙氨酸(F)、丝氨酸(S)、组氨酸(H)或天冬氨酸(D);
(ix)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置81)处的天冬氨酸(D)或谷氨酰胺(Q);
(x)使用AHo编号系统的氨基酸位置95(使用Kabat编号系统的氨基酸位置82b)处的甘氨酸(G)、天冬酰胺(N)或苏氨酸(T);和
(xi)使用AHo编号的氨基酸位置98(使用Kabat编号的氨基酸位置84)处的苏氨酸(T)、丙氨酸(A)、脯氨酸(P)或苯丙氨酸(F);
c)其中如果选择用于突变的一个或多个氨基酸位置在VH1b家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E);
(ii)使用AHo编号系统的氨基酸位置10(使用Kabat编号系统的氨基酸位置9)处的苏氨酸(T)、脯氨酸(P)、缬氨酸(V)或天冬氨酸(D);
(iii)使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L);
(iv)使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的缬氨酸(V)、精氨酸(R)、谷氨酰胺(Q)或甲硫氨酸(M);
(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)、精氨酸(R)或甲硫氨酸(M);
(vi)使用AHo编号系统的氨基酸位置20(使用Kabat编号系统的氨基酸位置19)处的精氨酸(R)、苏氨酸(T)或天冬酰胺(N);
(vii)使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I)、苯丙氨酸(F)或亮氨酸(L);
(viii)使用AHo编号系统的氨基酸位置45(使用Kabat编号系统的氨基酸位置38)处的赖氨酸(K);
(ix)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置40)处的苏氨酸(T)、脯氨酸(P)、缬氨酸(V)或精氨酸(R);
(x)使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置43)处的赖氨酸(K)、组氨酸(H)或谷氨酸(E);
(xi)使用AHo编号的氨基酸位置55(使用Kabat编号的氨基酸位置48)处的异亮氨酸(I);
(xii)使用AHo编号的氨基酸位置77(使用Kabat编号的氨基酸位置66)处的赖氨酸(K);
(xiii)使用AHo编号系统的氨基酸位置78(使用Kabat编号系统的氨基酸位置67)处的丙氨酸(A)、亮氨酸(L)或异亮氨酸(I);
(xiv)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置71)处的谷氨酸(E)、苏氨酸(T)或丙氨酸(A);
(xv)使用AHo编号系统的氨基酸位置86(使用Kabat编号系统的氨基酸位置75)处的苏氨酸(T)、丝氨酸(S)或亮氨酸(L);
(xvi)使用AHo编号系统的氨基酸位置87(使用Kabat编号系统的氨基酸位置76)处的天冬氨酸(D)、天冬酰胺(N)或甘氨酸(G);和
(xvii)使用AHo编号系统的氨基酸位置107(使用Kabat编号系统的氨基酸位置93)处的天冬酰胺(N)或丝氨酸(S);
d)其中如果选择用于突变的一个或多个氨基酸位置在Vκ1家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)或异亮氨酸(I);
(ii)使用AHo或Kabat编号系统的氨基酸位置3处的缬氨酸(V)或异亮氨酸(I);
(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)、亮氨酸(L)或异亮氨酸(I);
(iv)使用AHo或Kabat编号系统的氨基酸位置24处的谷氨酰胺(Q);
(v)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置39)处的精氨酸(R)或异亮氨酸(I);
(vi)使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置42)处的赖氨酸(K)、谷氨酸(E)、苏氨酸(T)、甲硫氨酸(M)或谷氨酰胺(Q);
(vii)使用AHo编号系统的氨基酸位置57(使用Kabat编号系统的氨基酸位置49)处的组氨酸(H)、丝氨酸(S)或苯丙氨酸(F);
(viii)使用AHo编号系统的氨基酸位置91(使用Kabat编号系统的氨基酸位置73)处的苯丙氨酸(F);和
(ix)使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置85)处的缬氨酸(V)、丝氨酸(S)、甘氨酸(G)、异亮氨酸(I);
e)其中如果选择用于突变的一个或多个氨基酸位置在Vκ3家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置2处的苏氨酸(T);
(ii)使用AHo或Kabat编号系统的氨基酸位置3处的苏氨酸(T);
(iii)使用AHo或Kabat编号系统的氨基酸位置10处的异亮氨酸(I);
(iv)使用AHo或Kabat编号系统的氨基酸位置12处的酪氨酸(Y);
(v)使用AHo或Kabat编号系统的氨基酸位置18处的丝氨酸(S);
(vi)使用AHo或Kabat编号系统的氨基酸位置20处的丙氨酸(A);
(vii)使用AHo编号系统的氨基酸位置56(使用Kabat编号系统的氨基酸位置48)处的甲硫氨酸(M);
(viii)使用AHo编号系统的氨基酸位置74(使用Kabat编号系统的氨基酸位置58)处的缬氨酸(V)或苏氨酸(T);
(ix)使用AHo编号系统的氨基酸位置94(使用Kabat编号系统的氨基酸位置76)处的天冬酰胺(N);
(x)使用AHo编号系统的氨基酸位置101(使用Kabat编号系统的氨基酸位置83)处的酪氨酸(Y)或丝氨酸(S);和
(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的亮氨酸(L)或丙氨酸(A);和
f)其中如果选择用于突变的一个或多个氨基酸位置在Vλ1家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的亮氨酸(L)、丝氨酸(S)或谷氨酸(E);
(ii)使用AHo或Kabat编号系统的氨基酸位置2处的丙氨酸(A)、脯氨酸(P)、异亮氨酸(I)或酪氨酸(Y);
(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)或甲硫氨酸(M);
(iv)使用AHo或Kabat编号系统的氨基酸位置7处的丝氨酸(S)或谷氨酸(E);
(v)使用AHo或Kabat编号系统的氨基酸位置11处的丙氨酸(A);
(vi)使用AHo或Kabat编号系统的氨基酸位置14处的苏氨酸(T)或丝氨酸(S);
(vii)使用AHo编号系统的氨基酸位置46(使用Kabat编号系统的氨基酸位置38)处的组氨酸(H);
(viii)使用AHo编号系统的氨基酸位置53(使用Kabat编号系统的氨基酸位置45)处的苏氨酸(T)、丝氨酸(S)、天冬酰胺(N)、谷氨酰胺(Q)或脯氨酸(P);
(ix)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置66)处的精氨酸(R)或谷氨酰胺(Q);
(x)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置74)处的甘氨酸(G)、苏氨酸(T)或天冬氨酸(D);和
(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的缬氨酸(V)、苏氨酸(T)、组氨酸(H)或谷氨酸(E)。
在一个优选实施方案中,免疫结合剂是scFv抗体。在其他实施方案中,免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。
本发明还包含根据上述方法制备的免疫结合剂。优选地,免疫结合剂是scFv抗体。在其他实施方案中,免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。本发明还包括包含一种或多种前述免疫结合剂和药学上可接受的载体的药物组合物。
在另外一个实施方案中,本发明提供了改造免疫结合剂例如scFv抗体的方法,其中在一个或多个氨基酸位置处进行一个或多个氨基酸置换,其中用于置换到免疫结合剂内的氨基酸残基选自本文表13-18中鉴定的优选氨基酸残基(即,不包括由种系(IMGT和Vbase)和成熟抗体(KDB)数据库的分析鉴定的共有氨基酸残基或来自所选择的scFv数据库的较不富集的残基)。即,置换仅选自在所选择的scFv数据库(QC)中显示最大富集的那些氨基酸残基。因此,在这个实施方案中,本发明提供了改造免疫结合剂的方法,所述免疫结合剂包含(i)VH3、VH1a或VH1b家族的重链可变区或其片段,所述重链可变区包含VH构架残基,或(ii)Vκ1、Vκ3或Vλ1家族的轻链可变区或其片段,所述轻链可变区包含VL构架残基,所述方法包括:
A)选择在VH构架残基、VL构架残基或VH和VL构架残基内的一个或多个氨基酸位置用于突变;和
B)使选择用于突变的一个或多个氨基酸位置突变,
a)其中如果选择用于突变的一个或多个氨基酸位置在VH3家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酰胺(Q);
(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酰胺(Q);
(iii)使用AHo或Kabat编号系统的氨基酸位置7处的苏氨酸(T);
(iv)使用AHo编号系统的氨基酸位置89(使用Kabat编号系统的氨基酸位置78)处的缬氨酸(V);和
(v)使用AHo编号系统的氨基酸位置103(使用Kabat编号的氨基酸位置89)处的亮氨酸(L);
b)其中如果选择用于突变的一个或多个氨基酸位置在VH1a家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E);
(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酸(E);
(iii)使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L);
(iv)使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的甲硫氨酸(M);
(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E);
(vi)使用AHo编号系统的氨基酸位置19(使用Kabat编号系统的氨基酸位置18)处的亮氨酸(L);
(vii)使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I);
(viii)使用AHo编号系统的氨基酸位置90(使用Kabat编号系统的氨基酸位置79)处的苯丙氨酸(F)、丝氨酸(S)、组氨酸(H)或天冬氨酸(D);
(ix)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置81)处的天冬氨酸(D);
(x)使用AHo编号系统的氨基酸位置95(使用Kabat编号系统的氨基酸位置82b)处的甘氨酸(G);和
(xi)使用AHo编号的氨基酸位置98(使用Kabat编号的氨基酸位置84)处的苯丙氨酸(F);
c)其中如果选择用于突变的一个或多个氨基酸位置在VH1b家族重链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E);
(ii)使用AHo编号系统的氨基酸位置10(使用Kabat编号系统的氨基酸位置9)处的苏氨酸(T)、脯氨酸(P)、缬氨酸(V)或天冬氨酸(D);
(iii)使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L);
(iv)使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的缬氨酸(V)、精氨酸(R)、谷氨酰胺(Q)或甲硫氨酸(M);
(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的精氨酸(R);
(vi)使用AHo编号系统的氨基酸位置20(使用Kabat编号系统的氨基酸位置19)处的天冬酰胺(N);
(vii)使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的亮氨酸(L);
(viii)使用AHo编号系统的氨基酸位置45(使用Kabat编号系统的氨基酸位置38)处的赖氨酸(K);
(ix)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置40)处的精氨酸(R);
(x)使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置43)处的赖氨酸(K);
(xi)使用AHo编号的氨基酸位置55(使用Kabat编号的氨基酸位置48)处的异亮氨酸(I);
(xii)使用AHo编号的氨基酸位置77(使用Kabat编号的氨基酸位置66)处的赖氨酸(K);
(xiii)使用AHo编号系统的氨基酸位置78(使用Kabat编号系统的氨基酸位置67)处的丙氨酸(A);
(xiv)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置71)处的谷氨酸(E);
(xv)使用AHo编号系统的氨基酸位置86(使用Kabat编号系统的氨基酸位置75)处的苏氨酸(T);
(xvi)使用AHo编号系统的氨基酸位置87(使用Kabat编号系统的氨基酸位置76)处的天冬酰胺(N);和
(xvii)使用AHo编号系统的氨基酸位置107(使用Kabat编号系统的氨基酸位置93)处的天冬酰胺(N);
d)其中如果选择用于突变的一个或多个氨基酸位置在Vκ1家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E);
(ii)使用AHo或Kabat编号系统的氨基酸位置3处的缬氨酸(V);
(iii)使用AHo或Kabat编号系统的氨基酸位置4处的亮氨酸(L);
(iv)使用AHo或Kabat编号系统的氨基酸位置24处的谷氨酰胺(Q);
(v)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置39)处的精氨酸(R);
(vi)使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置42)处的赖氨酸(K)、谷氨酸(E)、苏氨酸(T)、甲硫氨酸(M)或谷氨酰胺(Q);
(vii)使用AHo编号系统的氨基酸位置57(使用Kabat编号系统的氨基酸位置49)处的丝氨酸(S);
(viii)使用AHo编号系统的氨基酸位置91(使用Kabat编号系统的氨基酸位置73)处的苯丙氨酸(F);和
(ix)使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置85)处的缬氨酸(V);
e)其中如果选择用于突变的一个或多个氨基酸位置在Vκ3家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置2处的苏氨酸(T);
(ii)使用AHo或Kabat编号系统的氨基酸位置3处的苏氨酸(T);
(iii)使用AHo或Kabat编号系统的氨基酸位置10处的异亮氨酸(I);
(iv)使用AHo或Kabat编号系统的氨基酸位置12处的酪氨酸(Y);
(v)使用AHo或Kabat编号系统的氨基酸位置18处的丝氨酸(S);
(vi)使用AHo或Kabat编号系统的氨基酸位置20处的丙氨酸(A);
(vii)使用AHo编号系统的氨基酸位置56(使用Kabat编号系统的氨基酸位置48)处的甲硫氨酸(M);
(viii)使用AHo编号系统的氨基酸位置74(使用Kabat编号系统的氨基酸位置58)处的苏氨酸(T);
(ix)使用AHo编号系统的氨基酸位置94(使用Kabat编号系统的氨基酸位置76)处的天冬酰胺(N);
(x)使用AHo编号系统的氨基酸位置101(使用Kabat编号系统的氨基酸位置83)处的丝氨酸(S);和
(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的丙氨酸(A);和
f)其中如果选择用于突变的一个或多个氨基酸位置在Vλ1家族轻链可变区,那么突变包括选自下述的一个或多个置换:
(i)使用AHo或Kabat编号系统的氨基酸位置1处的亮氨酸(L);
(ii)使用AHo或Kabat编号系统的氨基酸位置2处的脯氨酸(P);
(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V);
(iv)使用AHo或Kabat编号系统的氨基酸位置7处的丝氨酸(S);
(v)使用AHo或Kabat编号系统的氨基酸位置11处的丙氨酸(A);
(vi)使用AHo或Kabat编号系统的氨基酸位置14处的苏氨酸(T);
(vii)使用AHo编号系统的氨基酸位置46(使用Kabat编号系统的氨基酸位置38)处的组氨酸(H);
(viii)使用AHo编号系统的氨基酸位置53(使用Kabat编号系统的氨基酸位置45)处的苏氨酸(T)、丝氨酸(S)、天冬酰胺(N)、谷氨酰胺(Q)或脯氨酸(P);
(ix)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置66)处的精氨酸(R);
(x)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置74)处的苏氨酸(T);和
(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的缬氨酸(V)。
在一个优选实施方案中,免疫结合剂是scFv抗体。在其他实施方案中,免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。
本发明还包含根据上述方法制备的免疫结合剂。优选地,免疫结合剂是scFv抗体。在其他实施方案中,免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。本发明还包括包含一种或多种前述免疫结合剂和药学上可接受的载体的药物组合物。
尽管这个小节中的上述多种改造方法提供了如在本文表13-18中分别对VH3、VH1a、VH1b、Vκ1、Vκ3和Vλ1家族定义的所有示例性和优选置换的清单,但应当理解本发明包括其中在选自VH3、VH1a、VH1b、Vκ1、Vκ3和Vλ1的一个可变区中仅进行一个或数个氨基酸置换的方法,以及其中在选自VH3、VH1a、VH1b、Vκ1、Vκ3或Vλ1家族的一个或多个可变区中,例如在包含一个重链和一个轻链可变区的免疫结合剂(例如,scFv)中的一个选自VH3、VH1a或VH1b家族的重链可变区和一个选自Vκ1、Vκ3或Vλ1家族的轻链可变区中进行一个、数个或多个氨基酸置换的方法。即,选自如表13-18中限定的示例性和优选置换的任何和所有可能的置换组合意欲由改造方法以及根据这些方法制备得到的免疫结合剂所包括。
例如,在多种实施方案中,该方法包括在选自VH3、VH1a或VH1b家族可变区的重链可变区中进行1、2、3、4、5、6、7、8、9、10或超过10个的指定氨基酸置换。在其他多种实施方案中,该方法包括在选自Vκ1、Vκ3或Vλ1家族可变区的轻链可变区中进行1、2、3、4、5、6、7、8、9、10或超过10个的指定氨基酸置换。
尽管描述了前述内容,但在多种实施方案中,某些免疫结合剂被排除用于本发明的改造方法和/或被排除成为通过改造方法产生的免疫结合剂组合物。例如,在多种实施方案中,存在附带条件,即免疫结合剂不是PCT公开号WO 2006/131013和WO 2008/006235中公开的任何scFv抗体或其变体,例如,PCT公开号WO 2006/131013和WO 2008/006235中公开的ESBA105或其变体,所述专利各自的内容明确地通过引用合并入本文。
在多种其他实施方案中,如果待按上述方法进行改造的免疫结合剂是PCT公开号WO 2006/131013或WO 2008/006235中公开的任何scFv抗体或其变体,那么可存在附带条件,即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置:Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。
在另外的多种其他实施方案中,对于待按照上述方法进行改造的任何免疫结合剂和/或按照上述方法产生的任何免疫结合剂,可存在附带条件,即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置:Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。
构架支架
如实施例8中详细描述的,本文描述的功能共有区方法已成功地用于设计这样的构架支架序列,其掺入为可变区家族的特定氨基酸位置鉴定的示例性和优选氨基酸置换。在这些支架中,CDR区不是指定的;相反,此种支架序列可以用作CDR序列(CDRL1、CDRL2、CDRL3、CDRH1、CDRH2和/或CDRH3)可以插入其内的“模板”,以产生可能显示期望的稳定性和/或溶解性性质的可变区,由于掺入支架内的示例性或优选氨基酸置换,基于所选择的scFv序列(基于其期望的稳定性和/或溶解性性质选择的)。例如,VH1a家族的重链构架支架序列显示于图9中(SEQ ID NO:1),VH1b家族的重链构架支架序列显示于图10中(SEQ ID NO:2),VH3家族的重链构架支架序列显示于图11中(SEQ ID NO:3),Vκ1家族的轻链构架支架序列显示于图12中(SEQ ID NO:4),Vκ3家族的轻链构架支架序列显示于图13中(SEQ ID NO:5),和Vλ1家族的轻链构架支架序列显示于图14中(SEQ ID NO:6)。
因此,在另一个方面,本发明提供了改造免疫结合剂的方法,所述免疫结合剂包含重链CDR1、CDR2和CDR3序列,所述方法包括将重链CDR1、CDR2和CDR3序列插入重链构架支架内,所述重链构架支架包含如图9(SEQ ID NO:1)、图10(SEQ ID NO:2)或图11(SEQ ID NO:3)中所示的氨基酸序列。在一个实施方案中,重链构架支架包含如图9(SEQ ID NO:1)中所示的氨基酸序列。在另一个实施方案中,重链构架支架包含如图10(SEQ ID NO:2)中所示的氨基酸序列。在另外一个实施方案中,重链构架支架包含如图11(SEQ ID NO:3)中所示的氨基酸序列。
另外或备选地,本发明提供了改造免疫结合剂的方法,所述免疫结合剂包含轻链CDR1、CDR2和CDR3序列,所述方法包括将轻链CDR1、CDR2和CDR3序列插入轻链构架支架内,所述轻链构架支架包含如图12(SEQ ID NO:4)、图13(SEQ ID NO:5)或图14(SEQ ID NO:6)中所示的氨基酸序列。在一个实施方案中,轻链构架支架包含如图12(SEQ ID NO:4)中所示的氨基酸序列。在另一个实施方案中,轻链构架支架包含如图13(SEQ ID NO:5)中所示的氨基酸序列。在另外一个实施方案中,轻链构架支架包含如图14(SEQ ID NO:6)中所示的氨基酸序列。
优选地,根据所述方法改造的免疫结合剂是scFv抗体,尽管其他免疫结合剂例如全长免疫球蛋白和Fab片段也可以根据该方法进行改造。在特定示例性实施方案中,一个或多个CDR(例如,CDRL1、CDRL2、CDRL3、CDRH1、CDRH2和/或CDRH3)衍生自上文讨论的具有治疗重要性的任何免疫结合剂。CDR可以通过使用标准分子生物学技术插入构架支架内。
本发明还包括使用构架支架根据上述方法改造的免疫结合剂。优选地,免疫结合剂是scFv抗体,尽管也包括了其他免疫结合剂,例如全长免疫球蛋白、Dab、纳米抗体和Fab片段。还包括了包含此种免疫结合剂和药学上可接受的载体的药物组合物。
在另外一个方面,本发明提供了包含如图9、图10或图11中所示的氨基酸序列的分离的重链构架支架。此种重链构架支架可以使用标准分子生物学技术来制备。
尽管描述了前述内容,但在多种实施方案中,某些构架支架序列被排除用于本发明的基于支架的改造方法和/或被排除成为通过支架-改造方法产生的免疫结合剂组合物。例如,在多种实施方案中,存在附带条件,即构架支架序列不是PCT公开号WO 2001/048017、PCT公开号WO 2003/097697、美国专利公开号20010024831和/或美国专利公开号US 20030096306中公开的任何scFv构架序列,所述专利各自的内容明确地通过引用合并入本文。
在上述基于支架的改造方法或由其产生的免疫结合剂的多种其他实施方案中,可存在附带条件,即图9、10或11中显示为可变的某些氨基酸位置(即,显示为“X”,且该位置的可能的氨基酸残基的清单在“X”下列出)可能受限制而不可变。例如,在某些实施方案中,存在附带条件,即任何或所有下述氨基酸位置可能限制为仅在“X”下首先列出、或在“X”下第二列出、或在“X”下第三列出(当存在时)、或在“X”下第四列出(当存在时)、或在“X”下第五列出(当存在时)或在“X”下第六列出(当存在时)的氨基酸残基:VH1a或VH1b的AHo位置12(Kabat 11);VH1b的AHo位置50(Kabat 43);VH1b的AHo位置77(Kabat 66);VH1b的AHo位置78(Kabat 67);VH1b的AHo位置82(Kabat 71);VH1b的AHo位置86(Kabat 75);VH1b的AHo位置87(Kabat 76);VH3的AHo位置89(Kabat 78);VH1a的AHo位置90(Kabat 79);和/或VH1b的AHo位置107(Kabat93)。
其他实施方案
应理解,本发明还包括美国临时专利申请系列号60/905,365的附录(A-C)和美国临时专利申请序列号60/937,112的附录(A-I)中所示的任何方法、参考文献和/或组合物,包括但不限于,已鉴定的数据库、生物信息学、计算机中(in silico)的数据操作和解释方法、功能测定法、优选序列、优选残基位置/改变、构架鉴定和选择、构架改变、CDR比对和整合以及优选改变/突变。
关于此类方法和组合物的另外的信息可见于U.S.S.N.s60/819,378;和分别于2006年7月和2007年2月6日提交的标题为“scFv Antibodies Which Pass Epithelial And/Or Endothelial Layers”的U.S.S.N.s 60/899,907和PCT公开号WO 2008/006235;2006年6月6日提交的标题为“Stable And Soluble Antibodies Inhibiting TNFα”的WO06131013A2;2003年5月21日提交的标题为“Immunoglobulin Frameworks Which Demonstrate EnhancedStability In The Intracellular Environment And Methods OfIdentifying Same”的EP1506236A2;2000年12月18日提交的标题为“Intrabodies ScFv with defined framework that is stable in areducing environment”的EP1479694A2;2000年12月18日提交的标题为“Intrabodies With Defined Framework That Is Stable In AReducing Environment And Applications Thereof”的EP1242457B1;2003年5月21日提交的标题为“Immunoglobulin Frameworks WhichDemonstrate Enhanced Stability In The Intracellular EnvironmentAnd Methods Of Identifying Same”的WO03097697A2;和2000年12月18日提交的标题为“Intrabodies With Defined Framework ThatIs Stable In A Reducing Environment And Applications Thereof”的WO0148017A1;和Honegger等人,J.Mol.Biol.309:657-670(2001)。
此外,要理解,本发明还包括适合于其他抗体形式例如全长抗体或其片段(例如,Fab、Dab等)的开发和/或改进的方法和组合物。因此,本文中的原理和残基(其鉴定为适合于选择或改变以获得期望的生物物理学和/或治疗性质)可用于广泛的免疫结合剂。在一个实施方案中,通过修饰本文中公开的一个或多个残基位置来改进治疗相关抗体例如FDA批准的抗体。
然而,本发明并不限于免疫结合剂的改造。例如,本领域技术人员将认识到,本发明的方法可以用于改造其他、非免疫球蛋白、结合分子,包括但不限于,纤连蛋白结合分子例如Adnectins(参见WO01/64942以及美国专利号6,673,901、6,703,199、7,078,490和7,119,171)、亲和体(Affibody)(参见例如,美国专利6,740,734和6,602,977以及WO 00/63243)、Anticalins(也称为脂质运载蛋白)(参见WO99/16873和WO 05/019254)、A结构域蛋白质(参见WO02/088171和WO 04/044011)和锚蛋白重复蛋白质例如Darpins或亮氨酸重复蛋白质(参见WO 02/20565和WO 06/083275)。
通过下列不应当被解释为进一步限定的实施例来进一步举例说明本公开内容。整个本申请中引用的所有图和所有参考文献、专利和公开的专利申请的内容明确地以它们的全文通过引用合并入本文。
实施例10:具有增强的溶解性和稳定性的scFv的产生
通过用经由质量控制(QC)测定法鉴定的稳定性突变置换,进一步优化通过可溶性设计鉴定的ESBA105变体。总共产生了4种构建体,其包含1-3个的上文实施例9中鉴定的可溶性突变(与QC 7.1和15.2中发现的所有稳定性突变(即,VL结构域中的D31N和V83E,以及VH结构域中的V78A、K43和F67L)组合)。所有优化的构建体产生比野生型scFv更可溶的蛋白质(参见表33)。最佳构建体在溶解性方面一致地显示超过2倍的增加(相对于野生型)。scFv分子的活性和稳定性都不受稳定性和溶解性增强突变的组合的显著影响。
表33:具有优化的溶解性和稳定性的scFv
| 蛋白质 |
VL/VH突变 |
FTIRTm(℃) |
PEG溶解性(mg/ml) |
相对于E105的活性 |
kD |
|
QC7.1D-N-15.2 |
VL:D31N;V83EVH:V78A;K43R;F67L |
69.0 |
90 |
1.7 |
9.06×10-10 |
|
QC7.1D-N-15.2VH V103T |
VL:D31N;V83EVH:V78A;K43R;FF67L;V103T |
68.9 |
106 |
1.5 |
8.79×10-10 |
|
QC7.1D-N-15.2Opt 0_2 |
VL:D31N;V83EVH:V12S;V78A;K43R;F67L;L144S |
66.6 |
121 |
1.2 |
8.12×10-10 |
|
QC7.1D-N-15.2VH V103T Opt0_2 |
VL:D31N;V83EVH:V12S;V78A;K43R;F67L;V103T;L144S |
67.3 |
186 |
1.5 |
1.34×10-9 |
所有4种变体的溶解性值用于解卷积各个突变对scFv溶解性的贡献。所有突变看起来都以累积方式促成scFv的溶解性,尽管这些残基中的几个在基本序列中和在3D结构内彼此关系密切。分析表明,VH结构域中的3个溶解性增强突变(V12S、L144S、V103T(或V103S))的组合占~60%的scFv溶解性。因为疏水斑块在所有免疫结合剂的可变结构域中是保守的,所以这个最佳突变组合可以用于改善几乎任何scFv或其他免疫结合剂分子的溶解性。
等同物
本领域技术人员将认识到或能够确定(通过只使用常规实验)本文中描述的本发明的特定实施方案的许多等同物。此类等同物意欲包括于下列权利要求中。
序列表
<110>David Urech,Leonard Borras
<120>修饰抗体的方法和具有改善的功能性质的修饰抗体
<130>P106700PC00
<160>12
<170>PatentIn version 3.5
<210>1
<211>147
<212>PRT
<213>人工序列
<220>
<223>图9-VH1家族重链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Gln或Glu
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa为Gln或Glu
<220>
<221>misc_feature
<222>(11)..(11)
<223>Xaa为Val或Leu
<220>
<221>misc_feature
<222>(12)..(12)
<223>Xaa为Lys或Met
<220>
<221>misc_feature
<222>(13)..(13)
<223>Xaa为Lys,Glu,或Gln
<220>
<221>misc_feature
<222>(18)..(18)
<223>Xaa为Val或Leu
<220>
<221>misc_feature
<222>(20)..(20)
<223>Xaa为Val或Ile
<220>
<221>misc_feature
<222>(26)..(40)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(30)..(40)
<223>CDR H1
<220>
<221>misc_feature
<222>(55)..(74)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(55)..(74)
<223>CDR H2
<220>
<221>misc_feature
<222>(88)..(88)
<223>Xaa为Tyr,Phe,Ser,His,或Asp
<220>
<221>misc_feature
<222>(90)..(90)
<223>Xaa为Glu,Asp,Gln
<220>
<221>misc_feature
<222>(93)..(93)
<223>Xaa为Ser,Gly,Thr,Asn
<220>
<221>misc_feature
<222>(96)..(96)
<223>Xaa为Ser,Phe,Thr,Ala,Pro
<220>
<221>misc_feature
<222>(107)..(136)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(107)..(136)
<223>CDR H3
<400>1
Xaa Val Gln Leu Val Xaa Ser Gly Ala Glu Xaa Xaa Xaa Pro Gly Ser
1 5 10 15
Ser Xaa Lys Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Arg Gln Ala Pro Gly Gln
35 40 45
Gly Leu Glu Trp Met Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Val Thr Ile Thr Ala
65 70 75 80
Asp Glu Ser Thr Ser Thr Ala Xaa Met Xaa Leu Ser Xaa Leu Arg Xaa
85 90 95
Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Gly Gln Gly Thr Leu Val Thr
130 135 140
Val Ser Ser
145
<210>2
<211>147
<212>PRT
<213>未知
<220>
<223>图10-VH1B家族重链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Gln或Glu
<220>
<221>misc_feature
<222>(9)..(9)
<223>Xaa为Ala,Thr,Asp,Pro,或Val
<220>
<221>misc_feature
<222>(11)..(11)
<223>Xaa为Val或Leu
<220>
<221>misc_feature
<222>(12)..(12)
<223>Xaa为Lys,Val,Arg,Gln,Met
<220>
<221>misc_feature
<222>(13)..(13)
<223>Xaa为Lys,Arg,Glu,或Met
<220>
<221>misc_feature
<222>(19)..(19)
<223>Xaa为Lys,Asn,Arg,或Thr
<220>
<221>misc_feature
<222>(20)..(20)
<223>Xaa为Val,Leu,Ile,或Phe
<220>
<221>misc_feature
<222>(26)..(40)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(30)..(40)
<223>CDR H1
<220>
<221>misc_feature
<222>(43)..(43)
<223>Xaa为Arg或Lys
<220>
<221>misc_feature
<222>(45)..(45)
<223>Xaa为Ala,Arg,Thr,Val或Pro
<220>
<221>misc_feature
<222>(48)..(48)
<223>Xaa为Gln,Lys,Glu,或His
<220>
<221>misc_feature
<222>(53)..(53)
<223>Xaa为Met或Ile
<220>
<221>misc_feature
<222>(55)..(74)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(55)..(74)
<223>CDR H2
<220>
<221>misc_feature
<222>(75)..(75)
<223>Xaa为Arg或Lys
<220>
<221>misc_feature
<222>(76)..(76)
<223>Xaa为Val,Ala,Ile,或Leu
<220>
<221>misc_feature
<222>(105)..(105)
<223>Xaa为Ala,Asn,或Ser
<220>
<221>misc_feature
<222>(107)..(136)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(107)..(136)
<223>CDR H3
<400>2
Xaa Val Gln Leu Val Gln Ser Gly Xaa Glu Xaa Xaa Xaa Pro Gly Ala
1 5 10 15
Ser Val Xaa Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Xaa Gln Xaa Pro Gly Xaa
35 40 45
Gly Leu Glu Trp Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Met Thr Glu
65 70 75 80
Asp Thr Ser Thr Asn Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser
85 90 95
Glu Asp Thr Ala Val Tyr Tyr Cys Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Gly Gln Gly Thr Leu Val Thr
130 135 140
Val Ser Ser
145
<210>3
<211>147
<212>PRT
<213>未知
<220>
<223>图11-VH3家族重链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Glu或Gln
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa为Glu或Gln
<220>
<221>misc_feature
<222>(7)..(7)
<223>Xaa为Ser,Thr,或Ala
<220>
<221>misc_feature
<222>(27)..(40)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(30)..(40)
<223>CDR H1
<220>
<221>misc_feature
<222>(55)..(74)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(55)..(74)
<223>CDR H2
<220>
<221>misc_feature
<222>(87)..(87)
<223>Xaa为Leu,Val,Ala,或Phe
<220>
<221>misc_feature
<222>(101)..(101)
<223>Xaa为Val,Leu,Ile,Met,Phe,Arg,或Gln
<220>
<221>misc_feature
<222>(107)..(136)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(107)..(136)
<223>CDR H3
<400>3
Xaa Val Gln Leu Val Xaa Xaa Gly Pro Gly Leu Val Lys Pro Ser Glu
1 5 10 15
Thr Leu Arg Leu Ser Cys Ala Ala Ser Gly Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Arg Gln Ala Pro Gly Lys
35 40 45
Gly Leu Glu Trp Val Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Phe Thr Ile Ser Arg
65 70 75 80
Asp Asn Ser Lys Asn Thr Xaa Tyr Leu Gln Met Asn Ser Leu Arg Ala
85 90 95
Glu Asp Thr Ala Xaa Tyr Tyr Cys Ala Arg Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Gly Gln Gly Thr Leu Val Thr
130 135 140
Val Ser Ser
145
<210>4
<211>149
<212>PRT
<213>未知
<220>
<223>图12-Vk1家族轻链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Glu,Asp,或Ile
<220>
<221>misc_feature
<222>(3)..(3)
<223>Xaa为Val,Gln,或Ile
<220>
<221>misc_feature
<222>(4)..(4)
<223>Xaa为Leu,Met,Val,或Ile
<220>
<221>misc_feature
<222>(24)..(24)
<223>Xaa为Gln或Arg
<220>
<221>misc_feature
<222>(25)..(42)
<223>CDR L1;Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(47)..(47)
<223>Xaa为Arg,Lys,或Ile
<220>
<221>misc_feature
<222>(50)..(50)
<223>Xaa为Lys,Arg,Glu,Thr,Met,或Gln
<220>
<221>misc_feature
<222>(57)..(57)
<223>Xaa为Ser,Tyr,Phe,或His
<220>
<221>misc_feature
<222>(58)..(72)
<223>CDR L2;Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(85)..(86)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(91)..(91)
<223>Xaa为Phe或Leu
<220>
<221>misc_feature
<222>(103)..(103)
<223>Xaa为Val,Thr,Ser,Gly,或Ile
<220>
<221>misc_feature
<222>(107)..(138)
<223>CDR L3;Xaa可以为任何天然存在的氨基酸
<400>4
Xaa Ile Xaa Xaa Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Xaa Pro
35 40 45
Gly Xaa Ala Pro Lys Leu Leu Ile Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Ser Arg Phe Ser Gly
65 70 75 80
Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Xaa Thr Ile Ser Ser Leu
85 90 95
Gln Pro Glu Asp Phe Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Gly Gln Gly Thr Lys
130 135 140
Val Glu Ile Lys Arg
145
<210>5
<211>149
<212>PRT
<213>未知
<220>
<223>图13-Vk3家族轻链
<220>
<221>misc_feature
<222>(2)..(2)
<223>Xaa为Thr或Ile
<220>
<221>misc_feature
<222>(3)..(3)
<223>Xaa为Thr或Val
<220>
<221>misc_feature
<222>(10)..(10)
<223>Xaa为Ile或Thr
<220>
<221>misc_feature
<222>(12)..(12)
<223>Xaa为Tyr或Ser
<220>
<221>misc_feature
<222>(18)..(18)
<223>Xaa为Ser或Arg
<220>
<221>misc_feature
<222>(20)..(20)
<223>Xaa为Ala或Thr
<220>
<221>misc_feature
<222>(25)..(42)
<223>CDR L1;Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(56)..(56)
<223>Xaa为Met或Ile
<220>
<221>misc_feature
<222>(58)..(72)
<223>CDR L2;Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(74)..(74)
<223>Xaa为Thr,Val,或Ile
<220>
<221>misc_feature
<222>(85)..(86)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(94)..(94)
<223>Xaa为Asn或Ser
<220>
<221>misc_feature
<222>(101)..(101)
<223>Xaa为Ser,Tyr,或Phe
<220>
<221>misc_feature
<222>(103)..(103)
<223>Xaa为Ala,Leu,或Val
<220>
<221>misc_feature
<222>(107)..(138)
<223>CDR L3;Xaa可以为任何天然存在的氨基酸
<400>5
Glu Xaa Xaa Leu Thr Gln Ser Pro Gly Xaa Leu Xaa Leu Ser Pro Gly
1 5 10 15
Glu Xaa Ala Xaa Leu Ser Cys Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Lys Pro
35 40 45
Gly Gln Ala Pro Arg Leu Leu Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Pro Asp Arg Phe Ser Gly
65 70 75 80
Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Leu Thr Ile Xaa Arg Leu
85 90 95
Glu Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Gly Gly Gly Thr Lys
130 135 140
Leu Glu Ile Lys Arg
145
<210>6
<211>149
<212>PRT
<213>未知
<220>
<223>图14-VL1家族轻链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Leu,Gln,Ser,或Glu
<220>
<221>misc_feature
<222>(2)..(2)
<223>Xaa为Ser,Ala,Pro,Ile,或Tyr
<220>
<221>misc_feature
<222>(4)..(4)
<223>Xaa为Val,Leu,或Met
<220>
<221>misc_feature
<222>(7)..(7)
<223>Xaa为Ser,Glu,或Pro
<220>
<221>misc_feature
<222>(8)..(8)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(11)..(11)
<223>Xaa为Ala或Val
<220>
<221>misc_feature
<222>(14)..(14)
<223>Xaa为Thr,Ser,或Ala
<220>
<221>misc_feature
<222>(25)..(42)
<223>CDR L1;Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(46)..(46)
<223>Xaa为His或Gln
<220>
<221>misc_feature
<222>(53)..(53)
<223>Xaa为Thr,Lys,Ser,Asn,Gln,或Pro
<220>
<221>misc_feature
<222>(58)..(72)
<223>CDR L2;Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(82)..(82)
<223>Xaa为Arg,Gln,或Lys
<220>
<221>misc_feature
<222>(85)..(86)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(92)..(92)
<223>Xaa为Thr,Gly,Asp,或Ala
<220>
<221>misc_feature
<222>(103)..(103)
<223>Xaa为Val,Asp,Thr,His,或Glu
<220>
<221>misc_feature
<222>(107)..(138)
<223>CDR L3;Xaa可以为任何天然存在的氨基酸
<400>6
Xaa Xaa Val Xaa Thr Gln Xaa Xaa Pro Ser Xaa Ser Gly Xaa Pro Gly
1 5 10 15
Gln Arg Val Thr Ile Ser Cys Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Xaa Leu Pro
35 40 45
Gly Thr Ala Pro Xaa Leu Leu Ile Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Asp Arg Phe Ser Gly
65 70 75 80
Ser Xaa Ser Gly Xaa Xaa Thr Ser Ala Ser Leu Xaa Ile Ser Gly Leu
85 90 95
Gln Ser Glu Asp Glu Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Gly Gly Gly Thr Lys
130 135 140
Leu Thr Val Leu Gly
145
<210>7
<211>236
<212>PRT
<213>未知
<220>
<223>图9-VH1家族重链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Gln或Glu
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa为Gln或Glu
<220>
<221>misc_feature
<222>(11)..(11)
<223>Xaa为Val或Leu
<220>
<221>misc_feature
<222>(12)..(12)
<223>Xaa为Lys或Met
<220>
<221>misc_feature
<222>(13)..(13)
<223>Xaa为Lys,Glu,或Gln
<220>
<221>misc_feature
<222>(18)..(18)
<223>Xaa为Val或Leu
<220>
<221>misc_feature
<222>(20)..(20)
<223>Xaa为Val或Ile
<220>
<221>misc_feature
<222>(26)..(29)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(30)..(79)
<223>CDR H1;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(94)..(143)
<223>CDR H2;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(157)..(157)
<223>Xaa为Tyr,Phe,Ser,His,或Asp
<220>
<221>misc_feature
<222>(159)..(159)
<223>Xaa为Glu,Asp,Gln
<220>
<221>misc_feature
<222>(162)..(162)
<223>Xaa为Ser,Gly,Thr,Asn
<220>
<221>misc_feature
<222>(165)..(165)
<223>Xaa为Ser,Phe,Thr,Ala,Pro
<220>
<221>misc_feature
<222>(176)..(225)
<223>CDR H3;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<400>7
Xaa Val Gln Leu Val Xaa Ser Gly Ala Glu Xaa Xaa Xaa Pro Gly Ser
1 5 10 15
Ser Xaa Lys Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp
65 70 75 80
Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met Gly Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg
130 135 140
Val Thr Ile Thr Ala Asp Glu Ser Thr Ser Thr Ala Xaa Met Xaa Leu
145 150 155 160
Ser Xaa Leu Arg Xaa Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Xaa
165 170 175
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser
225 230 235
<210>8
<211>236
<212>PRT
<213>未知
<220>
<223>图10-VH1B家族重链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Gln或Glu
<220>
<221>misc_feature
<222>(9)..(9)
<223>Xaa为Ala,Thr,Asp,Pro,或Val
<220>
<221>misc_feature
<222>(11)..(11)
<223>Xaa为Val或Leu
<220>
<221>misc_feature
<222>(12)..(12)
<223>Xaa为Lys,Val,Arg,Gln,Met
<220>
<221>misc_feature
<222>(13)..(13)
<223>Xaa为Lys,Arg,Glu,或Met
<220>
<221>misc_feature
<222>(19)..(19)
<223>Xaa为Lys,Asn,Arg,或Thr
<220>
<221>misc_feature
<222>(20)..(20)
<223>Xaa为Val,Leu,Ile,或Phe
<220>
<221>misc_feature
<222>(26)..(29)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(30)..(79)
<223>CDR H1;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(82)..(82)
<223>Xaa为Arg或Lys
<220>
<221>misc_feature
<222>(84)..(84)
<223>Xaa为Ala,Arg,Thr,Val或Pro
<220>
<221>misc_feature
<222>(87)..(87)
<223>Xaa为Gln,Lys,Glu,或His
<220>
<221>misc_feature
<222>(92)..(92)
<223>Xaa为Met或Ile
<220>
<221>misc_feature
<222>(94)..(143)
<223>CDRH2;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(144)..(144)
<223>Xaa为Arg或Lys
<220>
<221>misc_feature
<222>(145)..(145)
<223>Xaa为Val,Ala,Ile,或Leu
<220>
<221>misc_feature
<222>(149)..(149)
<223>Xaa为Glu,Arg,Thr,Ala
<220>
<221>misc_feature
<222>(153)..(153)
<223>Xaa为Thr,Ser,Ile,Leu
<220>
<221>misc_feature
<222>(154)..(154)
<223>Xaa为Asp,Ser,Asn,Gly
<220>
<221>misc_feature
<222>(174)..(174)
<223>Xaa为Ala,Asn,或Ser
<220>
<221>misc_feature
<222>(176)..(225)
<223>CDR H3;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<400>8
Xaa Val Gln Leu Val Gln Ser Gly Xaa Glu Xaa Xaa Xaa Pro Gly Ala
1 5 10 15
Ser Val Xaa Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp
65 70 75 80
Val Xaa Gln Xaa Pro Gly Xaa Gly Leu Glu Trp Xaa Gly Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
130 135 140
Xaa Thr Met Thr Xaa Asp Thr Ser Xaa Xaa Thr Ala Tyr Met Glu Leu
145 150 155 160
Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys Xaa Arg Xaa
165 170 175
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser
225 230 235
<210>9
<211>236
<212>PRT
<213>未知
<220>
<223>图11-VH3家族重链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Glu或Gln
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa为Glu或Gln
<220>
<221>misc_feature
<222>(7)..(7)
<223>Xaa为Ser,Thr,或Ala
<220>
<221>misc_feature
<222>(27)..(29)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(30)..(79)
<223>CDR H1;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(94)..(143)
<223>CDR H2;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(156)..(156)
<223>Xaa为Leu,Val,Ala,或Phe
<220>
<221>misc_feature
<222>(170)..(170)
<223>Xaa为Val,Leu,Ile,Met,Phe,Arg,或Gln
<220>
<221>misc_feature
<222>(176)..(225)
<223>CDR H3;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<400>9
Xaa Val Gln Leu Val Xaa Xaa Gly Pro Gly Leu Val Lys Pro Ser Glu
1 5 10 15
Thr Leu Arg Leu Ser Cys Ala Ala Ser Gly Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp
65 70 75 80
Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg
130 135 140
Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Xaa Tyr Leu Gln Met
145 150 155 160
Asn Ser Leu Arg Ala Glu Asp Thr Ala Xaa Tyr Tyr Cys Ala Arg Xaa
165 170 175
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
210 215 220
Xaa Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser
225 230 235
<210>10
<211>234
<212>PRT
<213>未知
<220>
<223>图12-Vk1家族轻链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Glu,AAsp,或Ile
<220>
<221>misc_feature
<222>(3)..(3)
<223>Xaa为Val,Gln,或Ile
<220>
<221>misc_feature
<222>(4)..(4)
<223>Xaa为Leu,Met,Val,或Ile
<220>
<221>misc_feature
<222>(24)..(24)
<223>Xaa为Gln或Arg
<220>
<221>misc_feature
<222>(25)..(74)
<223>CDR L1;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(79)..(79)
<223>Xaa为Arg,Lys,或Ile
<220>
<221>misc_feature
<222>(82)..(82)
<223>Xaa为Lys,Arg,Glu,Thr,Met,或Gln
<220>
<221>misc_feature
<222>(89)..(89)
<223>Xaa为Ser,Tyr,Phe,或Hi s
<220>
<221>misc_feature
<222>(90)..(139)
<223>CDR L2;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(152)..(153)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(158)..(158)
<223>Xaa为Phe或Leu
<220>
<221>misc_feature
<222>(170)..(170)
<223>Xaa为Val,Thr,Ser,Gly,或Ile
<220>
<221>misc_feature
<222>(174)..(223)
<223>CDR L3;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<400>10
Xaa Ile Xaa Xaa Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly
1 5 10 15
Asp Arg Val Thr Ile Thr Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Xaa Pro
65 70 75 80
Gly Xaa Ala Pro Lys Leu Leu Ile Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Ser Arg
130 135 140
Phe Ser Gly Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Xaa Thr Ile
145 150 155 160
Ser Ser Leu Gln Pro Glu Asp Phe Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa
165 170 175
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe
210 215 220
Gly Gln Gly Thr Lys Val Glu Ile Lys Arg
225 230
<210>11
<211>234
<212>PRT
<213>未知
<220>
<223>图13-Vk3家族轻链
<220>
<221>misc_feature
<222>(2)..(2)
<223>Xaa为Thr或Ile
<220>
<221>misc_feature
<222>(3)..(3)
<223>Xaa为Thr或Val
<220>
<221>misc_feature
<222>(10)..(10)
<223>Xaa为Ile或Thr
<220>
<221>misc_feature
<222>(12)..(12)
<223>Xaa为Tyr或Ser
<220>
<221>misc_feature
<222>(18)..(18)
<223>Xaa为Ser或Arg
<220>
<221>misc_feature
<222>(20)..(20)
<223>Xaa为Ala或Thr
<220>
<221>misc_feature
<222>(25)..(74)
<223>CDR L1;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(88)..(88)
<223>Xaa为Met或Ile
<220>
<221>misc_feature
<222>(90)..(139)
<223>CDR L2;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(141)..(141)
<223>Xaa为Thr,Val,或Ile
<220>
<221>misc_feature
<222>(152)..(153)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(161)..(161)
<223>Xaa为Asn或Ser
<220>
<221>misc_feature
<222>(168)..(168)
<223>Xaa为Ser,Tyr,或Phe
<220>
<221>misc_feature
<222>(170)..(170)
<223>Xaa为Ala,Leu,或Val
<220>
<221>misc_feature
<222>(174)..(223)
<223>CDR L3;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<400>11
Glu Xaa Xaa Leu Thr Gln Ser Pro Gly Xaa Leu Xaa Leu Ser Pro Gly
1 5 10 15
Glu Xaa Ala Xaa Leu Ser Cys Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Lys Pro
65 70 75 80
Gly Gln Ala Pro Arg Leu Leu Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Pro Asp Arg
130 135 140
Phe Ser Gly Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Leu Thr Ile
145 150 155 160
Xaa Arg Leu Glu Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa
165 170 175
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe
210 215 220
Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg
225 230
<210>12
<211>234
<212>PRT
<213>未知
<220>
<223>图14-VL1家族轻链
<220>
<221>misc_feature
<222>(1)..(1)
<223>Xaa为Leu,Gln,Ser,或Glu
<220>
<221>misc_feature
<222>(2)..(2)
<223>Xaa为Ser,Ala,Pro,Ile,或Tyr
<220>
<221>misc_feature
<222>(4)..(4)
<223>Xaa为Val,Leu,或Met
<220>
<221>misc_feature
<222>(7)..(7)
<223>Xaa为Ser,Glu,或Pro
<220>
<221>misc_feature
<222>(8)..(8)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(11)..(11)
<223>Xaa为Ala或Val
<220>
<221>misc_feature
<222>(14)..(14)
<223>Xaa为Thr,Ser,或Ala
<220>
<221>misc_feature
<222>(25)..(74)
<223>CDR L1;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(78)..(78)
<223>Xaa为Hi s或Gln
<220>
<221>misc_feature
<222>(85)..(85)
<223>Xaa为Thr,Lys,Ser,Asn,Gln,或Pro
<220>
<221>misc_feature
<222>(90)..(139)
<223>CDR L2;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(149)..(149)
<223>Xaa为Arg,Gln,或Lys
<220>
<221>misc_feature
<222>(152)..(153)
<223>Xaa可以为任何天然存在的氨基酸
<220>
<221>misc_feature
<222>(159)..(159)
<223>Xaa为Thr,Gly,Asp,或Ala
<220>
<221>misc_feature
<222>(170)..(170)
<223>Xaa为Val,Asp,Thr,His,或Glu
<220>
<221>misc_feature
<222>(174)..(223)
<223>CDR L3;至少3个且直至50个氨基酸可以存在或不存在;
如果存在,Xaa可以是任何天然存在的氨基酸
<400>12
Xaa Xaa Val Xaa Thr Gln Xaa Xaa Pro Ser Xaa Ser Gly Xaa Pro Gly
1 5 10 15
Gln Arg Val Thr Ile Ser Cys Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
20 25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
35 40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
50 55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Xaa Leu Pro
65 70 75 80
Gly Thr Ala Pro Xaa Leu Leu Ile Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa
85 90 95
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
100 105 110
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
115 120 125
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Asp Arg
130 135 140
Phe Ser Gly Ser Xaa Ser Gly Xaa Xaa Thr Ser Ala Ser Leu Xaa Ile
145 150 155 160
Ser Gly Leu Gln Ser Glu Asp Glu Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa
165 170 175
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
180 185 190
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
195 200 205
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe
210 215 220
Gly Gly Gly Thr Lys Leu Thr Val Leu Gly
225 230