CN101849001B

CN101849001B - 修饰抗体的方法和具有改善的功能性质的修饰抗体

Info

Publication number: CN101849001B
Application number: CN200880021889.4A
Authority: CN
Inventors: D·尤里奇; L·博拉斯
Original assignee: Esbatech a Novartis Co LLC; Esbatech An Alcon Biomedical Research Unit LLC
Current assignee: Novartis AG
Priority date: 2007-06-25
Filing date: 2008-06-25
Publication date: 2014-07-16
Anticipated expiration: 2028-06-25
Also published as: CN105017427A; CN106366192B; JP2017186338A; KR20100028575A; NZ581468A; EP2158315B1; JP2010531145A; JP5611820B2; ZA200908384B; RU2540150C2; RU2010102065A; JP2021119782A; WO2009000099A3; HK1137483A1; JP2015007104A; IL202360A0; AU2008267734A1; JP2019141091A; ES2566737T3; US20090074780A1

Abstract

本发明提供了使用基于序列的分析和合理的策略来修饰且改善免疫结合剂，特别是单链抗体(scFv)的结构和生物物理学性质(包括性质如稳定性、溶解性和/或抗原结合亲和力)的方法。本发明提供了通过在经由分析所选择的稳定scFv序列的数据库鉴定的氨基酸位置处进行一个或多个置换而改造免疫结合剂，特别是scFv的方法，其中用于置换的优选氨基酸残基已得到鉴定。本发明还提供了根据本发明的改造方法制备的免疫结合剂。本发明还提供了CDR序列可以插入其内的优选的scFv构架支架，以及使用这些优选的构架支架制备的scFv抗体。

Description

修饰抗体的方法和具有改善的功能性质的修饰抗体

本申请要求于2007年6月25日提交的美国临时申请序列号60/937,112的优先权，所述美国临时申请的名称为“Sequence BasedEngineering and Optimization of Single Chain Antibodies”。本申请还要求于2008年3月12日提交的美国临时申请序列号61/069,056的优先权，所述美国临时申请的名称为“Methods of Modifying Antibodies，and Modified Antibodies with Improved Functional Properties”。

发明背景

已证明抗体在癌症、自身免疫疾病和其他病症的治疗中是非常有效和成功的治疗剂。尽管一般已在临床上使用全长抗体，但存在使用抗体片段可以提供的许多优点，例如增加组织穿透力、与增加其他效应子功能的能力结合的Fc效应子功能的不存在、和由较短的全身体内半衰期导致的较少全身性副作用的可能性。抗体片段的药代动力学性质表明，它们可能特别良好地适合于局部治疗方法。此外，抗体片段在特定表达系统中可以比全长抗体更容易产生。

一个类型的抗体片段是单链抗体(scFv)，其由经由接头序列缀合的轻链可变结构域(V_L)与重链可变结构域(V_H)组成。因此，scFv缺乏所有抗体恒定区结构域，并且先前的可变/恒定结构域界面的氨基酸残基(界面残基)变成溶剂暴露的。scFv可以通过已建立的重组改造技术由全长抗体(例如IgG分子)制备。然而，全长抗体转变成scFv通常导致蛋白质的弱稳定性和溶解性、低产量和高聚集趋势，这增加免疫原性危险。

因此，已尝试改善scFv的性质例如溶解性和稳定性。例如，Nieba，L.等人(Prot.Eng.(1997)10：435-444)选择已知为界面残基的3个氨基酸残基且使其突变。他们观察到突变的scFv在细菌中周质表达增加，以及热诱导聚集速率减小，尽管热力学稳定性和溶解性未显著改变。其中对scFv内的特定氨基酸残基执行定点诱变的其他研究也已得到报告(参见例如，Tan，P.H.等人(1988)Biophys.J.75：1473-1482；，A.和Pluckthun，A.(1998)Biochem.37：13120-13127；，A.和Plückthun，A.(1999)Biochem.38：8739-8750)。在这些各种研究中，选择用于诱变的氨基酸残基基于其在scFv结构内的已知位置(例如，来自分子建模研究)进行选择。

在另一种方法中，将来自表达极弱的scFv的互补决定区(CDR)移植到已证实具有有利性质的scFv的构架区内(Jung，S.和Plückthun，A.(1997)Prot.Eng.10：959-966)。所得到的scFv显示改善的可溶性表达和热力学稳定性。

改造scFv以改善功能性质中的进展在例如，A.和Plückthun，A.(2001)J.Mol.Biol.305：989-1010中综述。然而，仍需要允许合理设计具有优良功能性质的scFv的新方法，特别是帮助技术人员选择潜在有问题的氨基酸残基用于改造的方法。此外，仍需要改造scFv和其他类型抗体从而赋予改善的功能性质，例如增加的稳定性和/或溶解性性质的方法。

发明概述

本发明提供了基于稳定、可溶scFv构架的序列分析改造免疫结合剂例如scFv抗体的方法，所述序列分析允许鉴定在scFv序列内对于稳定性和/或溶解性潜在有问题的氨基酸和鉴定在此种氨基酸位置处优选的氨基酸残基置换。因此，依照本发明的方法鉴定的氨基酸残基可以选择用于突变，并且可以制备已突变的改造的免疫结合剂例如scFv，且就改善的功能性质例如稳定性和/或溶解性进行筛选。本发明提供“功能共有区”(functional consensus)方法且证实其优点，其基于功能性选择的(functionally-selected)scFv序列数据库的使用，鉴定scFv构架内的优选氨基酸置换。

因此，本发明提供了改造免疫结合剂(例如scFv)的方法，其通过使特定构架氨基酸位置突变成使用本文描述的“功能共有区”方法鉴定的特定氨基酸残基。再进一步地，本发明提供了基于本文描述的“功能共有区”方法设计的scFv构架支架，其可以用作目的CDR序列可以插入其内以制备针对靶目的抗原的免疫结合剂例如scFv的构架序列。

优选地，在本发明的改造方法中使用或由本发明的改造方法产生的免疫结合剂是scFv，但其他免疫结合剂例如全长免疫球蛋白、Fab片段、单结构域抗体(例如Dab)和纳米抗体也可以根据本发明的方法进行改造。本发明还包含了根据改造方法制备的免疫结合剂，以及包含所述免疫结合剂和药学上可接受的载体的组合物。

在一个方面，本发明提供了改造免疫结合剂的方法，所述免疫结合剂包含(i)重链可变区或其片段，所述重链可变区包含V_H构架残基，和/或(ii)轻链可变区或其片段，所述轻链可变区包含V_L构架残基，所述方法包括：

A)选择在V_H构架残基、V_L构架残基或V_H和V_L构架残基内的一个或多个氨基酸位置用于突变；和

B)使选择用于突变的一个或多个氨基酸位置突变，其中选择用于突变的一个或多个氨基酸位置和在所选择的一个或多个位置处插入的一个或多个氨基酸残基在下文进一步详细描述。

下文描述的氨基酸位置编号使用AHo编号系统；使用Kabat编号系统的对应位置在本文中进一步描述，并且关于AHo和Kabat编号系统的换算表在实施例1中阐述。使用标准单字母缩写编码阐述氨基酸残基。

在一个实施方案中，其中如果选择用于突变的一个或多个氨基酸位置在重链可变区，那么突变包括选自下述的一个或多个置换：

(a)在氨基酸位置1处的Q或E；

(b)在氨基酸位置6处的Q或E；

(c)在氨基酸位置7处的T、S或A，更优选T或A，更加优选T；

(d)在氨基酸位置10处的A、T、P、V或D，更优选T、P、V或D；

(e)在氨基酸位置12处的L或V，更优选L；

(f)在氨基酸位置13处的V、R、Q、M或K，更优选V、R、Q或M；

(g)在氨基酸位置14处的R、M、E、Q或K，更优选R、M、E或Q，更加优选R或E；

(h)在氨基酸位置19处的L或V，更优选L；

(i)在氨基酸位置20处的R、T、K或N，更优选R、T或N，更加优选N；

(j)在氨基酸位置21处的I、F、L或V，更优选I、F或L，更加优选I或L；

(k)在氨基酸位置45处的R或K，更优选K；

(l)在氨基酸位置47处的T、P、V、A或R，更优选T、P、V或R，更加优选R；

(m)在氨基酸位置50处的K、Q、H或E，更优选K、H或E，更加优选K；

(n)在氨基酸位置55处的M或I，更优选I；

(o)在氨基酸位置77处的K或R，更优选K；

(p)在氨基酸位置78处的A、V、L或I，更优选A、L或I，更加优选A；

(q)在氨基酸位置82处的E、R、T或A，更优选E、T或A，更加优选E；

(r)在氨基酸位置86处的T、S、I或L，更优选T、S或L，更加优选T；

(s)在氨基酸位置87处的D、S、N或G，更优选D、N或G，更加优选N；

(t)在氨基酸位置89处的A、V、L或F，更优选A、V或F，更加优选V；

(u)在氨基酸位置90处的F、S、H、D或Y，更优选F、S、H或D；

(v)在氨基酸位置92处的D、Q或E，更优选D或Q，更加优选D；

(w)在氨基酸位置95处的G、N、T或S，更优选G、N或T，更加优选G；

(x)在氨基酸位置98处的T、A、P、F或S，更优选T、A、P或F，更加优选F；

(y)在氨基酸位置103处的R、Q、V、I、M、F或L，更优选R、Q、I、M、F或L，更加优选Y或L；和

(z)在氨基酸位置107处的N、S或A，更优选N或S，更加优选N。

在另一个实施方案中，其中如果选择用于突变的一个或多个氨基酸位置在轻链可变区，那么突变包括选自下述的一个或多个置换：

(aa)在氨基酸位置1处的Q、D、L、E、S或I，更优选L、E、S或I，更加优选L或E；

(bb)在氨基酸位置2处的S、A、Y、I、P或T，更优选A、Y、I、P或T，更加优选P或T；

(cc)在氨基酸位置3处的Q、V、T或I，更优选V、T或I，更加优选V或T；

(dd)在氨基酸位置4处的V、L、I或M，更优选V或L；

(ee)在氨基酸位置7处的S、E或P，更优选S或E，更加优选S；

(ff)在氨基酸位置10处的T或I，更优选I；

(gg)在氨基酸位置11处的A或V，更优选A；

(hh)在氨基酸位置12处的S或Y，更优选Y；

(ii)在氨基酸位置14处的T、S或A，更优选T或S，更加优选T；

(jj)在氨基酸位置18处的S或R，更优选S；

(kk)在氨基酸位置20处的T或A，更优选A；

(ll)在氨基酸位置24处的R或Q，更优选Q；

(mm)在氨基酸位置46处的H或Q，更优选H；

(nn)在氨基酸位置47处的K、R或I，更优选R或I，更加优选R；

(oo)在氨基酸位置50处的R、Q、K、E、T或M，更优选Q、K、E、T或M；

(pp)在氨基酸位置53处的K、T、S、N、Q或P，更优选T、S、N、Q或P；

(qq)在氨基酸位置56处的I或M，更优选M；

(rr)在氨基酸位置57处的H、S、F或Y，更优选H、S或F；

(ss)在氨基酸位置74处的I、V或T，更优选V或T、R，更加优选T；

(tt)在氨基酸位置82处的R、Q或K，更优选R或Q，更加优选R；

(uu)在氨基酸位置91处的L或F，更优选F；

(vv)在氨基酸位置92处的G、D、T或A，更优选G、D或T，更加优选T；

(xx)在氨基酸位置94处的S或N，更优选N；

(yy)在氨基酸位置101处的F、Y或S，更优选Y或S，更加优选S；和

(zz)在氨基酸位置103处的D、F、H、E、L、A、T、V、S、G或I，更优选H、E、L、A、T、V、S、G或I，更加优选A或V。

在一个实施方案中，重链可变区或其片段是VH3家族的，并且因此，如果选择用于突变的一个或多个氨基酸位置在VH3家族重链可变区，那么突变包括选自下述的一个或多个置换：

(i)在氨基酸位置1处的E或Q，更优选Q；

(ii)在氨基酸位置6处的E或Q，更优选Q；

(iii)在氨基酸位置7处的T、S或A，更优选T或A，更加优选T；

(iv)在氨基酸位置89处的A、V、L或F，更优选A、V或F，更加优选V；和

(v)在氨基酸位置103处的R、Q、V、I、L、M或F，更优选R、Q、I、L、M或F，更加优选L；

在另一个实施方案中，重链可变区或其片段是VH1a家族的，并且因此，如果选择用于突变的一个或多个氨基酸位置在VH1a家族重链可变区，那么突变包括选自下述的一个或多个置换：

(i)在氨基酸位置1处的E或Q，更优选E；

(ii)在氨基酸位置6处的E或Q，更优选E；

(iii)在氨基酸位置12处的L或V，更优选L；

(iv)在氨基酸位置13处的M或K，更优选M；

(v)在氨基酸位置14处的E、Q或K，更优选E或Q，更加优选E；

(vi)在氨基酸位置19处的L或V，更优选L；

(vii)在氨基酸位置21处的I或V，更优选I；

(viii)在氨基酸位置90处的F、S、H、D或Y，更优选F、S、H或D；

(ix)在氨基酸位置92处的D、Q或E，更优选D或Q，更加优选D；

(x)在氨基酸位置95处的G、N、T或S，更优选G、N或T，更加优选G；和

(xi)在氨基酸位置98处的T、A、P、F或S，更优选T、A、P或F，更加优选F。

在另一个实施方案中，重链可变区或其片段是VH1b家族的，并且因此，如果选择用于突变的一个或多个氨基酸位置在VH1b家族重链可变区，那么突变包括选自下述的一个或多个置换：

(i)在氨基酸位置1处的E或Q，更优选E；

(ii)在氨基酸位置10处的A、T、P、V或D，更优选T、P、V或D；

(iii)在氨基酸位置12处的L或V，更优选L；

(iv)在氨基酸位置13处的K、V、R、Q或M，更优选V、R、Q或M；

(v)在氨基酸位置14处的E、K、R或M，更优选E、R或M，更加优选R；

(vi)在氨基酸位置20处的R、T、K或N，更优选R、T或N，更加优选N；

(vii)在氨基酸位置21处的I、F、V或L，更优选I、F或L，更加优选L；

(viii)在氨基酸位置45处的R或K，更优选K；

(ix)在氨基酸位置47处的T、P、V、A、R，更优选T、P、V或R，更加优选R；

(x)在氨基酸位置50处的K、Q、H或E，更优选K、H或E，更加优选K；

(xi)在氨基酸位置55处的M或I，更优选I；

(xii)在氨基酸位置77处的K或R，更优选K；

(xiii)在氨基酸位置78处的A、V、L或I，更优选A、L或I，更加优选A；

(xiv)在氨基酸位置82处的E、R、T或A，更优选E、T或A，更加优选E；

(xv)在氨基酸位置86处的T、S、I或L，更优选T、S或L，更加优选T；

(xvi)在氨基酸位置87处的D、S、N或G，更优选D、N或G，更加优选N；和

(xvii)在氨基酸位置107处的N、S或A，更优选N或S，更加优选N。

在另一个实施方案中，轻链可变区或其片段是Vκ1家族的，并且因此，如果选择用于突变的一个或多个氨基酸位置在Vκ1家族轻链可变区，那么突变包括选自下述的一个或多个置换：

(i)在氨基酸位置1处的D、E或I，更优选E或I，更加优选E；

(ii)在氨基酸位置3处的Q、V或I，更优选V或I，更加优选V；

(iii)在氨基酸位置4处的V、L、I或M，更优选V、L或I，更加优选L；

(iv)在氨基酸位置24处的R或Q，更优选Q；

(v)在氨基酸位置47处的K、R或I，更优选R或I，更加优选R；

(vi)在氨基酸位置50处的K、R、E、T、M或Q，更优选K、E、T、M或Q；

(vii)在氨基酸位置57处的H、S、F或Y，更优选H、S或F，更加优选S；

(viii)在氨基酸位置91处的L或F，更优选F；和

(ix)在氨基酸位置103处的T、V、S、G或I，更优选V、S、G或I，更加优选V。

在另一个实施方案中，轻链可变区或其片段是Vκ3家族的，并且因此，如果选择用于突变的一个或多个氨基酸位置在Vκ3家族轻链可变区，那么突变包括选自下述的一个或多个置换：

(i)在氨基酸位置2处的I或T，更优选T；

(ii)在氨基酸位置3处的V或T，更优选T；

(iii)在氨基酸位置10处的T或I，更优选I；

(iv)在氨基酸位置12处的S或Y，更优选Y；

(v)在氨基酸位置18处的S或R，更优选S；

(vi)在氨基酸位置20处的T或A，更优选A；

(vii)在氨基酸位置56处的I或M，更优选M；

(viii)在氨基酸位置74处的I、V或T，更优选V或T，更加优选T；

(ix)在氨基酸位置94处的S或N，更优选N；

(x)在氨基酸位置101处的F、Y或S，更优选Y或S，更加优选S；和

(xi)在氨基酸位置103处的V、L或A，更优选L或A，更加优选A。

在另一个实施方案中，轻链可变区或其片段是Vλ1家族的，并且因此，如果选择用于突变的一个或多个氨基酸位置在Vλ1家族轻链可变区，那么突变包括选自下述的一个或多个置换：

(i)在氨基酸位置1处的L、Q、S或E，更优选L、S或E，更加优选L；

(ii)在氨基酸位置2处的S、A、P、I或Y，更优选A、P、I或Y，更加优选P；

(iii)在氨基酸位置4处的V、M或L，更优选V或M，更加优选V；

(iv)在氨基酸位置7处的S、E或P，更优选S或E，更加优选S；

(v)在氨基酸位置11处的A或V，更优选A；

(vi)在氨基酸位置14处的T、S或A，更优选T或S，更加优选T；

(vii)在氨基酸位置46处的H或Q，更优选H；

(viii)在氨基酸位置53处的K、T、S、N、Q或P，更优选T、S、N、Q或P；

(ix)在氨基酸位置82处的R、Q或K，更优选R或Q，更加优选R；

(x)在氨基酸位置92处的G、T、D或A，更优选G、T或D，更加优选T；和

(xi)在氨基酸位置103处的D、V、T、H或E，更优选V、T、H或E，更加优选V。

在另一个实施方案中，突变进一步包含选自下述的一个或多个(优选所有)重链置换：

(i)使用AHo或Kabat编号的氨基酸位置12处的丝氨酸(S)；

(ii)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的丝氨酸(S)；和

(iii)使用AHo编号的氨基酸位置144(使用Kabat编号的氨基酸位置103)处的丝氨酸(S)或苏氨酸(T)。

在另一个方面，本发明提供了分离的抗体构架支架(例如scFv支架)。例如，在多种实施方案中，本发明提供了包含如图9(SEQ IDNO：1)、图10(SEQ ID NO：2)或图11(SEQ ID NO：3)中所示的氨基酸序列的分离的重链构架支架。在另一个示例性实施方案中，本发明提供了包含如图12(SEQ ID NO：4)、图13(SEQ ID NO：5)或图14(SEQ ID NO：6)中所示的氨基酸序列的分离的轻链构架支架。此种支架可以用于改造免疫结合剂，例如scFv抗体。因此，在另一个方面，本发明提供了改造免疫结合剂的方法，所述免疫结合剂包含重链和/或轻链CDR1、CDR2和CDR3序列，所述方法包括将重链和/或轻链CDR1、CDR2和CDR3序列分别插入重链构架支架内。在特定示例性实施方案中，重链构架支架包含如图9(SEQ ID NO：1)、图10(SEQ ID NO：2)、图11(SEQ ID NO：3)、SEQ ID NO：7、SEQ ID NO：8或SEQ ID NO：9中所示的氨基酸序列。在一个优选实施方案中，重链构架支架包含如图9(SEQ ID NO：1)中所示的氨基酸序列。在另一个优选实施方案中，重链构架支架包含如图10(SEQID NO：2)中所示的氨基酸序列。在另一个优选实施方案中，重链构架支架包含如图11(SEQ ID NO：3)中所示的氨基酸序列。在另一个优选实施方案中，重链构架支架包含SEQ ID NO：7的氨基酸序列。在另一个优选实施方案中，重链构架支架包含SEQ ID NO：8的氨基酸序列。在另外一个优选实施方案中，重链构架支架包含SEQ ID NO：9的氨基酸序列。在其他示例性实施方案中，轻链构架支架包含如图12(SEQ ID NO：4)、图13(SEQ ID NO：5)、图14(SEQ ID NO：6)、SEQ ID NO：10、SEQ ID NO：11或SEQ ID NO：12中所示的氨基酸序列。在一个优选实施方案中，轻链构架支架包含如图11(SEQID NO：4)中所示的氨基酸序列。在另一个优选实施方案中，轻链构架支架包含如图12(SEQ ID NO：5)中所示的氨基酸序列。在另一个优选实施方案中，轻链构架支架包含如图13(SEQ ID NO：6)中所示的氨基酸序列。在另一个优选实施方案中，轻链构架支架包含如SEQ ID NO：10中所示的氨基酸序列。在另一个优选实施方案中，轻链构架支架包含如SEQ ID NO：11中所示的氨基酸序列。在另外一个优选实施方案中，轻链构架支架包含如SEQ ID NO：12中所示的氨基酸序列。优选地，免疫结合剂是scFv抗体，尽管如本文所描述的其他免疫结合剂(例如，全长抗体、Fab、Dab或纳米抗体)也可以根据本发明的方法进行改造。本发明还提供了根据本发明的方法改造的免疫结合剂组合物，例如scFv抗体。

附图简述

图1是概括根据本发明的方法的scFv的一般的基于序列的分析的流程图。

在第一个步骤中，提供了待在溶解性和稳定性方面进行改善的scFv的序列(框1)，其随后与抗体序列数据库进行比较(框2)，例如开放源种系序列数据库(例如，Vbase，IMGT；框3)、开放源成熟抗体序列数据库(例如，KDB；框4)或全长人稳定和可溶scFv片段的数据库(例如，QC；框5)。

应用例如框3中描述的开放源种系序列数据库允许鉴定高度保守的位置，其在进化过程中进行选择，并且因此被认为促成全长抗体背景中的可变结构域的稳定性(框3’)。针对开放源成熟抗体序列数据库4的比较允许鉴定这样的模式，其代表不依赖于各自的CDR的稳定性、溶解性和/或结合的改善(框4’)。此外，针对全长人稳定和可溶scFv片段的数据库(框5)的比较导致鉴定对于稳定性和/或溶解性关键的残基(特别是在scFv形式中)，以及鉴定这样的模式，其代表特别是在scFv形式，例如VL和VH组合中不依赖于各自的CDR的稳定性、溶解性和/或结合的改善(框5’)。

在下一个步骤中(框6)，用各个数据库中鉴定的最频繁的合适氨基酸置换关键残基。

最后(框7)，可以在酵母QC系统中进行关键残基的随机或偏好性诱变并且随后就改善的稳定性和/或溶解性进行筛选。突变体可以再次经历上文描述的操作(至框2的箭头)。

图2是用于scFv的基于序列的分析的示例性多步骤方法的流程图。

在第一个步骤中(框1)，基于生物信息学工具提供的结果，通过比较每个位置处不同氨基酸的出现情况，测定每一个残基在构架中的频率。在第二个步骤中，例如通过使用用式D＝∑ni(ni-1)/N (N-1)计算的辛普森(Simpson′s)指数，定义每个位置处的保守程度。在第三个步骤中，测定了使总体自由能降到最低的最佳置换(例如，通过应用玻尔兹曼(Boltzmann′s)定律：ΔΔGth＝-RTln(f亲本/f共有区))。最后(步骤4)，测定潜在的稳定性突变的作用。为了这个目的，可以考虑因素例如局部和非局部相互作用、规范残基(canonical residue)、界面、暴露程度和β-转角倾向。

图3是用于在酵母中选择稳定和可溶scFv的示例性质量控制(QC)系统的示意图。利用这个系统，通过诱导型报告构建体的存在(所述构建体的表达依赖于稳定和可溶scFv-AD-Gal11p融合蛋白的存在)选择在还原环境中能够表达稳定和可溶scFv的宿主细胞。融合蛋白与Gal4(1-100)的相互作用形成激活可选标记的表达的功能转录因子(参见图3A)。不稳定和/或不溶性scFv无法形成功能转录因子并且诱导可选标记的表达，并且因此从选择中排除(图3B)。即使在其中二硫键不折叠的还原条件下，所选择的scFv也能够获得稳定和可溶的蛋白质折叠，而不稳定和/或不溶性scFv趋于去折叠、聚集和/或降解。在氧化条件下，所选择的scFv仍展现优良的溶解性和稳定性特征。

图4是另一个示例性质量控制(QC)系统的示意图。用于选择可溶和稳定scFv的总体概念与图3描述的相同，然而，在这个形式中，scFv与包含活化结构域(AD)和DNA结合结构域(DBD)的功能转录因子直接融合。图4A描述了示例性可溶和稳定scFv，其当与功能转录因子融合时，不阻碍可选标记的转录。相比之下，图4B描述了其中不稳定scFv与转录因子融合而产生无功能融合构建体的情形，所述构建体无法激活可选标记的转录。

图5是体细胞突变前在天然种系序列内的特定构架(FW)位置处(图5A)，和在QC系统中选择的体细胞突变后在成熟抗体序列内的相应FW位置处(图5B)的变异性分析的示意图。可以赋予种系和QC序列内分别的FW位置(例如，高度可变构架残基(“hvFR”))不同的变异性值(即，分别为“G”和“Q”值)。如果对于特定位置G＞Q，那么在那个位置处存在有限数目的合适的稳定FW残基。如果对于特定位置G＜Q，那么这可能表明该残基已就最佳溶解性和稳定性进行了天然选择。

图6描述了在25-95℃下的热诱导胁迫后对于ESBA105变体观察到的变性曲线图。虚线表示具有至种系共有残基的回复突变(V3Q、R47K或V103T)的ESBA-105变体。实线表示包含通过本发明的方法鉴定的优选置换的变体(QC11.2、QC15.2和QC23.2)。

图7描述了包含共有序列回复突变(S-2、D-2、D-3)、至丙氨酸(D-1)或QC残基(QC7.1、QC11.2、QC15.2、QC23.2)的突变的一组ESBA105变体的热稳定性的比较。提供了每种变体的热稳定性(以任意去折叠单位表示)。

图8描述了在25-95℃下的热诱导胁迫后对于ESBA212变体观察到的变性曲线图。虚线表示具有至种系共有残基的回复突变(V3Q或R47K)的ESBA-212变体。实线表示亲本ESBA212分子。

图9举例说明了VH1a家族的scFv构架支架。第一行显示使用Kabat系统的重链可变区编号。第二行显示使用AHo系统的重链可变区编号。第三行显示scFv构架支架序列(SEQ ID NO：1)，其中在标记为“X”的那些位置处，该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“x”的位置以及标记为CDR1 H1、CDR H2和CDR H3的区域可以由任何氨基酸占据。

图10举例说明了VH1b家族的scFv构架支架。第一行显示使用Kabat系统的重链可变区编号。第二行显示使用AHo系统的重链可变区编号。第三行显示scFv构架支架序列(SEQ ID NO：2)，其中在标记为“X”的那些位置处，该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“x”的位置以及标记为CDR1H1、CDR H2和CDR H3的区域可以由任何氨基酸占据。

图11举例说明了VH3家族的scFv构架支架。第一行显示使用Kabat系统的重链可变区编号。第二行显示使用AHo系统的重链可变区编号。第三行显示scFv构架支架序列(SEQ ID NO：3)，其中在标记为“X”的那些位置处，该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“x”的位置以及标记为CDR1H1、CDR H2和CDR H3的区域可以由任何氨基酸占据。

图12举例说明了Vκ1家族的scFv构架支架。第一行显示使用Kabat系统的轻链可变区编号。第二行显示使用AHo系统的轻链可变区编号。第三行显示scFv轻链构架支架序列(SEQ ID NO：4)，其中在标记为“X”的那些位置处，该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“.”的位置以及标记为CDR1L1、CDR L2和CDRL3的区域可以由任何氨基酸占据。

图13举例说明了Vκ3家族的scFv构架支架。第一行显示使用Kabat系统的轻链可变区编号。第二行显示使用AHo系统的轻链可变区编号。第三行显示scFv轻链构架支架序列(SEQ ID NO：5)，其中在标记为“X”的那些位置处，该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“.”的位置以及标记为CDR1L1、CDR L2和CDRL3的区域可以由任何氨基酸占据。

图14举例说明了VL1家族的scFv构架支架。第一行显示使用Kabat系统的轻链可变区编号。第二行显示使用AHo系统的轻链可变区编号。第三行显示scFv轻链构架支架序列，其中在标记为“X”的那些位置处，该位置可以由“X”下所列出的任何氨基酸残基占据。标记为“.”的位置以及标记为CDR1L1、CDR L2和CDR L3的区域可以由任何氨基酸占据。在特定的优选实施方案中，在CDR L1内的AHo位置58和67-72分别由下述残基占据：D和NNQRPS。

图15描述了野生型ESBA105及其可溶性变体的PEG沉淀溶解度曲线。

图16描述了如在广泛温度范围(25-96℃)下的热攻击后测量的野生型ESBA105及其可溶性变体的热变性曲线图。

图17描述了SDS-PAGE凝胶，其显示了在热胁迫条件下温育2周后各种ESBA105可溶性突变体的降解行为。

发明详述

本发明涉及用于免疫结合剂性质，特别地scFv性质(包括但不限于稳定性、溶解性和/或亲和力)的基于序列的改造和优化的方法。更具体地，本发明公开了使用抗体序列分析鉴定scFv中待突变的氨基酸位置来优化scFv抗体，从而提高scFv的一个或多个物理性质的方法。本发明还涉及按照本发明的方法产生的或可获得的经改造的免疫结合剂例如scFv。

本发明至少部分基于抗体序列的多个数据库中的各重链和轻链构架位置上的氨基酸频率的分析。特别地，已将抗体序列数据库(例如，种系抗体序列数据库或成熟抗体数据库，例如Kabat数据库)的频率分析与因具有期望的功能性质而被选择的scFv序列的数据库的频率分析相比较。通过给各构架位置的变异性程度赋值(例如，通过使用辛普森指数)和通过比较不同类型的抗体序列数据库中的各构架位置上的变异性程度，现已能够鉴定对于scFv的功能性质(例如，稳定性、溶解性)是重要的构架位置。这现允许对构架氨基酸位置定义“功能共有区”，其中已鉴定了比免疫球蛋白序列(例如种系或成熟免疫球蛋白序列)中的相应位置更耐受变异性或更不耐受变异性的构架位置。因此，本发明提供基于功能性选择的scFv序列的数据库的使用的“功能共有区”方法并证明了其优点。此外，本发明提供了通过突变使用本文中描述的“功能共有区”方法鉴定的特定构架氨基酸位置来对免疫结合剂(例如，scFv)进行改造的方法。

首先定义某些术语，这样可使本发明更容易被理解。除非另外指出，本文中使用的所有技术和科学术语具有与本发明所属领域内的技术人员通常理解的意义相同的意义。虽然与本文中描述的方法和材料相似或等同的方法和材料可用于本发明的实践或试验中，但下面描述了适当的方法和材料。本文中提及的所有公开物、专利申请、专利和其他参考资料以它们的全文通过引用合并入本文。在矛盾的情况下，以本说明书(包括定义)为准。此外，材料、方法和实施例只是举例说明性的而非限定性的。

本文中使用的术语“抗体”是免疫球蛋白的同义词。根据本发明的抗体可以是完整的免疫球蛋白或其片段，其包括免疫球蛋白的至少一个可变结构域，例如单个可变结构域，Fv(Skerra A.和Plückthun，A.(1988)Science 240：1038-41)、scFv(Bird，R.E.等人(1988)Science 242：423-26；Huston，J.S.等人(1988；Proc.Natl.Acad.Sci.USA 85：5879-83)，Fab、(Fab′)2、或本领域技术人员熟知的其他片段。

本文中使用的术语“抗体构架(antibody framework)”是指可变结构域VL或VH的一部分，其用作该可变结构域的抗原结合环的支架(Kabat，E.A.等人，(1991)Sequences of proteins of immunologicalinterest.NIH Publication 91-3242)。

本文中使用的“抗体CDR”是指抗体的互补决定区，其如KabatE.A.等人，(1991)Sequences of proteins of immunological interest.NIHPublication 91-3242)定义的由抗原结合环组成。抗体Fv片段的两个可变结构域中的每一个包含例如3个CDR。

术语“单链抗体”或“scFv”意指包含通过接头连接的抗体重链可变区(V_H)和抗体轻链可变区(V_L)的分子。此类scFv分子可具有一般结构：NH₂-V_L-接头-V_H-COOH或NH₂-V_H-接头-V_L-COOH。

如本文中所使用的，“同一性”是指两个多肽、分子之间或两个核酸之间匹配的序列。当两个进行比较的序列中的位置都被相同的碱基或氨基酸单体亚单元占据(例如，如果两个DNA分子的每一个中的位置都被腺嘌呤占据，或两个多肽的每一个中的位置都被赖氨酸占据)时，各个分子在该位置上是同一的。两个序列之间的“百分数同一性”是由这两个序列共有的匹配位置数目除以进行比较的位置数目再乘以100的函数。例如，如果两个序列的10个位置中有6个匹配，那么这两个序列具有60％的同一性。例如，DNA序列CTGACT和CAGGTT共有50％的同一性(总共6个位置中有3个位置匹配)。通常，在将两个序列比对以产生最大同一性时进行比较。这样的比对可通过使用，例如，通过计算机程序例如Align程序(DNAstar，Inc.)方便地进行的Needleman等人(1970)J.Mol.Biol.48：443-453的方法来提供。

“相似的”序列是当比对时共有相同和相似氨基酸残基的序列，其中相似的残基是进行比对的参照序列中的相应氨基酸残基的保守置换。在这点上，参照序列中的残基的“保守置换”是用在物理或功能上与相应的参照残基相似(例如具有相似大小、形状、电荷、化学性质，包括形成共价键或氢键的能力等)的残基进行的置换。因此，“经保守置换修饰的”序列是与参照序列或野生型序列相异在于存在一个或多个保守置换的序列。两个序列之间的“百分数相似性”是包含由两个序列共有的匹配残基或保守置换的位置数目除以进行比较的位置数目再乘以100的函数。例如，如果两个序列的10个位置中有6个匹配以及10个位置中有2个包含保守置换，那么这两个序列具有80％的正相似性。

本文中使用的“氨基酸共有序列”是指可使用至少两个，优选更多的进行比对的氨基酸序列的矩阵产生的氨基酸序列(允许在比对中出现缺口)，其使得可能确定各位置上出现频率最高的氨基酸残基。共有序列是包含在各位置上出现频率最高的氨基酸的序列。如果两个或更多个氨基酸等同地出现在单个位置上，那么共有序列包括两个或所有此类氨基酸。

可在不同水平上分析蛋白质的氨基酸序列。例如，可在单个残基水平、多个残基水平、具有缺口的多个残基水平等上展示保守性或变异性。残基可展示相同残基的保守性或可在种类水平上保守。氨基酸种类的实例包括极性但不带电荷的R组(丝氨酸、苏氨酸、天冬酰胺和谷氨酰胺)；带正电荷的R组(赖氨酸、精氨酸和组氨酸)；带负电荷的R组(谷氨酸和天冬氨酸)；疏水R组(丙氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、缬氨酸和酪氨酸)；以及特殊氨基酸(半胱氨酸、甘氨酸和脯氨酸)。其他种类对于本领域技术人员来说是已知的并且可使用结构测定法或其他数据来定义以估量可置换性。在该意义上，可置换的氨基酸可以指可在该位置上进行置换并且保持功能保守性的任何氨基酸。

如本文中所使用的，当一个氨基酸序列(例如，第一V_H或V_L序列)与一个或多个另外的氨基酸序列(例如，数据库中的一个或多个VH或VL序列)比对时，可将一个序列(例如，第一V_H或V_L序列)中的氨基酸位置与一个或多个另外的氨基酸序列中的“相应位置”相比较。如本文中所使用的，“相应位置”表示当对序列进行最优比对时，即当序列进行比对以获得最高百分数同一性或百分数相似性时进行比较的序列中的等同位置。

如本文中所使用的，术语“抗体数据库”是指两个或更多个抗体氨基酸序列(“多个”序列)的集合，通常是指数十个、数百个或甚至数千个抗体氨基酸序列的集合。抗体数据库可存储例如抗体V_H区、抗体V_L区或两者的集合的氨基酸序列，或可存储由V_H和V_L区域组成的scFv序列的集合。优选，可将数据库存储在可检索的、固定的介质中，例如计算机上可检索的计算机程序中。在一个实施方案中，抗体数据库是包含或由种系抗体序列组成的数据库。在另一个实施方案中，抗体数据库是包含或由成熟(即，表达的)抗体序列组成的数据库(例如，成熟抗体序列的Kabat数据库，例如KBD数据库)。在另一个实施方案中，抗体数据库包含或由功能性选择的序列(例如，根据QC测定选择的序列)组成。

术语“免疫结合剂”是指分子，所述分子包含抗体的全部或部分抗原结合位置，例如重链和/或轻链可变结构域的全部或一部分，这样免疫结合剂能够特异性识别靶抗原。免疫结合剂的非限定性实例包括全长免疫球蛋白分子和scFv，以及抗体片段，包括但不限于(i)Fab片段，由V_L、V_H、C_L和C_H1结构域组成的单价片段；(ii)F(ab′)₂片段，包含通过铰链区上的二硫桥连接的两个Fab片段的二价片段，(iii)Fab′片段，其基本上是具有铰链区的一部分的Fab(参见，FUNDAMENTAL IMMUNOLOGY(Paul编辑，3.sup.rd ed.1993)；(iv)由V_H和C_H1结构域组成的Fd片段；(v)由抗体的单臂的V_L和V_H结构域组成的Fv片段；(vi)单结构域抗体例如Dab片段(Ward等人，(1989)Nature 341：544-546)，其由V_H或V_L结构域组成，Camelid(参见Hamers-Casterman，等人，Nature 363：446-448(1993)和Dumoulin等人，Protein Science 11：500-515(2002))或Shark抗体(例如，shark Ig-NARs)；和(vii)纳米抗体(Nanobody)，包含单个可变结构域和两个恒定结构域的重链可变区。

如本文中所使用的，术语“功能性质”是例如为了提高多肽的生产性质或治疗功效，其提高(例如相对于常规多肽)对于本领域技术人员来说是期望的和/或有利的多肽(例如，免疫结合剂)的性质。在一个实施方案中，功能性质是提高的稳定性(例如，热稳定性)。在另一个实施方案中，功能性质是提高的溶解性(例如，在细胞条件下)。在另一个实施方案中，功能性质是非聚集性。在另一个实施方案中，功能性质是表达(例如，在原核细胞中)的提高。在另一个实施方案中，功能性质是在内含体纯化方法后重折叠产量的提高。在某些实施方案中，功能性质不是抗原结合亲和力的提高。

scFv的基干序列的公析

本发明提供了用于分析scFv序列的方法，其允许鉴定scFv序列中选择用于突变的氨基酸位置。选择用于突变的氨基酸位置是经预测影响scFv的功能性质例如溶解性、稳定性和/或抗原结合的氨基酸位置，其中预测该位置上的突变提高scFv的性能。因此，本发明允许对scFv进行比简单随机突变scFv序列中的氨基酸位置更集中的改造以优化性能。

在图1的流程图中示意性地图解了scFv序列的基于序列的分析的某些方面。如该图中所示的，将要优化的scFv序列与一个或多个抗体数据库(包括由因稳定和可溶而被选择的scFv序列组成的抗体数据库)中的序列相比较。这可允许鉴定特别地scFv形式中对于稳定性和/或溶解性至关重要的残基，以及鉴定特别地在scFv形式(例如，V_L和V_H的组合)中显示不依赖于各自CDR的稳定性、溶解性和/或结合的提高的模式。在鉴定了至关重要的残基后，它们就可用例如在各自数据库中鉴定的出现频率最高的适当的氨基酸进行置换，和/或通过随机或偏好性诱变进行置换。

因此，在一个方面，本发明涉及鉴定单链抗体(scFv)中用于突变的氨基酸位置的方法，所述scFv具有V_H和V_L氨基酸序列，该方法包括：

a)将scFv V_H、V_L或V_H和V_L氨基酸序列输入包含许多抗体V_H、V_L或V_H和V_L氨基酸序列的数据库，以使scFv V_H、V_L或V_H和V_L氨基酸序列与数据库的抗体V_H、V_L或V_H和V_L氨基酸序列比对；

b)将scFv V_H或V_L氨基酸序列中的氨基酸位置与数据库的抗体V_H或V_L氨基酸序列中的相应位置相比较；

c)确定scFv V_H或V_L氨基酸序列中的氨基酸位置是否被在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守的氨基酸残基占据；和

d)当氨基酸位置被在数据库的抗体V_H或V_L氨基酸序列中的相应位置上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的氨基酸位置鉴定为用于突变的氨基酸位置。

因此，在本发明的方法中，将目的scFv的序列(即，V_H、V_L或两者的序列)与抗体数据库的序列相比较，然后确定目的scFv中的氨基酸位置是否被在数据库中的序列的相应位置上“保守的”氨基酸残基占据。如果scFv序列的氨基酸位置被在数据库的序列中的相应位置上不“保守的”氨基酸残基占据，则scFv的该氨基酸位置选择用于突变。优选，被分析的氨基酸位置是目的scFv中的构架氨基酸位置。更优选，可分析目的scFv中的每一个构架氨基酸位置。在备选的实施方案中，可分析目的scFv的一个或多个CDR中的一个或多个氨基酸位置。在另外的实施方案中，可分析目的scFv中的各氨基酸位置。

为了确定氨基酸残基在抗体数据库的序列中的特定氨基酸位置(例如，构架位置)上是否“保守”，可计算在特定位置上的保守程度。存在许多不同的本领域内已知的可定量给定的位置上的氨基酸多样性的方法，其全都可用于本发明的方法。优选，使用辛普森多样性指数计算保守程度，该指数是多样性的量度。其考虑到存在于各位置上的氨基酸的数目，以及各氨基酸的相对丰度(abundance)。辛普森指数(S.I.)代表两个随机选择的抗体序列在某些位置包含相同的氨基酸的概率。当测量保守性时，辛普森指数考虑了两个主要因素，丰富度(richness)和均匀度(evenness)。如本文中所使用的，“丰富度”是存在于特定位置上的氨基酸的不同种类的数目的量度(即，数据库中在该位置上显示的不同氨基酸残基的数目是丰富度的量度)。如本文中所使用的，“均匀度”是存在于特定位置上的氨基酸中的每一个的丰度的量度(即，数据库的序列中氨基酸残基在该位置上发生的频率是均匀度的量度)。

虽然残基丰富度独自可用作检查特定位置上的保守程度的量度，但其没有考虑存在于某些位置上的各氨基酸残基的相对频率。其对在数据库的序列中的特定位置上极少发生的氨基酸残基与对在相同位置以极高的频率发生的残基给予同样的权重。均匀度是组成位置的丰富度的不同氨基酸的相对丰度的量度。辛普森指数将两者(丰富度和均匀度)都考虑到了，从而是按照本发明定量保守程度的优选方法。特别地，在非常保守的位置上的低频率残基被认为是潜在有问题的，从而其可选择用于突变。

辛普森指数的公式为D＝∑n_i(n_i-1)/N(N-1)，其中N是调查的序列(例如，在数据库中)的总数，n_i是各氨基酸残基在被分析的位置上的频率。氨基酸事件(i)在数据库中的频率是氨基酸在数据库中发生的次数(n_i)。计数n_i本身以相对频率给出，其表示它们按照事件的总数进行了标准化。当最大多样性发生时，S.I.值是0，当最小多样性发生时，S.I.值是1。因此S.I.的范围是0至1，多样性和指数值呈负相关。

在图2中更详细地描述了概述用于分析数据库的序列中的构架氨基酸位置的多个步骤的流程图。

因此，在上述方法的优选实施方案中，使用辛普森指数给数据库的抗体V_H或V_L氨基酸序列中的相应位置的保守程度赋值。该相应位置的S.I.值可用作该位置的保守性的指标。

在其他实施方案中，将密切相关的抗体序列的可信比对(trustedalignment)(即，考虑蛋白质结构相似性的序列比对)，用于本发明以产生氨基酸的相对丰度和确定的位置的保守程度的矩阵。这些矩阵经设计用于抗体-抗体数据库比较。计算各残基的观察到的频率，并且将其与预期的频率(其基本上是数据集中各残基对于各位置的频率)相比较。

使用所述方法对给定的scFv抗体进行的分析提供了关于给定的scFv抗体中的某些位置上的生物学上允许的突变和罕见残基的信息，以及允许预测其构架中的潜在弱点。可将常规技术用于对“最佳”拟合一组氨基酸-频率数据的氨基酸置换进行工程设计(使用S.I.值和相对频率作为标准)。

上述基于序列的分析可用于scFv的V_H区域，scFv的V_L区域或两者。因此，在一个实施方案中，将scFv V_H氨基酸序列输入数据库并且与数据库的抗体V_H氨基酸序列比对。在另一个实施方案中，将scFv V_L氨基酸序列输入数据库并且与数据库的抗体V_L氨基酸序列比对。在另一个实施方案中，将scFv V_H和V_L氨基酸序列输入数据库并且与数据库的抗体V_H和V_L氨基酸序列比对。用于将一个序列与数据库中的其他序列的集合进行比对的算法在本领域内已良好地建立。将序列进行比对以获得序列之间的最高百分数同一性或相似性。

本发明的方法可用于分析scFv序列中的一个目的氨基酸位置或更优选，可用于分析多个目的氨基酸位置。因此，在上述方法的步骤b)中，可将scFv V_H或V_L氨基酸序列中的多个氨基酸位置与数据库的抗体V_H或V_L氨基酸序列中的相应位置相比较。要分析的优选位置是scFv的V_H和/或V_L序列中的构架位置(例如，可分析各VH和VL构架位置)。另外或备选地，可分析scFv的一个或多个CDR中的一个或多个位置(虽然突变CDR中的氨基酸位置可能不是优选的，因为CDR中的突变比构架区中的突变更可能影响抗原结合活性)。此外，本发明的方法允许分析scFv V_H、V_L或V_H和V_L氨基酸序列中的各氨基酸位置。

在本发明的方法中，可将目的scFv的序列与多种不同类型的抗体序列数据库的一种或多种中的序列相比较。例如，在一个实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是种系抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是重排的亲和力成熟的抗体V_H、V_L或V_H和V_L氨基酸序列。在另一个优选实施方案中，数据库的抗体V_H、V_L或V_H和V_L氨基酸序列是因具有至少一种期望的功能性质例如scFv稳定性或scFv溶解性而被选择(下面进一步论述的)的scFv抗体V_H、V_L或V_H和V_L氨基酸序列。

可从种系序列的序列比对或从天然发生的任何其他抗体序列获得、汇编和/或产生抗体序列信息。序列的来源可包括但不限于一种或多种下列数据库：

·Kabat数据库(.immuno.bme.nwu.Edu(到2007年10月为止)；Johnson和Wu(2001)Nucleic Acids Res.29：205-206；Johnson和Wu(2000)Nucleic Acids Res.28：214-218)。来自2000年的原始数据可通过在美国的FTP和在英国的镜像获得。

·Kabatman包含允许用户就序列的罕见特征检索Kabat序列和使用户能够发现对于特定抗体序列中的CDR的正则分配(canonicalassignment)的数据库。

·AAAAA网站(www.bioc.unizh.ch/antibody/(到2007年10月为止))，由Annemarie Honegger制作的提供关于抗体的序列信息和结构数据的抗体网页。

·ABG：抗体的3D结构的目录(directory)-由Antibody Group(ABG)产生的目录允许用户访问汇编在Protein Data Bank(PDB)中的抗体结构。在该目录中，各PDB条目(entry)具有至原始来源的超链接，从而使重新获得全部信息变得容易。

·ABG：小鼠VH和VK种系区段的种系基因目录，在Instituto deBiotecnologia，UNAM(National University of Mexico)的AntibodyGroup的网页的一部分。

·，国际免疫遗传学信息系统(internationalImMunoGeneTics information)-由Marie-Paule Lefranc(UniversitéMontpellier II，CNRS)于1989年创建，IMGT是专门于人和其他脊椎动物物种的免疫系统的免疫球蛋白、T细胞受体和相关蛋白质的集成知识资源。IMGT由序列数据库(IMGT/LIGM-DB，来自人和其他脊椎动物的IG和TR的综合数据库，具有完全注释的序列的翻译，IMGT/MHC-DB，IMGT/PRIMER-DB)、基因组数据库(IMGT/GENE-DB)、结构数据库(IMGT/3Dstructure-DB)、网络资源(IMGT Repertoire)组成(IMGT，the international ImMunoGeneTicsinformation；imgt.cines.fr(到2007年10月为止)；Lefranc等人(1999)Nucleic Acids Res.27：209-212；Ruiz等人(2000)NucleicAcids Res.28：219-221；Lefranc等人(2001)Nucleic Acids Res.29：207-209；Lefranc等人(2003)Nucleic Acids Res.31：307-310)。

·V BASE-从一千多个公开序列(包括目前从Genbank和EMBL数据库释放的序列)汇编的所有人种系可变区序列的综合目录。

在优选实施方案中，从scFv文库获得抗体序列信息，所述scFv文库具有已在还原性环境中就增强的稳定性和溶解性进行选择的确定的构架。更特别地，已描述了允许细胞内选择在还原性环境中具有增强的稳定性和溶解性的scFv构架的酵母质量控制(QC)-系统(参见例如，PCT公开号WO 2001/48017；美国申请号2001/0024831和US2003/0096306；美国专利7,258,985和7,258,986)。在该系统中，将scFv文库转化入能够表达特定的已知抗原并且只在抗原-scFv相互作用存在的情况下存活的宿主细胞。在适合抗原和scFv表达且只允许细胞在抗原-scFv相互作用存在的情况下存活的条件下培养转化的宿主细胞。因此，可分离在存活的细胞中表达的并且具有在还原性环境中是稳定的和可溶的确定的构架的scFv。因此，QC-系统可用于筛选大scFv文库，从而分离具有在还原性环境中是稳定的和可溶的构架的优选scFv，并且可将这些选择的scFv的序列汇编入scFv序列数据库。然后可使用本发明的方法将这样的scFv数据库用于与其他目的scFv序列的比较目的。在PCT公开号WO 2003/097697和美国申请号20060035320中更详细地描述了之前使用QC系统选择和确定的优选scFv构架序列。

原始QC-系统的变型在本领域内是已知的。在一个示例性实施方案中(在图3中对其进行了示意性举例说明)，使scFv文库与Gal4酵母转录因子的激活结构域(activation domain)(AD)融合，所述激活结构域又融合至所谓的Gal11p蛋白(11p)的一部分。然后将scFv-AD-Gal11p融合构建体转化入表达Gal 4的前100个氨基酸，从而包含Gal4的DNA结合结构域(DBD；Gal4(1-100))的宿主细胞。Gal11p是已知直接结合Gal4(1-100)的点突变(参见Barberis等人，Cell，81：359(1995))。在这样的条件下培养转化的宿主细胞，所述条件适合于scFv融合蛋白表达并且只允许细胞在scFv融合蛋白足够稳定和可溶以与Gal4(1-100)相互作用，从而形成包含连接至DBD的AD的功能转录因子(图3A)的情况下存活。因此，可分离在存活的细胞中表达的且具有在还原性环境中是稳定的和可溶的确定的构架的scFv。该示例性QC系统进一步描述于Auf der Maur等人，Methods，34：215-224(2004)中。

在另一个示例性实施方案中，用于本发明的方法的QC-系统描述于图4中。在QC-系统的该形式中，将scFv或scFv文库直接融合至功能转录因子并且在包含选择标记的酵母株系中表达。选择标记将只在功能性scFv-转录因子融合物存在的情况下被激活，这表明作为整体的构建体需要是稳定的且可溶的(图4A)。在scFv不稳定的情况下，其将形成聚集体并且最终被降解，从而也引起融合至其的转录因子降解，这样其不再能够激活选择标记的表达(参见图4B)。

在本发明的方法中，可将目的scFv的序列与抗体数据库中的所有序列相比较，或备选地只将数据库中序列的选择部分用于比较目的。即，可将数据库只限定或限制于与目的scFv具有高百分数相似性或同一性的序列。因此，在本发明的方法的一个实施方案中，数据库是其中只有与scFv抗体V_H、V_L或V_H和V_L氨基酸序列具有高度相似性的抗体V_H、V_L或V_H和V_L氨基酸序列才被包括在数据库中的受限制的数据库。

在将目的scFv序列输入数据库并且将其与数据库中的抗体序列相比较后，分析序列信息以提供关于给定的位置的氨基酸的频率和变异性的信息和预测潜在有问题的氨基酸位置，特别地scFv的构架中潜在有问题的氨基酸位置。这样的信息还可用于设计提高scFv的性质的突变。例如，可通过用在该位置上频繁出现的亲水残基置换暴露于溶剂的疏水残基来提高抗体溶解性。

在本发明的方法中，存在许多可能类型的氨基酸残基，所述氨基酸残基在数据库的抗体序列中的特定位置上可以是“保守的”。例如，一个特定的氨基酸残基，可在该位置上以极高的频率被发现，表明该特定氨基酸残基在该特定位置上是优选的。因此，在该方法的一个实施方案中，在步骤c)中，在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守的氨基酸残基是这样的氨基酸残基，该氨基酸残基在数据库的抗体V_H或V_L氨基酸序列中的该位置上出现频率最高。在其他实施方案中，位置可以对于特定类型或种类的氨基酸残基(即，位置不是仅被单个特定氨基酸残基优先占据，而是被其各自为相同类型或种类的残基的几个不同氨基酸残基优先占据)是“保守的”。例如，在步骤c)中，数据库的抗体V_H或V_L氨基酸序列中的相应位置可对于：(i)疏水氨基酸残基、(ii)亲水氨基酸残基、(iii)能够形成氢键的氨基酸残基或(iv)具有形成β-折叠的倾向的氨基酸残基是保守的。

在方法的步骤d)中，当氨基酸位置被在数据库的抗体V_H或V_L氨基酸序列中的相应位置上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的氨基酸位置鉴定为用于突变的氨基酸位置。存在许多可能的情况，其中将氨基酸位置鉴定为被“不保守”的氨基酸残基占据，从而将其鉴定为潜在有问题的。例如，如果数据库中的相应氨基酸位置对于疏水残基是保守的并且scFv中的位置被亲水残基占据，那么该位置在scFv中可能是潜在有问题的并且该位置可选择用于突变。同样，如果数据库中相应的氨基酸位置对于亲水残基是保守的并且scFv中的位置被疏水残基占据，那么该位置在scFv中可能是潜在有问题的，并且可选择该位置用于突变。在其他情况下，如果数据库中的相应氨基酸位置对于能够形成氢键或具有形成β-折叠的倾向的氨基酸残基是保守的，并且scFv中的位置分别被不能形成氢键或不具有形成β-折叠的倾向的残基占据，那么该位置在scFv中可能是潜在有问题的并且可选择该位置用于突变。

在优选实施方案中，可单独或组合地使用本发明中描述的方法以产生组合的氨基酸置换从而提高抗体单链片段的稳定性和/或溶解性。

协方差分析

本发明还涉及用于分析与数据库中的抗体序列相比scFv的序列中的协方差(covariance)的方法。共变的残基可以是例如，(i)构架区(FR)中的残基和CDR中的残基；(ii)一个CDR中的残基和另一个CDR中的残基；或(iii)V_H中的残基和V_L结构域中的残基。在抗体的三级结构中彼此相互作用的残基可共变，这样优选氨基酸残基可在共变对的两个位置上都是保守的，并且如果一个残基改变，则另一个残基也必须发生改变以维持抗体结构。用于对一组氨基酸序列进行协方差分析的方法在本领域内是已知的。例如，Choulier，L.等人(2000)Protein 41：475-484描述了将协方差分析用于人和小鼠种系Vκ和V_H序列的比对。

可将协方差分析与用于分析保守氨基酸位置(上述方法中的步骤a)-d))的上述方法组合，这样该方法还可包括步骤

e)对数据库的抗体V_H或V_L氨基酸序列进行协方差分析以鉴定氨基酸位置的共变对；

f)将氨基酸位置的共变对与scFvV_H或V_L氨基酸序列中的相应位置相比较；

g)确定scFv V_H或V_L氨基酸序列中的相应位置是否被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上保守的氨基酸残基占据；和

h)当scFv中的相应位置中的一个或两个位置被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的相应位置中的一个或两个位置鉴定为用于突变的氨基酸位置。

另外地或备选地，可独立地进行协方差分析，这样本发明提供了包括下列步骤的方法：

a)对数据库的抗体V_H或V_L氨基酸序列进行协方差分析以鉴定氨基酸位置的共变对；

b)将氨基酸位置的共变对与scFv V_H或V_L氨基酸序列中的相应位置比较；

c)确定scFv V_H或V_L氨基酸序列中的相应位置是否被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上保守的氨基酸残基占据；和

d)当scFv中的相应位置中的一个或两个位置被在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上不保守的氨基酸残基占据时，将scFv V_H或V_L氨基酸序列中的相应位置中的一个或两个位置鉴定为用于突变的氨基酸位置。

本发明的协方差分析方法可用于分析一个共变对或多于一个共变对。因此，在本发明的一个实施方案中，鉴定了数据库的抗体V_H或V_L氨基酸序列中的多个氨基酸位置共变对，并且将其与scFv V_H或V_L氨基酸序列中的相应位置相比较。

该方法还可包括突变scFv中的被氨基酸残基(所述氨基酸残基在数据库的抗体V_H或V_L氨基酸序列中的氨基酸位置的共变对上是不保守的)占据的相应位置中的一个或两个位置。在一个实施方案中，用在共变对氨基酸位置上出现频率最高的氨基酸残基置换scFv中的被氨基酸残基(所述氨基酸残基在氨基酸位置的共变对上是不保守的)占据的相应位置中的一个位置。在另一个实施方案中，用在共变对氨基酸位置上出现频率最高的氨基酸残基置换scFv中的被氨基酸残基(所述氨基酸残基在氨基酸位置的共变对上是不保守的)占据的相应位置中的两个位置。

分子建模

可将用于就潜在有问题的残基分析scFv的本发明的基于序列的方法与本领域内已知的用于分析抗体结构/功能关系的其他方法组合。例如，在优选实施方案中，可将本发明的基于序列的分析方法与分子建模组合起来，鉴定另外的潜在有问题的残基。用于抗体结构包括scFv结构的计算机建模的方法和软件已在本领域中建立并且可与本发明的基于序列的方法组合。因此，在另一个实施方案中，步骤a)-d)中所示的上述基于序列的方法还包括步骤：

e)将scFv V_H、V_L或V_H和V_L氨基酸序列经历分子建模；和

f)在scFv V_H、V_L或V_H和V_L氨基酸序列中鉴定至少一个用于突变的另外的氨基酸位置。

该方法还可包括突变scFv V_H、V_L或V_H和V_L氨基酸序列中的通过分子建模鉴定用于突变的该至少一个另外的氨基酸位置。

“功能共有区”对“常规共有区(conventional consensus)”分析

在特别优选的实施方案中，在第一抗体序列数据库(例如，种系数据库(例如，Vbase和/或IMGT)或成熟抗体数据库(例如，KBD))与因具有一个或多个期望的性质而被选择的scFv的第二数据库(例如通过酵母中的QC筛选选择的scFv的数据库，即QC数据库)之间比较一个或多个构架位置上的变异性程度。如图5中所举例说明的，可将变异性值(例如，辛普森指数值)分配给第一(例如，种系)数据库中的构架位置，在图5中称为“G”值，和可将变异性值(例如，辛普森指数值)分配给第二数据库(例如，QC数据库)中的相应构架位置，在图5中称为“Q”值。当特定位置的G值大于Q值(即，在该位置种系序列的变异性比选择的scFv序列的变异性更大)时，表明在该位置上存在有限数目的稳定的scFv构架氨基酸残基，该稳定的scFv构架氨基酸残基可适合于与任何CDR一起使用。备选地，当特定位置的G值比Q值小(即，在该位置上选择的scFv序列的变异性比种系序列中的变异性更大)时，表明该特定位置在scFv中更耐受变异性，从而可代表在其上的氨基酸置换可优化scFv的稳定性和/或溶解性的位置。表A提供了在其上G大于Q或G小于Q的高可变构架残基(hvFR)和氨基酸位置的数目的一览表。如表A中所指出的，氨基酸总数目(Aa#)和高可变构架残基(hvFR)中的变异性在种系和QC-FW之间显著增加。进行分析以产生表A的序列是使用QC测定法选择的约90个scFv序列(如WO03097697中所述；本文称为“Q”)和在2007年10月从http：//www.bioc.unizh.ch/antibody/Sequences/index.html处检索到的所有种系VH和VL序列(本文称为“G”)。对于表A的分析，VH和VL结构域未根据其亚型进行分组。

表A：一览表

	Aa#	G＜Q(事件的#)	G＞Q(事件的#)	X/Y	#hvFR(辛普森＜0.4)	G＜Q(事件的#)	G＞Q(事件的#)	X/Y
									V_L	108	61	11	5.5	16	13	3	4.3
V_H	116	50	18	2.8	27	22	5	4.4

考虑到上述内容，在另一个方面，本发明提供了鉴定单链抗体(scFv)中的一个或多个用于突变的构架氨基酸位置的方法，所述scFv具有V_H和V_L氨基酸序列，该方法包括：

a)提供V_H、V_L或V_H和V_L氨基酸序列(例如，种系和/或成熟抗体序列)的第一数据库；

b)提供因具有至少一个期望的功能性质而被选择的scFv抗体V_H、V_L或V_H和V_L氨基酸序列的第二数据库；

c)测定第一数据库的各构架位置和第二数据库的各构架位置上的氨基酸变异性；

d)鉴定在其上氨基酸变异性程度在第一数据库和第二数据库之间不同的一个或多个构架位置，从而鉴定单链抗体(scFv)中用于突变的一个或多个构架氨基酸位置。

优选地，各构架位置上的氨基酸变异性通过使用辛普森指数给保守程度赋值来测定。在一个实施方案中，基于与第一数据库相比，在第二(scFv)数据库中具有更低的辛普森指数值的一个或多个构架氨基酸位置，鉴定用于突变的一个或多个构架氨基酸位置。在另一个实施方案中，基于与第一数据库相比，在第二数据库中具有更高的辛普森指数值的一个或多个构架氨基酸位置，鉴定用于突变的一个或多个构架氨基酸位置。

在下面的实施例2和3中更详细地描述了对于三个人V_H家族和三个人V_L家族的变异性分析和用于突变的残基的鉴定。

富集/排除分析

在另一个方面，本发明提供了用于在免疫结合剂中目的构架位置上选择优选氨基酸残基置换(或备选地，排除特定氨基酸置换)(例如，以提高功能性质例如稳定性和/或溶解性)的方法。本发明的方法将第一抗体序列数据库(例如，种系数据库例如Vbase和/或IMGT，或更优选，成熟抗体数据库例如Kabat数据库(KBD))中的目的构架位置上的氨基酸残基的频率与因具有一个或多个期望的性质而被选择的scFv的第二数据库(例如通过酵母中的QC筛选选择的scFv数据库，例如QC数据库)中相应氨基酸位置上的氨基酸残基的频率相比较。

如下面实施例4中详细描述的，可按照它们的Kabat家族亚型(例如，Vh1b、VH3等)将来自第一数据库(例如，成熟抗体序列的数据库)的抗体序列(例如，VH或VL序列)分组。在各序列亚型(即，亚家族)中，各氨基酸残基(例如，A、V等)在各氨基酸位置上的频率测定为该亚型所有被分析的序列的百分数。对第二数据库(例如，因具有一个或多个期望的性质而被选择的，例如通过QC筛选选择的scFv的数据库)的所有序列进行同样的测定。对于各亚型，在第一和第二数据库之间比较所得的各氨基酸残基在特定位置上的百分数(相对频率)。当某个氨基酸残基的相对频率相对于第一数据库(例如，Kabat数据库)在第二数据库(例如，QC数据库)中增加时，表示各自的残基被有利地选择(即，“富集的残基”)并且为序列提供有利的性质。相反地，当氨基酸残基的相对频率与第一数据库相比在第二数据库中减少时，表明各自的残基是不利的(即，“被排除的残基”)。因此，富集的残基对于提高免疫结合剂的功能性质(例如，稳定性和/或溶解性)是优选残基，然而优选避开被排除的残基。

鉴于前述内容，在一个实施方案中，本发明提供了鉴定用于免疫结合剂中的置换的优选氨基酸残基的方法，其包括：

a)提供已分组的V_H或V_L氨基酸序列(例如，按照Kabat家族亚型分组的种系和/或成熟抗体序列)的第一数据库；

b)提供已分组的因具有至少一个期望的功能性质而被选择(例如，根据QC测定)的scFv抗体V_H或V_L氨基酸序列的第二数据库；

c)测定在第一数据库的构架位置和第二数据库的相应的构架位置上的氨基酸残基的氨基酸频率；

d)当氨基酸残基相对于第一数据库在第二数据库中以更高的频率发生(即，富集的残基)时，将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的优选氨基酸残基。

可定量第二(scFv)数据库(例如，QC数据库)中氨基酸残基的富集度(enrichment)。例如，可测定第二数据库中残基的相对频率(RF2)与第一数据库中残基的相对频率(RF1)之间的比率。该比率(RF2：RF1)可称为“富集因子”(EF)。因此，在某些实施方案中，如果第一和第二数据库之间氨基酸残基的相对频率的比率(在本文中，“富集因子”)是至少1(例如，1、2、3、4、5、6、7、8、9或10)，那么鉴定了步骤(d)中的氨基酸残基。在优选实施方案中，富集因子大于大约1.0(例如1.0、1.1、1.2、1.3、1.4或1.5)。在另一个优选实施方案中，富集因子是大约4.0至大约6.0(例如，4.0、4.1、4.2、4.3、4.4、4.5、4.6、4.7、4.8、4.9、5.0、5.1、5.2、5.3、5.4、5.5、5.6、5.7、5.8、5.9或6.0)。在另一个实施方案中，富集因子是大约6.0至大约8.0(例如，6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、7.0、7.1、7.3、7.4、7.5、7.6、7.7、7.8、7.9或8.0)。在其他实施方案中，富集因子大于10(例如，10、100、1000、10⁴、10⁵、10⁶、10⁷、10⁸、10⁹或更大)。在其他实施方案中，可以达到无限大的富集因子。

在另一个实施方案中，本发明提供了鉴定在特定位置处待从免疫结合剂中排除的氨基酸残基的方法，该方法包括：

d)当氨基酸残基相对于第一数据库在第二数据库中以更低的频率发生时，将该氨基酸残基鉴定为用于免疫结合剂的相应氨基酸位置上的置换的不利氨基酸残基，其中所述氨基酸残基的类型是不利的氨基酸残基(即，被排除的残基)。在某些优选实施方案中，如果富集因子(EF)小于1，则鉴定了步骤(d)(同上)中的不利氨基酸残基。

scFv的突变

在本发明的方法中，当scFv中的一个或多个氨基酸位置已鉴定为对于scFv的功能性质是潜在有问题的时候，所述方法还可包括突变scFv V_H或V_L氨基酸序列中的此类一个或多个氨基酸位置。例如，经鉴定用于突变的氨基酸位置可用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上保守或富集的氨基酸残基进行置换。

可使用在本领域中良好建立的几种可能的诱变方法之一突变经鉴定用于突变的氨基酸位置。例如，定点诱变可用于在目的氨基酸位置上进行特定的氨基酸置换。定点诱变还可用于产生一组突变的scFv，其中在目的氨基酸位置上导入了有限的氨基酸置换库集(repertoire)。

另外或备选地，可通过随机诱变或通过偏好性诱变突变经鉴定用于突变的氨基酸位置，从而产生突变的scFv文库，然后筛选突变的scFv的文库并选择scFv，优选选择具有至少一个提高的功能性质的scFv。在优选实施方案中，使用酵母质量控制-系统(QC-系统)(在上面更详细地描述的)筛选文库，该系统允许选择在还原性环境中具有增强的稳定性和/或溶解性的scFv构架。

用于筛选scFv文库的其他适当的选择技术已在本领域内进行了描述，包括但不限于展示技术例如噬菌体展示、核糖体展示和酵母展示(Jung等人(1999)J.Mol.Biol. 294：163-180；Wu等人(1999)J.Mol.Biol. 294：151-162；Schier等人(1996)J.Mol.Biol.255：28-43)。

在一个实施方案中，经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的氨基酸残基置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于疏水氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的疏水氨基酸残基进行置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于亲水氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的亲水氨基酸残基进行置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于能够形成氢键的氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的能够形成氢键的氨基酸残基进行置换。在另一个实施方案中，数据库的抗体V_H或V_L氨基酸序列中的相应位置对于具有形成β-折叠的倾向的氨基酸残基是保守的，并且scFv中经鉴定用于突变的氨基酸位置用在数据库的抗体V_H或V_L氨基酸序列中的相应位置上最显著富集的具有形成β-折叠的倾向的氨基酸残基进行置换。

在一个实施方案中，选择使总自由能最小化的最佳置换作为在目的氨基酸位置上进行的突变。使总自由能最小化的最佳置换可使用玻尔兹曼定律(Boltzmann′s Law)来确定。玻尔兹曼定律的公式是ΔΔG_th＝RTln(f_亲本/f_共有区)。

潜在的稳定性突变的作用可通过检查例如局部和非局部相互作用、规范残基(canonical residue)、界面、暴露程度和β转角倾向来进一步确定。本领域内已知的分子建模方法可以用于例如进一步检查潜在的稳定性突变的作用。如果考虑一组可能的置换，则分子建模法还可用于选择“最适”氨基酸置换。

取决于特定氨基酸位置，可以进行进一步分析。例如，残基可参与重链和轻链之间的相互作用或可通过盐桥或氢键与其他残基相互作用。在这些情况下，可能需要特别的分析。在本发明的另一个实施方案中，可将对于稳定性潜在有问题的残基改变成与其在共变对中的配对物(counterpart)相容的残基。备选地，可对配对残基进行突变以与最初鉴定为有问题的氨基酸相容。

溶解性的优化

scFv抗体中对于溶解性潜在有问题的残基包括在scFv中暴露于溶剂但在全长抗体的背景中将包埋在可变和恒定结构域之间的界面处的疏水氨基酸。在经改造的缺乏恒定结构域的scFv中，参与可变结构域和恒定结构域之间的相互作用的疏水残基变成暴露于溶剂(参见例如，Nieba等人(1997)Protein Eng.10：435-44)。scFv表面上的此类残基倾向于引起聚集，从而引起溶解性问题。

已描述了替换scFv抗体上的暴露于溶剂的疏水氨基酸的许多策略。正如本领域技术人员所熟知的，在某些位置修饰残基会影响抗体的生物物理性质如稳定性、溶解性和亲和力。在许多情况下，这些性质是相关的，这表示一个单个氨基酸的改变可影响上面提及的性质中的若干性质。因此，以非保守方式突变暴露于溶剂的疏水残基可导致减少的稳定性和/或对其抗原的亲和力的丧失。

其他方法意欲通过详尽使用蛋白质展示技术和/或筛选努力来解决溶解性问题。然而，此类方法太耗时，通常不能产生可溶性蛋白质或导致更低的稳定性或抗体亲和力的减小。在本发明中，公开了使用基于序列的分析设计将暴露于溶剂的疏水残基突变成具有更高的亲水性的残基的突变的方法。可通过选择在确定的位置上出现频率最高的亲水氨基酸来替换潜在有问题的残基。如果发现残基与抗体中任何其他残基相互作用，那么潜在有问题的残基可不突变成出现频率最高的残基而是突变成与共变对的第二氨基酸相容的残基。备选地，还可突变共变对的第二氨基酸以恢复氨基酸的组合。此外，可将序列之间的相似性的百分数考虑进来以帮助发现两个相关氨基酸的最优组合。

使用几个方法(包括但不限于基于溶剂暴露、实验信息和序列信息的方法以及分子建模)来鉴定scFv表面上的疏水氨基酸。

在本发明的一个实施方案中，通过用数据库中存在于这些位置上的出现频率最高的亲水残基置换暴露于scFv抗体表面上的疏水残基来提高溶解性。该原理基于频繁发生的残基可能是没问题的事实。如本领域技术人员所认识到的，保守置换通常在破坏分子的稳定性中具有较小的影响，而非保守置换可能对scFv的功能性质是有害的。

有时抗体表面上的疏水残基可参与重链和轻链之间的相互作用或可通过盐桥或氢键与其他残基相互作用。在这些情况下，可能需要特别的分析。在本发明的另一个实施方案中，对于溶解性潜在有问题的残基可以不突变成频率最高的残基而是突变成与共变对相容的残基，或可进行第二突变来恢复共变氨基酸的组合。

可使用另外的方法来设计暴露于溶剂的疏水位置上的突变。在本发明的另一个实施方案中，公开了采用将数据库限制于显示与待修饰的scFv的最高相似性的序列的方法(上文更详细论述的)。通过使用这样的受限制的参照数据库，设计突变以使其与要优化的抗体的特定序列背景最相适。在该情况下，当与更大量的序列(即，不受限制的数据库)比较时，所选择的亲水残基实际上在其各自的位置上可能不具有良好的代表性。

稳定性的优化

单链抗体片段包含共价连接轻链和重链可变结构域的肽接头。虽然这样的接头有效地避免使可变结构域破裂，从而使scFv优于Fv片段，但与Fab片段或全长抗体(在这两者中V_H和V_L仅通过恒定结构域间接连接)相比，scFv片段仍然更易于去折叠和聚集。

scFv中另一个常见问题是scFv表面上疏水残基的暴露，这导致分子间聚集。此外，有时在亲和力成熟过程中获得的体细胞突变将亲水残基置于β-折叠的核心内。此类突变在IgG形式中或甚至Fab片段中可被良好耐受，但在scFv中，这很明显引起去稳定和随后的去折叠。

已知的引起scFv去稳定的因素包括：scFv抗体表面上暴露于溶剂的疏水残基；埋藏在蛋白质核心内的罕见亲水残基以及存在于重链和轻链之间的疏水界面中的亲水残基。此外，核心中的非极性残基之间的范德瓦尔斯嵌合作用(van der Waals packing interaction)已知在蛋白质的稳定性中起着重要作用(Monsellier E.和Bedouelle H.(2006)J.Mol.Biol.362：580-93，Tan等人(1998)Biophys.J.75：1473-82；A.和Plückthun A.(1998)Biochemistry 37：13120-7)。

因此，在一个实施方案中，为了增加scFv抗体的稳定性，鉴定了在非常保守的位置上的罕见和/或不利的氨基酸并且将其突变成在这些保守位置上更常见的氨基酸。此类罕见和/或不利的氨基酸包括：(i)scFv抗体表面上的暴露于溶剂的疏水残基；(ii)埋藏在蛋白质的核心中的罕见亲水残基；(iii)存在于重链和轻链之间的疏水界面中的亲水残基；和(iv)通过立体阻碍干扰VH/VL界面VH/VL的残基。

因此，在本发明的一个实施方案中，稳定性的增加可通过用在这些位置上出现频率最高的氨基酸置换在它们的位置上不具代表性的氨基酸来获得。出现频率通常提供了生物学接受性的指标。

残基可参与重链和轻链之间的相互作用或可通过盐桥、氢键或二硫键与其他残基相互作用。在这些情况下，可能需要特别的分析。在本发明的另一个实施方案中，可将对于稳定性潜在有问题的残基改变成与其共变对中的配对残基相容的残基。备选地，可突变配对残基以使之与最初鉴定为有问题的氨基酸相容。

可使用另外的方法设计提高稳定性的突变。在本发明的另一个实施方案中，公开了采用将数据库限制于显示与待修饰的scFv的最高相似性的序列的方法(上文更详细论述的)。通过使用这样的受限制的参照数据库，设计突变以使其与要优化的抗体的特定序列背景最相适。突变使用存在于所选择的数据库序列亚组中的出现频率最高的氨基酸。在该情况下，当与更大量的序列(即，不受限制的数据库)比较时，所选择的残基实际上可能在其各自的位置上不具有良好的代表性。

scFv组合物和制剂

本发明的另一个方面涉及按照本发明的方法制备的scFv组合物。因此，本发明提供了经改造的scFv组合物，其中与原始的目的scFv相比，已将一个或多个突变导入氨基酸序列，其中突变已被导入经预测影响一个或多个生物学性质例如稳定性或溶解性的位置，特别地一个或多个构架位置。在一个实施方案中，scFv已进行了改造，从而包含一个突变的氨基酸位置(例如，一个构架位置)。在其他实施方案中，scFv已进行了改造，从而包含2、3、4、5、6、7、8、9、10或多于10个突变的氨基酸位置(例如，构架位置)。

本发明的另一个方面涉及本发明的scFv组合物的药物制剂。此类制剂通常包含scFv组合物和药学上可接受的载体。如本文中所使用的，“药学上可接受的载体”包括生理上相容的任何和所有溶剂、分散介质、包衣、抗菌剂和抗真菌剂、等渗剂和吸收延迟剂等。优选，载体适合于例如静脉内、肌内、皮下、胃肠外、脊柱、表皮施用(例如，通过注射或输注)、或局部施用(例如，至眼或皮肤)。取决于施用途径，可将scFv包被在材料中以保护化合物免受酸的作用和可使化合物失活的其他天然条件的损害。

本发明的药物化合物可包括一种或多种药学上可接受的盐。“药学上可接受的盐”是指保持亲本化合物期望的生物学活性并且不提供任何不想要的毒理学效应的盐(参见例如，Berge，S.M.等人(1977)J.Pharm.Sci.66：1-19)。此类盐的实例包括酸加成盐和碱加成盐。酸加成盐包括从无毒无机酸例如盐酸、硝酸、磷酸(phosphoric)、硫酸(sulfuric)、氢溴酸、氢碘酸、亚磷酸(phosphorous)等衍生的盐，以及从无毒有机酸例如脂肪族一羧酸和二羧酸、苯基取代的链烷酸、羟基链烷酸、芳香族酸、脂肪族和芳香族磺酸等衍生的盐。碱加成盐包括从碱土金属例如钠、钾、镁、钙等衍生的盐，以及从无毒有机胺例如N，N′-二苄基乙二胺、N-甲基葡糖胺、氯普鲁卡因、胆碱、二乙醇胺、乙二胺、普鲁卡因等衍生的盐。

本发明的药物组合物还可包含药学上可接受的抗氧化剂。药学上可接受的抗氧化剂的实例包括：(1)水溶性抗氧化剂，例如抗坏血酸、盐酸半胱氨酸、硫酸氢钠、焦亚硫酸钠(sodium metabisulfite)、亚硫酸钠等；(2)油溶性抗氧化剂例如抗坏血酸棕榈酸酯、丁羟基茴香醚(BHA)、丁羟甲苯(BHT)、卵磷脂、没食子酸丙酯、α-生育酚等和(3)金属螯合剂，例如柠檬酸、乙二胺四乙酸(EDTA)、山梨糖醇、酒石酸、磷酸等。

可用于本发明的药物组合物的适当的水性和非水性载体的实例包括水、乙醇、多元醇(例如丙三醇、丙二醇、聚乙二醇等)和其适当的混合物，植物油例如橄榄油，和可注射的有机酯例如油酸乙酯。可以例如通过使用包衣材料例如卵磷脂、在分散体的情况下通过维持需要的颗粒大小和通过使用表面活性剂维持恰当的流动性。

此类组合物还可包含佐剂例如防腐剂、湿润剂、乳化剂和分散剂。可通过灭菌方法(同上)和通过包含各种抗菌剂和抗真菌剂例如对羟基苯甲酸酯(paraben)、氯丁醇、苯酚、山梨酸等来确保防止微生物的存在。也可期望将等渗剂例如糖、氯化钠等包含入组合物。此外，可通过包含延迟吸收的试剂例如单硬脂酸铝和明胶来获得可注射药物形式的延长吸收。

药学上可接受的载体包括无菌水溶液或分散体以及用于临时制备无菌注射液或分散体的无菌粉剂。此类介质和试剂用于药物活性物质的用途在本领域内是已知的。除非任何常规介质或试剂与活性化合物不相容，否则预期其在本发明的药物组合物中的用途。还可将补充的活性化合物掺入组合物。

治疗性组合物通常必须是无菌的并且在生产和贮存的条件下是稳定的。可将组合物配制为溶液、微乳剂、脂质体或适合高药物浓度的其他有序结构。载体可以是包含例如水、乙醇、多元醇(例如丙三醇、丙二醇和液体聚乙二醇等)和其适当的混合物的溶剂或分散介质。可以例如通过使用包衣例如卵磷脂、在分散体的情况下通过维持需要的颗粒大小和通过使用表面活性剂来维持恰当的流动性。在许多情况下，优选在组合物中包含等渗剂，例如糖、多元醇例如甘露醇、山梨糖醇或氯化钠。可通过在组合物中包含延迟吸收的试剂例如单硬脂酸盐和明胶来获得可注射组合物的延长的吸收。

无菌注射液可通过将活性化合物以需要的量与上面例举的成分的一种或组合一起掺入适当的溶剂中，然后进行灭菌微过滤(如果需要的话)来制备。通常，通过将活性化合物掺入包含基本分散介质和需要的来自上面列举的成分的其他成分的无菌媒介物来制备分散体。在用于制备无菌注射液的无菌粉剂的情况下，制备的优选方法是从之前无菌过滤的溶液产生包含活性成分和任何额外的期望的成分的粉剂的真空干燥和冷冻干燥(冻干法(lyophilization))。

可与载体材料组合从而产生单个剂型的活性成分的量将随正在治疗的受试者以及施用的特定模式的变化而变化。可与载体材料组合从而产生单个剂型的活性成分的量通常是产生治疗效果的组合物的量。一般地，除百分之百外，该量将在大约0.01％至大约99％的活性成分，优选大约0.1％至大约70％，最优选大约1％至大约30％的活性成分的范围内(与药学上可接受的载体组合)。

调整给药方案以提供最佳的期望的应答(例如，治疗应答)。例如，可施用单个大丸剂，可在一段时间内施用几份分开的剂量或可根据治疗状况的紧急性的需要，按比例减少或增加剂量。特别有利地以单位剂型(dosage unit form)配制胃肠外组合物以便施用和保持剂量均一。本文中使用的单位剂型是指适合用作用于待治疗的受试者的单份剂量的物理上分开的单位；各单位包含经计算与需要的药物载体一起产生期望的治疗效果的预先确定量的活性化合物。本发明的单位剂型的规格(specification)受制于和直接取决于(a)活性化合物的独特特征和要获得的具体治疗效果，和(b)配制用于治疗个体的敏感性的此类活性化合物的领域中固有的限制。

基于“功能共有区”方法的免疫结合剂的改造

如实施例2和3中详细描述的，本文中描述的“功能共有区”方法(其中将因提高的性质而被选择的scFv序列的数据库用于分析构架位置变异性)允许鉴定氨基酸位置，所述氨基酸位置与种系数据库中的这些相同位置上的变异性相比，具有更高或更低的对变异性的耐受性。如实施例5和6中详细描述的，样品scFv中某些氨基酸位置至种系共有残基的回复突变具有中性或有害作用，而包含“功能共有区”残基的scFv变体展示与野生型scFv分子相比增加的热稳定性。因此，本文中通过功能共有区方法鉴定的构架位置对于为了改变，优选提高scFv的功能性质的scFv修饰是优选位置。如实施例3的表3至8中所示，下列构架位置已被鉴定为用于所指定的V_H或V_L序列中的修饰的优选位置(下面使用的编号是AHo编号系统；将AHo编号转换成Kabat系统编号的换算表(conversion table)示于实施例1的表1和2中)：

VH3：氨基酸位置1、6、7、89和103；

VH1a：氨基酸位置1、6、12、13、14、19、21、90、92、95和98；

VH1b：氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107；

Vκ1：氨基酸位置1、3、4、24、47、50、57、91和103；

Vκ3：2、3、10、12、18、20、56、74、94、101和103；和

Vλ1：1、2、4、7、11、14、46、53、82、92和103。

因此，一个或多个此类氨基酸位置可选择用于免疫结合剂例如scFv分子的改造，从而产生免疫结合剂的变异(即，突变的)形式。因此，在另一个方面，本发明提供了对免疫结合剂进行改造的方法，该方法包括：

a)在免疫结合剂中选择一个或多个氨基酸位置用于突变；和

b)突变一个或多个选择用于突变的氨基酸位置，其中一个或多个选择用于突变的氨基酸位置选自：

(i)使用AHo编号的VH3氨基酸位置1、6、7、89和103(使用Kabat编号的氨基酸位置1、6、7、78和89)；

(ii)使用AHo编号的VH1a的氨基酸位置1、6、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、6、11、12、13、18、20、79、81、82b和84)；

(iii)使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48、66、67、71、75、76和93)；

(iv)使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57、91和103(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49、73和85)；

(v)使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94、101和103(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76、83和85)；和

(vi)使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82、92和103(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66、74和85)。

在优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH3的氨基酸位置1、6、7、89和103(使用Kabat编号的氨基酸位置1、6、7、78和89)。

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH1a的氨基酸位置1、6、12、13、14、19、21、90、92、95和98(使用Kabat编号的氨基酸位置1、6、11、12、13、18、20、79、81、82b和84)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的VH1b的氨基酸位置1、10、12、13、14、20、21、45、47、50、55、77、78、82、86、87和107(使用Kabat编号的氨基酸位置1、9、11、12、13、19、20、38、40、43、48、66、67、71、75、76和93)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vκ1的氨基酸位置1、3、4、24、47、50、57、91和103(使用Kabat编号的氨基酸位置1、3、4、24、39、42、49、73和85)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vκ3的氨基酸位置2、3、10、12、18、20、56、74、94、101和103(使用Kabat编号的氨基酸位置2、3、10、12、18、20、48、58、76、83和85)；

在另一个优选实施方案中，一个或多个选择用于突变的氨基酸位置选自使用AHo编号的Vλ1的氨基酸位置1、2、4、7、11、14、46、53、82、92和103(使用Kabat编号的氨基酸位置1、2、4、7、11、14、38、45、66、74和85)。

在不同的实施方案中，1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或多于20个上述氨基酸位置被选择用于突变。

优选，免疫结合剂是scFv，但还可按照本方法对其他免疫结合剂例如全长免疫球蛋白、Fab片段或本文中描述的任何其他类型的免疫结合剂(例如，Dab或纳米抗体)进行改造。本发明还包括按照改造方法制备的免疫结合剂以及包含免疫结合剂和药学上可接受的载体的组合物。此外，本发明进一步延伸至根据本文公开的任何一种方法改造且以商业规模生产的免疫结合剂。

在特定示例性实施方案中，根据本发明的方法改造的免疫结合剂是本领域公认的免疫结合剂，其结合具有治疗重要性的靶抗原或包含衍生自具有治疗重要性的免疫结合剂的可变区(VL和/或VL区)或一个或多个CDR(例如，CDRL1、CDRL2、CDRL3、CDRH1、CDRH2和/或CDRH3)的免疫结合剂。例如，目前由FDA或其他管理机构批准的免疫结合剂可以根据本发明的方法进行改造。更具体而言，这些示例性免疫结合剂包括但不限于，抗CD3抗体例如莫罗单抗(OKT3；Johnson&Johnson，Brunswick，NJ；参见Arakawa等人J.Biochem，(1996)120：657-662；Kung和Goldstein等人，Science(1979)，206：347-349)、抗CD11抗体例如依法珠单抗(，Genentech，South San Francisco，CA)、抗CD20抗体例如利妥昔单抗(/，Genentech，South SanFrancisco，CA)、托西莫单抗(，GlaxoSmithKline，London)或替伊莫单抗(，Biogen Idec，Cambridge MA)(参见美国专利号5,736,137；6,455,043；和6,682,734)、抗CD25(IL2Rα)抗体例如达克珠单抗(，Roche，Basel，Switzerland)或巴利昔单抗(，Novartis，Basel，Switzerland)、抗CD33抗体例如吉妥珠单抗(，Wyeth，Madison，NJ-参见美国专利号5,714,350和6,350,861)、抗CD52抗体例如阿仑珠单抗(，Millennium Pharmacueticals，Cambridge，MA)、抗GpIIb/gIIa抗体例如阿昔单抗(，Centocor，Horsham，PA)、抗TNFα抗体例如英利昔单抗(，Centocor，Horsham，PA)或阿达木单抗(，Abbott，Abbott Park，IL-参见美国专利号6,258,562)、抗IgE抗体例如奥马珠单抗(，Genentech，South San Francisco，CA)、抗RSV抗体例如帕利珠单抗(，Medimmune，Gaithersburg，MD-参见美国专利号5,824,307)、抗EpCAM抗体例如依决洛单抗(，Centocor)、抗EGFR抗体例如西妥昔单抗(，Imclone Systems，NewYork，NY)或帕木单抗(，Amgen，Thousand Oaks，CA)、抗HER2/neu抗体例如曲妥珠单抗(，Genentech)、抗α4整联蛋白抗体例如那他珠单抗(，BiogenIdec)、抗C5抗体例如依库珠单抗(，Alexion Pharmaceuticals，Chesire，CT)和抗VEGF抗体例如贝伐珠单抗(，Genentech-参见美国专利号6,884,879)或雷珠单抗(，Genentech)。

尽管描述了前述内容，但在多种实施方案中，某些免疫结合剂被排除用于本发明的改造方法和/或被排除成为通过改造方法产生的免疫结合剂组合物。例如，在多种实施方案中，存在附带条件，即免疫结合剂不是PCT公开号WO 2006/131013和WO 2008/006235中公开的任何scFv抗体或其变体，例如，PCT公开号WO 2006/131013和WO 2008/006235中公开的ESBA105或其变体，所述专利各自的内容明确地通过引用合并入本文。

在多种其他实施方案中，如果待按上述方法进行改造的免疫结合剂是PCT公开号WO 2006/131013或WO 2008/006235中公开的任何scFv抗体或其变体，那么可存在附带条件，即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置：Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。

在另外的多种其他实施方案中，对于待按照上述方法进行改造的任何免疫结合剂和/或按照上述方法产生的任何免疫结合剂，可存在附带条件，即根据改造方法可选择用于置换的可能的氨基酸位置的清单不包括任何或所有下列氨基酸位置：Vκ1或Vλ1的AHo位置4(Kabat 4)、Vκ3的AHo位置101(Kabat 83)、VH1a或VH1b的AHo位置12(Kabat 11)、VH1b的AHo位置50(Kabat 43)、VH1b的AHo位置77(Kabat 66)、VH1b的AHo位置78(Kabat 67)、VH1b的AHo位置82(Kabat 71)、VH1b的AHo位置86(Kabat 75)、VH1b的AHo位置87(Kabat 76)、VH3的AHo位置89(Kabat 78)、VH1a的AHo位置90(Kabat 79)和/或VH1b的AHo位置107(Kabat 93)。

免疫结合剂在示例性和优选位置处的突变

如实施例7中详细描述的，本文描述的功能共有区方法已成功地用于鉴定在所选择的scFv(“QC”)数据库中被富集的特定氨基酸残基置换。例如，实施例7中的表13-18列出在VH3、VH1a、VH1b、Vκ1、Vκ3或Vλ1家族构架内的限定氨基酸位置处的示例性和优选氨基酸置换。示例性置换包括由种系(IMGT和Vbase)和成熟抗体(KDB)数据库的分析鉴定的共有残基，以及在所选择的scFv构架数据库(QC)中鉴定为优先富集的氨基酸残基。所鉴定的最优选置换是在所选择的scFv构架数据库(QC)中的该位置处显示最大富集的残基。

因此，本发明提供了其中将一个或多个特定氨基酸置换引入免疫结合剂例如scFv抗体内的改造方法。此种置换可以使用标准分子生物学方法例如定点诱变、PCR介导的诱变等来进行。

在一个实施方案中，本发明提供了改造免疫结合剂例如scFv抗体的方法，其中在一个或多个氨基酸位置处进行一个或多个氨基酸置换，其中用于置换到免疫结合剂内的氨基酸残基选自本文表13-18中鉴定的示例性和优选氨基酸残基。因此，本发明提供了改造免疫结合剂的方法，所述免疫结合剂包含(i)VH3、VH1a或VH1b家族的重链可变区或其片段，所述重链可变区包含V_H构架残基，或(ii)Vκ1、Vκ3或Vλ1家族的轻链可变区或其片段，所述轻链可变区包含V_L构架残基，所述方法包括：

B)使选择用于突变的一个或多个氨基酸位置突变，

a)其中如果选择用于突变的一个或多个氨基酸位置在VH3家族重链可变区，那么突变包括选自下述的一个或多个置换：

(i)在使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)或谷氨酰胺(Q)；

(ii)在使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酸(E)或谷氨酰胺(Q)；

(iii)在使用AHo或Kabat编号系统的氨基酸位置7处的苏氨酸(T)、丝氨酸(S)或丙氨酸(A)；

(iv)在使用AHo编号系统的氨基酸位置89(使用Kabat编号系统的氨基酸位置78)处的丙氨酸(A)、缬氨酸(V)、亮氨酸(L)或苯丙氨酸(F)；和

(v)在使用AHo编号系统的氨基酸位置103(使用Kabat编号的氨基酸位置89)处的精氨酸(R)、谷氨酰胺(Q)、缬氨酸(V)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)或苯丙氨酸(F)；

b)其中如果选择用于突变的一个或多个氨基酸位置在VH1a家族重链可变区，那么突变包括选自下述的一个或多个置换：

(iii)在使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L)或缬氨酸(V)；

(iv)在使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的甲硫氨酸(M)或赖氨酸(K)；

(v)在使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)、谷氨酰胺(Q)或赖氨酸(K)；

(vi)在使用AHo编号系统的氨基酸位置19(使用Kabat编号系统的氨基酸位置18)处的亮氨酸(L)或缬氨酸(V)；

(vii)在使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I)或缬氨酸(V)；

(viii)在使用AHo编号系统的氨基酸位置90(使用Kabat编号系统的氨基酸位置79)处的苯丙氨酸(F)、丝氨酸(S)、组氨酸(H)、天冬氨酸(D)或酪氨酸(Y)；

(ix)在使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置81)处的天冬氨酸(D)、谷氨酰胺(Q)或谷氨酸(E)；

(x)在使用AHo编号系统的氨基酸位置95(使用Kabat编号系统的氨基酸位置82b)处的甘氨酸(G)、天冬酰胺(N)、苏氨酸(T)或丝氨酸(S)；和

(xi)在使用AHo编号系统的氨基酸位置98(使用Kabat编号的氨基酸位置84)处的苏氨酸(T)、丙氨酸(A)、脯氨酸(P)、苯丙氨酸(F)或丝氨酸(S)；

c)其中如果选择用于突变的一个或多个氨基酸位置在VH1b家族重链可变区，那么突变包括选自下述的一个或多个置换：

(ii)在使用AHo编号系统的氨基酸位置10(使用Kabat编号系统的氨基酸位置9)处的丙氨酸(A)、苏氨酸(T)、脯氨酸(P)、缬氨酸(V)或天冬氨酸(D)；

(iv)在使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的赖氨酸(K)、缬氨酸(V)、精氨酸(R)、谷氨酰胺(Q)或甲硫氨酸(M)；

(v)在使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)、赖氨酸(K)、精氨酸(R)或甲硫氨酸(M)；

(vi)在使用AHo编号系统的氨基酸位置20(使用Kabat编号系统的氨基酸位置19)处的精氨酸(R)、苏氨酸(T)、赖氨酸(K)或天冬酰胺(N)；

(vii)在使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I)、苯丙氨酸(F)、缬氨酸(V)或亮氨酸(L)；

(viii)在使用AHo编号系统的氨基酸位置45(使用Kabat编号系统的氨基酸位置38)处的精氨酸(R)或赖氨酸(K)；

(ix)在使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置40)处的苏氨酸(T)、脯氨酸(P)、缬氨酸(V)、丙氨酸(A)或精氨酸(R)；

(x)在使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置43)处的赖氨酸(K)、谷氨酰胺(Q)、组氨酸(H)或谷氨酸(E)；

(xi)在使用AHo编号的氨基酸位置55(使用Kabat编号的氨基酸位置48)处的甲硫氨酸(M)或异亮氨酸(I)；

(xii)在使用AHo编号的氨基酸位置77(使用Kabat编号的氨基酸位置66)处的赖氨酸(K)或精氨酸(R)；

(xiii)在使用AHo编号系统的氨基酸位置78(使用Kabat编号系统的氨基酸位置67)处的丙氨酸(A)、缬氨酸(V)、亮氨酸(L)或异亮氨酸(I)；

(xiv)在使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置71)处的谷氨酸(E)、精氨酸(R)、苏氨酸(T)或丙氨酸(A)；

(xv)在使用AHo编号系统的氨基酸位置86(使用Kabat编号系统的氨基酸位置75)处的苏氨酸(T)、丝氨酸(S)、异亮氨酸(I)或亮氨酸(L)；

(xvi)在使用AHo编号系统的氨基酸位置87(使用Kabat编号系统的氨基酸位置76)处的天冬氨酸(D)、丝氨酸(S)、天冬酰胺(N)或甘氨酸(G)；和

(xvii)在使用AHo编号系统的氨基酸位置107(使用Kabat编号系统的氨基酸位置93)处的天冬酰胺(N)、丝氨酸(S)或丙氨酸(A)；

d)其中如果选择用于突变的一个或多个氨基酸位置在Vκ1家族轻链可变区，那么突变包括选自下述的一个或多个置换：

(i)在使用AHo或Kabat编号系统的氨基酸位置1处的天冬氨酸(D)、谷氨酸(E)或异亮氨酸(I)；

(ii)在使用AHo或Kabat编号系统的氨基酸位置3处的谷氨酰胺(Q)、缬氨酸(V)或异亮氨酸(I)；

(iii)在使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)、亮氨酸(L)、异亮氨酸(I)或甲硫氨酸(M)；

(iv)在使用AHo或Kabat编号系统的氨基酸位置24处的精氨酸(R)或谷氨酰胺(Q)；

(v)在使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置39)处的赖氨酸(K)、精氨酸(R)或异亮氨酸(I)；

(vi)在使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置42)处的赖氨酸(K)、精氨酸(R)、谷氨酸(E)、苏氨酸(T)、甲硫氨酸(M)或谷氨酰胺(Q)；

(vii)在使用AHo编号系统的氨基酸位置57(使用Kabat编号系统的氨基酸位置49)处的组氨酸(H)、丝氨酸(S)、苯丙氨酸(F)或酪氨酸(Y)；

(viii)在使用AHo编号系统的氨基酸位置91(使用Kabat编号系统的氨基酸位置73)处的亮氨酸(L)或苯丙氨酸(F)；和

(ix)在使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置85)处的苏氨酸(T)、缬氨酸(V)、丝氨酸(S)、甘氨酸(G)或异亮氨酸(I)；

e)其中如果选择用于突变的一个或多个氨基酸位置在Vκ3家族轻链可变区，那么突变包括选自下述的一个或多个置换：

(i)使用AHo或Kabat编号系统的氨基酸位置2处的异亮氨酸(I)或苏氨酸(T)；

(ii)使用AHo或Kabat编号系统的氨基酸位置3处的缬氨酸(V)或苏氨酸(T)；

(iii)使用AHo或Kabat编号系统的氨基酸位置10处的苏氨酸(T)或异亮氨酸(I)；

(iv)使用AHo或Kabat编号系统的氨基酸位置12处的丝氨酸(S)或酪氨酸(Y)；

(v)使用AHo或Kabat编号系统的氨基酸位置18处的丝氨酸(S)或精氨酸(R)；

(vi)使用AHo或Kabat编号系统的氨基酸位置20处的苏氨酸(T)或丙氨酸(A)；

(vii)使用AHo编号系统的氨基酸位置56(使用Kabat编号系统的氨基酸位置48)处的异亮氨酸(I)或甲硫氨酸(M)；

(viii)使用AHo编号系统的氨基酸位置74(使用Kabat编号系统的氨基酸位置58)处的异亮氨酸(I)、缬氨酸(V)或苏氨酸(T)；

(ix)使用AHo编号系统的氨基酸位置94(使用Kabat编号系统的氨基酸位置76)处的丝氨酸(S)或天冬酰胺(N)；

(x)使用AHo编号系统的氨基酸位置101(使用Kabat编号系统的氨基酸位置83)处的苯丙氨酸(F)、酪氨酸(Y)或丝氨酸(S)；和

(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的缬氨酸(V)、亮氨酸(L)或丙氨酸(A)；和

f)其中如果选择用于突变的一个或多个氨基酸位置在Vλ1家族轻链可变区，那么突变包括选自下述的一个或多个置换：

(i)使用AHo或Kabat编号系统的氨基酸位置1处的亮氨酸(L)、谷氨酰胺(Q)、丝氨酸(S)或谷氨酸(E)；

(ii)使用AHo或Kabat编号系统的氨基酸位置2处的丝氨酸(S)、丙氨酸(A)、脯氨酸(P)、异亮氨酸(I)或酪氨酸(Y)；

(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)、甲硫氨酸(M)或亮氨酸(L)；

(iv)使用AHo或Kabat编号系统的氨基酸位置7处的丝氨酸(S)、谷氨酸(E)、脯氨酸(P)；

(v)使用AHo或Kabat编号系统的氨基酸位置11处的丙氨酸(A)或缬氨酸(V)；

(vi)使用AHo或Kabat编号系统的氨基酸位置14处的苏氨酸(T)、丝氨酸(S)或丙氨酸(A)；

(vii)使用AHo编号系统的氨基酸位置46(使用Kabat编号系统的氨基酸位置38)处的组氨酸(H)或谷氨酰胺(Q)；

(viii)使用AHo编号系统的氨基酸位置53(使用Kabat编号系统的氨基酸位置45)处的赖氨酸(K)、苏氨酸(T)、丝氨酸(S)、天冬酰胺(N)、谷氨酰胺(Q)或脯氨酸(P)；

(ix)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置66)处的精氨酸(R)、谷氨酰胺(Q)或赖氨酸(K)；

(x)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置74)处的甘氨酸(G)、苏氨酸(T)、天冬氨酸(D)、丙氨酸(A)；和

(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的天冬氨酸(D)、缬氨酸(V)、苏氨酸(T)、组氨酸(H)或谷氨酸(E)。

在一个优选实施方案中，免疫结合剂是scFv抗体。在其他实施方案中，免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。

本发明还包含根据上述方法制备的免疫结合剂。优选地，免疫结合剂是scFv抗体。在其他实施方案中，免疫结合剂是例如全长免疫球蛋白、Dab、纳米抗体或Fab片段。本发明还包括包含一种或多种前述免疫结合剂和药学上可接受的载体的药物组合物。

在另一个实施方案中，本发明提供了改造免疫结合剂例如scFv抗体的方法，其中在一个或多个氨基酸位置处进行一个或多个氨基酸置换，其中用于置换到免疫结合剂内的氨基酸残基选自本文表13-18中鉴定的示例性和优选氨基酸残基，但不包括由种系(IMGT和Vbase)和成熟抗体(KDB)数据库的分析鉴定的共有氨基酸残基。即，置换选自在所选择的scFv数据库(QC)中显示富集的那些氨基酸残基。因此，在这个实施方案中，本发明提供了改造免疫结合剂的方法，所述免疫结合剂包含(i)VH3、VH1a或VH1b家族的重链可变区或其片段，所述重链可变区包含V_H构架残基，或(ii)Vκ1、Vκ3或Vλ1家族的轻链可变区或其片段，所述轻链可变区包含V_L构架残基，所述方法包括：

B)使选择用于突变的一个或多个氨基酸位置突变，

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酰胺(Q)；

(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酰胺(Q)；

(iii)使用AHo或Kabat编号系统的氨基酸位置7处的苏氨酸(T)或丙氨酸(A)；

(iv)使用AHo编号系统的氨基酸位置89(使用Kabat编号系统的氨基酸位置78)处的丙氨酸(A)、缬氨酸(V)或苯丙氨酸(F)；和

(v)使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置89)处的精氨酸(R)、谷氨酰胺(Q)、异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)或苯丙氨酸(F)；

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)；

(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酸(E)；

(iii)使用AHo编号系统的氨基酸位置12(使用Kabat编号系统的氨基酸位置11)处的亮氨酸(L)；

(iv)使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的甲硫氨酸(M)；

(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)或谷氨酰胺(Q)；

(vi)使用AHo编号系统的氨基酸位置19(使用Kabat编号系统的氨基酸位置18)处的亮氨酸(L)；

(vii)使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I)；

(viii)使用AHo编号系统的氨基酸位置90(使用Kabat编号系统的氨基酸位置79)处的苯丙氨酸(F)、丝氨酸(S)、组氨酸(H)或天冬氨酸(D)；

(ix)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置81)处的天冬氨酸(D)或谷氨酰胺(Q)；

(x)使用AHo编号系统的氨基酸位置95(使用Kabat编号系统的氨基酸位置82b)处的甘氨酸(G)、天冬酰胺(N)或苏氨酸(T)；和

(xi)使用AHo编号的氨基酸位置98(使用Kabat编号的氨基酸位置84)处的苏氨酸(T)、丙氨酸(A)、脯氨酸(P)或苯丙氨酸(F)；

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)；

(ii)使用AHo编号系统的氨基酸位置10(使用Kabat编号系统的氨基酸位置9)处的苏氨酸(T)、脯氨酸(P)、缬氨酸(V)或天冬氨酸(D)；

(iv)使用AHo编号系统的氨基酸位置13(使用Kabat编号系统的氨基酸位置12)处的缬氨酸(V)、精氨酸(R)、谷氨酰胺(Q)或甲硫氨酸(M)；

(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)、精氨酸(R)或甲硫氨酸(M)；

(vi)使用AHo编号系统的氨基酸位置20(使用Kabat编号系统的氨基酸位置19)处的精氨酸(R)、苏氨酸(T)或天冬酰胺(N)；

(vii)使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的异亮氨酸(I)、苯丙氨酸(F)或亮氨酸(L)；

(viii)使用AHo编号系统的氨基酸位置45(使用Kabat编号系统的氨基酸位置38)处的赖氨酸(K)；

(ix)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置40)处的苏氨酸(T)、脯氨酸(P)、缬氨酸(V)或精氨酸(R)；

(x)使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置43)处的赖氨酸(K)、组氨酸(H)或谷氨酸(E)；

(xi)使用AHo编号的氨基酸位置55(使用Kabat编号的氨基酸位置48)处的异亮氨酸(I)；

(xii)使用AHo编号的氨基酸位置77(使用Kabat编号的氨基酸位置66)处的赖氨酸(K)；

(xiii)使用AHo编号系统的氨基酸位置78(使用Kabat编号系统的氨基酸位置67)处的丙氨酸(A)、亮氨酸(L)或异亮氨酸(I)；

(xiv)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置71)处的谷氨酸(E)、苏氨酸(T)或丙氨酸(A)；

(xv)使用AHo编号系统的氨基酸位置86(使用Kabat编号系统的氨基酸位置75)处的苏氨酸(T)、丝氨酸(S)或亮氨酸(L)；

(xvi)使用AHo编号系统的氨基酸位置87(使用Kabat编号系统的氨基酸位置76)处的天冬氨酸(D)、天冬酰胺(N)或甘氨酸(G)；和

(xvii)使用AHo编号系统的氨基酸位置107(使用Kabat编号系统的氨基酸位置93)处的天冬酰胺(N)或丝氨酸(S)；

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)或异亮氨酸(I)；

(ii)使用AHo或Kabat编号系统的氨基酸位置3处的缬氨酸(V)或异亮氨酸(I)；

(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)、亮氨酸(L)或异亮氨酸(I)；

(iv)使用AHo或Kabat编号系统的氨基酸位置24处的谷氨酰胺(Q)；

(v)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置39)处的精氨酸(R)或异亮氨酸(I)；

(vi)使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置42)处的赖氨酸(K)、谷氨酸(E)、苏氨酸(T)、甲硫氨酸(M)或谷氨酰胺(Q)；

(vii)使用AHo编号系统的氨基酸位置57(使用Kabat编号系统的氨基酸位置49)处的组氨酸(H)、丝氨酸(S)或苯丙氨酸(F)；

(viii)使用AHo编号系统的氨基酸位置91(使用Kabat编号系统的氨基酸位置73)处的苯丙氨酸(F)；和

(ix)使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置85)处的缬氨酸(V)、丝氨酸(S)、甘氨酸(G)、异亮氨酸(I)；

(i)使用AHo或Kabat编号系统的氨基酸位置2处的苏氨酸(T)；

(ii)使用AHo或Kabat编号系统的氨基酸位置3处的苏氨酸(T)；

(iii)使用AHo或Kabat编号系统的氨基酸位置10处的异亮氨酸(I)；

(iv)使用AHo或Kabat编号系统的氨基酸位置12处的酪氨酸(Y)；

(v)使用AHo或Kabat编号系统的氨基酸位置18处的丝氨酸(S)；

(vi)使用AHo或Kabat编号系统的氨基酸位置20处的丙氨酸(A)；

(vii)使用AHo编号系统的氨基酸位置56(使用Kabat编号系统的氨基酸位置48)处的甲硫氨酸(M)；

(viii)使用AHo编号系统的氨基酸位置74(使用Kabat编号系统的氨基酸位置58)处的缬氨酸(V)或苏氨酸(T)；

(ix)使用AHo编号系统的氨基酸位置94(使用Kabat编号系统的氨基酸位置76)处的天冬酰胺(N)；

(x)使用AHo编号系统的氨基酸位置101(使用Kabat编号系统的氨基酸位置83)处的酪氨酸(Y)或丝氨酸(S)；和

(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的亮氨酸(L)或丙氨酸(A)；和

(i)使用AHo或Kabat编号系统的氨基酸位置1处的亮氨酸(L)、丝氨酸(S)或谷氨酸(E)；

(ii)使用AHo或Kabat编号系统的氨基酸位置2处的丙氨酸(A)、脯氨酸(P)、异亮氨酸(I)或酪氨酸(Y)；

(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)或甲硫氨酸(M)；

(iv)使用AHo或Kabat编号系统的氨基酸位置7处的丝氨酸(S)或谷氨酸(E)；

(v)使用AHo或Kabat编号系统的氨基酸位置11处的丙氨酸(A)；

(vi)使用AHo或Kabat编号系统的氨基酸位置14处的苏氨酸(T)或丝氨酸(S)；

(vii)使用AHo编号系统的氨基酸位置46(使用Kabat编号系统的氨基酸位置38)处的组氨酸(H)；

(viii)使用AHo编号系统的氨基酸位置53(使用Kabat编号系统的氨基酸位置45)处的苏氨酸(T)、丝氨酸(S)、天冬酰胺(N)、谷氨酰胺(Q)或脯氨酸(P)；

(ix)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置66)处的精氨酸(R)或谷氨酰胺(Q)；

(x)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置74)处的甘氨酸(G)、苏氨酸(T)或天冬氨酸(D)；和

(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的缬氨酸(V)、苏氨酸(T)、组氨酸(H)或谷氨酸(E)。

在另外一个实施方案中，本发明提供了改造免疫结合剂例如scFv抗体的方法，其中在一个或多个氨基酸位置处进行一个或多个氨基酸置换，其中用于置换到免疫结合剂内的氨基酸残基选自本文表13-18中鉴定的优选氨基酸残基(即，不包括由种系(IMGT和Vbase)和成熟抗体(KDB)数据库的分析鉴定的共有氨基酸残基或来自所选择的scFv数据库的较不富集的残基)。即，置换仅选自在所选择的scFv数据库(QC)中显示最大富集的那些氨基酸残基。因此，在这个实施方案中，本发明提供了改造免疫结合剂的方法，所述免疫结合剂包含(i)VH3、VH1a或VH1b家族的重链可变区或其片段，所述重链可变区包含V_H构架残基，或(ii)Vκ1、Vκ3或Vλ1家族的轻链可变区或其片段，所述轻链可变区包含V_L构架残基，所述方法包括：

B)使选择用于突变的一个或多个氨基酸位置突变，

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酰胺(Q)；

(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酰胺(Q)；

(iii)使用AHo或Kabat编号系统的氨基酸位置7处的苏氨酸(T)；

(iv)使用AHo编号系统的氨基酸位置89(使用Kabat编号系统的氨基酸位置78)处的缬氨酸(V)；和

(v)使用AHo编号系统的氨基酸位置103(使用Kabat编号的氨基酸位置89)处的亮氨酸(L)；

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)；

(ii)使用AHo或Kabat编号系统的氨基酸位置6处的谷氨酸(E)；

(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的谷氨酸(E)；

(ix)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置81)处的天冬氨酸(D)；

(x)使用AHo编号系统的氨基酸位置95(使用Kabat编号系统的氨基酸位置82b)处的甘氨酸(G)；和

(xi)使用AHo编号的氨基酸位置98(使用Kabat编号的氨基酸位置84)处的苯丙氨酸(F)；

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)；

(v)使用AHo编号系统的氨基酸位置14(使用Kabat编号系统的氨基酸位置13)处的精氨酸(R)；

(vi)使用AHo编号系统的氨基酸位置20(使用Kabat编号系统的氨基酸位置19)处的天冬酰胺(N)；

(vii)使用AHo编号系统的氨基酸位置21(使用Kabat编号系统的氨基酸位置20)处的亮氨酸(L)；

(ix)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置40)处的精氨酸(R)；

(x)使用AHo编号系统的氨基酸位置50(使用Kabat编号系统的氨基酸位置43)处的赖氨酸(K)；

(xiii)使用AHo编号系统的氨基酸位置78(使用Kabat编号系统的氨基酸位置67)处的丙氨酸(A)；

(xiv)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置71)处的谷氨酸(E)；

(xv)使用AHo编号系统的氨基酸位置86(使用Kabat编号系统的氨基酸位置75)处的苏氨酸(T)；

(xvi)使用AHo编号系统的氨基酸位置87(使用Kabat编号系统的氨基酸位置76)处的天冬酰胺(N)；和

(xvii)使用AHo编号系统的氨基酸位置107(使用Kabat编号系统的氨基酸位置93)处的天冬酰胺(N)；

(i)使用AHo或Kabat编号系统的氨基酸位置1处的谷氨酸(E)；

(ii)使用AHo或Kabat编号系统的氨基酸位置3处的缬氨酸(V)；

(iii)使用AHo或Kabat编号系统的氨基酸位置4处的亮氨酸(L)；

(iv)使用AHo或Kabat编号系统的氨基酸位置24处的谷氨酰胺(Q)；

(v)使用AHo编号系统的氨基酸位置47(使用Kabat编号系统的氨基酸位置39)处的精氨酸(R)；

(vii)使用AHo编号系统的氨基酸位置57(使用Kabat编号系统的氨基酸位置49)处的丝氨酸(S)；

(ix)使用AHo编号系统的氨基酸位置103(使用Kabat编号系统的氨基酸位置85)处的缬氨酸(V)；

(i)使用AHo或Kabat编号系统的氨基酸位置2处的苏氨酸(T)；

(ii)使用AHo或Kabat编号系统的氨基酸位置3处的苏氨酸(T)；

(iii)使用AHo或Kabat编号系统的氨基酸位置10处的异亮氨酸(I)；

(iv)使用AHo或Kabat编号系统的氨基酸位置12处的酪氨酸(Y)；

(v)使用AHo或Kabat编号系统的氨基酸位置18处的丝氨酸(S)；

(vi)使用AHo或Kabat编号系统的氨基酸位置20处的丙氨酸(A)；

(viii)使用AHo编号系统的氨基酸位置74(使用Kabat编号系统的氨基酸位置58)处的苏氨酸(T)；

(x)使用AHo编号系统的氨基酸位置101(使用Kabat编号系统的氨基酸位置83)处的丝氨酸(S)；和

(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的丙氨酸(A)；和

(i)使用AHo或Kabat编号系统的氨基酸位置1处的亮氨酸(L)；

(ii)使用AHo或Kabat编号系统的氨基酸位置2处的脯氨酸(P)；

(iii)使用AHo或Kabat编号系统的氨基酸位置4处的缬氨酸(V)；

(iv)使用AHo或Kabat编号系统的氨基酸位置7处的丝氨酸(S)；

(v)使用AHo或Kabat编号系统的氨基酸位置11处的丙氨酸(A)；

(vi)使用AHo或Kabat编号系统的氨基酸位置14处的苏氨酸(T)；

(ix)使用AHo编号系统的氨基酸位置82(使用Kabat编号系统的氨基酸位置66)处的精氨酸(R)；

(x)使用AHo编号系统的氨基酸位置92(使用Kabat编号系统的氨基酸位置74)处的苏氨酸(T)；和

(xi)使用AHo编号的氨基酸位置103(使用Kabat编号的氨基酸位置85)处的缬氨酸(V)。

尽管这个小节中的上述多种改造方法提供了如在本文表13-18中分别对VH3、VH1a、VH1b、Vκ1、Vκ3和Vλ1家族定义的所有示例性和优选置换的清单，但应当理解本发明包括其中在选自VH3、VH1a、VH1b、Vκ1、Vκ3和Vλ1的一个可变区中仅进行一个或数个氨基酸置换的方法，以及其中在选自VH3、VH1a、VH1b、Vκ1、Vκ3或Vλ1家族的一个或多个可变区中，例如在包含一个重链和一个轻链可变区的免疫结合剂(例如，scFv)中的一个选自VH3、VH1a或VH1b家族的重链可变区和一个选自Vκ1、Vκ3或Vλ1家族的轻链可变区中进行一个、数个或多个氨基酸置换的方法。即，选自如表13-18中限定的示例性和优选置换的任何和所有可能的置换组合意欲由改造方法以及根据这些方法制备得到的免疫结合剂所包括。

例如，在多种实施方案中，该方法包括在选自VH3、VH1a或VH1b家族可变区的重链可变区中进行1、2、3、4、5、6、7、8、9、10或超过10个的指定氨基酸置换。在其他多种实施方案中，该方法包括在选自Vκ1、Vκ3或Vλ1家族可变区的轻链可变区中进行1、2、3、4、5、6、7、8、9、10或超过10个的指定氨基酸置换。

构架支架

如实施例8中详细描述的，本文描述的功能共有区方法已成功地用于设计这样的构架支架序列，其掺入为可变区家族的特定氨基酸位置鉴定的示例性和优选氨基酸置换。在这些支架中，CDR区不是指定的；相反，此种支架序列可以用作CDR序列(CDRL1、CDRL2、CDRL3、CDRH1、CDRH2和/或CDRH3)可以插入其内的“模板”，以产生可能显示期望的稳定性和/或溶解性性质的可变区，由于掺入支架内的示例性或优选氨基酸置换，基于所选择的scFv序列(基于其期望的稳定性和/或溶解性性质选择的)。例如，VH1a家族的重链构架支架序列显示于图9中(SEQ ID NO：1)，VH1b家族的重链构架支架序列显示于图10中(SEQ ID NO：2)，VH3家族的重链构架支架序列显示于图11中(SEQ ID NO：3)，Vκ1家族的轻链构架支架序列显示于图12中(SEQ ID NO：4)，Vκ3家族的轻链构架支架序列显示于图13中(SEQ ID NO：5)，和Vλ1家族的轻链构架支架序列显示于图14中(SEQ ID NO：6)。

因此，在另一个方面，本发明提供了改造免疫结合剂的方法，所述免疫结合剂包含重链CDR1、CDR2和CDR3序列，所述方法包括将重链CDR1、CDR2和CDR3序列插入重链构架支架内，所述重链构架支架包含如图9(SEQ ID NO：1)、图10(SEQ ID NO：2)或图11(SEQ ID NO：3)中所示的氨基酸序列。在一个实施方案中，重链构架支架包含如图9(SEQ ID NO：1)中所示的氨基酸序列。在另一个实施方案中，重链构架支架包含如图10(SEQ ID NO：2)中所示的氨基酸序列。在另外一个实施方案中，重链构架支架包含如图11(SEQ ID NO：3)中所示的氨基酸序列。

另外或备选地，本发明提供了改造免疫结合剂的方法，所述免疫结合剂包含轻链CDR1、CDR2和CDR3序列，所述方法包括将轻链CDR1、CDR2和CDR3序列插入轻链构架支架内，所述轻链构架支架包含如图12(SEQ ID NO：4)、图13(SEQ ID NO：5)或图14(SEQ ID NO：6)中所示的氨基酸序列。在一个实施方案中，轻链构架支架包含如图12(SEQ ID NO：4)中所示的氨基酸序列。在另一个实施方案中，轻链构架支架包含如图13(SEQ ID NO：5)中所示的氨基酸序列。在另外一个实施方案中，轻链构架支架包含如图14(SEQ ID NO：6)中所示的氨基酸序列。

优选地，根据所述方法改造的免疫结合剂是scFv抗体，尽管其他免疫结合剂例如全长免疫球蛋白和Fab片段也可以根据该方法进行改造。在特定示例性实施方案中，一个或多个CDR(例如，CDRL1、CDRL2、CDRL3、CDRH1、CDRH2和/或CDRH3)衍生自上文讨论的具有治疗重要性的任何免疫结合剂。CDR可以通过使用标准分子生物学技术插入构架支架内。

本发明还包括使用构架支架根据上述方法改造的免疫结合剂。优选地，免疫结合剂是scFv抗体，尽管也包括了其他免疫结合剂，例如全长免疫球蛋白、Dab、纳米抗体和Fab片段。还包括了包含此种免疫结合剂和药学上可接受的载体的药物组合物。

在另外一个方面，本发明提供了包含如图9、图10或图11中所示的氨基酸序列的分离的重链构架支架。此种重链构架支架可以使用标准分子生物学技术来制备。

尽管描述了前述内容，但在多种实施方案中，某些构架支架序列被排除用于本发明的基于支架的改造方法和/或被排除成为通过支架-改造方法产生的免疫结合剂组合物。例如，在多种实施方案中，存在附带条件，即构架支架序列不是PCT公开号WO 2001/048017、PCT公开号WO 2003/097697、美国专利公开号20010024831和/或美国专利公开号US 20030096306中公开的任何scFv构架序列，所述专利各自的内容明确地通过引用合并入本文。

在上述基于支架的改造方法或由其产生的免疫结合剂的多种其他实施方案中，可存在附带条件，即图9、10或11中显示为可变的某些氨基酸位置(即，显示为“X”，且该位置的可能的氨基酸残基的清单在“X”下列出)可能受限制而不可变。例如，在某些实施方案中，存在附带条件，即任何或所有下述氨基酸位置可能限制为仅在“X”下首先列出、或在“X”下第二列出、或在“X”下第三列出(当存在时)、或在“X”下第四列出(当存在时)、或在“X”下第五列出(当存在时)或在“X”下第六列出(当存在时)的氨基酸残基：VH1a或VH1b的AHo位置12(Kabat 11)；VH1b的AHo位置50(Kabat 43)；VH1b的AHo位置77(Kabat 66)；VH1b的AHo位置78(Kabat 67)；VH1b的AHo位置82(Kabat 71)；VH1b的AHo位置86(Kabat 75)；VH1b的AHo位置87(Kabat 76)；VH3的AHo位置89(Kabat 78)；VH1a的AHo位置90(Kabat 79)；和/或VH1b的AHo位置107(Kabat93)。

其他实施方案

应理解，本发明还包括美国临时专利申请系列号60/905,365的附录(A-C)和美国临时专利申请序列号60/937,112的附录(A-I)中所示的任何方法、参考文献和/或组合物，包括但不限于，已鉴定的数据库、生物信息学、计算机中(in silico)的数据操作和解释方法、功能测定法、优选序列、优选残基位置/改变、构架鉴定和选择、构架改变、CDR比对和整合以及优选改变/突变。

关于此类方法和组合物的另外的信息可见于U.S.S.N.s60/819,378；和分别于2006年7月和2007年2月6日提交的标题为“scFv Antibodies Which Pass Epithelial And/Or Endothelial Layers”的U.S.S.N.s 60/899,907和PCT公开号WO 2008/006235；2006年6月6日提交的标题为“Stable And Soluble Antibodies Inhibiting TNFα”的WO06131013A2；2003年5月21日提交的标题为“Immunoglobulin Frameworks Which Demonstrate EnhancedStability In The Intracellular Environment And Methods OfIdentifying Same”的EP1506236A2；2000年12月18日提交的标题为“Intrabodies ScFv with defined framework that is stable in areducing environment”的EP1479694A2；2000年12月18日提交的标题为“Intrabodies With Defined Framework That Is Stable In AReducing Environment And Applications Thereof”的EP1242457B1；2003年5月21日提交的标题为“Immunoglobulin Frameworks WhichDemonstrate Enhanced Stability In The Intracellular EnvironmentAnd Methods Of Identifying Same”的WO03097697A2；和2000年12月18日提交的标题为“Intrabodies With Defined Framework ThatIs Stable In A Reducing Environment And Applications Thereof”的WO0148017A1；和Honegger等人，J.Mol.Biol.309：657-670(2001)。

此外，要理解，本发明还包括适合于其他抗体形式例如全长抗体或其片段(例如，Fab、Dab等)的开发和/或改进的方法和组合物。因此，本文中的原理和残基(其鉴定为适合于选择或改变以获得期望的生物物理学和/或治疗性质)可用于广泛的免疫结合剂。在一个实施方案中，通过修饰本文中公开的一个或多个残基位置来改进治疗相关抗体例如FDA批准的抗体。

然而，本发明并不限于免疫结合剂的改造。例如，本领域技术人员将认识到，本发明的方法可以用于改造其他、非免疫球蛋白、结合分子，包括但不限于，纤连蛋白结合分子例如Adnectins(参见WO01/64942以及美国专利号6,673,901、6,703,199、7,078,490和7,119,171)、亲和体(Affibody)(参见例如，美国专利6,740,734和6,602,977以及WO 00/63243)、Anticalins(也称为脂质运载蛋白)(参见WO99/16873和WO 05/019254)、A结构域蛋白质(参见WO02/088171和WO 04/044011)和锚蛋白重复蛋白质例如Darpins或亮氨酸重复蛋白质(参见WO 02/20565和WO 06/083275)。

通过下列不应当被解释为进一步限定的实施例来进一步举例说明本公开内容。整个本申请中引用的所有图和所有参考文献、专利和公开的专利申请的内容明确地以它们的全文通过引用合并入本文。

实施例1：抗体位置编号系统

在本实施例中，提供了用于鉴定抗体重链和轻链可变区中的氨基酸残基位置的两个不同编号系统的换算表。Kabat编号系统进一步描述于Kabat等人(Kabat，E.A.，等人(1991)Sequences of Proteins ofImmunological Interest，第5版，U.S.Department of Health andHuman Services，NIH Publication No.91-3242)。AHo编号系统进一步描述干Honegger，A.和Plückthun，A.(2001)J.Mol.Biol.309：657-670)。

重链可变区编号

表1：重链可变结构域中残基位置的换算表

Kabat AHo	Kabat AHo	Kabat AHo
			1 12 23 34 45 56 67 7· 88 99 1010 1111 1212 1313 1414 1515 1616 1717 1818 1919 2020 2121 2222 2323 2424 2525 2626 27· 2827 2928 3029 3130 3231 3332 3433 3534 3635 3735a 3835b 39· 40· 41· 4236 4337 4438 4539 4640 4741 4842 4943 43	44 5145 5246 5347 5448 5549 5650 5751 5852 5952a 6052b 6152c 62· 6353 6454 6555 6656 6757 6858 6959 7060 7161 7262 7363 7464 7565 7666 7767 7868 7969 6970 8171 8272 8373 8474 8575 8676 8777 8878 8979 9080 9181 9282 9382a 9482b 9582b 9683 9784 9885 9986 100	87 10188 10289 10390 10491 10592 10693 10794 10895 10996 11097 11198 11299 113100 114100a 115100b 116100c 117100d 118100e 119100f 120100g 121100h 122100i 123· 124· 125· 126· 127· 128· 129· 130· 131· 132· 133· 134· 135· 136101 137102 102103 139104 140105 141106 142107 143108 144109 145110 146111 147112 118113 149

—————————————————————————————

第1栏，Kabat编号系统中的残基位置。第2栏，第1栏中标示的位置在AHo编号系统中的相应编号。第3栏，Kabat编号系统中的残基位置。第4栏，第3栏中标示的位置在AHo编号系统中的相应编号。第5栏，Kabat编号系统中的残基位置。第6栏，第5栏中标示的位置在AHo编号系统中的相应编号。

轻链可变区的编号

表2：轻链可变结构域中残基位置的换算表

Kabat AHo	Kabat AHo	Kabat AHo
			1 12 23 34 45 56 67 78 89 910 1011 1112 1213 1314 1415 1516 1617 1718 1819 1920 2021 2122 2223 2324 2425 2526 2627 27· 2827a 2927b 3027c 3127d 3227e 3327f 34· 3528 3629 3730 3831 3932 4033 4134 4235 4336 4437 4538 4639 4740 4841 4942 50	43 5144 5245 5346 5447 5548 5649 5750 58· 59· 60· 61· 62· 63· 64· 65· 6651 6752 6853 6954 7055 7156 7257 7358 7459 7560 7661 7762 7863 7964 8065 8166 8267 6768 68· 85· 8669 8770 8871 8972 9073 9174 9275 9376 9477 9578 9679 9780 9881 9982 100	83 10184 10285 10386 10487 10588 10689 10790 10891 10992 11093 11194 11295 11395a 11495b 11595c 11695d 11795e 11895f 119· 120· 121· 122· 123· 124· 125· 126· 127· 128· 129· 130· 131· 132· 133· 134· 135· 13696 13797 13898 13999 140100 141101 142102 143103 144104 145105 146106 147107 148108 149

——————————————————————————————

实施例2：scFv序列的基于序列的分析

在本实施例中，详细地描述了scFv序列的基于序列的分析。概述分析过程的流程图示于图1中。

人免疫球蛋白序列的收集和比对

从不同的数据库收集人成熟抗体和种系的可变结构域序列并且将其以单字母代码氨基酸序列的形式输入定制的数据库。使用Needleman-Wunsch序列比对算法的EXCEL工具(Needleman等人，JMol Biol.，48(3)：443-53(1970))比对抗体序列。然后将数据库细分成如下4个不同的阵列(根据原始数据来源)以帮助随后的分析和比较：

VBase：人种系序列

IMGT：人种系序列

KDB数据库：成熟抗体

QC数据库：包含通过质量控制筛选选择的所选择scFv构架的ESBATech内部数据库

QC筛选系统和根据其选择的具有期望的功能性质的scFv构架序列进一步描述于例如PCT公开号WO 2001/48017、美国申请号20010024831、US 20030096306、美国专利号7,258,985和7,258,986、PCT公开号WO 2003/097697和美国申请号20060035320中。

按照免疫球蛋白的可变结构域的AHo编号系统进行缺口的引入和残基位置的命名(Honegger，A.和Plückthun，A.(2001)J.Mol.Biol.309：657-670)。然后，按照Kabat等人(Kabat，E.A.，等人(1991)Sequences of Proteins of Immunological Interest，第5版，U.S.Department of Health and Human Services，NIH Publication No.91-3242)鉴定构架区和CDR区。弃去KDB数据库中低于70％的完整性或在构架区中包含多个未确定的残基的序列。也排除与数据库中的任何其他序列具有超过95％的同一性的序列，从而在分析中避免随机噪音。

序列至亚组的分配

通过按照基于序列同源性的分类方法(Tomlinson，I.M.等人(1992)J.Mol.Biol.227：776-798；Williams，S.C.和Winter，G.(1993)Eur.J.Immunol.23：1456-1461)；Cox，J.P.等人(1994)Eur.J.Immunol.24：827-836)使抗体聚类来将抗体序列分类成不同的家族。与家族共有区的百分数同源性被限定为70％的相似性。在其中序列在两个或更多个不同种系家族之间显示矛盾或同源性百分数低于70％(对任何家族)的情况下，确定最接近的种系对应物，详细分析CDR长度、规范类(canonical class)和定义的亚类残基以正确地分配家族。

统计分析

在确定家族群(family cluster)后，即可对在“质量控制(“QC”)筛选”(该QC筛选详细地描述于PCT公开号WO 2003/097697)中鉴定的结果(hit)进行统计分析。只可能对最具代表性的家族(VH3、VH1a、VH1b、Vk1、Vk3和Vλ1)进行分析，因为最小数目的序列是分析所需要的。通过把数据集中观察到的特定残基类型的次数除以序列的总数来计算各位置i的残基频率fi(r)。通过使用作为系统中多样性的数学量度的辛普森指数，将位置的熵N(i)计算为每一个残基位置的变异性的量度(Shenkin，P.S.等人(1991)Proteins 11：297-313；Larson，S.M.和Davidson，A.R.(2000)Protein Sci.9：2170-2180；Demarest，S.J.等人(2004)J.Mol.Biol.335：41-48)，所述辛普森指数提供了比丰富度更多的关于氨基酸组成的信息。通过将存在的不同氨基酸的数目以及各残基的相对丰度考虑进来来计算各位置i的多样性程度。

D = \frac{Σ_{i = 1}^{r} n (n - 1)}{N (N - 1)}

其中：D是辛普森指数，N是氨基酸的总数，r是存在于各位置上的不同氨基酸的数目，n是特定氨基酸类型的残基的数目。

使用不同的标准筛选所选择的Fv构架(通过QC筛选选择的)的QC数据库以定义独特特征。将序列数据库中不同的阵列用于确定Fv构架中残基位置的变异性程度和用于鉴定在自然界中罕见的存在于所选择的Fv构架中的耐受变异的位置。将等于或大于10％的位置的熵评分的差异定义为阈值。如果给定的位置上的残基被其他序列阵列中不常被观察到的氨基酸，即种系数据库(VBase和IMGT)和KDB数据库中不常被观察到的氨基酸占据，那么选择另外的位置。如果发现残基的行为确实不同，(在任何其他序列阵列中具有低代表性或无代表性)，则将残基位置定义为独特的。

所选择的Fv构架序列的独特特征的鉴定的基本原理是构架的已证明是优良的性质和这些发现用于改进的支架的潜在用途。我们假定在所选择的构架中显示一定程度的变异性的在自然界中高度保守的位置应当耐受随机诱变，并且表现增加的发现优于scFv形式中的天然残基的备选氨基酸的概率。此外，对罕见氨基酸的显著偏好是对某个残基的自然选择的指标。基于这两个统计指导方针，选择重链和轻链中的不同残基作为浮动位置(floating position)(耐受变异性的)或优选置换(罕见残基)。

实施例3：耐受变异性的和罕见残基位置的鉴定

通过使用上述实施例2中的基于序列的scFv分析方法，分析3个重链可变区家族(VH3、VH1a和VH1b)和3个轻链可变区家族(Vκ1、Vκ3和Vλ1)以鉴定耐受变异性的氨基酸位置。特别地，如上所述，测定4个不同数据库Vbase、IMGT、KDB和QC(所选择的scFv)中的序列的各氨基酸位置的多样性程度(如使用辛普森指数计算的)。基于与QC选择的scFv数据库相比Vbase和IMGT种系数据库的这些位置上的辛普森指数值的差异来鉴定耐受变异的和罕见残基的氨基酸位置。此外，对于已鉴定的目的位置，鉴定种系共有残基并且测定QC和KDB数据库中该共有残基的频率。

重链可变区家族VH3、VH1a和VH1b的变异性分析结果分别示于表3、4和5。对于各个表，栏目如下：第1栏：使用AHo编号系统的氨基酸残基位置(可使用实施例1的表1中所示的换算表完成至Kabat编号系统的转换)；第2至5栏：第1栏中标示的残基位置对于数据库中各抗体阵列的经计算的多样性；第6栏：相应的种系家族和KDB的共有残基；第7栏：第6栏中的共有残基在KDB数据库中的相对残基频率；和第8栏：第6栏中的共有残基在QC选择的scFv数据库中的相对残基频率。

表3：VH3家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表4：VH1a家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表5：VH1b家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

轻链可变区家族Vκ1、Vκ3和Vλ1的变异性分析结果分别示于表6、7和8。对于各表，栏目如下：第1栏：使用AHo编号系统的氨基酸残基位置(可使用实施例1的表1中所示的换算表完成至Kabat编号系统的转换)；第2至5栏：第1栏中标示的残基位置对于数据库中各抗体阵列的经计算的多样性；第6栏：相应的种系家族和KDB的共有残基；第7栏：第6栏中的共有残基在KDB数据库中的相对残基频率；和第8栏：第6栏中的共有残基在QC选择的scFv数据库中的相对残基频率。

表6：Vκ1家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表7：Vκ3家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

表8：Vλ1家族的残基的变异性分析和种系中鉴定的共有氨基酸的相应频率。

如上面表3至8中所示，发现QC系统选择的scFv构架中的残基位置的亚组强烈地偏向在种系(VBase和IMGT)和成熟抗体(KDB)中不存在或不具代表性的某些残基，这表明可基于在质量控制酵母筛选系统中选择的构架序列的独特特征，合理地提高scFv的稳定性。

实施例4：优选残基的选择

为了选择已知提高scFv的功能性质(例如，稳定性和/或溶解性)的特定氨基酸位置上的优选氨基酸残基置换(或，备选地，排除氨基酸残基)，根据它们的家族亚型(例如，VH1b、VH3等)将来自成熟抗体序列的Kabat数据库的VH和VL序列分组。在各序列亚家族中，将各氨基酸位置上的各氨基酸残基的频率测定为一组亚型的所有被分析的序列的百分数。对QC数据库的所有序列进行同样的测定，所述QC数据库由就增强的稳定性和/或溶解性通过所谓的QC系统预选择的抗体组成。对于各亚型，在各相应位置上将针对Kabat序列和针对QC序列获得的各氨基酸残基的所得的百分数(相对频率)进行比较。如果某个氨基酸残基的相对频率相对于Kabat数据库，在QC数据库中增加，那么各自的残基被认为是给定的位置上提高scFv的稳定性和/或溶解性的优选残基。相反地，如果某个氨基酸残基的相对频率相对于Kabat数据库，在QC数据库中减小，那么各自的残基在该位置上在scFv形式的背景中被认为是不利的。

表9描述了不同数据库中VH1b亚型的氨基酸位置H78(AHo编号；Kabat编号H67)上的残基频率的示例性分析。表9中的栏目如下：第1栏：残基类型；第2栏：IMGT种系数据库中残基的频率；第3栏：Vbase种系数据库中残基的频率；第4栏：QC数据库中残基的频率；第5栏：Kabat数据库中残基的频率。

表9：两个种系数据库、QC数据库和成熟抗体的Kabat数据库中VH1b亚型的位置78(AHo编号)上的相对残基频率。

^＊收集的用于残基频率分析的序列的数目

在QC数据库中，以24％的频率(高于在成熟Kabat数据库(KDB_VH1B)中对于相同残基观察到的2％的频率12倍)观察到丙氨酸(A)残基。因此，位置H78(AHo编号)上的丙氨酸残基被认为是该位置上增强scFv的功能性质(例如，稳定性和/或溶解性)的优选残基。相反，在QC数据库中以47％的相对频率(比成熟Kabat数据库中观察到的86％的频率和在种系数据库中对于相同的残基观察到的超过90％的频率(IMGT-germ中91％和Vbase germ中100％)低得多)观察到缬氨酸(V)残基。因此，缬氨酸残基(V)在scFv形式的背景中在位置H78上被认为是不利的残基。

实施例5：来自2个不同方法的ESBA105scFv变体的比较

在本实施例中，比较通过两个不同方法制备的scFv变体的稳定性。亲本scFv抗体是之前已描述的ESBA 105(参见例如，PCT公开号WO 2006/131013和WO 2008/006235)。使用质量控制酵母筛选系统选择一组ESBA 105变体(“QC变体”)，所述变体也已在之前进行了描述(参见例如，PCT公开号WO 2006/131013和WO 2008/006235)。通过将某些氨基酸位置回复突变至优选种系共有序列(通过上文实施例2和3中描述的序列分析鉴定的)来制备其他组的变体。通过在氨基酸序列中检索在种系序列中保守但在所选择的scFv中包含罕见的或低频率的氨基酸的位置来选择回复突变(称为种系共有区改造法)。

通过使分子经历热诱导胁迫来就稳定性检测所有变体。通过在广泛范围的温度(25-95℃)下进行攻击，可以测定每一个变体的热去折叠转变(thermal unfolding transition)的大致中点(TM)。使用FT-IRATR光谱法(其中IR光被导向通过干涉仪(interferometer))进行野生型分子和变体的热稳定性测量。测得的信号是干涉图，对该信号进行傅里叶变换，最终的光谱与来自常规的(分散的)红外光谱法的光谱相同。

热去折叠结果概述于下面的表10中并且在图6中进行了图解描述。表10的栏目如下：第1栏：ESBA 105变体；第2栏：包含突变的结构域；第3栏：以AHo编号表示的突变；第4栏：根据图6中的热去折叠曲线计算的TM中点；第5栏：与亲本ESBA 105相比的相对活性；第5栏：用于第1栏中指定的变体的诱变策略。

表10：来自两个不同方法的ESBA 105变体和它们对在FT-IR中测量的总稳定性(经计算的热去折叠转变的中点)的贡献的比较。

与QC变体相比较，至种系共有序列的回复突变对ESBA 105的热稳定性和活性具有负面影响或无影响。因此，这些结果与已由其他人用于提高不同抗体和形式的稳定性的共有区改造方法(参见例如，Steipe，B等人(1994)J.Mol. Biol. 240：188-192；Ohage，E.和Steipe，B.(1999)J.Mol. Biol. 291：1119-1128；Knappik，A.等人(2000)J.Mol.Biol.296：57-86，Ewert，S.等人(2003)Biochemistry 42：1517-1528；以及Monsellier，E.和Bedouelle，H.(2006)J.Mol.Biol.362：580-593)相矛盾。

在分开的实验中，将上述QC变体(QC11.2、QC15.2和QC23.2)和另外的QC变体(QC7.1)与具有共有序列回复突变(S-2、D-2和D-3)或至丙氨酸的回复突变(D-1)的第二组变体相比较(参见表11)。表11中标示了所选择的构架位置上的残基的同一性，在图7中描述了测量的热稳定性(以任意去折叠单位表示)。

表11：提供了在包含共有序列回复突变(S-2、D-2、D-3)、至丙氨酸(D-1)或QC残基(QC7.1、QC11.2、QC15.2、QC23.2)的突变的ESBA105变体的所选择构架位置处的构架残基的同一性。不同于亲本ESBA105抗体的残基以粗体斜体标示。氨基酸位置以Kabat编号提供。

虽然一些共有序列变体(S-2和D-1)展示热稳定性的显著增加，但该增加比通过4个QC变体的每一个获得的热稳定性的增加要少。

因此，本文中的结果证明用于“质量控制酵母筛选系统”的选择压力产生了支架的亚群，所述支架的亚群包含在自然界中(仍然在人中)极少观察到的并且推定负责这些构架的优良生物物理性质的共同特征。通过在60℃下攻击ESBA 105的不同变体，可以再确认在选择的scFv构架数据库中鉴定的优选置换的优良性质。因此，已证明本文中描述的基于从QC酵母筛选系统获得的所选择的scFv序列的“功能共有区”方法产生这样的scFv变体，其具有比使用种系共有区方法制备的变体更优良的热稳定性。

实施例6：ESBA212 scFv变体

在本实施例中，比较具有与ESBA105不同的结合特异性的scFv抗体(ESBA212)的种系共有序列变体的稳定性。

通过将某些氨基酸位置回复突变至优选种系共有序列(通过上面的实施例2和3中描述的序列分析鉴定的)来制备所有ESBA212变体。通过在氨基酸序列中检索在种系序列中保守但在所选择的scFv中包含罕见的或低频率的氨基酸的位置来选择回复突变(称为种系共有区改造法)。如实施例5中一样，通过使分子经历热诱导的胁迫来就稳定性检测所有变体。

ESBA212变体的热去折叠结果概述于下面的表11中，并且在图8中进行了图解描述。表11中的栏目如下：第1栏：ESBA212变体；第2栏：包含突变的结构域；第3栏：以AHo编号表示的突变；第4栏：根据图7中的热去折叠曲线计算的TM中点；第5栏：与亲本ESBA212相比的相对活性；第5栏：用于第1栏中指定的变体的诱变策略。

表12：回复突变至种系共有残基的ESBA212变体和它们对在FT-IR中测量的总稳定性(经计算的热去折叠转变的中点)的贡献的比较。

如对于不相关的ESBA 105scFv抗体所观察到的，至种系共有序列的回复突变对ESBA212的热稳定性和活性具有负面影响或无影响。因此，这些结果用于进一步突出常规的基于共有区的方法的不足。这些缺陷可通过使用本发明的功能共有区方法来解决。

实施例7：在鉴定的scFv构架位置处的示例性和优选氨基酸置换

使用上文实施例2、3和4中描述的基于序列的scFv分析方法，可以鉴定在QC选择的scFv数据库(其与种系数据库相比，在变异性方面显示出差异)中的scFv构架内的氨基酸残基位置处的示例性和优选氨基酸置换。通过测定2个种系数据库(IMGT和Vbase)、QC选择的scFv数据库和成熟抗体数据库(KDB)内在每个目的特定构架位置处20种氨基酸各自的频率来进行该分析，如实施例4中对于VH1b重链家族的AHo位置78(Kabat位置67)(作为代表性例子)所描述的。鉴定了3个重链可变区家族(VH3、VH1a和VH1b)以及3个轻链可变区家族(Vκ1、Vκ3和Vλ1)的示例性和优选氨基酸置换。

结果概括于下文表13-18中。对于每个表，第1栏显示使用AHo编号系统的残基位置，第2栏显示种系共有残基，第3栏显示在QC选择的scFv构架中发现的示例性置换，第4栏显示在QC选择的scFv构架中发现的优选残基，和第5至8栏显示在第1栏中标示的残基位置处的优选置换(在第4栏中显示)在4个不同数据库中的相对残基频率。

表13：鉴定为VH3家族的QC选择的scFv构架的独特特征的残基位置的示例性和优选氨基酸置换。

表14：鉴定为VH1a家族的QC选择的scFv构架的独特特征的残基位置的示例性和优选氨基酸置换。

表15：鉴定为VH1b家族的QC选择的scFv构架的独特特征的残基位置的示例性和优选氨基酸置换。

表16：鉴定为Vκ1家族的QC选择的scFv构架的独特特征的残基位置的示例性和优选氨基酸置换。

表17：鉴定为Vκ3家族的QC选择的scFv构架的独特特征的残基位置的示例性和优选氨基酸置换。

表18：鉴定为Vλ1家族的QC选择的scFv构架的独特特征的残基位置的示例性和优选氨基酸置换。

如由表13-18中的结果所证实的，发现在QC选择的scFv构架中的残基位置的子集强烈偏向这样的特定残基，所述特定残基在种系序列和成熟抗体序列中不存在或具有低代表性，并且因此明显不用于Ig形式或衍生片段中。因此，在QC选择的scFv构架中鉴定的示例性和优选置换代表可能促成由QC选择的scFv构架显示的期望的功能性质(例如，稳定性、溶解性)的氨基酸残基。

实施例8：基于功能共有区的scFv构架支架

基于实施例7中鉴定的示例性和优选氨基酸置换，基于本文描述的功能共有区方法设计scFv构架支架。在这些scFv构架支架中，未限定CDR1、CDR2和CDR3序列，因为这些支架代表基本上任何CDR1、CDR2和CDR3序列可以插入其内的构架序列。此外，在scFv构架支架中，允许已鉴定为顺应变异性的那些氨基酸位置(如实施例7的表中所示)由对于该位置鉴定的任何示例性或优选氨基酸置换占据。

重链构架支架在图9-11中描述(还参见表19-21)。因此，对于VH1a家族，scFv构架支架在图9中举例说明(还参见表19)。对于VH1b家族，scFv构架支架在图10中举例说明(还参见表20)。对于VH3家族，scFv构架支架在图11中举例说明(还参见表21)。对于这些图各自中的比对，第一行显示使用Kabat系统的重链可变区编号，并且第二行显示使用AHo系统的重链可变区编号。第三行显示scFv构架支架序列，其中在标记为“X”的那些位置处，该位置可以由在“X”下列出的任何氨基酸残基占据。此外，标记为“x”的位置(即，图中的Kabat 26、27、28、29和AHo 27、29、30、31)和标记为CDR的区域可以由任何氨基酸占据。对于标记为“X”的可变位置，在“X”下列出的第一个氨基酸残基代表种系共有残基，在“X”下列出的第二个氨基酸残基代表在该位置处的优选氨基酸置换，并且在“X”下列出的另外的氨基酸残基(如果存在的话)代表在该位置处的其他示例性氨基酸置换。

轻链构架支架在图12-14中描述(还参见表22-24)。因此，对于Vκ1家族，scFv构架支架在图12中举例说明(还参见表22)。对于Vκ3家族，scFv构架支架在图13中举例说明(还参见表23)。对于Vλ1家族，scFv构架支架在图14中举例说明(还参见表24)。对于这些图各自中的比对，第一行显示使用Kabat系统的轻链可变区编号，并且第二行显示使用AHo系统的轻链可变区编号。第三行显示scFv构架支架序列，其中在标记为“X”的那些位置处，该位置可以由在“X”下列出的任何氨基酸残基占据。此外，标记为“.”的构架位置和标记为CDR的区域可以由任何氨基酸占据。

实施例9：具有改善的溶解性的scFv的产生

在这个实施例中，基于结构建模和序列分析的方法用于鉴定在scFv构架区中导致改善的溶解性的突变。

a)结构分析

使用可经由ExPASy网络服务器访问的自动化蛋白质结构同源性建模服务器，对ESBA105scFv的3D结构进行建模。根据溶剂可达的相对面积(rSAS)分析结构，并且残基如下进行分类：(1)显示rSAS≥50％的残基为暴露的；和(2)50％≤rSAS≥25％的残基为部分暴露的。rSAS≥25％的疏水性残基视为疏水斑块(hydrophobic patch)。为了验证发现的每个疏水斑块的溶剂可达面积，利用与ESBA105具有高同源性的27个PDB文件和高于的分辨率完成计算。计算疏水斑块的平均rSAS和标准差，并且对其中的每一个进行详细检查(参见表25)。

表25：疏水斑块的评估。

残基	结构域	暴露于溶剂的表面％	STDE％	rSAS	序列变异性	VH/抗原界面	VH/VL界面	VH/CH界面
									2	VH	23.06	19.26	10-25％	10-25％	＞0-20％	＞0-20％	0
4	VH	0.66	1.26	0-10％	0-10％	0		0
									5	VH	61.85	12.96	50-75％	10-25％	0	＞0-20％	0
12	VH	70.27	9.17	50-75％	10-25％	0	0	60-80％
									103	VH	35.85	5.85	25-50％	10-25％	0	＞0-2％	＞0-2％
144	VH	62.17	7.82	50-75％	10-25％	0	0	＞0-2％
									15	VL	49.59	9.77	25-50％	10-25％	0	0	0
147	VL	31.19	23.32	25-50％	10-25％	0	0	60-80％

第1栏，在AHo编号系统中的残基位置。第2栏，第1栏中标示的位置的结构域。第3栏，利用27个PDB文件计算的平均溶剂可达面积。第4栏，第3栏的标准差。第5至9栏，从AHo检索到的疏水斑块的结构作用。

在ESBA105中鉴定的大多数疏水斑块对应于可变-恒定结构域(VH/CH)界面。这与scFv形式中的暴露于溶剂的疏水性残基的先前发现(Nieba等人，1997)相关。2个疏水斑块(VH 2和VH 5)也促成VL-VH相互作用，并且因此从序列分析中排除。

b)可溶性突变的设计

从Annemarie Honegger的抗体网页(www.bioc.uzh.ch/antibody)检索到总共122个VL和137个VH序列。序列最初对应于从蛋白质数据库(PDB)(www.rcsb.org/pdb/home/home.do)中提取的Fv或Fab形式的393个抗体结构。不考虑物种或亚组，将序列用于分析，以便增加发现具有比天然残基更高的亲水性的备选氨基酸的概率。排除与数据库内的任何其他序列具有超过95％的同一性的序列，以减少偏差。序列进行比对且就残基频率进行分析。应用序列分析工具和算法，以鉴定和选择亲水突变，从而破坏ESBA105中的疏水斑块。序列根据免疫球蛋白可变结构域的AHo编号系统(Honegger和Plückthun 2001)进行比对。将分析限制于构架区。

各位置i在定制的数据库中的残基频率f(r)通过将在数据集内观察到的特定残基的次数除以序列总数来计算。在第一个步骤中，计算每个疏水斑块的不同氨基酸的出现频率。利用上文描述的定制的数据库分析ESBA105中鉴定的每个疏水斑块的残基频率。表26报告了在疏水斑块处的残基频率(除以数据库中存在的残基的总数)。

表26.来自scFv或Fab形式的成熟抗体的259个序列的在ESBA105中鉴定的疏水斑块的残基频率

残基	VH4	VH 12	VH 103	VH 144	VL 15	VL 147
							A	0.23046215	0	0	0	3.8647343	0.176821923
C	0	0	0	0	0	0
							D	0	0	0	0	0	0
E	0	0	0	0	0	0
							F	0.483091787	0	0.483091787	0	0	0
G	0	0	0	0	0	0
							H	0	0	0	0	0	0
I	0	2.415458937	9.661835749	0	5.314009662	70.38834951
							K	0	0	0	0	0	0
L	96.61835749	89.85507246	7.246376812	27.0531401	45.89371981	15.53398058
							M	0	0	10.62801932	1.93236715	0	0.970873786
N	0	0	0	0	0	0
							P	0.966183575	0	0	0.966183575	21.73913043	0.485436893
Q	0	0	0	0.483091787	0	0
							R	0	0	7.246376812	0	0	0
S	0	0.966183575	0	18.84057971	0	0
							T	0	0	15.4589372	50.72463768	0.966183575	0
V	1.93236715	6.763285024	49.27536232	0	22.22222222	12.62135922
							W	0	0	0	0	0	0
Y	0	0	0	0	0	0

第1栏：残基类型。第2至5栏，重链中的疏水斑块的残基的相对频率。第6至7栏，轻链中的疏水斑块的残基的相对频率。

在第二个步骤中，通过选择在各个疏水斑块处最丰富的亲水残基，将在疏水斑块处的亲水残基的频率用于设计可溶性突变。表27报告了使用这种方法鉴定的可溶性突变体。根据在数篇文章中公开的平均疏水性值计算亲本和突变体残基的疏水性，并且将其表示为侧链暴露于溶剂的水平的函数。

表27.在ESBA105中引入以破坏疏水斑块的不同可溶性突变

残基	结构域	暴露于溶剂的表面％	亲本残基	亲本残基的疏水性	可溶性突变	突变的疏水性
							4	VH	0.66	L	85.2	A	42.7
12	VH	70.27	V	73.2	S	28
							103	VH	35.85	V	73.2	T	32.8
144^*	VH	62.17	V	73.2	S	28
							15	VL	49.59	V	73.2	T	32.8
147	VL	31.19	L	85.2	A	42.7

^＊在位置144处的疏水斑块不改变成数据库中最丰富的亲水残基，而改变成Ser，因为这已包含在ESBA105的CDR供体中。

第1栏，AHo编号系统中的残基位置。第2栏，第1栏中标示的位置的结构域。第3栏，从27个PDB文件计算的平均溶剂可达面积。第4栏，ESBA105中的亲本残基。第5栏，从AHo检索到的第4栏的平均疏水性。第6栏，在第1栏中标示的位置处最丰富的亲水残基。从AHo检索到的第6栏的平均疏水性。

c)可溶性ESBA105变体的测试

单独或以多重组合引入可溶性突变，并且就重折叠产量、表达、活性和稳定性以及聚集模式对其进行测试。表28显示基于对溶解性的潜在贡献和突变将改变抗原结合的风险水平，在每种ESBA105优化变体中引入的可溶性突变的各种组合。

表28：ESBA105的可溶性变体的设计。

^＊在第二轮中分开测试

^＊＊下划线将分别包含于轻链和重链中的突变的数目分开。

第1栏，AHo编号系统中的残基位置。第2栏，第1栏中标示的位置的结构域。第3栏，ESBA105中不同疏水斑块处的亲本残基。第4栏，在标示的位置处包含可溶性突变的不同变体。

i.溶解性的测量

通过测量在离心的PEG-蛋白质混合物的上清液中的蛋白质浓度，测定ESBA105和变体的最大溶解性。使20mg/ml起始浓度与30-50％饱和的PEG溶液1∶1混合。在凭经验确定Log S对Peg浓度(％w/v)的线性依赖后，基于观察到的野生型ESBA105的溶解性曲线图选择这些条件。显示优良溶解性的变体ESBA105的几个例子的溶解性曲线示于图15中。溶解性值的完整列表也在表29中提供。

表29.与亲本ESBA105相比，突变体的估计的最大溶解性和活性。

ii.热稳定性的测量

使用FT-IR ATR光谱法进行亲本ESBA105的热稳定性测量和溶解性跟踪。对分子实施广泛温度范围(25-95℃)的热攻击。通过对干涉图信号应用傅里叶变换获得变性曲线图(参见图16)。通过应用玻尔兹曼S形模型，将变性曲线图用于估计每种ESBA105变体的热去折叠转变的中点(TM)(表30)。

表30：每种可溶性变体的热去折叠转变的中点(TM)。

iii.聚集性的测量

ESBA105及其可溶性变体也在时间依赖性测试上进行分析，以评估降解和聚集行为。为此，在升高的温度下(40℃)在磷酸盐缓冲液(pH 6.5)中温育可溶性蛋白质(20mg/ml)。对照样品维持于-80℃下。在2周的温育期后就降解(SDS-PAGE)和聚集(SEC)分析样品。这允许弃去易于降解(参见图17)或显示形成可溶性或不溶性聚集物的倾向(参见表31)的变体。

表31：不溶性聚集的测量

蛋白质	蛋白质丧失(不溶性聚集物)
		ESBA105	1.14％
ESBA105Opt 1_0	8.17％
		ESBA105Opt 0_2	4.45％
ESBA105Opt 1_2	46.60％
		ESBA105VH V103T	-1.95％

iv.可溶性变体的表达和重折叠

也就表达和重折叠产量(相对于亲本ESBA105分子)测试可溶性突变体。这些研究的结果显示于表31中。

表31.可溶性变体的表达和重折叠。

尽管与亲本ESBA105分子相比，所有亲水性可溶性突变体显示出改善的溶解性，但这些分子中仅少数显示适合于其他生物物理学性质。例如，相对于亲本ESBA105分子，许多变体具有减少的热稳定性和/或重折叠产量。特别地，在位置VL147处的亲水置换严重减少稳定性。因此，使不显著影响热稳定性的可溶性突变组合，并且对其实施进一步的热胁迫以证实其性质。

包含4个不同可溶性突变的组合的3个突变体(Opt1.0、Opt0.2和VH：V103T)显著改善ESBA105的溶解性，而不影响重现性、活性或热稳定性。然而，在40℃下温育2周后，在ESBA105中具有Opt1.0和Opt0.2的组合突变的突变体(Opt 12)显示增加量的不溶性聚集物(参见表29)。这可以通过位置VL 15处的Val在β折叠转角中的作用加以解释，因为Val在所有氨基酸中具有最大的β折叠倾向。这个结果证实在位置VL 15处的单个可溶性突变是耐受的，但在与破坏其他疏水斑块的可溶性突变体的组合中则不耐受。因此，包含于Opt0_2和VH：V103T中的突变选择为改善scFv分子的溶解性性质的最佳执行者。

实施例10：具有增强的溶解性和稳定性的scFv的产生

通过用经由质量控制(QC)测定法鉴定的稳定性突变置换，进一步优化通过可溶性设计鉴定的ESBA105变体。总共产生了4种构建体，其包含1-3个的上文实施例9中鉴定的可溶性突变(与QC 7.1和15.2中发现的所有稳定性突变(即，VL结构域中的D31N和V83E，以及VH结构域中的V78A、K43和F67L)组合)。所有优化的构建体产生比野生型scFv更可溶的蛋白质(参见表33)。最佳构建体在溶解性方面一致地显示超过2倍的增加(相对于野生型)。scFv分子的活性和稳定性都不受稳定性和溶解性增强突变的组合的显著影响。

表33：具有优化的溶解性和稳定性的scFv

蛋白质	VL/VH突变	FTIRTm(℃)	PEG溶解性(mg/ml)	相对于E105的活性	kD
						QC7.1D-N-15.2	VL：D31N；V83EVH：V78A；K43R；F67L	69.0	90	1.7	9.06×10^-10
QC7.1D-N-15.2VH V103T	VL：D31N；V83EVH：V78A；K43R；FF67L；V103T	68.9	106	1.5	8.79×10^-10
						QC7.1D-N-15.2Opt 0_2	VL：D31N；V83EVH：V12S；V78A；K43R；F67L；L144S	66.6	121	1.2	8.12×10^-10
QC7.1D-N-15.2VH V103T Opt0_2	VL：D31N；V83EVH：V12S；V78A；K43R；F67L；V103T；L144S	67.3	186	1.5	1.34×10^-9

所有4种变体的溶解性值用于解卷积各个突变对scFv溶解性的贡献。所有突变看起来都以累积方式促成scFv的溶解性，尽管这些残基中的几个在基本序列中和在3D结构内彼此关系密切。分析表明，VH结构域中的3个溶解性增强突变(V12S、L144S、V103T(或V103S))的组合占～60％的scFv溶解性。因为疏水斑块在所有免疫结合剂的可变结构域中是保守的，所以这个最佳突变组合可以用于改善几乎任何scFv或其他免疫结合剂分子的溶解性。

等同物

本领域技术人员将认识到或能够确定(通过只使用常规实验)本文中描述的本发明的特定实施方案的许多等同物。此类等同物意欲包括于下列权利要求中。

序列表

<110>David Urech，Leonard Borras

<120>修饰抗体的方法和具有改善的功能性质的修饰抗体

<130>P106700PC00

<160>12

<170>PatentIn version 3.5

<210>1

<211>147

<212>PRT

<213>人工序列

<220>

<223>图9-VH1家族重链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Gln或Glu

<220>

<221>misc_feature

<222>(6)..(6)

<223>Xaa为Gln或Glu

<220>

<221>misc_feature

<222>(11)..(11)

<223>Xaa为Val或Leu

<220>

<221>misc_feature

<222>(12)..(12)

<223>Xaa为Lys或Met

<220>

<221>misc_feature

<222>(13)..(13)

<223>Xaa为Lys，Glu，或Gln

<220>

<221>misc_feature

<222>(18)..(18)

<223>Xaa为Val或Leu

<220>

<221>misc_feature

<222>(20)..(20)

<223>Xaa为Val或Ile

<220>

<221>misc_feature

<222>(26)..(40)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(30)..(40)

<223>CDR H1

<220>

<221>misc_feature

<222>(55)..(74)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(55)..(74)

<223>CDR H2

<220>

<221>misc_feature

<222>(88)..(88)

<223>Xaa为Tyr，Phe，Ser，His，或Asp

<220>

<221>misc_feature

<222>(90)..(90)

<223>Xaa为Glu，Asp，Gln

<220>

<221>misc_feature

<222>(93)..(93)

<223>Xaa为Ser，Gly，Thr，Asn

<220>

<221>misc_feature

<222>(96)..(96)

<223>Xaa为Ser，Phe，Thr，Ala，Pro

<220>

<221>misc_feature

<222>(107)..(136)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(107)..(136)

<223>CDR H3

<400>1

Xaa Val Gln Leu Val Xaa Ser Gly Ala Glu Xaa Xaa Xaa Pro Gly Ser

1 5 10 15

Ser Xaa Lys Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Arg Gln Ala Pro Gly Gln

35 40 45

Gly Leu Glu Trp Met Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Val Thr Ile Thr Ala

65 70 75 80

Asp Glu Ser Thr Ser Thr Ala Xaa Met Xaa Leu Ser Xaa Leu Arg Xaa

85 90 95

Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Gly Gln Gly Thr Leu Val Thr

130 135 140

Val Ser Ser

145

<210>2

<211>147

<212>PRT

<213>未知

<220>

<223>图10-VH1B家族重链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Gln或Glu

<220>

<221>misc_feature

<222>(9)..(9)

<223>Xaa为Ala，Thr，Asp，Pro，或Val

<220>

<221>misc_feature

<222>(11)..(11)

<223>Xaa为Val或Leu

<220>

<221>misc_feature

<222>(12)..(12)

<223>Xaa为Lys，Val，Arg，Gln，Met

<220>

<221>misc_feature

<222>(13)..(13)

<223>Xaa为Lys，Arg，Glu，或Met

<220>

<221>misc_feature

<222>(19)..(19)

<223>Xaa为Lys，Asn，Arg，或Thr

<220>

<221>misc_feature

<222>(20)..(20)

<223>Xaa为Val，Leu，Ile，或Phe

<220>

<221>misc_feature

<222>(26)..(40)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(30)..(40)

<223>CDR H1

<220>

<221>misc_feature

<222>(43)..(43)

<223>Xaa为Arg或Lys

<220>

<221>misc_feature

<222>(45)..(45)

<223>Xaa为Ala，Arg，Thr，Val或Pro

<220>

<221>misc_feature

<222>(48)..(48)

<223>Xaa为Gln，Lys，Glu，或His

<220>

<221>misc_feature

<222>(53)..(53)

<223>Xaa为Met或Ile

<220>

<221>misc_feature

<222>(55)..(74)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(55)..(74)

<223>CDR H2

<220>

<221>misc_feature

<222>(75)..(75)

<223>Xaa为Arg或Lys

<220>

<221>misc_feature

<222>(76)..(76)

<223>Xaa为Val，Ala，Ile，或Leu

<220>

<221>misc_feature

<222>(105)..(105)

<223>Xaa为Ala，Asn，或Ser

<220>

<221>misc_feature

<222>(107)..(136)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(107)..(136)

<223>CDR H3

<400>2

Xaa Val Gln Leu Val Gln Ser Gly Xaa Glu Xaa Xaa Xaa Pro Gly Ala

1 5 10 15

Ser Val Xaa Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Xaa Gln Xaa Pro Gly Xaa

35 40 45

Gly Leu Glu Trp Xaa Gly Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Thr Met Thr Glu

65 70 75 80

Asp Thr Ser Thr Asn Thr Ala Tyr Met Glu Leu Ser Ser Leu Arg Ser

85 90 95

Glu Asp Thr Ala Val Tyr Tyr Cys Xaa Arg Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Gly Gln Gly Thr Leu Val Thr

130 135 140

Val Ser Ser

145

<210>3

<211>147

<212>PRT

<213>未知

<220>

<223>图11-VH3家族重链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Glu或Gln

<220>

<221>misc_feature

<222>(6)..(6)

<223>Xaa为Glu或Gln

<220>

<221>misc_feature

<222>(7)..(7)

<223>Xaa为Ser，Thr，或Ala

<220>

<221>misc_feature

<222>(27)..(40)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(30)..(40)

<223>CDR H1

<220>

<221>misc_feature

<222>(55)..(74)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(55)..(74)

<223>CDR H2

<220>

<221>misc_feature

<222>(87)..(87)

<223>Xaa为Leu，Val，Ala，或Phe

<220>

<221>misc_feature

<222>(101)..(101)

<223>Xaa为Val，Leu，Ile，Met，Phe，Arg，或Gln

<220>

<221>misc_feature

<222>(107)..(136)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(107)..(136)

<223>CDR H3

<400>3

Xaa Val Gln Leu Val Xaa Xaa Gly Pro Gly Leu Val Lys Pro Ser Glu

1 5 10 15

Thr Leu Arg Leu Ser Cys Ala Ala Ser Gly Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Arg Gln Ala Pro Gly Lys

35 40 45

Gly Leu Glu Trp Val Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Phe Thr Ile Ser Arg

65 70 75 80

Asp Asn Ser Lys Asn Thr Xaa Tyr Leu Gln Met Asn Ser Leu Arg Ala

85 90 95

Glu Asp Thr Ala Xaa Tyr Tyr Cys Ala Arg Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Gly Gln Gly Thr Leu Val Thr

130 135 140

Val Ser Ser

145

<210>4

<211>149

<212>PRT

<213>未知

<220>

<223>图12-Vk1家族轻链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Glu，Asp，或Ile

<220>

<221>misc_feature

<222>(3)..(3)

<223>Xaa为Val，Gln，或Ile

<220>

<221>misc_feature

<222>(4)..(4)

<223>Xaa为Leu，Met，Val，或Ile

<220>

<221>misc_feature

<222>(24)..(24)

<223>Xaa为Gln或Arg

<220>

<221>misc_feature

<222>(25)..(42)

<223>CDR L1；Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(47)..(47)

<223>Xaa为Arg，Lys，或Ile

<220>

<221>misc_feature

<222>(50)..(50)

<223>Xaa为Lys，Arg，Glu，Thr，Met，或Gln

<220>

<221>misc_feature

<222>(57)..(57)

<223>Xaa为Ser，Tyr，Phe，或His

<220>

<221>misc_feature

<222>(58)..(72)

<223>CDR L2；Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(85)..(86)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(91)..(91)

<223>Xaa为Phe或Leu

<220>

<221>misc_feature

<222>(103)..(103)

<223>Xaa为Val，Thr，Ser，Gly，或Ile

<220>

<221>misc_feature

<222>(107)..(138)

<223>CDR L3；Xaa可以为任何天然存在的氨基酸

<400>4

Xaa Ile Xaa Xaa Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Xaa Pro

35 40 45

Gly Xaa Ala Pro Lys Leu Leu Ile Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Ser Arg Phe Ser Gly

65 70 75 80

Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Xaa Thr Ile Ser Ser Leu

85 90 95

Gln Pro Glu Asp Phe Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Gly Gln Gly Thr Lys

130 135 140

Val Glu Ile Lys Arg

145

<210>5

<211>149

<212>PRT

<213>未知

<220>

<223>图13-Vk3家族轻链

<220>

<221>misc_feature

<222>(2)..(2)

<223>Xaa为Thr或Ile

<220>

<221>misc_feature

<222>(3)..(3)

<223>Xaa为Thr或Val

<220>

<221>misc_feature

<222>(10)..(10)

<223>Xaa为Ile或Thr

<220>

<221>misc_feature

<222>(12)..(12)

<223>Xaa为Tyr或Ser

<220>

<221>misc_feature

<222>(18)..(18)

<223>Xaa为Ser或Arg

<220>

<221>misc_feature

<222>(20)..(20)

<223>Xaa为Ala或Thr

<220>

<221>misc_feature

<222>(25)..(42)

<223>CDR L1；Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(56)..(56)

<223>Xaa为Met或Ile

<220>

<221>misc_feature

<222>(58)..(72)

<223>CDR L2；Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(74)..(74)

<223>Xaa为Thr，Val，或Ile

<220>

<221>misc_feature

<222>(85)..(86)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(94)..(94)

<223>Xaa为Asn或Ser

<220>

<221>misc_feature

<222>(101)..(101)

<223>Xaa为Ser，Tyr，或Phe

<220>

<221>misc_feature

<222>(103)..(103)

<223>Xaa为Ala，Leu，或Val

<220>

<221>misc_feature

<222>(107)..(138)

<223>CDR L3；Xaa可以为任何天然存在的氨基酸

<400>5

Glu Xaa Xaa Leu Thr Gln Ser Pro Gly Xaa Leu Xaa Leu Ser Pro Gly

1 5 10 15

Glu Xaa Ala Xaa Leu Ser Cys Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Lys Pro

35 40 45

Gly Gln Ala Pro Arg Leu Leu Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Pro Asp Arg Phe Ser Gly

65 70 75 80

Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Leu Thr Ile Xaa Arg Leu

85 90 95

Glu Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Gly Gly Gly Thr Lys

130 135 140

Leu Glu Ile Lys Arg

145

<210>6

<211>149

<212>PRT

<213>未知

<220>

<223>图14-VL1家族轻链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Leu，Gln，Ser，或Glu

<220>

<221>misc_feature

<222>(2)..(2)

<223>Xaa为Ser，Ala，Pro，Ile，或Tyr

<220>

<221>misc_feature

<222>(4)..(4)

<223>Xaa为Val，Leu，或Met

<220>

<221>misc_feature

<222>(7)..(7)

<223>Xaa为Ser，Glu，或Pro

<220>

<221>misc_feature

<222>(8)..(8)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(11)..(11)

<223>Xaa为Ala或Val

<220>

<221>misc_feature

<222>(14)..(14)

<223>Xaa为Thr，Ser，或Ala

<220>

<221>misc_feature

<222>(25)..(42)

<223>CDR L1；Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(46)..(46)

<223>Xaa为His或Gln

<220>

<221>misc_feature

<222>(53)..(53)

<223>Xaa为Thr，Lys，Ser，Asn，Gln，或Pro

<220>

<221>misc_feature

<222>(58)..(72)

<223>CDR L2；Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(82)..(82)

<223>Xaa为Arg，Gln，或Lys

<220>

<221>misc_feature

<222>(85)..(86)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(92)..(92)

<223>Xaa为Thr，Gly，Asp，或Ala

<220>

<221>misc_feature

<222>(103)..(103)

<223>Xaa为Val，Asp，Thr，His，或Glu

<220>

<221>misc_feature

<222>(107)..(138)

<223>CDR L3；Xaa可以为任何天然存在的氨基酸

<400>6

Xaa Xaa Val Xaa Thr Gln Xaa Xaa Pro Ser Xaa Ser Gly Xaa Pro Gly

1 5 10 15

Gln Arg Val Thr Ile Ser Cys Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Xaa Leu Pro

35 40 45

Gly Thr Ala Pro Xaa Leu Leu Ile Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Asp Arg Phe Ser Gly

65 70 75 80

Ser Xaa Ser Gly Xaa Xaa Thr Ser Ala Ser Leu Xaa Ile Ser Gly Leu

85 90 95

Gln Ser Glu Asp Glu Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Gly Gly Gly Thr Lys

130 135 140

Leu Thr Val Leu Gly

145

<210>7

<211>236

<212>PRT

<213>未知

<220>

<223>图9-VH1家族重链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Gln或Glu

<220>

<221>misc_feature

<222>(6)..(6)

<223>Xaa为Gln或Glu

<220>

<221>misc_feature

<222>(11)..(11)

<223>Xaa为Val或Leu

<220>

<221>misc_feature

<222>(12)..(12)

<223>Xaa为Lys或Met

<220>

<221>misc_feature

<222>(13)..(13)

<223>Xaa为Lys，Glu，或Gln

<220>

<221>misc_feature

<222>(18)..(18)

<223>Xaa为Val或Leu

<220>

<221>misc_feature

<222>(20)..(20)

<223>Xaa为Val或Ile

<220>

<221>misc_feature

<222>(26)..(29)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(30)..(79)

<223>CDR H1；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(94)..(143)

<223>CDR H2；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(157)..(157)

<223>Xaa为Tyr，Phe，Ser，His，或Asp

<220>

<221>misc_feature

<222>(159)..(159)

<223>Xaa为Glu，Asp，Gln

<220>

<221>misc_feature

<222>(162)..(162)

<223>Xaa为Ser，Gly，Thr，Asn

<220>

<221>misc_feature

<222>(165)..(165)

<223>Xaa为Ser，Phe，Thr，Ala，Pro

<220>

<221>misc_feature

<222>(176)..(225)

<223>CDR H3；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<400>7

Xaa Val Gln Leu Val Xaa Ser Gly Ala Glu Xaa Xaa Xaa Pro Gly Ser

1 5 10 15

Ser Xaa Lys Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

35 40 45

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp

65 70 75 80

Val Arg Gln Ala Pro Gly Gln Gly Leu Glu Trp Met Gly Xaa Xaa Xaa

85 90 95

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg

130 135 140

Val Thr Ile Thr Ala Asp Glu Ser Thr Ser Thr Ala Xaa Met Xaa Leu

145 150 155 160

Ser Xaa Leu Arg Xaa Glu Asp Thr Ala Val Tyr Tyr Cys Ala Arg Xaa

165 170 175

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 190

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

195 200 205

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

210 215 220

Xaa Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser

225 230 235

<210>8

<211>236

<212>PRT

<213>未知

<220>

<223>图10-VH1B家族重链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Gln或Glu

<220>

<221>misc_feature

<222>(9)..(9)

<223>Xaa为Ala，Thr，Asp，Pro，或Val

<220>

<221>misc_feature

<222>(11)..(11)

<223>Xaa为Val或Leu

<220>

<221>misc_feature

<222>(12)..(12)

<223>Xaa为Lys，Val，Arg，Gln，Met

<220>

<221>misc_feature

<222>(13)..(13)

<223>Xaa为Lys，Arg，Glu，或Met

<220>

<221>misc_feature

<222>(19)..(19)

<223>Xaa为Lys，Asn，Arg，或Thr

<220>

<221>misc_feature

<222>(20)..(20)

<223>Xaa为Val，Leu，Ile，或Phe

<220>

<221>misc_feature

<222>(26)..(29)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(30)..(79)

<223>CDR H1；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(82)..(82)

<223>Xaa为Arg或Lys

<220>

<221>misc_feature

<222>(84)..(84)

<223>Xaa为Ala，Arg，Thr，Val或Pro

<220>

<221>misc_feature

<222>(87)..(87)

<223>Xaa为Gln，Lys，Glu，或His

<220>

<221>misc_feature

<222>(92)..(92)

<223>Xaa为Met或Ile

<220>

<221>misc_feature

<222>(94)..(143)

<223>CDRH2；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(144)..(144)

<223>Xaa为Arg或Lys

<220>

<221>misc_feature

<222>(145)..(145)

<223>Xaa为Val，Ala，Ile，或Leu

<220>

<221>misc_feature

<222>(149)..(149)

<223>Xaa为Glu，Arg，Thr，Ala

<220>

<221>misc_feature

<222>(153)..(153)

<223>Xaa为Thr，Ser，Ile，Leu

<220>

<221>misc_feature

<222>(154)..(154)

<223>Xaa为Asp，Ser，Asn，Gly

<220>

<221>misc_feature

<222>(174)..(174)

<223>Xaa为Ala，Asn，或Ser

<220>

<221>misc_feature

<222>(176)..(225)

<223>CDR H3；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<400>8

Xaa Val Gln Leu Val Gln Ser Gly Xaa Glu Xaa Xaa Xaa Pro Gly Ala

1 5 10 15

Ser Val Xaa Xaa Ser Cys Lys Ala Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

35 40 45

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp

65 70 75 80

Val Xaa Gln Xaa Pro Gly Xaa Gly Leu Glu Trp Xaa Gly Xaa Xaa Xaa

85 90 95

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

130 135 140

Xaa Thr Met Thr Xaa Asp Thr Ser Xaa Xaa Thr Ala Tyr Met Glu Leu

145 150 155 160

Ser Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys Xaa Arg Xaa

165 170 175

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 190

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

195 200 205

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

210 215 220

Xaa Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser

225 230 235

<210>9

<211>236

<212>PRT

<213>未知

<220>

<223>图11-VH3家族重链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Glu或Gln

<220>

<221>misc_feature

<222>(6)..(6)

<223>Xaa为Glu或Gln

<220>

<221>misc_feature

<222>(7)..(7)

<223>Xaa为Ser，Thr，或Ala

<220>

<221>misc_feature

<222>(27)..(29)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(30)..(79)

<223>CDR H1；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(94)..(143)

<223>CDR H2；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(156)..(156)

<223>Xaa为Leu，Val，Ala，或Phe

<220>

<221>misc_feature

<222>(170)..(170)

<223>Xaa为Val，Leu，Ile，Met，Phe，Arg，或Gln

<220>

<221>misc_feature

<222>(176)..(225)

<223>CDR H3；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<400>9

Xaa Val Gln Leu Val Xaa Xaa Gly Pro Gly Leu Val Lys Pro Ser Glu

1 5 10 15

Thr Leu Arg Leu Ser Cys Ala Ala Ser Gly Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

35 40 45

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp

65 70 75 80

Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val Ser Xaa Xaa Xaa

85 90 95

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg

130 135 140

Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Xaa Tyr Leu Gln Met

145 150 155 160

Asn Ser Leu Arg Ala Glu Asp Thr Ala Xaa Tyr Tyr Cys Ala Arg Xaa

165 170 175

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 190

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

195 200 205

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

210 215 220

Xaa Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser

225 230 235

<210>10

<211>234

<212>PRT

<213>未知

<220>

<223>图12-Vk1家族轻链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Glu，AAsp，或Ile

<220>

<221>misc_feature

<222>(3)..(3)

<223>Xaa为Val，Gln，或Ile

<220>

<221>misc_feature

<222>(4)..(4)

<223>Xaa为Leu，Met，Val，或Ile

<220>

<221>misc_feature

<222>(24)..(24)

<223>Xaa为Gln或Arg

<220>

<221>misc_feature

<222>(25)..(74)

<223>CDR L1；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(79)..(79)

<223>Xaa为Arg，Lys，或Ile

<220>

<221>misc_feature

<222>(82)..(82)

<223>Xaa为Lys，Arg，Glu，Thr，Met，或Gln

<220>

<221>misc_feature

<222>(89)..(89)

<223>Xaa为Ser，Tyr，Phe，或Hi s

<220>

<221>misc_feature

<222>(90)..(139)

<223>CDR L2；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(152)..(153)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(158)..(158)

<223>Xaa为Phe或Leu

<220>

<221>misc_feature

<222>(170)..(170)

<223>Xaa为Val，Thr，Ser，Gly，或Ile

<220>

<221>misc_feature

<222>(174)..(223)

<223>CDR L3；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<400>10

Xaa Ile Xaa Xaa Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

35 40 45

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Xaa Pro

65 70 75 80

Gly Xaa Ala Pro Lys Leu Leu Ile Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

85 90 95

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Ser Arg

130 135 140

Phe Ser Gly Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Xaa Thr Ile

145 150 155 160

Ser Ser Leu Gln Pro Glu Asp Phe Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa

165 170 175

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 190

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

195 200 205

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe

210 215 220

Gly Gln Gly Thr Lys Val Glu Ile Lys Arg

225 230

<210>11

<211>234

<212>PRT

<213>未知

<220>

<223>图13-Vk3家族轻链

<220>

<221>misc_feature

<222>(2)..(2)

<223>Xaa为Thr或Ile

<220>

<221>misc_feature

<222>(3)..(3)

<223>Xaa为Thr或Val

<220>

<221>misc_feature

<222>(10)..(10)

<223>Xaa为Ile或Thr

<220>

<221>misc_feature

<222>(12)..(12)

<223>Xaa为Tyr或Ser

<220>

<221>misc_feature

<222>(18)..(18)

<223>Xaa为Ser或Arg

<220>

<221>misc_feature

<222>(20)..(20)

<223>Xaa为Ala或Thr

<220>

<221>misc_feature

<222>(25)..(74)

<223>CDR L1；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(88)..(88)

<223>Xaa为Met或Ile

<220>

<221>misc_feature

<222>(90)..(139)

<223>CDR L2；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(141)..(141)

<223>Xaa为Thr，Val，或Ile

<220>

<221>misc_feature

<222>(152)..(153)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(161)..(161)

<223>Xaa为Asn或Ser

<220>

<221>misc_feature

<222>(168)..(168)

<223>Xaa为Ser，Tyr，或Phe

<220>

<221>misc_feature

<222>(170)..(170)

<223>Xaa为Ala，Leu，或Val

<220>

<221>misc_feature

<222>(174)..(223)

<223>CDR L3；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<400>11

Glu Xaa Xaa Leu Thr Gln Ser Pro Gly Xaa Leu Xaa Leu Ser Pro Gly

1 5 10 15

Glu Xaa Ala Xaa Leu Ser Cys Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

35 40 45

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Gln Lys Pro

65 70 75 80

Gly Gln Ala Pro Arg Leu Leu Xaa Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa

85 90 95

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Xaa Pro Asp Arg

130 135 140

Phe Ser Gly Ser Gly Ser Gly Xaa Xaa Thr Asp Phe Thr Leu Thr Ile

145 150 155 160

Xaa Arg Leu Glu Pro Glu Asp Xaa Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa

165 170 175

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 190

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

195 200 205

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe

210 215 220

Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg

225 230

<210>12

<211>234

<212>PRT

<213>未知

<220>

<223>图14-VL1家族轻链

<220>

<221>misc_feature

<222>(1)..(1)

<223>Xaa为Leu，Gln，Ser，或Glu

<220>

<221>misc_feature

<222>(2)..(2)

<223>Xaa为Ser，Ala，Pro，Ile，或Tyr

<220>

<221>misc_feature

<222>(4)..(4)

<223>Xaa为Val，Leu，或Met

<220>

<221>misc_feature

<222>(7)..(7)

<223>Xaa为Ser，Glu，或Pro

<220>

<221>misc_feature

<222>(8)..(8)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(11)..(11)

<223>Xaa为Ala或Val

<220>

<221>misc_feature

<222>(14)..(14)

<223>Xaa为Thr，Ser，或Ala

<220>

<221>misc_feature

<222>(25)..(74)

<223>CDR L1；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(78)..(78)

<223>Xaa为Hi s或Gln

<220>

<221>misc_feature

<222>(85)..(85)

<223>Xaa为Thr，Lys，Ser，Asn，Gln，或Pro

<220>

<221>misc_feature

<222>(90)..(139)

<223>CDR L2；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(149)..(149)

<223>Xaa为Arg，Gln，或Lys

<220>

<221>misc_feature

<222>(152)..(153)

<223>Xaa可以为任何天然存在的氨基酸

<220>

<221>misc_feature

<222>(159)..(159)

<223>Xaa为Thr，Gly，Asp，或Ala

<220>

<221>misc_feature

<222>(170)..(170)

<223>Xaa为Val，Asp，Thr，His，或Glu

<220>

<221>misc_feature

<222>(174)..(223)

<223>CDR L3；至少3个且直至50个氨基酸可以存在或不存在；

如果存在，Xaa可以是任何天然存在的氨基酸

<400>12

Xaa Xaa Val Xaa Thr Gln Xaa Xaa Pro Ser Xaa Ser Gly Xaa Pro Gly

1 5 10 15

Gln Arg Val Thr Ile Ser Cys Ser Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

20 25 30

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

35 40 45

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

50 55 60

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Tyr Gln Xaa Leu Pro

65 70 75 80

Gly Thr Ala Pro Xaa Leu Leu Ile Tyr Xaa Xaa Xaa Xaa Xaa Xaa Xaa

85 90 95

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

100 105 110

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

115 120 125

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Gly Val Pro Asp Arg

130 135 140

Phe Ser Gly Ser Xaa Ser Gly Xaa Xaa Thr Ser Ala Ser Leu Xaa Ile

145 150 155 160

Ser Gly Leu Gln Ser Glu Asp Glu Ala Xaa Tyr Tyr Cys Xaa Xaa Xaa

165 170 175

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

180 185 190

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa

195 200 205

Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe

210 215 220

Gly Gly Gly Thr Lys Leu Thr Val Leu Gly

225 230

Claims

1.改造免疫结合剂的方法，其中所述免疫结合剂是ESBA105抗体，所述方法包括：

A)选择在所述ESBA105抗体的V_H构架残基、V_L构架残基或V_H和V_L构架残基内的一个或多个氨基酸位置用于突变；和

B)使选择用于突变的所述一个或多个氨基酸位置突变，

其中所述突变由下述的置换组成：

V_L构架残基中的D31N和V83E，以及V_H构架残基中的V78A，K43R和F67L，其中所述氨基酸位置使用Kabat编号系统。