[go: up one dir, main page]

CN101040043B - 突变型扩环酶 - Google Patents

突变型扩环酶 Download PDF

Info

Publication number
CN101040043B
CN101040043B CN200580034984.4A CN200580034984A CN101040043B CN 101040043 B CN101040043 B CN 101040043B CN 200580034984 A CN200580034984 A CN 200580034984A CN 101040043 B CN101040043 B CN 101040043B
Authority
CN
China
Prior art keywords
ala
thr
arg
ttc
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN200580034984.4A
Other languages
English (en)
Other versions
CN101040043A (zh
Inventor
迪克·希珀
理查德·克尔曼
罗拉纳·麦德勒尼·拉姆斯多克
鲁洛夫·阿利·兰斯·伯韦比格
斯蒂芬·J·詹尼
燕·陈
永红·陈
晓东·高
安克·克里伯
克劳斯·克里伯
查尔琳·图拉琴
马修·图斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Centrient Pharmaceuticals Netherlands BV
Original Assignee
DSM IP Assets BV
DSM Sinochem Pharmaceuticals Netherlands BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV, DSM Sinochem Pharmaceuticals Netherlands BV filed Critical DSM IP Assets BV
Publication of CN101040043A publication Critical patent/CN101040043A/zh
Application granted granted Critical
Publication of CN101040043B publication Critical patent/CN101040043B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P35/00Preparation of compounds having a 5-thia-1-azabicyclo [4.2.0] octane ring system, e.g. cephalosporin

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种突变型扩环酶,其是具有扩环酶活性的模型多肽的变体,其中该突变型扩环酶较之具有扩环酶活性的模型多肽而言,具有捉高到至少两倍的、针对己二酰-6-APA的体外扩环酶活性。

Description

突变型扩环酶
发明领域
本发明涉及突变型扩环酶(mutant expandase)、编码此类酶的多核苷酸、用编码所述突变型扩环酶的所述多核苷酸转化过的微生物,以及此类突变型扩环酶或此类微生物在对5-羧基戊酰基-6-氨基青霉烷酸(adipyl-6-APA=ad-6-APA=己二酰-6-APA)进行的扩环反应中的用途。
发明背景
beta内酰胺抗生素构成了具有长久临床使用历史的最为重要的的抗生素化合物的组。该组中,突出的是青霉素和头孢菌素。青霉素是多种有丝真菌(例如,Penicillium,例如,P.chrysogenum)天然生产的。头孢菌素是多种微生物,例如Acremonium(例如A.chrysogenum)和Streptomyces(例如Streptomyces clavuligerus)天然生产的。
作为经典菌株改良技术的结果,在过去数十年中,P.chrysogenum和A.chrysogenum的抗生素生产水平显著提高。随着对导致青霉素和头孢菌素产生的生物合成途径的逐渐增加的认识、以及重组DNA技术的出现,用于提高菌株生产的新工具已可获得。
β-内酰胺生物合成中涉及的大多数酶已被鉴定出来,它们相应的基因已被克隆,如可在Ingolia and Queener,Med Res Rev(1989)9:245-264(生物合成路径和酶)和Aharonowitz,Cohen,and Martin,Ann Rev Microbiol(1992)46:461-495(基因克隆)中找到。
P.chrysogenum中对青霉素的生物合成中的前两个步骤是:三种氨基酸,L-5-氨基-5-羧基戊酸(L-α-氨基己二酸)  (A)、L-半胱氨酸(C)和L-缬氨酸(V)向三肽LLD-ACV的缩合,以及接着该三肽的环化,以形成异青霉素N。该化合物含有典型的β-内酰胺结构。
第三个步骤涉及:通过酰基转移酶(AT),用疏水侧链对L-5-氨基-5-羧基戊酸的亲水侧链进行的取代。
在EP-A-0448180中已描述:通过AT介导的酶促交换反应发生在细胞内细胞器,微体中。通过表达脱乙酰氧头孢菌素C合酶(EC 1.14.20.1-DAOCS,在本文中还称作扩环酶)的非前驱(non-precursed)P.chrysogenum转化子可形成大量脱乙酰氧头孢菌素C(DAOC),这一观察暗示了P.chrysogenum中大量存在青霉素N,其是扩环酶的天然底物(Alvi et al.,J Antibiot(1995)48:338-340)。但是,DAOC的D-α-氨基-己二酰侧链不容易去除。
头孢菌素比青霉素昂贵得多。一个原因在于一些头孢菌素(头孢氨苄)是通过大量化学转化从青霉素制得的。另一个原因是,迄今为止,通过发酵仅可获得具有D-α-氨基-己二酰侧链的头孢菌素。头孢菌素C,迄今为止该领域中最为重要的起始原料,在任何pH下都非常易溶于水,这暗示要使用麻烦且昂贵的柱技术来进行冗长且成本高的分离过程。通过这种方法获得的头孢菌素C必须通过大量化学和酶促转化转变为可作治疗用的头孢菌素。
目前工业界偏好的用于制备中间产物7-氨基-脱乙酰氧头孢烷酸(7-ADCA)的方法涉及复杂的化学步骤,这些步骤导致青霉素G的扩环和衍生化。用于生产7-ADCA的必要化学步骤之一涉及将5元青霉素环结构扩展为6元头孢菌素环结构(见,例如US 4,003,894)。该复杂的化学加工过程既昂贵又对环境有害。
因此,人们非常需要用酶促反应(例如酶促催化,优选在发酵中进行的)来代替此类化学方法。用生物学方法来代替化学扩环方法的关键是头孢菌素生物合成途径中的中枢酶——扩环酶。
人们已发现,来自细菌Streptomyces clavuligeus(S.clavuligerus)的扩环酶在某些情况下能进行青霉素扩环。当引入P.chrysogenum时,其能将青霉素环结构转化为头孢菌素环结构,如Cantwell et al.,Proc R Soc Lond B(1992)248:283-289所述。已从生物化学和功能方面对扩环酶进行了很好的表征(EP-A-0366354),对其相应基因也同样如是。已描述了cefE基因(编码S.clavuligerus扩环酶的基因——EP-A-0341892)的物理图谱、DNA序列以及用cefE在P.chrysogenum中进行的转化研究。S.clavuligerus扩环酶的DNA和氨基酸序列如SEQ ID NO:1所示。
扩环酶的另一来源是细菌Nocardia lactamdurans(N.lactamdurans,以前的S.lactamdurans)。已描述了该酶的生物化学属性以及编码该酶的基因的DNA序列——分别见Cortes et al.,J Gen Microbiol(1987)133:3165-3174和Coque et al.,Mol Gen Genet(1993)236:453-458。N.lactamdurans扩环酶的DNA和氨基酸序列如SEQ ID NO:2所示。
近来,已在Streptomyces jumonjinensis、Streptomyces ambofaciens和Streptomyces chartreuses中发现了新的扩环酶(cefE)基因和酶——见Hsuet al.(2004),Appl.和Environm.Microbiol.70,6257-6263。表1概括了若干种扩环酶的氨基酸序列同一性,显示:取决于酶的来源,序列同一性范围在67至85%之间。
表1:若干种扩环酶的氨基酸序列同一性(数据取自Hsu et al)
来源 S.clavuligerus S.jumonjiensis S.ambofaciens S.chartreuses N.lactamduans
S.clavuligerus     100
S.jumonjinensis     81     100
S.ambofaciens     81     85     100
S.chartreuses     76     77     79    100
N.lactamdurans     70     68     70    67     100
在主要发生于原核细胞中的对头孢菌素的生物合成中,脱乙酰氧头孢菌素C随后通过脱乙酰头孢菌素C合酶(还被称为脱乙酰氧头孢菌素C羟化酶或羟化酶,EC 1.14.11.26-DACS)转化为脱乙酰头孢菌素C。编码此类羟化酶的基因被称为cefF基因(例如,见Hsu et al)。真核细胞(例如,Acremonium chrysogenum)中发现的扩环酶可催化青霉素N向脱乙酰氧头孢菌素C的直接转化,这是由于其具有扩环酶和水解酶这两种活性。因此,编码基因被称为cefEF(见Hsu et al)。
在本文中,术语扩环酶既表示扩环酶(EC 1.14.20.1,由cefE基因编码的),也表示除此之外还具有羟化酶活性的扩环酶(cefEF基因编码的EC 1.14.20.1+EC 1.14.11.26)。
鉴于扩环酶催化青霉素N的5元噻唑烷环向DAOC的6元二氢噻嗪环的扩环过程,该酶理所当然是代替化学方法中扩环步骤的合理候选者。不幸的是,该酶作用于头孢菌素生物合成途径的青霉素N中间产物,但对于通过P.chrysogenum生产的容易获得的不昂贵的青霉素(例如青霉素V或青霉素G)没有作用或作用很小。青霉素N不能通过商业途径获得,甚至当被扩环时,其D-α-氨基-己二酰侧链也不易被青霉素酰基转移酶除去。
已有报道,扩环酶能将具有特定侧链的青霉素扩环成相应的7-ADCA衍生物。在EP-A-0532341、WO95/04148和WO95/04149公开的技术中已利用了扩环酶的这一特征。在这些公开文献中,将青霉素G向7-ADCA的传统化学体外转化过程已被用扩环酶基因转化的重组Penicilliumchrysogenum菌株中对某些6-氨基青霉烷酸(6-APA)的体内转化代替。
更具体地,EP-A-0532341教导了在P.chrysogenum中对扩环酶的体内使用与作为给料的己二酰侧链(也被称作己二酰)组合,所述侧链是P.chrysogenum中乙酰转移酶的底物。这导致了己二酰-6-APA的形成,其被引入P.chrysogenum菌株的扩环酶转化,以产生己二酰-7-ADCA。最后,描述了对己二酰侧链的去除,产生了作为最终产物的7-ADCA。此外,EP-A-540210教导了对己二酰-7-ADAC和己二酰-7-ACA的类似生产方法。
作为替代性方法,使用经cefE转化的P.chrysogenum对青霉素G的扩环已在EP0828850中提出。此外,已描述了对S.clavuligerus的突变体cefE基因的使用,用于提高青霉素G的扩环。US 5,919,680、WO98/02551、WO 99/33994、WO 01/85951和EP 1348759都公开了突变体cefE基因,据声称,它们编码具有针对青霉素G的更高的扩环酶活性的酶。
但是,这些突变型扩环酶仍未能提供用于生产头孢菌素的具有商业吸引力的方法。
因此,人们需要进一步改进从对己二酰-6-APA的扩环来制备头孢菌素的方法。该方法的特征在于从头孢菌素核心材料高效去除侧链物质。用于进一步改进该方法的一个步骤是提高针对己二酰-6-APA的扩环酶活性。
附图说明
1/3.A和B对经改进的扩环酶突变体的氨基酸比对;SCLAVEIW代表S.clavuligerus的扩环酶的氨基酸序列;NOCAEIW代表N.lactamdurans的扩环酶的氨基酸序列;对其它序列而言,注解如下所示:309EIWIT代表突变型扩环酶H309的扩环酶氨基酸序列,以此类推。
2/3.载体pIATWAn的示意图。
3/3.对根据实施例3的扩环酶试验混合物的HPLC分析
A.在t=0分钟时
B.在t=30分钟时
发明详述
在第一个方面,本发明提供了一种突变型扩环酶,其是具有扩环酶活性的模型多肽的变体。优选地,本发明提供了一种突变型扩环酶,其中该突变型扩环酶较之具有扩环酶活性的模型多肽而言,具有提高到至少两倍的、针对己二酰-6-APA的体外扩环酶活性。对针对己二酰-6-APA的体外扩环酶活性的测定在材料和方法(试验(1)-(3))中有详细描述。更优选地,突变型扩环酶的针对己二酰-6-APA的体外扩环酶活性提高到至少2.5倍,更优选地,至少3倍,更优选地,至少4倍,更优选地,至少5倍,更优选地,至少6倍,更优选地,至少7倍,更优选地,至少8倍,更优选地,至少9倍,更优选地,至少10倍,更优选地,至少11倍。
在根据本发明的突变型扩环酶的一些中,S.clavuligerus的扩环酶的氨基酸序列已被N.lactamdurans的氨基酸序列的相应部分所代替。N.lactamdurans菌株ATCC27382的CefE基因的氨基酸序列示于SEQ IDNO:2中。
在对这些突变型扩环酶的描述中,氨基酸按照对S.clavuligerus扩环酶的氨基酸序列的同源部分的编号进行编号。S.clavuligerus和N.lactamdurans的扩环酶氨基酸序列的同源性可从图1和表1中获得。
在本发明的上下文中,“改变的扩环酶或突变型扩环酶”指任何这样的酶:其具有扩环酶活性,但并非从天然来源获得,其氨基酸序列与S.clavuligerus和N.lactamdurans的天然扩环酶的完全氨基酸序列有所不同。
本发明还提供了一种突变型扩环酶,其优选至少在选自由位置2、18、59、73、74、89、90、99、101、105、112、113、155、170、177、209、213、217、244、249、251、277、278、280、281、284、293、300、307和311构成的组1中的氨基酸位置经过修饰,上述位置编号是用Streptomyces clavuligerus的cefE基因编码的扩环酶的氨基酸序列的氨基酸位置编号来表示的。Streptomyces clavuligerus的cefE基因的核苷酸序列以及所述cefE基因编码的氨基酸序列示于SEQ ID NO:1中。更优选地,所述突变型扩环酶至少在选自由位置2、18、59、89、90、99、101、105、112、113、170、177、209、213、217、249、251、278、280、284和293构成的组2中的氨基酸位置经过修饰。所述突变体还可至少在选自组1的但不同于组2部分的氨基酸位置,以及选自组2的至少一处氨基酸位置纤过修饰。
一种高度优选的突变型扩环酶至少在氨基酸位置89,同时在扩环酶的任何氨基酸位置经过修饰,优选地,同时在选自组1的氨基酸位置或选自组2的氨基酸位置,或选自组1的不同于组2部分的氨基酸位置,以及选自组2的至少一处氨基酸位置经过修饰。
最优选地,本发明提供了一种突变型扩环酶,其中该突变型扩环酶较之具有扩环酶活性的模型多肽而言,具有提高到至少两倍的、针对己二酰-6-APA的体外扩环酶活性,更优选地,至少2.5倍,更优选地,至少3倍,更优选地,至少4倍,更优选地,至少5倍,更优选地,至少6倍,更优选地,至少7倍,更优选地,至少8倍,更优选地,至少9倍,更优选地,至少10倍,更优选地,至少11倍,其中,所述突变型扩环酶优选在选自组1的至少一处氨基酸位置经过修饰,所述位置是按照上文所述使用Streptomyces clavuligerus的cefE基因编码的扩环酶的氨基酸序列的氨基酸位置编号来定义的。更优选地,所述突变型扩环酶至少在选自组2的氨基酸位置经过修饰。具有提高的扩环酶活性的突变体还可至少在选自组1的氨基酸位置以及至少在选自组2的氨基酸位置经过修饰。
一种高度优选的具有提高的扩环酶活性的突变型扩环酶至少在氨基酸位置89,同时在扩环酶的任何氨基酸位置经过修饰,优选地,同时在选自组1的氨基酸位置或选自组2的氨基酸位置,或选自组1的氨基酸位置以及选自组2的至少一处氨基酸位置经过修饰。
在氨基酸位置上的修饰可包含:用选自存在于自然界的20种L-氨基酸(见表2)的组的另一种氨基酸进行的取代。或者,在氨基酸位置上的修饰可包含所述位置上的氨基酸的去除。此外,在氨基酸位置上的修饰可包含对所述氨基酸的C末端或N末端侧的一个或多个氨基酸的取代。
表2
氨基酸   三字母编码   单字母编码
丙氨酸   Ala   A
精氨酸   Arg   R
天冬酰胺   Asn   N
天冬氨酸   Asp   D
半胱氨酸   Cys   C
谷氨酸   Glu   E
谷氨酰胺   Gln   Q
甘氨酸   Gly   G
组氨酸   His   H
异亮氨酸   Ile   I
亮氨酸   Leu   L
赖氨酸   Lys   K
甲硫氨酸   Met   M
苯丙氨酸   Phe   F
脯氨酸   Pro   P
丝氨酸   Ser   S
苏氨酸   Thr   T
色氨酸   Trp   W
酪氨酸   Tyr   Y
缬氨酸   Val   V
本发明中使用的具有扩环酶活性的模型多肽选自具有扩环酶的多肽(优选具有根据SEQ ID NO:1的氨基酸序列或具有根据SEQ ID NO:2的氨基酸序列)和具有扩环酶活性,且具有下述氨基酸序列的多肽构成的组,所述氨基酸序列与SEQ ID NO:1具有至少70%,优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,最优选至少95%百分比同一性,或与SEQ ID NO:2具有至少70%,优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,最优选至少95%百分比同一性,所述多肽例如表1中所概括的扩环酶。用于本发明中最优选作为具有扩环酶活性的模型多肽是具有扩环酶活性,具有根据SEQ ID NO:1的氨基酸序列或具有根据SEQ ID NO:2的氨基酸序列的多肽。
本发明优选提供了具有至少位于如下位置的修饰的突变型扩环酶:
●选自由2、89、277、281和300构成的组的两处或更多处氨基酸位置,更优选地,在位置2+281或89+281或277+300。
●选自由2、89、281、293和311构成的组的3处或更多处氨基酸位置,更优选地,在位置2+89+281或89+281+311或89+281+293。
●选自由2、73、89、90、217、244、277、280、281、306、307和311构成的组的4处或更多处氨基酸位置,更优选地,在位置2+277+280+281或2+281+307+311或73+89+281+311或89+217+281+311或89+244+281+311或89+281+307+311或277+281+306+311或89+281+306+311或90+281+306+311。
●选自由2、73、89、90、155、213、249、278、281、293、300、306、307和311构成的组的5处或更多处氨基酸位置,更优选地,在位置2+89+281+306+311或2+155+281+306+311或73+89+213+281+311或89+78+218+307+311、89+281+293+300+311或89+249+281+307+311。
●选自由90+105+113+281+306+311构成的组的6处氨基酸位置。
●选自由2、73、89、105、113、155、170、177、251、277、280、293、300、306、307和311构成的组的7处或更多处氨基酸位置,更优选地,73+89+281+293+300+307+311或105+113+155+177+281+306+311或155+177+277+280+281+306+311。
●选自由2、89、90、99、105、113、155、177、277、281、307和311构成的组的8处或更多处氨基酸位置,更优选地,在2+90+99+105+113+281+306+311或2+90+105+113+155+177+277+281。
●选自由2+90+105+113+155+177+281+306+311构成的组的9处氨基酸位置。
●选自由2、59、90、101、105、113、155、177、209、277、281、307和311构成的组的10处或更多处氨基酸位置,更优选地,在2+90+105+113+155+177+277+281+306+311。
●选自由2、90、105、113、155、177、277、281、293、307、311构成的组的11处氨基酸位置。
本发明涉及对扩环酶氨基酸中某些的取代。优选地,此类取代包括如下替换:
●用半胱氨酸、丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、酪氨酸、赖氨酸和精氨酸替换根据SEQ ID NO:1的位置18上的组氨酸;更优选地,用丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、赖氨酸和精氨酸去替换;最优选地,用精氨酸;
●用苏氨酸或用疏水氨基酸(例如缬氨酸、亮氨酸、异亮氨酸和苯丙氨酸)或用两性氨基酸(例如酪氨酸、色氨酸、组氨酸、谷氨酰胺和天冬酰胺)替换根据SEQ ID NO:4的位置74上的甲硫氨酸,更优选地,用苏氨酸或异亮氨酸;
●替换根据SEQ ID NO:1的位置89上的苏氨酸;优选地,用带电荷氨基酸,优选带负电荷氨基酸,例如天冬氨酸或谷氨酸来进行,最优选地,用带正电荷氨基酸来进行,例如用赖氨酸、精氨酸或组氨酸;最优选的是赖氨酸。
●替换根据SEQ ID NO:1上的位置112上的丝氨酸,优选地,用苏氨酸来进行;
●用谷氨酰胺或天冬酰胺,更优选用谷氨酰胺来替换根据SEQ IDNO:1的位置244上的组氨酸;
●用具有极性侧链的氨基酸来替换根据SEQ ID NO:1的位置284和SEQ ID NO:4的位置285上的天冬氨酸,所述具有极性侧链的氨基酸例如丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、谷氨酸、组氨酸、赖氨酸、精氨酸和酪氨酸,更优选地,天冬酰胺、谷氨酰胺、谷氨酸、赖氨酸和精氨酸;最优选的是天冬酰胺
●用具有小残基的氨基酸来替换根据SEQ ID NO:1的位置300上的甘氨酸,所述具有小残基的氨基酸例如丙氨酸、丝氨酸、苏氨酸、半胱氨酸、缬氨酸、异亮氨酸、亮氨酸、天冬酰胺和天冬氨酸,更优选地,缬氨酸。
本发明还提供了如前文所定义的突变型扩环酶,它们是选自由S.clavuligerus、S.jumonjinensis、S.ambofaciens、S.chartreuses和N.lactamdurans的野生型扩环酶构成的组的变体。最优选的是如前文所定义的、是S.clavuligerus和N.lactamdurans的野生型扩环酶的变体的突变型扩环酶。最优选的是如前文所定义的、是S.clavuligerus的野生型扩环酶的变体的突变型扩环酶。优选的突变型扩环酶是具有至少在如下位置上的修饰的、Streptomyces clavuligerus的扩环酶的突变体:
●选自由D2、T89、L277、C281和G300构成的组的2处或多处氨基酸位置。
●选自由D2、T89、C281、T293和A311构成的组的3处或多处氨基酸位置
●选自由D2、M73、T89、N90、Y217、H244、L277、E280、C281、R306、R307和A311构成的组的4处或多处氨基酸位置
●选自由D2、M73、T89、N90、C155、T213、R249、A278、C281、T293、R306、R307和A311构成的组的5处或多处氨基酸位置
●选自由N90+T105+G113+C281+R306+A311构成的组的6处或多处氨基酸位置。
●选自由D2、M73、T89、T105、G113、C155、H170、P177、D251、L277、E280、C281、T293、G300、R306、R307和A311构成的组的7处或多处氨基酸位置
●选自由D2、T89、N90、M99、T105、G113、C155、P177、L277、C281、R306、R307和A311构成的组的8处或多处氨基酸位置。
●选自由D2+N90+T105+G113+C155+P177+C281+R306+A311构成的组的9处或多处氨基酸位置。
●选自由D2、S59、N90、T105、G113、T105、G113、C155、P177、G209、L277、C281、R306、R307、A311构成的组的10处或多处氨基酸位置。
●选自由D2、N90、T105、G113、C155、P177、L277、C281、R306、R307、A3 11构成的组的11处或多处氨基酸位置。
在各个位置上的优选修饰是D2N、D2H、D2Y、S59G、M73H、M73I、T89A、T89K、T89V、N90W、N90S、M99T、T105I、Y101F、G113D、C155W、H170Y、P177L、G209A、T213A、Y217H、H244R、R249C、D251G、L277Q、L277T、A278V、E280G、C281Y、T293K、G300S、R306缺失、R307缺失、R370T和A311D。在这种表示法中,数字之后的字母代表存在于突变型扩环酶中的氨基酸(单字母编码)。位置R306或R307上的缺失表示,位置306或307上原有的精氨酸不再存在于突变型扩环酶中。高度优选的突变型扩环酶是表3中概括的突变型扩环酶。
优选地,本发明提供的突变型扩环酶具有前文定义的针对己二酰-6-APA的提高的扩环酶活性,同样地,本发明提供的突变型扩环酶具有针对Pen-G的提高的扩环酶活性。优选地,本发明提供的突变型扩环酶具有针对己二酰-6-APA以及Pen-G两者的提高的扩环酶活性。具有针对Pen-G的提高的活性的突变型扩环酶可有利地用于下文所述的对苯基乙酰-7-ADCA的生产过程中。
本发明还提供了具有降低的或甚至不存在的对异青霉素N(iPN)的扩环酶活性的突变型扩环酶。优选地,针对己二酰-6-APA或Pen-G的扩环酶活性不受影响,但是更优选地,针对己二酰-6-APA或Pen-G或它们二者的扩环酶活性如上文所定义的提高。这些更优选的突变型扩环酶的优点是,针对异青霉素N(iPN)的扩环酶活性的降低或者甚至不存在导致生产ad-7-ADCA或苯基乙酰-7-ADCA的发酵过程中副产物更少。
优选的突变型扩环酶具有:降低的或者甚至不存在的、针对作为底物的异青霉素N(iPN)的扩环酶活性,可选地,同时具有针对作为底物的ad-6-APA的提高的扩环酶活性,并且在根据SEQ ID NO:1的氨基酸编号的位置89上已经过修饰,由此,天然存在的氨基酸已被替换,优选被带电荷氨基酸替换,优选被带负电荷氨基酸,例如天冬氨酸或谷氨酸替换,最优选被带正电荷氨基酸,例如赖氨酸、精氨酸或组氨酸替换,最优选的是赖氨酸。
一种高度优选的突变型扩环酶选自由H101、H106、H111、H122、H127、H262、H301、H305、H308、H309、H401、H402、H403、H501、H502、H503、H504、H505、H506、H507、H508、H601、H602、H603、H604、H605、H606、H607、H608、H609、H650、H651、H652、H653、H654、H655、H656、H657、H658、H659、H660、H661、H662、G601、G602、G603、G604、G605、G606、G607、G608、G609、G610、G611、G613和G614构成的组(见表3)。
在第二个方面,本发明提供了一种多核苷酸,其编码本发明的突变型扩环酶。编码根据本发明的突变型扩环酶的多核苷酸可以是编码根据本发明的合适氨基酸序列的任何多核苷酸。这表明,其可对应于S.clavuligerus的cefE基因,只除了编码各个氨基酸位置上的突变的核苷酸之外。或者,其可对应于S.clavuligerus的cefE基因,只除了编码对应于N.lactamdurans扩环酶序列的氨基酸序列部分的多核苷酸片段之外。或者,本发明的多核苷酸可包含下述编码序列,其中,针对多种氨基酸的密码子用途都与S.clavuligerus中和/或N.lactamdurans中的密码子用途不同。例如,密码子用途可被改造为特定宿主细胞的密码子用途,其将或已被用编码改变的扩环酶的DNA片段所转化。
在第三个方面,本发明提供了一种表达载体或表达盒,其中包含如前文定义的本发明的多核苷酸。
在第四个方面,本发明提供了一种经转化的宿主细胞,其经过了本发明的多核苷酸或本发明的表达载体或表达盒的转化。经转化的宿主细胞可被用于生产本发明的突变型扩环酶,或者所述宿主细胞可被用于生产感兴趣的beta-内酰胺化合物。
用于生产本发明突变型扩环酶的宿主细胞优选是本领域已知能通过细胞外或细胞内的方式有效生产蛋白质或酶的宿主细胞,例如,微生物,例如真菌、酵母和细菌。优选的宿主细胞的例子包括但不限于下述的属:Aspergillus(例如A.niger、A.oryzea)、Penicillium(例如P.emersonii、P.chrysogenum)、Saccharomyces(例如S.cerevisiae)、Kluyveromyces(例如K.lactis)、Bacillus(例如B.subtilis、B.licheniformis、B.amyloliquefaciens)。Escherichia(E.coli)、Streptomyces(例如S.clavuligerus)。
用于生产感兴趣的beta-内酰胺化合物的宿主细胞优选是本领域已知其能通过细胞外或细胞内的方式有效生产beta-内酰胺化合物的宿主细胞。优选的宿主细胞的例子包括但不限于下述的属:Penicillium(例如P.chrysogenum)、Acremonium(例如A.chrysogenum)、Streptomyces(例如S.clavuligerus)、Nocardia(例如N.lactamdurans)、Lysobacter(例如L.lactamgenus和Flavobacterium的种。
在第五个方面,本发明提供了一种方法,用于生产本发明的突变型扩环酶,所述方法包括将根据本发明的经转化的宿主细胞培养于有益于生产所述突变型扩环酶的条件下,以及可选地,回收突变型扩环酶。回收的突变型扩环酶可有利地用于体外方法,以从相应的青霉素生产想要的头孢菌素,例如,回收的突变型扩环酶可用于从Pen-G生产苯基乙酰-7-ADCA或从己二酰-6-APA生产己二酰-7-ADCA的方法。
在第六个方面,本发明提供了一种方法,用于生产感兴趣的beta-内酰胺化合物,所述方法包括将根据本发明的经转化的宿主细胞培养于有益于生产感兴趣的beta-内酰胺化合物的条件下,以及可选地,回收beta-内酰胺化合物。优选的beta-内酰胺化合物属于头孢菌素的组,例如苯基乙酰-7-ADCA、己二酰-7-ADCA、己二酰-7-ADAC和己二酰-7-ACA。在一种优选的实施方式中,本发明提供了一种方法,用于生产苯基乙酰-7-ADCA或己二酰-7-ADCA,所述方法通过培养选定的Penicillium chrysogenum菌株来进行,所述菌株已用编码本发明突变型扩环酶的本发明多核苷酸转化过。为生产苯基乙酰-7-ADCA,选择针对作为底物的Pen-G来说具有高的提高因子(improvement factor)的突变型扩环酶。为生产己二酰-7-ADCA,选择针对作为底物的ad-6-APA来说具有高的提高因子的突变型扩环酶。
在另一种优选的实施方式中,本发明提供了一种方法,用于生产7-ADCA,所述方法包括前文所述用于生产苯基乙酰-7-ADCA或己二酰-7-ADCA的方法,接着,在可选的对所述7-ADCA衍生物的纯化之后有一个工艺步骤,其中,苯基乙酰-7-ADCA和己二酰-7-ADCA的苯基乙酰或己二酰侧链被分别切下,由此产生7-ADCA和释放的侧链酸。所述切割可以通过化学方法获得,或者更优选地,使用酰基转移酶通过酶促方式获得。用于切割己二酰侧链的合适的酰基转移酶可从多种Pseudomonas的种(例如,Pseudomonas SY-77或Pseudomonas SE-83)获得。用于切割苯基乙酰侧链的合适的酰基转移酶是来自Escherichia coli或Alcaligenes feacalis的酰基转移酶。
在第七个方面,本发明提供了一种方法,用于从相应的青霉素来生产头孢菌素,其中,青霉素的5元噻唑烷环向头孢菌素的6元二氢噻嗪环的扩环过程以体外方法的形式发生,这是被本发明的突变型扩环酶所催化的。在一种优选的方法中,通过本发明的突变型扩环酶,将己二酰-6-APA扩环为相应的己二酰-7-ADCA,优选通过针对作为底物的己二酰-6-APA具有高的提高因子的突变型扩环酶来进行。在另一种优选的方法中,通过本发明的突变型扩环酶,将Pen-G扩环为相应的己二酰-7-ADCA,优选通过针对作为底物的Pen-G具有高的提高因子的突变型扩环酶来进行。
接着,在可选的对所述7-ADCA衍生物的纯化之后,所述方法可以有一个工艺步骤,其中,苯基乙酰-7-ADCA和己二酰-7-ADCA的侧链被切下,由此产生7-ADCA和释放的侧链酸——见上文。
可以根据本领域已知的涉及对己二酰-7-ADCA或苯基乙酰-7-ADCA的侧链进行化学或酶促切割的方法来回收想要的终产物7-ADCA,并且可选地,得到的7-ADCA可被进一步纯化和/或结晶。
在第八个方面,本发明提供了一种方法,用于获得本发明的突变型扩环酶,其中,所述方法包括如下步骤:
1.对编码具有扩环酶活性的模型多肽的克隆基因加以诱变,由此获得编码突变型扩环酶的经诱变基因的集合;
2.将编码突变型扩环酶的经诱变基因的集合在合适的宿主细胞中表达,针对对合适的底物的提高的活性,对突变型扩环酶的集合加以筛选;
3.可选地,使用编码具有扩环酶活性的模型多肽的基因,或者编码具有针对合适底物的提高的活性的突变型扩环酶的经诱变基因中的一种或多种,重复步骤1和2一次或多次。
对编码具有扩环酶活性的模型多肽的基因的克隆可根据本领域已知的方法来进行。
优选的具有扩环酶活性的模型多肽选自由可从Streptomycesclavuligerus获得的具有扩环酶活性的多肽(优选具有根据SEQ ID NO:1的氨基酸序列)和具有扩环酶活性、且具有下述氨基酸序列的多肽构成的组,所述氨基酸序列与SEQ ID NO:1具有至少70%,优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,最优选至少95%的百分比同一性,所述多肽例如表1中所概括的扩环酶。
导致在整个基因上产生突变的任何诱变技术都可使用。合适的技术是易错(EP)PCR(聚合酶链式反应)和/或通过精确遵循WO 03/010183所述使用饱和突变引物PCR(sMPP)。
材料和方法
1.常规
寡核苷酸通过Invitrogen(Carlsbad CA,US)合成。
DNA测序由SEQLAB(
Figure S05834984420070417D000151
,Germany)或由Baseclear(Leiden,The Netherlands)来进行。
限制性酶购自Invitrogen。
蛋白质试验按照Bradford,M.M.(1976)Anal Biochem.72:248-54所述的方法来进行。
Escherichia coli DH10B electromax感受态细胞从Invitrogen获得。实验方案由厂商提供。
SDS-PAGE电泳在Invitrogen提供的系统中开展。NuPAGE Novex Bis-Tris Gels(Invitrogen)。SimplyBlue SafeStain Microwave方案
所用构建体总览
质粒 描述
PBAD-MH-Zeo-MBP-ScEwt 阿拉伯糖可诱导的E.coli表达构建体,具有与野生型S.clavuligerus扩环酶融合的麦芽糖结合蛋白(MBP)。Zeocine标记
PBAD-MH-Zeo-MBP-H127 同上,但与H127扩环酶融合(还见表3x)
PBAD-MH-Zeo-MBP-H406 同上,但与H406扩环酶融合(还见表3x)
PBAD-MH-Zeo-MBP-H402 同上,但与H402扩环酶融合(还见表3x)
PBAD-MH-Zeo-MBP-H403 同上,但与H403扩环酶融合(还见表3x)
1.克隆E.coli表达载体
通过EcoRI/SalI消化,将融合产物连接进pBAD/MH MBP-ScEwt Destzeo载体。这用文库基因替换了野生型扩环酶基因。为防止出现显著数量的野生型构建体,用SmaI消化连接构建体。
2.文库的构建
用连接混合物对E.coli的转化产生了大约12,000-13,000个菌落的文库。为检验文库的质量,选择菌落的随机组,用限制性酶对构建体进行消化。这显示,文库的大约26%显示了不正常的状况。接着,对10个常规克隆进行了序列分析,以测定突变频率。序列显示,饱和和易错突变都以满意的水平存在。
3.对突变型扩环酶的表达和筛选
3.1针对提高的活性来筛选cefE文库
将含有文库A的E.coli TG1细胞涂布并培养于琼脂平板上。通过自动设备捡出菌落,至含有液体培养基(2YT,30μg/ml氯霉素,05%葡萄糖)的96孔微滴定板中,通过在37℃振荡,培养至饱和。将细胞在96孔微滴定板中传代(subculture);1∶40接种进2YT,30μg/ml氯霉素,用0.2mM IPTG,在28℃振荡诱导24小时。沉淀细胞,用等体积缓冲液(5mM吗啉,pH 7.5)去洗涤。旋转离心之后,将细胞重新悬浮于裂解混合液中,用于初级筛选扩环酶试验(1)。
3.2.在微滴定板(MTP)中进行的初级筛选
培养和诱导
将扩环酶E.coli文库涂布到Luria-Bertani(LB)培养基平板(低盐琼脂+25μg/ml Zeocine)上,在37℃培养过夜。从所述平板接种含有150μlLB低盐培养基和25μg/ml Zeocine的微滴定板(MTP),在25℃和550rpm下培养36小时。
从MTP取5μl接种进含有1ml 2*TY(胰蛋白胨和酵母提取物)培养基+50μg/ml Zeocine+阿拉伯糖的深孔板中。向MTP中剩余的培养物加入100μl 50%甘油,作为甘油贮液冷冻于-80℃。
在25℃和550rpm对深孔板培养30小时。在2750rpm(Heraeusmultifuge 4kr.)对深孔板培养物加以10分钟的离心。弃去上清液,沉淀冷冻于-20℃。
不含细胞的提取物(CFE)
前文中获得的冷冻沉淀被解冻于200μl提取缓冲液(50mM Tris/HClpH=7.5;5mM DTT;0.1mg/ml DNAse;5mM MgSO4·H2O和0.5mg/ml裂解酶)中。为重新悬浮沉淀,对板加以振荡。将板在室温下培养30分钟,在2750rpm下离心10分钟。
3.3在摇瓶中进行的次级筛选
生长和诱导
将选定的菌落从平板接种进10ml LB低盐+Zeocine 25μg/ml,在37℃,280rpm下过夜培养。将培养得到的培养物以0.010至0.050之间(Biochrom Ultraspec 2000)的光学密度(600nm)接种进含有25μg/mlZeocine的100ml LB低盐培养基。在37℃,280rpm培养后,收获600nm处光学密度为0.4-0.6之间的细胞。然后,加入阿拉伯糖(终浓度0.2%),在27℃和220rpm下诱导过夜。
4.扩环酶试验
4.1扩环酶试验(1)-筛选试验(初级试验):
扩环酶试验缓冲液:5mM吗啉缓冲液,pH 7.5,和辅助因子混合物(终浓度为50μM ATP、1mM DTT、60μM FeSO4、2.7mM抗坏血酸盐/酯),500μM ad-6-APA,体积比1/10的E.coli细胞裂解物和2.4mMα-KG。每种辅助因子都在pH 7.5的缓冲液中制备,这对于活性来说是关键的。
扩环酶反应被发现在高达3小时内都相对己二酰-7-ADCA的形成/检测呈线性。对于体外扩环酶反应得最佳温度被确定为大约11℃,这可能是由于在更高的温度下该酶或生产过程的不稳定性。但是,实际筛选在室温和25℃之间的温度进行,这更对应于想要的反应条件温度。
对用于提高7-ADCA形成的家族改组(family shuffled)文库的筛选由Flow Injection Analysis-MS(FIA-MS,阴性模式,Mass Transition[M-H]341>295)来确定。最终分析:LC柱:使用40%MeOH至100%MeOH中0.1%甲酸的溶剂条件。两条通道被用于监测每种反应产物。反应30分钟后对样品加以分析。
4.2扩环酶试验(2)-次级扩环酶试验
扩环酶试验缓冲液:5mM吗啉缓冲液,pH 7.5,和辅助因子混合物(终浓度为50μM ATP、1mM DTT、60μM FeSO4、2.7mM抗坏血酸盐/酯),2mM己二酰-6-APA,体积比1/10的E.coli细胞裂解物和2.4mMα-酮戊二酸盐/酯。每种辅助因子都在pH 7.5的缓冲液中制备,这对于活性来说是关键的。转化在29℃进行,在0至30分钟之间取样。用60%(v/v)乙腈终浓度来终止反应。在HPLC上对形成的己二酰-7-ADCA加以分析。(移动相:10%乙腈,在10mM磷酸钾缓冲液(pH 3.0)中)。柱:X-TerraTM RP18 3.5μ。3.9x100mm,在214和254nm(254nm用于分析被扩环的抗生素)处检测。HPLC数据分析:软件:Waters3.20。
4.3扩环酶试验(3)-扩环酶试验
将总共300μl反应混合物加入到75μl CFE中,在29℃孵育想要的时间,反应混合物由50mM Tris/HCl pH 7.5、1mM DTT、2.7mM抗坏血酸盐/酯、0.05mM ATP、24mM α-酮戊二酸盐/酯、0.06mM FeSO4·7H2O、4mM己二酰-6-氨基-青霉烷酸(ad-6-APA)构成。加入60μl马来酸以及10g/l EDTA终止反应。己二酰-7-氨基-脱乙酰氧-头孢烷酸的形成用1H-NMR来探测。
从6-APA和青霉素扩环酶(EC 3.5.1.11)催化的己二酸获得己二酰-6-APA。或者,可通过在己二酸作为前体存在的情况下培养例如合适的Penicillium chrysogenum菌株来获得己二酰-6-APA。
实施例
实施例1对野生型扩环酶的克隆
从S.clavuligerus基因组DNA通过PCR克隆出cefE基因,将其连接进GFP融合载体(所谓的pCK系列),用于转化E.coli TG1(AmershamPharmacia Biotech,Inc.NJ USA)。从平板上的转化子选出若干菌落,针对有活性的克隆对其加以检测。鉴定出若干活性克隆。克隆“778”看起来是野生型基因,但是有趣的是,另一个克隆“779”展示了针对己二酰-6-APA扩环的强烈提高的活性。克隆“779”的产物被测序,其显示出三处氨基酸突变(H18R、D284N和G300V)。通过Flow Injection Analysis-MS(FIA-MS)分析的克隆的己二酰-7-ADCA生产显示:Sc-cefE突变体“779”优于野生型亲本。GFP荧光测量显示,克隆“779”的扩环酶产物的提高并非由于其中cefE的提高表达。因此,我们推断,克隆“779”的扩环酶产物的提高是氨基酸取代导致的活性提高的结果。
pCK衍生的GFP融合载体
构建融合标签载体系列(所谓的pCK系列),其含有与扩环酶3’末端融合的His标签,以及在HIS标签3’末端融合的绿色荧光蛋白(GFP)。含有GFP的载体能在随后的试验中,针对蛋白质浓度对扩环酶活性数据加以高通量归一化。载体含有p15A复制起点(低拷贝数),以及在有葡萄糖的情况下会被遏制的lac启动子。
实施例2  野生型N.lactamdurans和S.clavuligerus cefE基因的家族改细和 筛选-文库A
根据EP752008所述的方法对扩环酶基因加以改组。使用GFP融合标签载体(pCK)来制备扩环酶突变体文库。仅改组CefE ORF,而其它序列不变。在将扩环酶的改组库移入pCK载体后,使用两种亲本野生型扩环酶基因(S.clavuligerus和N.lactamdurans)加上克隆“779”来制备一组文库(文库A)。
对文库样品最初的涂布显示,文库含有至少70%的绿色荧光克隆。由于这个原因,在继续进行第一次FIA/MS筛选之前预先筛选出非荧光菌落不被认为是必须的。
对从文库组A中随机捡出的菌落进行的测序显示,所有亲本都存在于文库中,所以选择该文库以用于最初筛选。
对来自文库A的720个克隆加以筛选,14个克隆(突变型扩环酶H101、H102、H104、H106、H108、H111、H112、H114、H115、H117、H120、H122、H125、H127)被重新检验,初步结果显示较之S.calvuligerus扩环酶(克隆“778”)来说扩环酶活性有所提高,这是通过体外扩环酶试验(1)测量的。这些克隆被选用来进行后续试验。针对扩环酶-GFP浓度对扩环酶活性进行的归一化(即,校正扩环酶蛋白浓度之间的区别)验证了这些克隆比活性的提高。
实施例3  野生型N.lactamdurans和S.clavuligerus cefE基因的家族改组- 文库B
用改组野生型N.lactamdurans和S.clavuligerus cefE作为亲本基因来构建文库B。“779”击中序列(hit sequence)不用于构建该文库。该扩环酶文库显示文库中不具有活性或仅具有非常低的活性的克隆占显著水平。为从进一步试验中除去不具有活性的克隆,用基于FACS的预筛选来筛选文库B,以提高进入到扩环酶试验中的活性克隆的百分比。
基于其通过GFP的荧光进行FACS拣选之后,在遏制条件下回收选出的细胞。从这些培养物制备的DNA被用于转化E.coli TG1。使用的这些扩环酶构建体还是与GFP融合的融合蛋白,如针对文库A所描述的那样。
文库的百分之70-80是GFP活性的。总体而言,然后使用体外扩环酶试验以及对己二酰-7-ADCA形成的FIA-MS探测,对来自该文库的2200个克隆进行了筛选。
选出了十四个可能的击中(H200系列)。这些击中中的四个,其中包括H262,通过重新试验程序被证实(包括再次转化和体外试验和分析MS)。
实施例4  使用经改组的扩环酶构建嵌合扩环酶序列-文库C
使用传统的分子生物学技术和生物信息学工具,对来自上述两个文库(文库A和B)的击中序列加以重组,得到文库C(H300系列)。针对活性对得到的三个嵌合体(chimeras)加以测试,其中包括扩环酶H301。
剩下的六个克隆(包括H305、H307、H308、H309)没有作为GFP融合产物被检验,也没有被FIA-MS分析。这些克隆被直接重新克隆进与位于CefE突变体基因上游的麦芽糖结合蛋白(MBP)融合的pSJ载体系列,在体外试验之后于HPLC上被分析。
实施例5使用基于pSJ的载体系列对编码改进的扩环酶的基因进行重新 克隆以及改进的扩环酶的酶活性
pSJ08被用作为克隆载体,用于扩环酶文库。该质粒是通过用小的寡核苷酸替换扩环酶基因(作为NdeI-NsiI片段)引入NotI限制性位点来构建的。S.clavuligerus cefE作为NdeI-NsiI片段在pSJ08中被克隆,得到pSJ05。
pSJ05含有紧邻NsiI位点上游的额外NdeI位点。该位点被去除,以防止对NdeI-NsiI位点中经改组基因的进一步克隆可能造成的干扰,由此得到pSJ11。接着,将麦芽糖结合蛋白(MBP)融合到cefE的5’末端,得到pSJ10。含有MBP-cefE融合基因的用于Nocardia lactambdurans的质粒(pSJ01)也被构建了。DNA序列分析证实了所有序列。
将来自A、B和C文库的经改进克隆从pCK载体重新克隆进pSJ10载体(MBP-cefE在tac启动子之后)。这是通过PCR对经改进的扩环酶加以扩增来进行的。正向(5’末端)引物引入NdeI,反向(3’末端)引物引入NsiI位点。用NdeI和NsiI消化之后,在E.coli载体(pSJ10)和Penicillium chrysogenum载体(pIATWAn-图2/3)中克隆该击中,表2。
最后,对每种取一些克隆加以测序,含有经验证为正确序列的每种取一个用于进一步的分析。
最好的扩环酶击中的DNA和氨基酸序列包括于序列表中,其概览见表2。
诱导表达
E.coli NM554在含有氯霉素(30μg/ml)的2xTY培养基上于37℃培养过夜。在新鲜的含有氯霉素(30μg/ml)的2xTY培养基中将细胞稀释为540nm处的光学密度(OD540)为0.010-0.020。当细胞在540nm的光学密度达到0.4-0.6时,加入IPTG(终浓度0.5mM),在27℃过夜诱导表达。
在提取缓冲液(5mM DTT,50mM Tris/HCl pH7.5,含有裂解酶)中对细胞加以洗涤和重新悬浮,超声波处理(冰水上)。离心之后,将上清液用于扩环酶试验(2)。
通过SDS-PAGE来测定扩环酶在不含细胞的提取物中的表达。
表2 H100、H200和H300系列扩环酶击中,它们的突变。它们的E.coli和Penicillium表达载体以及它们的扩环酶活性(试验2)。
Figure S05834984420070417D000221
Figure S05834984420070417D000231
*比活性(nmol 7-ADCA·min-1·mg-1蛋白质)
**I.F.=提高因子;等于突变型扩环酶比活性与来自S.clavuligeris的扩环酶的比活性之间的比例。
实施例6扩环酶H122和H127在Penicillium chrysogenum中的表达
扩环酶突变体H122和H127被克隆进用于Penicillium chrysogenum表达的载体(pIAT系列载体,表2)。经改组的扩环酶基因被克隆进含有E.coli复制子和选择标记的质粒载体。与在P.chrysogenum中的表达兼容的启动子,即IPNS启动子,被用于表达扩环酶基因。此外还存在用于Penicillium chrysogenum的选择标记(amdS)。
通过用NotI消化表达构建体pIAT127(扩环酶H127)和pIAT122(扩环酶H122),获得表达构建体。用线性片段和amdS表达盒(HindIII消化物)共转化高产量的Penicillium chrysogenum。
通过用己二酸酯作为前驱(precursing),可在表达活性扩环酶基因的菌株中对己二酰-7-ADCA的生产加以检验。
将表达扩环酶H127的菌株的头孢菌素生产与表达野生型扩环酶的菌株相比,这以分批方式进行,用乳糖作为碳源。己二酰-7-ADCA的产量增加10-50%之间,总的β-内酰胺生产增加了0-30%,这取决于乳糖和己二酸酯的浓度。
此外,扩环酶H122在Penicillium chrysogenum中表达。与用表达野生型扩环酶的菌株对头孢菌素的生产相比较,显示,己二酰-7-ADCA生产增加0-50%之间,总的beta内酰胺生产在-20至0%之间变动,这取决于培养基中的乳糖和己二酸酯浓度。
实施例7第一代经改进的扩环酶(H400系列)
通过对野生型Streptomyces clavuligerus CefE基因(SEQ ID NO:1)进行易错(EP)PCR(聚合酶链式反应)来构建第一代扩环酶文库。在针对ad-6-APA向ad-7-ADCA的提高的转化对该文库加以筛选之后,选出3个不同的突变体基因。突变体展示出提高至2.5倍的ad-6-APA扩环活性(H401、H402、H403:见表3)。
实施例8第二代经改进的扩环酶(H500系列)
精确按照WO 03/010183所述,通过使用饱和突变引物PCR(sMPP)来构建第二代扩环酶文库。从第一代(H401、H402和H403)中选出的突变体基因被用作为模板,用于构建第二代文库。
通过使用Taq聚合酶来进行sMPP,由此引入额外的突变(随机),增加文库的变异程度。设计的引物在突变位置退火,在第一代扩环酶击中中发现的突变处被饱和。此外,设计通用的正向和反向引物,其中分别引入NdeI和NsiI。这有助于向Penicillium表达载体中的克隆,用于体内检验突变型扩环酶。
对文库进行培养,按照材料和方法章节所述,诱导扩环酶的表达。按照材料和方法章节所述,用NMR来测定ad-7-ADCA的形成。
选出大约150个提高的突变型扩环酶,针对它们的ad-6-APA扩环酶活性对它们加以重新检验。基于该重新检验的结果,选出17个突变体,用于在摇瓶中进行最终检验,以及按照材料和方法所述通过HPLC进行分析。
总体而言,17个选出的击中中的15个显示出:用ad-6-APA作为底物时扩环酶活性显著提高。为将对表达突变体的假阳性选择排除在外,在SDS-PAGE上定量蛋白质水平。这验证了:提高的活性并非由于E.coli中扩环酶的更强表达,提高的活性可归功于扩环酶突变体提高的比活性。
总的来说,鉴定出了8个突变型扩环酶,它们展示出高达4.5倍的ad-6-APA扩环酶提高因子(较之S.clavuligerus的野生型扩环酶而言——SEQID NO:1)。这些突变体被命名为H501-H508(见表3)。
实施例9经改进扩环酶的第三代(H600系列)
在实施例2第二代中获得的8个突变体(H501-H508)被用作为模板,用于构建第三代扩环酶文库。按照与第二代扩环酶文库相同的方法来构建该文库。此外,扩环酶C末端的SKA信号序列被改变为SKD,这导致:当在Penicillium中表达时,扩环酶仅在胞质中表达。
对该文库的筛选产生了22个不同的扩环酶突变体基因,它们较之S.calvuligerus扩环酶明显提高到5倍至11倍之间(表3,H600系列)。
对同样的文档的第二次筛选产生了13个额外的突变型扩环酶(G601-G611以及G613-G614;见表3)
实施例10用异青霉素N(iPN)和青霉素G(Pen-G)作为底物时提高的 突变型扩环酶活性
使用iPN和PenG作为底物来测量若干种突变型扩环酶的活性。用iPN作为底物的试验按照材料和方法章节所述来进行,除了ad-6-APA被同样浓度的iPN(4mM)所代替。用Pen-G作为底物的试验按照材料和方法章节所述来进行,除了ad-6-APA被7mM Pen-G所代替。表3概括了多种扩环酶突变体针对iPN和Pen-G的活性。
虽然测试的大多数扩环酶突变体展示出提高至5倍的针对iPN的扩环酶活性,但是携带T89K突变的突变体却丢失了基本全部的针对iPN的活性。
测试的多种扩环酶突变体的针对Pen-G的活性与野生型扩环酶相同(提高因子为1)或者提高至高达8倍。数据进一步显示,用ad-6-APA和Pen-G作为底物时用单个突变体获得的提高因子之间没有关联。针对ad-6-APA和Pen-G的各自的提高因子之间的比例在0.1(例如H654)至1.2(例如H503)之间。
表3.突变型扩环酶和它们针对ad-6-APA、PenG和iPN的扩环酶活性。通过其编号来辨认每个突变体;突变被引入到S.clavuligerus的模型扩环酶(SEQ ID NO:1)中。扩环酶活性作为较之来自S.clavuligerus的模型扩环酶(定义扩环酶活性=1)的提高因子来表示,这根据材料和方法和实施例4中所述的体外扩环酶试验来确定。
Figure S05834984420070417D000261
Figure S05834984420070417D000271
表3显示,已获得了提高因子在1.5至10.6倍范围内的突变型扩环酶。
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>突变型扩环酶
<130>24172WO
<160>14
<170>PatentIn version  3.1
<210>1
<211>936
<212>DNA
<213>Streptomyces clavuligerus
<220>
<221>外显子
<222>(1)..(933)
<223>
<400>1
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cac cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu His Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
        35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag atc acc aat acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg tcc    336
Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro Ser
            100                 105                 110
ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac acc    384
Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr Thr
        115                 120                 125
gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc gag    432
Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr Glu
    130                 135                 140
ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg cgg    480
Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ttc cgc tac ttc ccg cag gtc ccc gag cac cgc agc gcc gag gag cag    528
Phe Arg Tyr Phe Pro Gln Val Pro Glu His Arg Ser Ala Glu Glu Gln
                165                 170                 175
ccc ctg cgg atg gcg ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu  Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc gat gtc agc ctg gac    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asp Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg ggc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Gly Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tga                                    936
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>2
<211>970
<212>DNA
<213>Nocardia lactamdurans
<220>
<221>外显子
<222>(1)..(942)
<223>
<400>2
atg acg gac gcg acc gtg ccg acc ttc gat ctg gcc gag ctg cgt gag    48
Met Thr Asp Ala Thr Val Pro Thr Phe Asp Leu Ala Glu Leu Arg Glu
1               5                   10                  15
ggc ttg cac cag gag gag ttc cgc cac tgc ctg cgc gag aag ggc gtg    96
Gly Leu His Gln Glu Glu Phe Arg His Cys Leu Arg Glu Lys Gly Val
            20                  25                  30
ttc tac ctc aag ggc acc ggg ctc gcc gag gcg gac cac gcc tcg gcg    144
Phe Tyr Leu Lys Gly Thr Gly Leu Ala Glu Ala Asp His Ala Ser Ala
        35                  40                  45
cgg gag atc gcg gtg gac ttc ttc gac cac ggc acc gag gcc gag aag    192
Arg Glu Ile Ala Val Asp Phe Phe Asp His Gly Thr Glu Ala Glu Lys
    50                  55                  60
aag gcg gtg atg acg ccg atc ccg acc atc cgg cgc ggg tac gcc ggg    240
Lys Ala Val Met Thr Pro Ile Pro Thr Ile Arg Arg Gly Tyr Ala Gly
65                  70                  75                  80
ctg gag tcc gag agc acc gcg cag atc acg aac acc ggc aag tac acc    288
Leu Glu Ser Glu Ser Thr Ala GlnIle Thr Asn Thr Gly Lys  Tyr Thr
                85                  90                  95
gac tac tcg atg tcg tac tcg atg ggc acc gcg gac aac ctg ttc ccc    336
Asp Tyr Ser Met Ser Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro
            100                 105                 110
agc gcc gag ttc gag aag gcg tgg gag gac tac ttc gcg cgg atg tac    384
Ser Ala Glu Phe Glu Lys Ala Trp Glu Asp Tyr Phe Ala Arg Met Tyr
        115                 120                 125
cgc gct tcg cag gac gtc gcg cgg cag gtg ctg acc tcg gtc ggc gcg    432
Arg Ala Ser Gln Asp Val Ala Arg Gln Val Leu Thr Ser Val Gly Ala
    130                 135                 140
gaa ccc gag gtc ggc atg gac gcc ttc ctc gac tgc gaa ccc ctg ctg    480
Glu Pro Glu Val Gly Met Asp Ala Phe Leu Asp Cys Glu Pro Leu Leu
145                 150                 155                 160
cgc ctg cgc tac ttc ccc gag gtg ccc gag gat cgc gtg gcc gag gag    528
Arg Leu Arg Tyr Phe Pro Glu Val Pro Glu Asp Arg Val Ala Glu Glu
                165                 170                 175
cag ccg ctg cgg atg gcc ccg cat tac gac ctc tcg atc gtc acc ctg    576
Gln Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Ile Val Thr Leu
            180                 185                 190
atc cac cag acc cct tgc gcg aac ggg ttc gtc agc ctg cag gtc gag    624
Ile His Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Val Glu
        195                 200                 205
gtg gac ggg tcc tat gtg gac atc ccg gcg cag ccg ggc gcg gtg ctg    672
Val Asp Gly Ser Tyr Val Asp Ile Pro Ala Gln Pro Gly Ala Val Leu
    210                 215                 220
gtg ttc tgc ggc gcg gtg gcg acg ctg gtg gcc gac ggc gcg atc aag    720
Val Phe Cys Gly Ala Val Ala Thr Leu Val Ala Asp Gly Ala Ile Lys
225                 230                 235                 240
gcg ccc aag cac cac gtg gcc gcg ccc ggc gcg gac aag cgg gtg ggc    768
Ala Pro Lys His His Val Ala Ala Pro Gly Ala Asp Lys Arg Val Gly
                245                 250                 255
agc agc cgc acc tcc agc gtg ttc ttc ctg cgc ccc aac ggg gac ttc    816
Ser Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Gly Asp Phe
            260                 265                 270
cgc ttc tcg gtg ccg cgg gcc agg gag tgc ggg ttc gac gtc agc atc    864
Arg Phe Ser Val Pro Arg Ala Arg Glu Cys Gly Phe Asp Val Ser Ile
        275                 280                 285
ccg gcc gag acc gcc acc ttc gac gac tgg atc ggc ggc aac tac atc    912
Pro Ala Glu Thr Ala Thr Phe Asp Asp Trp Ile Gly Gly Asn Tyr Ile
    290                 295                 300
aac atc cgg aag acc gcc gcc gcc cgg ctt tgaaggctct tcatgacgag      962
Asn Ile Arg Lys Thr Ala Ala Ala Arg Leu
305                 310
ccaatgca                                                           970
<210>3
<211>936
<212>DNA
<213>人工
<220>
<223>779
<220>
<221>外显子
<222>(1)..(936)
<223>
<400>3
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cgc cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu Arg Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
        35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag att acc aat acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg tcc    336
Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro Ser
            100                 105                 110
ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac acc    384
Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr Thr
        115                 120                 125
gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc gag    432
Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr Glu
    130                 135                 140
ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg cgg    480
Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ttc cgc tac ttc ccg cag gtc ccc gag cac cgc agc gcc gag gag cag    528
Phe Arg Tyr Phe Pro Gln Val Pro Glu His Arg Ser Ala Glu Glu Gln
                165                 170                 175
ccc ctg cgg atg gcg ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc aat gtc agc ctg gac    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asn Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg gtc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Val Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tga                                    936
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>4
<211>939
<212>DNA
<213>人工序列
<220>
<223>H262
<220>
<221>外显子
<222>(1)..(936)
<223>
<400>4
atg acg gac gcg acc gtg ccg acc ttc gat ctg gcc gag ctg cgt gag    48
Met Thr Asp Ala Thr Val Pro Thr Phe Asp Leu Ala Glu Leu Arg Glu
1               5                   10                  15
ggc ttg cac cag gag gag ttc cgc cac tgc ctg cgc gag aag ggc gtg    96
Gly Leu His Gln Glu Glu Phe Arg His Cys Leu Arg Glu Lys Gly Val
            20                  25                  30
ttc tac ctc aag ggc acc ggg ctc gcc gag gcg gac cac gcc tcg gcg    144
Phe Tyr Leu Lys Gly Thr Gly Leu Ala Glu Ala Asp His Ala Ser Ala
        35                  40                  45
cgg gag atc gcg gtg gac ttc ttc gag cac ggc agc gag gcg gag aag    192
Arg Glu Ile Ala Val Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys
    50                  55                  60
cgc gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg    240
Arg Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly
65                  70                  75                  80
ctg gag tcg gag agc acc gcg cag atc acg aac acc ggc agc tac tcc    288
Leu Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser
                85                  90                  95
gac tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg    336
Asp Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro
            100                 105                 110
tcc ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac    384
Ser Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr
        115                 120                 125
acc gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc    432
Thr Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr
    130                 135                 140
gag ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg    480
Glu Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu
145                 150                 155                 160
cgg ttc cgc tac ttc ccg cag gtg ccc gag gat cgc gtg gcc gag gag    528
Arg Phe Arg Tyr Phe Pro Gln Val Pro Glu Asp Arg Val Ala Glu Glu
                165                 170                 175
cag ccg ctg cgg atg gcc ccg cac tac gac ctc tcg atc gtc acc ctg    576
Gln Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Ile Val Thr Leu
            180                 185                 190
atc cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag    624
Ile Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu
        195                 200                 205
gtc ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc    672
Val Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu
    210                 215                 220
gtc ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag    720
Val Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys
225                 230                 235                 240
gcc ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc    768
Ala Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly
                245                 250                 255
agc agc cgc acc tcc agc gtg ttc ttc ctg cgc ccc aac ggg gac ttc    816
Ser Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Gly Asp phe
            260                 265                 270
cgc ttc tcg gtg ccg cgg gcc agg gag tgc ggg ttc gac gtc ggc ctg    864
Arg Phe Ser Val Pro Arg Ala Arg Glu Cys Gly Phe Asp Val Gly Leu
        275                 280                 285
gac ggc gag acc gcc acg ttc cgg gat tgg atc ggg ggc aac tac gtg    912
Asp Gly Glu Thr Ala Thr Phe Arg Asp Trp Ile Gly Gly Asn Tyr Val
    290                 295                 300
aac atc cgc cgc aca tcc aag gca tag                                939
Asn Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>5
<211>936
<212>DNA
<213>人工序列
<220>
<223>H127
<220>
<221>外显子
<222>(1)..(933)
<223>
<400>5
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cgc cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu Arg Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
        35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe GLu His Gly Ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag att acc aat acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tcg tac tcg atg ggc acc gcg gac aac ctg ttc ccc agc    336
Tyr Ser Met Ser Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro Ser
            100                 105                 110
gcc gag ttc gag aag gcg tgg gag gac tac ttc gcg cgg atg tac cgc    384
Ala Glu Phe Glu Lys Ala Trp Glu Asp Tyr Phe Ala Arg Met Tyr Arg
        115                 120                 125
gct tcg cag gac gtc gcg cgg cag gtg ctg acc tcg gtc ggc gcg gaa    432
Ala Ser Gln Asp Val Ala Arg Gln Val Leu Thr Ser Val Gly Ala Glu
    130                 135                 140
ccc gag gtc ggc atg gac gcc ttc ctc gac tgc gaa ccc ctg ctg cgc    480
Pro Glu Val Gly Met Asp Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ctg cgc tac ttc ccc gag gtg ccc gag gat cgc gtg gcc gag gag cag    528
Leu Arg Tyr Phe Pro Glu Val Pro Glu Asp Arg Val Ala Glu Glu Gln
                165                 170                 175
ccg ctg cgg atg gcc ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc aat gtc agc ctg gac    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asn Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg gtc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Val Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tga                                    936
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>6
<211>962
<212>DNA
<213>人工序列
<220>
<223>H101
<220>
<221>外显子
<222>(1)..(933)
<223>
<400>6
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cgc cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu Arg Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
        35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag att acc aat acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg tcc    336
Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro Ser
            100                 105                 110
ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac acc    384
Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr Thr
        115                 120                 125
gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc gag    432
Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr Glu
    130                 135                 140
ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg cgg    480
Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ttc cgc tac ttc ccg cag gtc ccc gag cac cgc agc gcc gag gag cag    528
Phe Arg Tyr Phe Pro Gln Val Pro Glu His Arg Ser Ala Glu Glu Gln
                165                 170                 175
ccc ctg cgg atg gcg ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly AlaIle Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc aat gtc agc ctg gac    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asn Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg gtc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Val Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tgataggctc ttcatgacga gaatatgca        962
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>7
<211>936
<212>DNA
<213>人工序列
<220>
<223>H111
<220>
<221>外显子
<222>(1)..(933)
<223>
<400>7
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cgc cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu Arg Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
        35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag att acc aat acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg tcc    336
Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro Ser
            100                 105                 110
ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac acc    384
Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr Thr
        115                 120                 125
gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc gag    432
Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr Glu
    130                 135                 140
ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg cgg    480
Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ttc cgc tac ttc ccg cag gtc ccc gag cac cgc agc gcc gag gag cag    528
Phe Arg Tyr Phe Pro Gln Val Pro Glu His Arg Ser Ala Glu Glu Gln
                165                 170                 175
ccc ctg cgg atg gcg ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac caa gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His Gln Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc aat gtc agc ctg gac    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asn Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg gtc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Val Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tga                                    936
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>8
<211>936
<212>DNA
<213>人工序列
<220>
<223>H122
<220>
<221>外显子
<222>(1)..(933)
<223>
<400>8
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cac cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu His Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
        35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe Glu His Gly ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag atc acc aat acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg tcc    336
Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro Ser
            100                 105                 110
ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac acc    384
G1y Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr Thr
        115                 120                 125
gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc gag    432
Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr Glu
    130                 135                 140
ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg cgg    480
Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ttc cgc tac ttc ccg cag gtc ccc gag cac cgc agc gcc gag gag cag    528
Phe Arg Tyr Phe Pro Gln Val Pro Glu His Arg Ser Ala Glu Glu Gln
                165                 170                 175
ccc ctg cgg atg gcg ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc aat gtc agc ctg gac    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asn Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg gtc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Val Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tga                                     936
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>9
<211>936
<212>DNA
<213>人工序列
<220>
<223>H301
<220>
<221>外显子
<222>(1)..(933)
<223>
<400>9
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cgc cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu Arg Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
        35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc acg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Thr Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag att acc aat acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg tcc    336
Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro Ser
            100                 105                 110
ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac acc    384
Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr Thr
        115                 120                 125
gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc gag    432
Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr Glu
    130                 135                 140
ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg cgg    480
Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ttc cgc tac ttc ccg cag gtc ccc gag cac cgc agc gcc gag gag cag    528
Phe Arg Tyr Phe Pro Gln Val Pro Glu His Arg Ser Ala Glu Gl  Gln
                165                 170                 175
ccc ctg cgg atg gcg ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly AlaIle Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc aat gtc agc ctg gsc    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asn Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg gtc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Val Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tga                                    936
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>10
<211>936
<212>DNA
<213>人工序列
<220>
<223>H305
<220>
<221>外显子
<222>(1)..(933)
<223>
<400>10
atg gac acg acg gtg ccc acc ttc agc ctg gcc gaa ctc cag cag ggc    48
Met Asp Thr Thr Val Pro Thr Phe Ser Leu Ala Glu Leu Gln Gln Gly
1               5                   10                  15
ctg cac cag gac gag ttc cgc agg tgt ctg agg gac aag ggc ctc ttc    96
Leu His Gln Asp Glu Phe Arg Arg Cys Leu Arg Asp Lys Gly Leu Phe
            20                  25                  30
tat ctg acg gac tgc ggt ctg acc gac acc gag ctg aag tcg gcc aag    144
Tyr Leu Thr Asp Cys Gly Leu Thr Asp Thr Glu Leu Lys Ser Ala Lys
         35                  40                  45
gac atc gtc atc gac ttc ttc gag cac ggc agc gag gcg gag aag cgc    192
Asp Ile Val Ile Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys Arg
    50                  55                  60
gcc gtc acc tcg ccc gtc ccc acc acg cgc cgc ggc ttc acc ggg ctg    240
Ala Val Thr Ser Pro Val Pro Thr Thr Arg Arg Gly Phe Thr Gly Leu
65                  70                  75                  80
gag tcg gag agc acc gcc cag atc acc aat  acc ggc agc tac tcc gac    288
Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser Asp
                85                  90                  95
tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg tcc    336
Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu phe Pro Ser
            100                 105                 110
ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac acc    384
Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr Thr
        115                 120                 125
gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc gag    432
Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr Glu
    130                 135                 140
ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg cgg    480
Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu Arg
145                 150                 155                 160
ttc cgc tac ttc ccg cag gtc ccc gag cac cgc agc gcc gag gag cag    528
Phe Arg Tyr Phe Pro Gln Val Pro Glu His Arg Ser Ala Glu Glu Gln
                165                 170                 175
ccc ctg cgg atg gcg ccg cac tac gac ctg tcg atg gtc acc ctc atc    576
Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Met Val Thr Leu Ile
            180                 185                 190
cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag gtc    624
Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu Val
        195                 200                 205
ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc gtc    672
Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu Val
    210                 215                 220
ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag gcc    720
Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys Ala
225                 230                 235                 240
ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc agc    768
Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly Ser
                245                 250                 255
agc cgc acc tcc agt gtg ttc ttc ctc cgt ccc aac gcg gac ttc acc    816
Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Ala Asp Phe Thr
            260                 265                 270
ttc tcc gtc ccg ctg gcg cgc gag tgc ggc ttc gat gtc agc ctg gac    864
Phe Ser Val Pro Leu Ala Arg Glu Cys Gly Phe Asp Val Ser Leu Asp
        275                 280                 285
ggc gag acc gcc acg ttc cag gat tgg atc ggg gtc aac tac gtg aac    912
Gly Glu Thr Ala Thr Phe Gln Asp Trp Ile Gly Val Asn Tyr Val Asn
    290                 295                 300
atc cgc cgc aca tcc aag gca tag                                    936
Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>11
<211>939
<212>DNA
<213>人工序列
<220>
<223>H307
<220>
<221>外显子
<222>(1)..(936)
<223>
<400>11
atg acg gac gcg acc gtg ccg acc ttc gat ctg gcc gag ctg cgt gag    48
Met Thr Asp Ala Thr Val Pro Thr Phe Asp Leu Ala Glu Leu Arg Glu
1               5                  10                  15
ggc ttg cac cag gag gag ttc cgc cac tgc ctg cgc gag aag ggc gtg    96
Gly Leu His Gln Glu Glu Phe Arg His Cys Leu Arg Glu Lys Gly Val
            20                  25                  30
ttc tac ctc aag ggc acc ggg ctc gcc gag gcg gac cac gcc tcg gcg    144
Phe Tyr Leu Lys Gly Thr Gly Leu Ala Glu Ala Asp His Ala Ser Ala
        35                  40                  45
cgg gag atc gcg gtg gac ttc ttc gag cac ggc agc gag gcg gag aag    192
Arg Glu Ile Ala Val Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys
    50                  55                  60
cgc gcc gtc acc tcg ccc gtc ccc acc acg cgc cgc ggc ttc acc ggg    240
Arg Ala Val Thr Ser Pro Val Pro Thr Thr Arg Arg Gly Phe Thr Gly
65                  70                  75                  80
ctg gag tcg gag agc acc gcg cag atc acg aac acc ggc agc tac tcc    288
Leu Glu Ser Glu Ser Thr Ala GlnIle Thr Asn Thr Gly Ser Tyr  Ser
                85                  90                  95
gac tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg    336
Asp Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro
            100                 105                 110
tcc ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac    384
Ser Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr
        115                 120                 125
acc gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc    432
Thr Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr
    130                 135                 140
gag ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg    480
G1u Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu
145                 150                 155                 160
cgg ttc cgc tac ttc ccg cag gtg ccc gag gat cgc gtg gcc gag gag    528
Arg Phe Arg Tyr Phe Pro Gln Val Pro Glu Asp Arg Val Ala Glu Glu
                165                 170                 175
cag ccg ctg cgg atg gcc ccg cac tac gac ctc tcg atc gtc acc ctg    576
Gln Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Ile Val Thr Leu
            180                 185                 190
atc cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag    624
Ile Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu
        195                 200                 205
gtc ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc    672
Val Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu
    210                 215                 220
gtc ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag    720
Val Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys
225                 230                 235                 240
gcc ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc    768
Ala Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly
                245                 250                 255
agc agc cgc acc tcc agc gtg ttc ttc ctg cgc ccc aac ggg gac ttc    816
Ser Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Gly Asp Phe
            260                 265                 270
cgc ttc tcg gtg ccg cgg gcc agg gag tgc ggg ttc gac gtc ggc ctg    864
Arg Phe Ser Val Pro Arg Ala Arg Glu Cys Gly Phe Asp Val Gly Leu
        275                 280                 285
gac ggc gag acc gcc acg ttc cgg gat tgg atc ggg ggc aac tac gtg    912
Asp Gly Glu Thr Ala Thr Phe Arg Asp Trp Ile Gly Gly Asn Tyr Val
    290                 295                 300
aac atc cgc cgc aca tcc aag gca tag    939
Asn Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>12
<211>939
<212>DNA
<213>人工序列
<220>
<223>H308
<220>
<221>外显子
<222>(1)..(936)
<223>
<400>12
atg acg gac gcg acc gtg ccg acc ttc gat ctg gcc gag ctg cgt gag    48
Met Thr Asp Ala Thr Val Pro Thr Phe Asp Leu Ala Glu Leu Arg Glu
1               5                   10                  15
ggc ttg cac cag gag gag ttc cgc cac tgc ctg cgc gag aag ggc gtg    96
Gly Leu His Gln Glu Glu Phe Arg His Cys Leu Arg Glu Lys Gly Val
            20                  25                  30
ttc tac ctc aag ggc acc ggg ctc gcc gag gcg gac cac gcc tcg gcg    144
Phe Tyr Leu Lys Gly Thr Gly Leu Ala Glu Ala Asp His Ala Ser Ala
        35                  40                  45
cgg gag atc gcg gtg gac ttc ttc gag cac ggc agc gag gcg gag aag    192
Arg Glu Ile Ala Val Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys
    50                  55                  60
cgc gcc gtc acc tcg ccc gtc ccc acc atg cgc cgc ggc ttc acc ggg    240
Arg Ala Val Thr Ser Pro Val Pro Thr Met Arg Arg Gly Phe Thr Gly
65                  70                  75                  80
ctg gag tcg gag agc acc gcg cag atc acg aac acc ggc agc tac tcc    288
Leu Glu Ser Glu Ser Thr Ala Gln Ile Thr Asn Thr Gly Ser Tyr Ser
                85                  90                  95
gac tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg    336
Asp Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro
            100                 105                 110
tcc ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac    384
Ser Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr
        115                 120                 125
acc gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc    432
Thr Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr
    130                 135                 140
gag ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg    480
Glu Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu
145                 150                 155                 160
cgg ttc cgc tac ttc ccg cag gtg ccc gag gat cgc gtg gcc gag gag    528
Arg Phe Arg Tyr Phe Pro Gln Val Pro Glu Asp Arg Val Ala Glu Glu
               165                 170                 175
cag ccg ctg cgg atg gcc ccg cac tac gac ctc tcg atc gtc acc ctg    576
Gln Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Ile Val Thr Leu
            180                 185                 190
atc cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag    624
Ile Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu
        195                 200                 205
gtc ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc    672
Val Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu
    210                 215                 220
gtc ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag    720
Val Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys
225                 230                 235                 240
gcc ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc    768
Ala Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly
               245                 250                 255
agc agc cgc acc tcc agc gtg ttc ttc ctg cgc ccc aac ggg gac ttc    816
Ser Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Gly Asp Phe
            260                 265                 270
cgc ttc tcg gtg ccg cgg gcc agg gag tgc ggg ttc aac gtc ggc ctg    864
Arg Phe Ser Val Pro Arg Ala Arg Glu Cys Gly Phe Asn Val Gly Leu
        275                 280                 285
gac ggc gag acc gcc acg ttc cgg gat tgg atc ggg ggc aac tac gtg    912
Asp Gly Glu Thr Ala Thr Phe Arg Asp Trp Ile Gly Gly Asn Tyr Val
    290                 295                 300
aac atc cgc cgc aca tcc aag gca tag                                939
Asn Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>13
<211>939
<212>DNA
<213>人工序列
<220>
<223>H309
<220>
<221>外显子
<222>(1)..(936)
<223>
<400>13
atg acg gac gcg acc gtg ccg acc ttc gat ctg gcc gag ctg cgt gag    48
Met Thr Asp Ala Thr Val Pro Thr Phe Asp Leu Ala Glu Leu Arg Glu
1               5                   10                  15
ggc ttg cac cag gag gag ttc cgc cac tgc ctg cgc gag aag ggc gtg    96
Gly Leu His Gln Glu Glu Phe Arg His Cys Leu Arg Glu Lys Gly Val
            20                  25                  30
ttc tac ctc aag ggc acc ggg ctc gcc gag gcg gac cac gcc tcg gcg    144
Phe Tyr Leu Lys Gly Thr Gly Leu Ala Glu Ala Asp His Ala Ser Ala
        35                  40                  45
cgg gag atc gcg gtg gac ttc ttc gag cac ggc agc gag gcg gag aag    192
Arg Glu Ile Ala Val Asp Phe Phe Glu His Gly Ser Glu Ala Glu Lys
    50                  55                  60
cgc gcc gtc acc tcg ccc gtc ccc acc acg cgc cgc ggc ttc acc ggg    240
Arg Ala Val Thr Ser Pro Val Pro Thr Thr Arg Arg Gly Phe Thr Gly
65                  70                  75                  80
ctg gag tcg gag agc acc gcg cag atc acg aac acc ggc agc tac tcc    288
Leu Glu Ser Glu Ser Thr Ala GlnIle Thr Asn Thr Gly Ser Tyr  Ser
                85                  90                  95
gac tac tcg atg tgc tac tcg atg ggc acc gcg gac aac ctc ttc ccg    336
Asp Tyr Ser Met Cys Tyr Ser Met Gly Thr Ala Asp Asn Leu Phe Pro
            100                 105                 110
tcc ggt gac ttc gag cgg atc tgg acc cag tac ttc gac cgc cag tac    384
Ser Gly Asp Phe Glu Arg Ile Trp Thr Gln Tyr Phe Asp Arg Gln Tyr
        115                 120                 125
acc gcc tcc cgc gcg gtc gcc cgg gag gtc ctg cgg gcg acc ggg acc    432
Thr Ala Ser Arg Ala Val Ala Arg Glu Val Leu Arg Ala Thr Gly Thr
    130                 135                 140
gag ccc gac ggc ggg gtc gag gcc ttc ctc gac tgc gag ccg ctg ctg    480
Glu Pro Asp Gly Gly Val Glu Ala Phe Leu Asp Cys Glu Pro Leu Leu
145                 150                 155                 160
cgg ttc cgc tac ttc ccg cag gtg ccc gag gat cgc gtg gcc gag gag    528
Arg Phe Arg Tyr Phe Pro Gln Val Pro Glu Asp Arg Val Ala Glu Glu
                165                 170                 175
cag ccg ctg cgg atg gcc ccg cac tac gac ctc tcg atc gtc acc ctg    576
Gln Pro Leu Arg Met Ala Pro His Tyr Asp Leu Ser Ile Val Thr Leu
            180                 185                 190
atc cag cag aca ccc tgc gcc aac ggc ttc gtc agc ctc cag gcc gag    624
Ile Gln Gln Thr Pro Cys Ala Asn Gly Phe Val Ser Leu Gln Ala Glu
        195                 200                 205
gtc ggc ggc gcg ttc acg gac ctg ccc tac cgt ccg gac gcc gtc ctc    672
Val Gly Gly Ala Phe Thr Asp Leu Pro Tyr Arg Pro Asp Ala Val Leu
    210                 215                 220
gtc ttc tgc ggc gcc atc gcg acc ctg gtg acc ggc ggc cag gtc aag    720
Val Phe Cys Gly Ala Ile Ala Thr Leu Val Thr Gly Gly Gln Val Lys
225                 230                 235                 240
gcc ccc cgg cac cat gtc gcg gcc ccc cgc agg gac cag ata gcg ggc    768
Ala Pro Arg His His Val Ala Ala Pro Arg Arg Asp Gln Ile Ala Gly
                245                 250                 255
agc agc cgc acc tcc agc gtg ttc ttc ctg cgc ccc aac ggg gac ttc    816
Ser Ser Arg Thr Ser Ser Val Phe Phe Leu Arg Pro Asn Gly Asp Phe
            260                 265                 270
cgc ttc tcg gtg ccg cgg gcc agg gag tgc ggg ttc aac gtc ggc ctg    864
Arg Phe Ser Val Pro Arg Ala Arg Glu Cys Gly Phe Asn Val Gly Leu
        275                 280                 285
gac ggc gag acc gcc acg ttc cgg gat tgg atc ggg ggc aac tac gtg    912
Asp Gly Glu Thr Ala Thr Phe Arg Asp Trp Ile Gly Gly Asn Tyr Val
    290                 295                 300
aac atc cgc cgc aca tcc aag gca tag                                939
Asn Ile Arg Arg Thr Ser Lys Ala
305                 310
<210>14
<211>5335
<212>DNA
<213>人工序列
<220>
<223>Penrcillium表还盒质粒
<220>
<221>exon
<222>(930)..(1862)
<223>编码序列扩环酶
<400>14
gaattcctta tactgggcct gctgcattgg tctgccattg cagggtatat atggctgacc    60
tggccaatct ccatcgagaa tctgggcgac tgaagaactg cccgcagaca agatggagac    120
tttcgtctag cacggtctag ggcagatccg atgccattgg ctctgtcaac tgtcgactac    180
atgtatctgc atgttgcatc gggaaatccc accacaggga cagccaagcg gccccgcgac    240
ttggcagtgg gcaaactacg cccgattctg gtgccaagaa ccgagaagaa tgagacagac    300
ccacgttgca ctctaaccgg atgctatcga cttacggtgg ctgaagattc aacacgctgc    360
aacgagagcc aaggtggtcc ggacattttc tacgtgccgg tttaccttgg aacatcgccg    420
tcgttgagtg cacgttgcct actctctcgt ggcttggctg ggcccacgag cccgattgac    480
tcgacggtgt tacttgggta tctatggccc cgttttctgg cacggtaatg ataagtactt    540
actagtcttc gagcggggga gtgttgctct gcccgagcat caacgattgg cctgatcgca    600
ccgtctgcaa atgccacggt gcggaccgac tgaaatctca gaccaccaaa gaccctccga    660
cttcgagata cggttactaa ttttacactg gctccagcgg ccccatccag taagcatctg    720
ggctgcaagc gtataatgtc tccaggttgt ctcagcataa acaccccgcc cccgctcagg    780
cacacaggaa gagagctcag gtcgtttcca ttgcgtccat actcttcact cattgtcatc    840
tgcaggagaa cttcccctgt ccctttgcca agccctctct tcgtcgttgt ccacgccttc    900
aagttttcac cattattttt ctagaccat atg gac acg acg gtg ccc acc ttc      953
                                Met Asp Thr Thr Val Pro Thr Phe
                                1               5
agc ctg gcc gaa ctc cag cag ggc ctg cgc cag gac gag ttc cgc agg    1001
Ser Leu Ala Glu Leu Gln Gln Gly Leu Arg Gln Asp Glu Phe Arg Arg
    10                  15                  20
tgt ctg agg gac aag ggc ctc ttc tat ctg acg gac tgc ggt ctg acc    1049
Cys Leu Arg Asp Lys Gly Leu Phe Tyr Leu Thr Asp Cys Gly Leu Thr
25                  30                  35                  40
gac acc gag ctg aag tcg gcc aag gac atc gtc atc gac ttc ttc gag    1097
Asp Thr Glu Leu Lys Ser Ala Lys Asp Ile Val Ile Asp Phe Phe Glu
                45                  50                  55
cac ggc agc gag gcg gag aag cgc gcc gtc acc tcg ccc gtc ccc acc    1145
His Gly Ser Glu Ala Glu Lys Arg Ala Val Thr Ser Pro Val Pro Thr
            60                  65                  70
atg cgc cgc ggc ttc acc ggg ctg gag tcg gag agc acc gcc cag att    1193
Met Arg Arg Gly Phe Thr Gly Leu Glu Ser Glu Ser Thr Ala Gln Ile
        75                  80                  85
acc aat acc ggc agc tac tcc gac tac tcg atg tgc tac tcg atg ggc    1241
Thr Asn Thr Gly Ser Tyr Ser Asp Tyr Ser Met Cys Tyr Ser Met Gly
    90                  95                 100
acc gcg gac aac ctc ttc ccg tcc ggt gac ttc gag cgg atc tgg acc    1289
Thr Ala Asp Asn Leu Phe Pro Ser Gly Asp Phe Glu Arg Ile Trp Thr
105                 110                 115                 120
cag tac ttc gac cgc cag tac acc gcc tcc cgc gcg gtc gcc cgg gag    1337
Gln Tyr Phe Asp Arg Gln Tyr Thr Ala Ser Arg Ala Val Ala Arg Glu
                125                 130                 135
gtc ctg cgg gcg acc ggg acc gag ccc gac ggc ggg gtc gag gcc ttc    1385
Val Leu Arg Ala Thr Gly Thr Glu Pro Asp Gly Gly Val Glu Ala Phe
            140                 145                 150
ctc gac tgc gag ccg ctg ctg cgg ttc cgc tacttc ccg cag gtc ccc    1433
Leu Asp Cys Glu Pro Leu Leu Arg Phe Arg Tyr Phe Pro Gln Val Pro
        155                 160                 165
gag cac cgc agc gcc gag gag cag ccc ctg cgg atg gcg ccg cac tac    1481
Glu His Arg Ser Ala Glu Glu Gln pro Leu Arg Met Ala Pro His Tyr
    170                 175                 180
gac ctg tcg atg gtc acc ctc atc cag cag aca ccc tgc gcc aac ggc    1529
Asp Leu Ser Met Val Thr Leu Ile Gln Gln Thr Pro Cys Ala Asn Gly
185                 190                 195                 200
ttc gtc agc ctc cag gcc gag gtc ggc ggc gcg ttc acg gac ctg ccc    1577
Phe Val Ser Leu Gln Ala Glu Val Gly Gly Ala Phe Thr Asp Leu Pro
                205                 210                 215
tac cgt ccg gac gcc gtc ctc gtc ttc tgc ggc gcc atc gcg acc ctg    1625
Tyr Arg Pro Asp Ala Val Leu Val Phe Cys Gly Ala Ile Ala Thr Leu
            220                 225                 230
gtg acc ggc ggc cag gtc aag gcc ccc cgg cac cat gtc gcg gcc ccc    1673
Val Thr Gly Gly Gln Val Lys Ala Pro Arg His His Val Ala Ala Pro
        235                 240                 245
cgc agg gac cag ata gcg ggc agc agc cgc acc tcc agt gtg ttc ttc    1721
Arg Arg Asp Gln Ile Ala Gly Ser Ser Arg Thr Ser Ser Val Phe Phe
    250                 255                 260
ctc cgt ccc aac gcg gac ttc acc ttc tcc gtc ccg ctg gcg cgc gag    1769
Leu Arg Pro Asn Ala Asp Phe Thr Phe Ser Val Pro Leu Ala Arg Glu
265                 270                 275                 280
tgc ggc ttc aat gtc agc ctg gac ggc gag acc gcc acg ttc cag gat    1817
Cys Gly Phe Asn Val Ser Leu Asp Gly Glu Thr Ala Thr Phe Gln Asp
                285                 290                 295
tgg atc ggg gtc aac tac gtg aac atc cgc cgc aca tcc aag gca        1862
Trp Ile Gly Val Asn Tyr Val Asn Ile Arg Arg Thr Ser Lys Ala
            300                 305                 310
tgataggctc ttcatgacga gaatatgcat cttttgtatg tagcttcaac cgactccgtc    1922
ttcacttctt cgcccgcact gcctaccgtt tgtaccatct gactcatata aatgtctagc    1982
ccctacctac actataccta agggagagaa gcgtagagtg attaacgtac gggcctatag    2042
taccccgatc tctagataga acatttagta gagattagga tgcctaacta atttaacttg    2102
agcattgtcc cgttcatatt gattttcagt ccattataca ctcttaatcg tttcccggta    2162
gaagcctgat atatacgacc atagggtgtg gagaacaggg cttcccgtct gcttggccgt    2222
acttaagcta tatattctac acggccaata ctcaatgtgc ccttagcacc taagcggcac    2282
tctagggtaa gtgcgggtga tataggtgag aagtcttaag actgaagaca ggatatcacg    2342
cgttaccctg caccgtacct actaccttca atatcaactc tttcaggatg gacagggtcg    2402
acactagttc tagagcggcc gccaccgcgg tggagctcca gcttttgttc cctttagtga    2462
gggttaattg cgcgcttggc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat    2522
ccgctcacaa ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc    2582
taatgagtga gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga    2642
aacctgtcgt gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt    2702
attgggcgct cttccgcttc ctcgctcact gactcgctcg gctcggtcgt tcggctgcgg    2762
cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac    2822
gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg    2882
ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca    2942
agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ctctggaagc    3002
tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc    3062
ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag    3122
gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc    3182
ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca    3242
gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg    3302
aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg    3362
aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct    3422
ggtagcggtg gtttttttgt tttcaagcag cagattacgc gcagaaaaaa aggatctcaa    3482
gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa    3542
gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa    3602
tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc    3662
ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga    3722
ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca    3782
atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc    3842
ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat    3902
tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc    3962
attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt    4022
tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc    4082
ttcggctctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg    4142
gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt    4202
gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg    4262
gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga    4322
aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg    4382
taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg    4442
tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt    4502
tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc    4562
atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca    4622
tttccccgaa aagtgccacc tgacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg    4682
gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct    4742
ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg    4802
ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag    4862
ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg    4922
gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc    4982
tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat    5042
gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgct tacaatttcc    5102
attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat    5162
tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt    5222
tttcccagtc acgacgttgt aaaacgacgg ccagtgagcg cgcgtaatac gactcactat    5282
agggcgaatt gggtaccggg ccccccctcg agtgcggccg caagcttgat atc           5335

Claims (15)

1.一种突变型扩环酶,其选自由
H503=D2N+T89V+C281Y、
H504=T89K+C281Y+T293K、
H505=T89K+C281Y、
H601=M73H+T89K+C281Y+A311D、
H602=T89K+Y217H+C281Y+A311D、
H603=T89K+H244R+C281Y+A311D、
H604=T89K+C281Y+R307T+A311D、
H605=T89K+C281Y+R307T+A311D、
H606=M73I+T89K+C281Y+T293K+G300S+R307T+A311D、
H607=T89K+C281Y+T293K+G300S+A311D、
H608=T89K+C281Y+A311D、
H609=M73H+T89K+T213A+C281Y+A311D、
H653=T89V+C281Y+R306Δ+A311D、
H654=T89K+R249C+C281Y+R306Δ+A311D、
H658=D2N+T89V+C281Y+R306Δ+A311D、
H659=T89K+C281Y+R306Δ+A311D、
G601=T89V+A278V+C281L+307缺失+A311D、
G602=D2N+T89V+C155W+P177L+L277T+C281Y+A311D、
G609=D2Y+T89V+C281Y+307缺失+A311D、
G610=D2N+T89V+T105I+G13D+C155W+P177L+C281Y+A311D、
G611=T89V+T105I+G13D+C155W+P177L+C281Q+307缺失+A311D、
G613=T89V+H170Y+D251G+L277Q+C281Y+307缺失+A311D构成的组,
并且其中,所述突变被引入来自Streptomyces clavuligerus的模型扩环酶SEQ ID NO:1中。
2.编码根据权利要求1所述的突变型扩环酶的多核苷酸。
3.包含权利要求2的多核苷酸的表达载体或表达盒。
4.用权利要求2的多核苷酸或权利要求3的载体或表达盒转化过的宿主细胞。
5.一种方法,用于生产权利要求1的突变型扩环酶,所述方法包括将根据权利要求4所述的宿主细胞在有益于生产所述突变型扩环酶的条件下培养。
6.权利要求5的方法,还包括回收所述突变型扩环酶。
7.一种方法,用于生产感兴趣的β-内酰胺化合物,所述方法包括将根据权利要求4所述的宿主细胞在有益于生产所述β-内酰胺化合物的条件下培养。
8.权利要求7的方法,还包括回收所述β-内酰胺化合物。
9.根据权利要求7所述的方法,其还包含对所述β-内酰胺化合物进行N-脱乙酰化,以产生N-脱乙酰的β-内酰胺化合物。
10.权利要求1所述的突变型扩环酶多肽在将青霉烷环扩环为3-头孢环中的用途。
11.权利要求1所述的突变型扩环酶多肽在将己二酰-6-APA的青霉烷环扩环为3-头孢环中的用途。
12.如权利要求10所述的用途,用于生产己二酰-7-ADCA、己二酰-7-ADAC或己二酰-7-ACA。
13.生产己二酰-6-APA的微生物,其用编码权利要求1所述的经改变的扩环酶多肽的DNA片段转化过。
14.用于发酵生产己二酰-7-ADCA的方法,所述方法包含:
a.在己二酰-6-APA的生产条件下,培养能生产己二酰-6-APA的下述微生物,所述微生物用编码权利要求1的经改变的扩环酶的DNA片段转化过;
b.使用所述经改变的扩环酶将所述己二酰-6-APA原位转化为己二酰-7-ADCA;
c.分离想要的己二酰-7-ADCA。
15.用于生产7-ADCA的方法,所述方法包含:
a.在己二酰-6-APA的生产条件下,培养能生产己二酰-6-APA的下述微生物,所述微生物还用编码权利要求1的经改变的扩环酶的DNA片段转化过;
b.使用经改变的扩环酶将所述己二酰-6-APA原位转化为己二酰-7-ADCA;
c.分离想要的己二酰-7-ADCA;
d.将己二酰侧链去除,产生7-ADCA;以及
e.回收7-ADCA。
CN200580034984.4A 2004-10-13 2005-10-11 突变型扩环酶 Expired - Lifetime CN101040043B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP04105022.0 2004-10-13
EP04105022 2004-10-13
EP05106347.7 2005-07-12
EP05106347 2005-07-12
PCT/EP2005/055148 WO2006040313A2 (en) 2004-10-13 2005-10-11 Mutant expandases

Publications (2)

Publication Number Publication Date
CN101040043A CN101040043A (zh) 2007-09-19
CN101040043B true CN101040043B (zh) 2014-05-28

Family

ID=35840672

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580034984.4A Expired - Lifetime CN101040043B (zh) 2004-10-13 2005-10-11 突变型扩环酶

Country Status (6)

Country Link
EP (1) EP1799817B1 (zh)
KR (1) KR20070073779A (zh)
CN (1) CN101040043B (zh)
BR (1) BRPI0515976A (zh)
ES (1) ES2395945T3 (zh)
WO (1) WO2006040313A2 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104805047B (zh) * 2014-01-23 2017-09-22 中国科学院微生物研究所 产头孢菌素g的重组菌及其构建方法与应用
CN107304418B (zh) * 2016-04-18 2022-08-26 百瑞全球有限公司 青霉素扩环酶突变体、编码该突变体的dna、含有该突变体的试剂盒及其应用
CN107557348B (zh) * 2016-07-01 2022-07-08 百瑞全球有限公司 头孢菌素羟化酶突变体、编码该突变体的dna、使用该突变体的方法及其应用
CN112852913B (zh) * 2020-04-17 2021-12-10 中国科学院天津工业生物技术研究所 脱乙酰氧头孢菌素C合成酶突变体及其在β-内酰胺抗生素母核合成中的应用
CN113234093A (zh) * 2021-04-13 2021-08-10 伊犁川宁生物技术股份有限公司 一种3-去乙酰氧基头孢菌素c钠盐及其制备方法
CN115838753B (zh) * 2021-09-18 2024-10-29 中国科学院天津工业生物技术研究所 一种生产7-氨基去乙酰氧基头孢烷酸的方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
PL180799B1 (pl) * 1993-07-30 2001-04-30 Gist Brocades Bv Sposób wydajnego wytwarzania 7-ADCA poprzez 2-(karboksyetylotio)acetylo-7-ADCA i 3-(karboksymetylotio)-propionylo-7-ADCA
US5919680A (en) * 1995-11-27 1999-07-06 Isis Innovation Limited Process for the production of SSC's via expandase activity on penicillin G
WO1998002551A2 (en) * 1996-07-16 1998-01-22 Gist-Brocades B.V. Process for the production of adipoyl cephalosporins
GB0011185D0 (en) * 2000-05-09 2000-06-28 Synpac Pharmaceuticals Limited Protein

Also Published As

Publication number Publication date
WO2006040313A2 (en) 2006-04-20
EP1799817B1 (en) 2012-11-21
CN101040043A (zh) 2007-09-19
KR20070073779A (ko) 2007-07-10
BRPI0515976A (pt) 2008-08-12
EP1799817A2 (en) 2007-06-27
WO2006040313A3 (en) 2006-10-19
ES2395945T3 (es) 2013-02-18

Similar Documents

Publication Publication Date Title
CN108753813B (zh) 获得无标记转基因植物的方法
CN107916275B (zh) 一种利用具有还原tca途径的解脂耶氏酵母菌株好氧合成琥珀酸的方法
CN108486105B (zh) 一种马克斯克鲁维酵母启动子及其制备方法与应用
CN107475267B (zh) 4-羟基异亮氨酸生产质粒与菌株以及4-羟基异亮氨酸的合成方法
CN111592990B (zh) 阿魏酸酯酶的重组表达菌株、制备方法及其应用
CN110540989A (zh) 基于pcr技术克隆已知区域旁邻的未知dna序列的引物及方法
CN111171132B (zh) 乌鳢抗菌肽
CN101302531B (zh) 一种在大肠杆菌-链霉菌-假单胞菌之间穿梭表达的bac载体及其构建方法
CN101040043B (zh) 突变型扩环酶
CN101693901B (zh) 一种大肠杆菌-棒状杆菌穿梭型诱导表达载体pDXW-8及其构建方法
AU684785B2 (en) Marker gene
WO1994026913A9 (en) Marker gene
CN108410870B (zh) 马克斯克鲁维酵母启动子、分泌信号肽及其制备与应用
CN111587964A (zh) 阿魏酸酯酶制剂、复合酶制剂以及蛋鸡复合饲料
CN110004131A (zh) 一种提高赖氨酸脱羧酶活性和稳定性的分子改造方法
CN110734480A (zh) 大肠杆菌分子伴侣GroEL/ES在协助合成植物Rubisco中的应用
CN108728484B (zh) 用于获得无标记转基因植物的载体及其应用
CN104450768B (zh) 一种靶向酵母线粒体的穿梭载体及其应用
AU2020103156A4 (en) A TA Cloning Vector Based on Enzyme Digestion and Its Construction Method
US20100304461A1 (en) Portable, Temperature and Chemically Inducible Expression Vector for High Cell Density Expression of Heterologous Genes in Escherichia Coli
CN110305873A (zh) 共编辑标记ben-1sgRNA靶位点及其CRISPR/Cas9共编辑系统和应用
CN115369099B (zh) 一种米黑根毛霉脂肪酶突变体及提高米黑根毛霉脂肪酶活性和/或甲醇耐受性的方法
CN110157721A (zh) 一种痘苗病毒天坛株的示踪打靶质粒及其制备方法
CN115109791B (zh) 一种基于IncQ型质粒泛宿主的功能基因递送载体、构建方法和应用
CN110747216A (zh) 一种多基因共表达成套载体及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: NETHERLANDS COMPANY OF DSM SINOCHEM PHARMACEUTICAL

Free format text: FORMER OWNER: DSM IP ASSETS BV

Effective date: 20120329

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20120329

Address after: About Holland

Applicant after: DSM SINOCHEM PHARMACEUTICALS NETHERLANDS B.V.

Address before: Holland Heerlen

Applicant before: DSM IP ASSETS B.V.

C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: About Holland

Patentee after: DSM Sinochem Pharmaceuticals Netherlands B.V.

Address before: About Holland

Patentee before: DSM SINOCHEM PHARMACEUTICALS NETHERLANDS B.V.