[go: up one dir, main page]

KR20190086269A - 체내 지속형 재조합 당단백질 및 이의 제조방법 - Google Patents

체내 지속형 재조합 당단백질 및 이의 제조방법 Download PDF

Info

Publication number
KR20190086269A
KR20190086269A KR1020180004589A KR20180004589A KR20190086269A KR 20190086269 A KR20190086269 A KR 20190086269A KR 1020180004589 A KR1020180004589 A KR 1020180004589A KR 20180004589 A KR20180004589 A KR 20180004589A KR 20190086269 A KR20190086269 A KR 20190086269A
Authority
KR
South Korea
Prior art keywords
ser
leu
thr
glu
asp
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Abandoned
Application number
KR1020180004589A
Other languages
English (en)
Inventor
강관엽
김태윤
류재환
김연정
김용재
Original Assignee
재단법인 목암생명과학연구소
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 목암생명과학연구소 filed Critical 재단법인 목암생명과학연구소
Priority to KR1020180004589A priority Critical patent/KR20190086269A/ko
Priority to JP2020536745A priority patent/JP2021510683A/ja
Priority to EP19738515.6A priority patent/EP3738978A4/en
Priority to US16/961,378 priority patent/US20210079062A1/en
Priority to CN201980008176.2A priority patent/CN111788220A/zh
Priority to PCT/KR2019/000479 priority patent/WO2019139416A1/ko
Publication of KR20190086269A publication Critical patent/KR20190086269A/ko
Abandoned legal-status Critical Current

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/549Sugars, nucleosides, nucleotides or nucleic acids
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/54Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic compound
    • A61K47/545Heterocyclic compounds
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/56Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule
    • A61K47/59Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule obtained otherwise than by reactions only involving carbon-to-carbon unsaturated bonds, e.g. polyureas or polyurethanes
    • A61K47/60Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being an organic macromolecular compound, e.g. an oligomeric, polymeric or dendrimeric molecule obtained otherwise than by reactions only involving carbon-to-carbon unsaturated bonds, e.g. polyureas or polyurethanes the organic macromolecular compound being a polyoxyalkylene oligomer, polymer or dendrimer, e.g. PEG, PPG, PEO or polyglycerol
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • C07K14/755Factors VIII, e.g. factor VIII C (AHF), factor VIII Ag (VWF)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/6432Coagulation factor Xa (3.4.21.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21021Coagulation factor VIIa (3.4.21.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • C12Y304/21027Coagulation factor XIa (3.4.21.27)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/35Fusion polypeptide containing a fusion for enhanced stability/folding during expression, e.g. fusions with chaperones or thioredoxin

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Hematology (AREA)
  • Microbiology (AREA)
  • Epidemiology (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

본 발명은 적어도 하나의 당쇄 말단에 생체적합성 중합체가 연결된 구조를 갖는 체내 지속형 재조합 당단백질 및 이의 제조방법을 제공한다.
본 발명에 따른 체내 지속형 재조합 당단백질은, 종래의 당 접합 기술을 이용한 단백질 제조방법에 비하여, 정교하고 안전한 방법을 통하여 단백질 표면이 개질된 것으로, 면역원성이 감소되고 체내 지속성이 향상된 장점이 있다.

Description

체내 지속형 재조합 당단백질 및 이의 제조방법{LONG-ACTING RECOMBINANT GLYCOPROTEINS AND MENUFACTURING METHOD THEREOF}
본 발명은 적어도 하나의 당쇄 말단에 생체적합성 중합체가 연결된 구조를 갖는 체내 지속형 재조합 당단백질 및 이의 제조방법에 관한 것이다.
당단백질은, 단백질 생성 과정 중에 골지체에서 단백질의 잔기에 당 사슬(당쇄)이 연결되어 표면에 당쇄를 포함하고 있는 단백질을 말한다. 당 단백질에서 당쇄의 기능은 단백질의 특성에 큰 영향을 미친다. 예를 들어, 단백질의 수용성을 향상 시키고, 단백질 분해효소로부터 단백질을 보호하고, 면역원성을 감소시키고, 단백질의 세포 내 수송(trafficking) 및 로컬리제이션(localization)의 방향성을 결정하거나 세포 간의 상호 작용에 영향을 미칠 수 있다(Ref: Function and 3D Structure of the N-Glycans on Glycoproteins, Int. J. Mol. Sci. 2012, 13, 8398-8429).
이러한 당쇄의 중요성에 기인하여, 글리코엔지니어링(Glycoengineering)을 통해 단백질의 특성을 개선시키고자 하는 시도는 계속되어 왔다. 예를 들어, 에리스로포이에틴(EPO)를 대상으로 두 개의 추가적인 N-당쇄를 도입함으로 체내에서 반감기를 향상 시킬 수 있다(Glycoengineering: the effect of glycosylation on the properties of therapeutic proteins, J Pharm Sci. 2005 94(8):1626-35). 또한, 암세포 표적 항체 치료제의 경우 글리코엔지니어링을 통해 제작된 푸코오스(fucose)가 결여된 항체는 숙주의 면역 반응을 더 잘 유도하고 치료 효과가 더 우수한 것으로 보고되었다(Production of therapeutic antibodies with controlled fucosylation, MAbs. 2009 1(3): 230-236). 이러한 당쇄 공학을 이용하는 방법은 기존의 화학적 방법보다 부 반응에 의한 부산물의 발생이 최소화될 수 있으며 효율적인 장점이 있다.
한편, 이와 같이 당쇄 변화를 통해 당단백질의 특성을 개선하는 방법 중 보다 정교한 당쇄 변화를 구현하고자 당대사공학(metabolic glycoengineering)을 적용하는 시도가 이루어지고 있으나, 구체적인 응용 및 상업적 활용은 아직 미진한 실정이다.
본 발명의 목적은 적어도 하나의 당쇄 말단에 도입된 시알산 유도체에 생체적합성 중합체가 연결된 체내 지속형 재조합 당단백질을 제공하는 것이다.
본 발명의 다른 목적은 대사 표지(metabolic labeling) 기법을 적용하여 당단백질의 적어도 하나의 당쇄 말단의 시알산이 아지드기 또는 알킨기가 도입된 시알산 유도체로 개질된 체내 지속형 재조합 당단백질을 제조하는 방법을 제공하는 것이다.
본 발명의 또 다른 목적은 상기 당쇄 말단의 시알산 유도체에 생체적합성 중합체를 도입하여 개질된 체내 지속형 재조합 당단백질을 제조하는 방법을 제공하는 것이다.
상기 목적을 달성하기 위해,
본 발명의 일 구현예는 당단백질의 적어도 하나의 당쇄 말단의 시알산 유도체에 결합된 하기 화학식 1로 표시되는 링커를 포함하는, 체내 지속형 재조합 당단백질을 제공한다.
[화학식 1]
Figure pat00001
R1 및 R2는 각각 독립적으로, C1- 8알킬, C6- 12아릴, C3- 6사이클로알킬, 3 내지 10원의 헤테로사이클로알킬, 아미노, (아미노)C1- 6알킬, (아미노)C3- 6사이클로알킬, (아미노)C6-12아릴, (아미노)(3 내지 10원의 헤테로사이클로알킬) 또는 5 내지 12원의 헤테로아릴이거나(이때, 상기 헤테로사이클로알킬 및 헤테로아릴은 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있고, 여기서, 상기 아미노는 H, 할로겐, CN, C1- 6알킬, 할로C1 - 3알킬 또는 C1- 6알콕시카보닐로 이루어진 군으로부터 선택되는 하나 이상의 치환기로 치환될 수 있다), 상기 R1과 R2는 서로 결합하여 8 내지 16원 헤테로융합고리를 형성할 수 있고(이때, 상기 헤테로융합고리는 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있다),
상기 링커는 R1, R2 또는 R1과 R2가 서로 결합하여 형성하는 고리 중 적어도 하나에 연결된 생체적합성 중합체를 포함한다.
또한, 본 발명의 다른 구현예는 (1) 당단백질을 코딩하는 뉴클레오타이드를 포함하는 발현 벡터를 숙주 세포에 도입하는 단계 및 (2) 상기 숙주 세포를 제1 작용기가 부착된 시알산 생성 대사물(sialic acid metabolite)의 유도체가 첨가된 배양액에서 배양하여, 적어도 하나의 당쇄 말단에 제1 작용기가 부착된 시알산 유도체가 도입된 당단백질을 수득하는 단계를 포함하는, 체내 지속형 재조합 당단백질의 제조방법을 제공한다.
또한, 본 발명의 또 다른 구현예는 상기 단계 (2) 처리 후, (3) 상기 배양액으로부터 시알산 생성 대사물의 유도체를 제거하는 단계, (4) 상기 배양액에 제2 작용기 및 생체적합성 중합체가 부착된 화합물을 첨가하여 클릭 반응(click reaction)을 시키는 단계 및 (5) 적어도 하나의 당쇄 말단에 생체적합성 중합체가 부착된 당단백질을 회수하는 단계를 포함하는 체내 지속형 재조합 당단백질의 제조방법을 제공한다.
본 발명에 따른 체내 지속형 재조합 당단백질은 단백질 표면에 존재하는 당쇄에 폴리에틸렌글리콜과 같은 생체적합성 중합체가 접합됨으로써, 체내에서 당 단백질 자체의 면역원성을 줄이고 체내 지속성을 향상시킬 수 있다. 또한, 본 발명에 따른 체내 지속형 재조합 당단백질을 제조하는 방법은 재조합 DNA 기술을 이용한 목적 당단백질 발현에서 해당 숙주 세포의 정상적인 당 대사과정을 이용함으로써, 당쇄와 생체적합성 중합체의 접합 효율과 정확성이 높은 장점이 있다. 따라서, 종래의 당 접합 기술을 이용한 당단백질의 당쇄 변환 방법에 비하여, 안정적이고 공정 경제적으로 개질된 재조합 단백질을 제공할 수 있다.
도 1은 실시예 1.1.에서 scFVIII G4 B3 를 숙주세포에 형질감염시 사용한 발현 벡터의 지도이다.
도 2는 실시예 1.2.에서 scFVIII G4_B3의 정제 과정을 SDS PAGE로 분석한 결과이다(레인 1: 분자량 마커, 레인 2: 세포 배양 배지 농축액, 레인 3: VIII select 용출액, 레인 4: 정제된 scFVIII G4 B3).
도 3은 실시예 2.1.에서 세포 배양 과정 및 각 사이클의 세부 단위를 나타낸 것이다.
도 4a 및 도 4b는 각각, Ac4ManAl가 첨가된 scFVIII G4 B3 발현 세포주와 Ac4ManAl가 첨가되지 않은 scFVIII G4 B3 발현 세포주의 성장곡선 및 scFVIII G4 B3 발현량을 나타낸 것이다.
도 5는 Ac4ManAz가 첨가된 scFVIII G4 B3 발현 세포주와 Ac4ManAz가 첨가되지 않은 scFVIII G4 B3 발현 세포주의 scFVIII G4 B3 발현량을 나타낸 것이다.
도 6a는 scFVIII G4 B3 Az의 글리코페길레이션(glycopegylation) 반응산물과 정제된 scFVIII G4 B3 Az 를 SDS PAGE로 분석한 결과이다(레인 1: 분자량 마커, 레인 2: scFVIII G4 B3 Az 과 20kDa DBCO PEG 반응산물, 레인 3: scFVIII G4 B3 Az 과 30kDa DBCO PEG 반응산물, 레인 4: scFVIII G4 B3 Az과 40kDa DBCO PEG 반응산물, 레인 5: 정제된 scFVIII G4 B3 Az).
도 6b는 scFVIII G4 B3 Az의 글리코페길레이션 반응산물과 정제된 scFVIII G4 B3 Az 를 SDS PAGE로 분석한 결과이다(레인 1: 분자량 마커, 레인 2: 정제된 scFVIII G4 B3 Az, 레인 3: scFVIII G4 B3 Az과 10kDa DBCO PEG 반응산물).
도 6c는 scFVIII G4 B3 Az 와 scFVIII G4 B3 Az 의 글리코페길레이션 반응산물의 정제물을 SDS PAGE로 분석한 결과이다(레인 1: 분자량 마커, 레인 2: 정제된 scFVIII G4 B3 Az, 레인 3: 정제된 20kDa DBCO PEG 접합 scFVIII G4 B3 Az, 레인 4: 분자량 마커).
도 6d는 scFVIII G4 B3 Az의 글리코페길레이션 반응산물의 정제물을 SDS PAGE로 분석한 결과이다(레인 1: 분자량 마커, 레인 2: 정제된 10kDa DBCO PEG 접합 scFVIII G4 B3 Az).
도 7은 Cu2 + 존재 하에서 scFVIII G4 B3 Al에 azide-PEG40kDa를 첨가하여 클릭반응시킨 산물을 SDS PAGE로 분석한 결과이다.
도 8은 글리코페길화 FVIII를 정맥 주사 투여 후 시간의 흐름에 따라 혈액 내에 잔존하는 인자 VIII의 활성을 비페길화 FVIII과 비교한 것을 나타낸 것이다.
도 9는 글리코페길화 FVIII를 피하 주사 투여 후 시간의 흐름에 따라 혈액 내에 잔존하는 인자 VIII의 활성을 비페길화 FVIII 과 비교한 것을 나타낸 것이다.
도 10a는 글리코페길화 FVIII를 피하 주사 투여 후 시간의 흐름에 따라 혈액 내에 잔존하는 인자 VIII의 활성을 비페길화 FVIII 과 비교한 것을 나타낸 것이다.
도 10b는 글리코페길화 FVIII를 피하 주사 투여 후 시간의 흐름에 따라 혈액 내에 잔존하는 인자 VIII의 활성을 비페길화 FVIII 과 비교한 것을 나타낸 것이다.
본 발명의 일 측면은, 당단백질의 적어도 하나의 당쇄 말단의 시알산 유도체에 결합된 하기 화학식 1로 표시되는 링커를 포함하는, 체내 지속형 재조합 당단백질을 제공할 수 있다.
[화학식 1]
Figure pat00002
R1 및 R2는 각각 독립적으로, C1- 8알킬, C6- 12아릴, C3- 6사이클로알킬, 3 내지 10원의 헤테로사이클로알킬, 아미노, (아미노)C1- 6알킬, (아미노)C3- 6사이클로알킬, (아미노)C6-12아릴, (아미노)(3 내지 10원의 헤테로사이클로알킬) 또는 5 내지 12원의 헤테로아릴이거나(이때, 상기 헤테로사이클로알킬 및 헤테로아릴은 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있고, 여기서, 상기 아미노는 H, 할로겐, CN, C1- 6알킬, 할로C1 - 3알킬 또는 C1- 6알콕시카보닐로 이루어진 군으로부터 선택되는 하나 이상의 치환기로 치환될 수 있다), 상기 R1과 R2는 서로 결합하여 8 내지 16원 헤테로융합고리를 형성할 수 있고(이때, 상기 헤테로융합고리는 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있다),
상기 링커는 R1, R2 또는 R1과 R2가 서로 결합하여 형성하는 고리 중 적어도 하나에 연결된 생체적합성 중합체를 포함한다.
당단백질은 단백질의 잔기에 당쇄가 이중 결합으로 연결되어 있는 것으로, 단백질 표면의 당쇄를 개질시키는 것은 단백질의 수용성을 향상시키거나, 단백질 분해 효소로부터 보호하거나, 세포간 산호 작용에서 단백질의 방향성을 결정하는 등 단백질의 특성에 영향을 미칠 수 있는 것이 알려져 있다.
이에, 본 발명자들은 당단백질의 체내 지속성 및 안정성을 개선시키기 위하여, 당대사공학(metabolic glycoengineering)을 이용하여 단백질의 당쇄를 상기 화학식 1의 링커를 통해 생체적합성 중합체와 접합시켜 본 발명을 완성하였다.
구체적으로, 본 발명은 세포 독성을 갖는 구리와 같은 촉매를 필요로 하지 않는 아지드(azide)-알킨(alkyne) 고리화 반응(클릭 반응; click reaction)을 이용하여 당단백질에 생체적합성 중합체를 표지한 것이다. 다른 화학 반응과 달리 체내에서도 전구체를 대상으로 화학 반응이 가능한 것은 전구체에 미리 도입된 반응기가 아지드나 알킨으로서 체내에 존재하는 물질의 방해 없이 화학 반응이 가능하기 때문이다.
상기 당단백질은 인자 VIIa (activated 인자 VII), 인자 VIII, 인자 IX, 에리스로포에틴(erythropoietin), 안티트롬빈(antithrombin), IDS(iduronate-2-sulfatase), 이미글루세라제(imiglucerase), 아갈시다제 알파(agalsidase-alpha), 아갈시다제 베타(agalsidase-beta), 히알루로니다아제(hyaluronidase), 알글루코시다아제 알파(alglucosidase alfa), GalNAc 4-설퍼타아제(GalNAc 4-sulfatase), 인간 디엔에이 가수분해효소(human DNAse), 이자리파아제(pancrelipase), 항 혈소판 글로불린(anti-thrombocyte globulin), 폴리트로핀 베타(follitropin beta), 폴리트로핀 알파(follitropin alpha), LH(luteinizing hormone), 골형성단백질(osteogenic protein-1), 융모생식선자극호르몬 알파(choriogonadotropin alfa), 갑상선자극호르몬 알파(thyrotropin alpha), 소마트로핀(somatropin), 달베포에틴 알파(darbepoetin alfa), 에포에틴 베타(epoetin-beta), 에포에틴 알파(epoetin-alpha), 드로트레코긴 알파(drotrecogin alfa), 재조합 치료용 모노클로널 항체(recombinant therapeutic monoclonal antibody), 인터페론 알파(interferon alfa), 인터페론 베타(interferon beta), 인터페론-γ(interferon-γ), 에나터셉트(etanercept), 조직 플라스미노겐 활성인자(tissue plasminogen activator), 폰 빌레브란트 인자(von willebrand factor), 에포에틴 델타(epoetin delta), 베라글루세라아제 알파(velaglucerase alfa), β-글루코스레보로시다아제(β-glucocerebrosidases), 탈리글루세라제 알파(taliglucerase alfa), 둘라글루타드(dulaglutide), 과립구 마크로파지콜로니 자극인자(granulocyte macrophage colony stimulating factor), α1-항트립신(α1-antitrypsin), 키모트립신(chymotrypsin), 란피르나제(ranpirnase), 레노그라스팀(lenograstim), BSSL(bucelipase alfa), 우로키나아제 알파(urokinase alfa), IGFBP-6(insulin growth factor binding protein 6), TGF β1(transforming growth factor β1), 사그라모스팀(sargramostim), 인터류킨-3(interleukin-3), 프로우로키나아제(prourokinase), 림포톡신(lymphotoxin), C1-INH(C1-esterase inhibitor), 아스파라기나아제(asparaginase), 콜린에스터라아제(cholinesterase), 트롬보포이에틴(trombopoietin), 렙틴(leptin), FSH, IFN-α2, α-글루코시다아제(α-glucosidase), α-갈락토시다아제(α-galactosidase), 갈설파제(galsulfase), α-L-이듀로니다아제(α-L-iduronidase)로 이루어진 군으로부터 선택된 적어도 하나일 수 있으나, 이에 제한되지 않는다.
상기 생체적합성 중합체는 폴리에틸렌글리콜(PEG), 폴리시알산(PSA), 폴리옥사졸린, 헤파로산(heparosan)으로 이루어진 군으로부터 선택된 적어도 하나일 수 있으며, 바람직하게는 폴리에틸렌글리콜이다.
또한, 상기 폴리에틸렌글리콜의 중량평균분자량은 5 내지 40 kDa일 수 있고, 5 내지 30 kDa, 또는 5 내지 20 kDa일 수 있다. 분자량이 40 kDa이하인 작은 크기의 폴리에틸렌글리콜을 다중 접합시킴으로써, 이보다 큰 분자량을 갖는 폴리에틸렌글리콜 접합시 생기는 PEG 독성이 발생할 우려가 적고, 당단백질의 반감기를 보다 향상시키고 피하투여시 생체 이용율을 향상시킬 수 있다.
또한, 상기 화학식 1의 구조는 하기 화학식 2 내지 18 및 이들의 이성질체로 이루어진 군으로부터 선택된 적어도 하나일 수 있다.
[화학식 2]
Figure pat00003
[화학식 3]
Figure pat00004
[화학식 4]
Figure pat00005
[화학식 5]
Figure pat00006
[화학식 6]
Figure pat00007
[화학식 7]
Figure pat00008
[화학식 8]
Figure pat00009
[화학식 9]
Figure pat00010
[화학식 10]
Figure pat00011
[화학식 11]
Figure pat00012
[화학식 12]
Figure pat00013
[화학식 13]
Figure pat00014
[화학식 14]
Figure pat00015
[화학식 15]
Figure pat00016
[화학식 16]
Figure pat00017
[화학식 17]
Figure pat00018
[화학식 18]
Figure pat00019
이때, L은 단일결합, 할로겐, C1- 8알킬, C6- 12아릴, -CO-, -R3CONR3-, -OCONR3- 또는 -R3NCOR3- 일 수 있고(상기 R3는 각각 독립적으로 H, C1- 4알킬, C6- 12아릴로부터 선택될 수 있다), X는 생체적합성 중합체이다.
구체적으로, 상기 화합물은 아래와 같은 화학식 19 내지 26으로 표시되는 화합물 중 어느 하나일 수 있으며, 이때 n은 100 내지 3,000의 정수이다.
[화학식 19]
Figure pat00020
[화학식 20]
Figure pat00021
[화학식 21]
Figure pat00022
[화학식 22]
Figure pat00023
[화학식 23]
Figure pat00024
[화학식 24]
Figure pat00025
[화학식 25]
Figure pat00026
[화학식 26]
Figure pat00027
본 발명의 일 실시예로, 상기 당단백질은 인자 VIII(FVIII) 단백질일 수 있다. 야생형 인자 VIII 단백질은 A1-a1-A2-a2-B-a3-A3-C1-C2 도메인으로 구성되는 것으로, 간세포에서 단쇄의 단백질로 발현된 후 퓨린으로 처리된 후 성숙되어 중쇄와 경쇄를 포함하는 280kDa의 헤테로 이량체를 형성한다. 본 발명에서 개질할 수 있는 인자 VIII 단백질은 일반적인 인자 VIII로, 서열번호 1로 표시될 수 있고, 바람직하게는 단쇄 형태의 인자 VIII(scFVIII)일 수 있다.
또한, 상기 인자 VIII 단백질은 연속적으로 또는 비연속적으로 일부가 결실된 B 도메인 영역과 일부가 결여된 a3 영역 포함하고, 상기 연속적으로 또는 비연속적으로 일부가 결실된 B 도메인 영역과 일부가 결여된 a3 영역을 포함하는 단쇄 형태의 인자 VIII는, 서열번호 2(서열번호 1에서 B 도메인과 a3 도메인 영역의 아미노산 잔기 789-1653 이 결실된 형태), 서열번호 3(서열번호 1에서 B 도메인과 a3 도메인 영역의 아미노산 잔기 833-1653이 결실된 형태), 서열번호 4(서열번호 1에서 B 도메인과 a3 도메인 영역의 아미노산 잔기 903-1653이 결실된 형태), 서열번호 5(서열번호 1에서 B 도메인과 a3 도메인 영역의 아미노산 잔기 966-1653이 결실된 형태), 서열번호 6(서열번호 1에서 B 도메인과 a3 도메인 영역의 아미노산 잔기 903-1636 및 1643-1653이 결실된 형태), 서열번호 7(서열번호 1에서 B 도메인과 a3 도메인 영역의 아미노산 잔기 966-1653이 결실된 형태), 서열번호 8(서열번호 4에서 아미노산 잔기 782위치의 이소류신이 시스테인으로 치환된 형태) 중 어느 하나를 포함할 수 있다.
또한, 상기 인자 VIII 단백질은 다양하게 변형된 펩티드, 즉 변이체를 포함할 수 있다. 상기 변형은 인자 VIII의 기능을 변형시키지 않는 내에서 하나 이상의 단백질을 치환, 결실 또는 추가하는 방법을 통하여 수행될 수 있다. 이러한 다양한 펩티드는 서열번호 2 내지 8의 아미노산 서열 중 어느 하나와 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 동일한 것일 수 있다.
또한, 상기 인자 VIII 단백질에서 상기 링커가 연결되는 당쇄는, 서열번호 1의 아미노산 서열을 기준으로, 아미노산 잔기 42, 239, 582, 757, 784, 828, 900, 963, 1001, 1005, 1055, 1066, 1185, 1255, 1259, 1282, 1300, 1412, 1442, 1810 및 2118 중 적어도 하나의 위치에 포함될 수 있다. 이와 같이 단쇄형 인자 VIII(scFVIII)을 포함하는 인자 VIII 단백질은 표면에 다수의 당쇄를 갖고 있어 본 발명에 따라 당대사공학을 적용하여 단백질의 표면을 개질시키기에 적합하다.
또한, 본 발명의 다른 측면은, (1) 당단백질을 코딩하는 뉴클레오타이드를 포함하는 발현 벡터를 숙주 세포에 도입하는 단계 및 (2) 상기 숙주 세포를 제1 작용기가 부착된 시알산 생성 대사물의 유도체가 첨가된 배양액에서 배양하는 단계를 포함하는 체내 지속형 재조합 당단백질의 제조방법을 제공할 수 있다.
상기 단계 (1)에서, 상기 당단백질은 인자 VIII 단백질일 수 있고, 이때 당단백질의 서열은 서열번호 2 내지 8 중 어느 하나의 아미노산 서열일 수 있고, 상기 뉴클레오타이드의 핵산 서열은 서열번호 9 내지 15 중 어느 하나의 염기 서열일 수 있다. 또한, 상기 뉴클레오타이드는 신호 서열(signal sequence) 또는 리더 서열(leader sequence)을 추가적으로 포함할 수 있다.
여기에서 사용된 용어 "신호 서열"은 융합 단백질의 분비를 지시하는 신호펩타이드를 코딩하는 핵산을 의미한다. 상기 신호펩타이드는 숙주 세포에서 번역된 후에 절단된다. 구체적으로, 본 발명의 신호 서열은 ER(endoplasmic reticulum) 막을 관통하는 단백질의 이동을 개시하는 아미노산 서열을 코딩하는 폴리뉴클레오타이드다. 본 발명에서 유용한 신호 서열은 항체 경쇄 신호 서열, 예를 들면 항체 14.18(Gillies et al., J. Immunol. Meth 1989. 125:191-202), 항체 중쇄 신호 서열, 예를 들면, MOPC141 항체 중쇄 신호 서열(Sakano et al., Nature, 1980. 286: 676-683), 및 당업계에 알려진 다른 신호서열(예, Watson et al., Nucleic Acid Research, 1984. 12:5145-5164를 참조)을 포함한다.
신호 펩타이드는 당업계에 그 특징이 잘 알려져 있으며, 통상 16 내지 30개의 아미노산 잔기를 포함하나, 그보다 더 많거나 적은 아미노산 잔기를 포함할 수 있다. 통상적인 신호 펩타이드는 기본 N-말단 영역, 중심의 소수성 영역, 및 보다 극성인(polar) C-말단 영역의 세 영역으로 구성된다.
중심 소수성 영역은 미성숙 폴리펩티드가 이동하는 동안 막지질 이중층을 통하여 신호 서열을 고정시키는 4 내지 12개의 소수성 잔기를 포함한다. 개시 이후에, 신호 서열은 흔히 신호 펩티다아제(signal peptidases)로 알려진 세포 효소에 의하여 ER의 루멘(lumen) 내에서 절단된다. 이때, 상기 신호 서열은 tPa(tissue Plasminogen Activation), HSV gDs(signal sequence of Herpes simplex virus glycoprotein D), 또는 성장 호르몬(growth hormone)의 분비신호 서열일 수 있다. 바람직하게, 포유동물 등을 포함하는 고등 진핵 세포에서 사용되는 분비 신호 서열을 사용할 수 있다. 또한, 본 발명의 분비 신호 서열은 야생형 IL-7에 포함된 신호서열을 사용하거나, 숙주세포에서 발현 빈도가 높은 코돈으로 치환하여 사용할 수 있다.
또한, 상기 발현 벡터는 숙주 세포에 도입되어 숙주 세포 유전체 내로 재조합 및 삽입될 수 있는 것이다. 상기 벡터는 선형 핵산, 플라스미드, 파지미드, 코스미드, RNA 벡터, 바이러스 벡터 및 이의 유사체들을 포함한다. 바이러스 벡터의 예로는 레트로바이러스, 아데노바이러스, 및 아데노-관련 바이러스를 포함하나 이에 제한되지 않는다. 또한, 상기 플라스미드는 항생제 내성 유전자와 같은 선별 마커를 포함할 수 있고, 플라스미드를 유지하는 숙주 세포는 선택적인 조건하에서 배양될 수 있다.
또한, 본 발명에서 사용된 용어 "숙주 세포"는 재조합 발현 벡터가 도입될 수 있는 원핵 및 진핵 세포를 나타낸다. 본 발명에서 사용된 용어, "형질주입된", "형질전환된" 및 "형질감염된"은 당업계에 공지된 기술을 사용하여 세포 내로 핵산(예를 들어, 벡터)을 도입하는 것을 의미한다. 적절한 숙주 세포는, 본 발명의 염기서열이 형질주입 또는 형질감염되어, 인자 VIII 단백질의 발현 및/또는 분비에 이용될 수 있으며, 본 발명에 사용될 수 있는 바람직한 숙주 세포는 대장균, 불사의 하이브리도마 세포, NS/0 골수종 세포, 293 세포, 중국 햄스터 난소 세포(CHO cell), HeLa 세포, 인간 양수 유래 세포(CapT cell) 또는 COS 세포를 포함한다. 예를 들어, 본 발명에서 인자 VIII 단백질을 발현시키는데 사용된 숙주 균주는 CHO-S가 가장 바람직하며, 상기 유전자 및 이들의 사용 방법은 당 업계에 공지되어 있다.
또한, 상기 단계 (2)에서, 상기 숙주 세포를 배양시 제1 작용기가 부착된 시알산 생성 대사물의 유도체를 첨가하는 것은 숙주 세포 단백질의 시알산 생성 대사 경로를 통해 당단백질의 당쇄의 말단에 제1 작용기가 부착된 시알산 유도체를 도입시키기 위한 것이다. 즉, 단계 (2)에서 상기 당단백질은 제1 작용기가 부착된 시알산 유도체로 개질될 수 있다.
여기서, 상기 제1 작용기는 아지드기 또는 알킨기일 수 있다. 또한, 상기 시알산 생성 대사물의 유도체는 세포 내에 효율적으로 전달되기 위하여 아세틸기 또는 에틸기, 프로필기 등의 알킬기를 포함할 수 있다. 상기 알킬기는 제1 작용기가 부착된 시알산 생성 대사물의 히드록실기와 에스테르결합하여 세포 투과를 용이하게 하고, 세포 투과 후 세포 내의 에스테라제에 의해 제거됨으로써 첨가된 시알산 생성 대사물이 당쇄의 일부로 치환되는 것을 방해하지 않는다.
또한, 상기 단계 (2)에서, 상기 당단백질의 시알산 생합성 경로의 중간 물질인 시알산 생성 대사물을 대체할 수 있는, 상기 시알산 생성 대사물의 유도체는 하기 화학식 27 내지 32 및 이들의 이성질체로 이루어진 군으로부터 선택된 적어도 하나의 화합물일 수 있다.
[화학식 27]
Figure pat00028
[화학식 28]
Figure pat00029
[화학식 29]
[화학식 30]
Figure pat00031
[화학식 31]
Figure pat00032
[화학식 32]
Figure pat00033
한편, 상기 단계 (2)에서, 시알산 생성 대사물의 유도체는 상기 동물 세포 유래 숙주세포의 농도가 1.0x 105 이상일 때, 0.1 내지 300 mM 농도로 첨가될 수 있다. 본원 발명에 따른 방법은 세포의 당 대사 과정을 이용하기 때문에, 상기 제1 작용기를 포함하는 시알산 생성 대사물은 목적 당단백질 뿐만 아니라, 숙주 세포의 모든 당 단백질과 연관된 대사의 대사 물질에 치환될 수 있다. 따라서, 당쇄 변환의 목적으로 단백질에 높은 비율로 제1 작용기를 도입하기 위해, 상기 숙주 세포의 농도가 높을 때 바람직하게는 세포 농도 1.0x 105 이상일 때 시알산 생성 대사물의 유도체를 첨가하는 것이 바람직하다.
숙주 세포의 성장기에는 상기 시알산 생성 대사물의 유도체가 첨가되지 않은 상태에서 배양을 진행하고, 일정 세포 성장 후 세포 배양 조건을 세포 성장률을 낮추고 세포 생존을 유지시키는 조건으로 전환한 후, 상기 제1 작용기를 포함하는 시알산 생성 대사물 유도체가 첨가된 배양액에서 숙주 세포를 배양하는 것이 바람직하다. 숙주 세포의 성장이 저하된 시기에 첨가된 시알산 생성 대사물은 세포가 성장하는 시기 보다 높은 비율로 목적 단백질 당쇄의 시알산에 도입될 수 있다.
이때, 세포 성장률을 낮추는 조건으로는 온도를 낮게 조절하거나 배양 배지의 영양 성분을 제한하는 방법이 있다. 구체적으로, 시알산 생성 대사물 유도체 첨가시 배양 온도를 세포 성장기의 37℃에서 29 내지 35℃로 전환하는 경우 세포 성장은 늦추어지지만 목적 단백질의 발현은 10 일 이상 지속될 수 있다. 또한, 세포 배양 배지에서 생물학적 성장인자, 비타민, 필수 아미노산 류 등의 영양소의 농도를 낮출 수 있다. 예를 들어, 인자 VIII의 당쇄를 대사 표지(metabolic labeling) 하는 경우 부티르산(butylic acid)과 같은 물질을 첨가함으로써 세포 주기에 영향을 주어 성장을 정지시키고 인자 VIII 의 발현은 그대로 유지시켜 인자 VIII의 당쇄에 도입되는 제1 작용기로 치환된 시알산 유도체 비율을 높일 수 있다.
또한, 상기 단계 (2)로부터 제1 작용기가 부착된 시알산 유도체를 포함하는 당쇄를 갖는 당단백질을 정제하고, (3) 상기 배양액으로부터 시알산 생성 대사물의 유도체를 제거하는 단계, (4) 상기 배양액에제2 작용기 및 생체적합성 중합체가 부착된 화합물을 첨가하여 클릭 반응(click reaction)을 시키는 단계 및 (5) 적어도 하나의 당쇄 말단에 생체적합성 중합체가 부착된 당단백질을 회수하는 단계를 더 포함할 수 있다.
상기 당단백질의 시알산 유도체의 제1 작용기와 제2 작용기를 반응시키기 위해서는, 배양액에 과량으로 존재하는 시알산 생성 대사물의 유도체를 제거할 필요가 있다.
여기서, 상기 제1 작용기는 아지드기 또는 알킨기일 수 있다. 또한, 상기 제1 작용기가 아지드기일 때, 제2 작용기는 알킨기 또는 사이클로알킨기이고, 제1 작용기가 알킨기일 때, 제2 작용기는 아지드기일 수 있다.
구체적으로, 상기 단계 (4)에서, 본 발명의 방법의 상기 단계 (2)에 따라 목적 단백질의 당쇄에 도입된 아지드기 또는 알킨기를 갖는 시알산 유도체를 대상으로, 클릭 반응을 이용하여 생체적합성 중합체를 접합시킬 수 있다. 예를 들어, 상기 단계 (2)에서 아지드기가 부착된 시알산 생성 대사물 유도체를 사용한 경우, 상기 단계 (4)에서 알킨기 또는 사이클로알킨기 및 생체적합성 중합체가 부착된 화합물을 사용할 수 있고, 상기 단계 (2)에서 알킨기가 부착된 시알산 생성 대사물 유도체를 사용한 경우, 상기 단계 (4)에서 아지드기 및 생체적합성 중합체가 부착된 화합물을 사용할 수 있다.
상기 단계 (4)에서 제2 작용기 및 생체적합성 중합체가 부착된 화합물은 아래 화학식 33 내지 49 및 이들의 이성질체로 이루어진 군으로부터 선택되는 적어도 하나의 화합물인 것이 바람직하다.
[화학식 33]
Figure pat00034
[화학식 34]
Figure pat00035
[화학식 35]
Figure pat00036
[화학식 36]
Figure pat00037
[화학식 37]
Figure pat00038
[화학식 38]
Figure pat00039
[화학식 39]
Figure pat00040
[화학식 40]
Figure pat00041
[화학식 41]
Figure pat00042
[화학식 42]
Figure pat00043
[화학식 43]
Figure pat00044
[화학식 44]
Figure pat00045
[화학식 45]
Figure pat00046
[화학식 46]
Figure pat00047
[화학식 47]
Figure pat00048
[화학식 48]
Figure pat00049
[화학식 49]
Figure pat00050
이때, L은 단일결합, 할로겐, C1- 8알킬, C6- 12아릴, -CO-, -R3CONR3-, -OCONR3- 또는 -R3NCOR3- 일 수 있고(상기 R3는 각각 독립적으로 H, C1- 4알킬, C6- 12아릴로부터 선택될 수 있다), X는 생체적합성 중합체이다.
또한, 상기 단계 (4)에서 회수되는 당단백질은, 적어도 하나의 당쇄 말단의 시알산 유도체에 결합된 하기 화학식 1로 표시되는 링커를 포함하는 것으로, 그 구체적인 물성 또는 예시는 본 발명에 따른 체내 지속형 재조합 당단백질에 대해 전술한 바와 같다:
[화학식 1]
Figure pat00051
R1 및 R2는 각각 독립적으로, C1- 8알킬, C6- 12아릴, C3- 6사이클로알킬, 3 내지 10원의 헤테로사이클로알킬, 아미노, (아미노)C1- 6알킬, (아미노)C3- 6사이클로알킬, (아미노)C6-12아릴, (아미노)(3 내지 10원의 헤테로사이클로알킬) 또는 5 내지 12원의 헤테로아릴이거나(이때, 상기 헤테로사이클로알킬 및 헤테로아릴은 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있고, 여기서, 상기 아미노는 H, 할로겐, CN, C1- 6알킬, 할로C1 - 3알킬 또는 C1- 6알콕시카보닐로 이루어진 군으로부터 선택되는 하나 이상의 치환기로 치환될 수 있다), 상기 R1과 R2는 서로 결합하여 8 내지 16원 헤테로융합고리를 형성할 수 있고(이때, 상기 헤테로융합고리는 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있다),
상기 링커는 R1, R2 또는 R1과 R2가 서로 결합하여 형성하는 고리 중 적어도 하나에 연결된 생체적합성 중합체를 포함한다.
이하, 본 발명을 하기 실시예에 의하여 더욱 상세하게 설명한다. 단, 하기 실시예는 본 발명을 예시하기 위한 것일 뿐, 본 발명의 범위가 이들만으로 한정되는 것은 아니다. 구체적으로, 본 특허 출원 이전에 본 발명자(들)가 출원한 특허 (PCT/KR2017/006633)에서 제작한 다양한 scFVIII 들 중의 하나의 scFVIII인 scFVIII G4 B3을 대상으로 본 특허의 기술을 설명하고자 한다. 그러나 본 특허의 기술을 설명하는 측면에서 하나의 scFVIII를 선정한 사유는 선정된 sc FVIII에 특별한 용이점이 있는 것이 아니고 단지 하나의 실시 예를 통해 제시하고자 하는 기술적 설명을 보다 명확히 하기 위함이다.
실시예 1. 재조합 sc(single-chain) 인자 VIII의 제조
실시예 1.1. scFVIII 발현 세포주 제작
본 발명자에 의해 출원된 특허 (PCT/KR2017/006633)의 scFVIII G4 B3 (아미노산 서열번호 8)을 코딩하는 DNA 염기 서열(서열번호 15의 염기 서열)을 발현하는 벡터(도 1 참조)로 CHO-S 세포주를 형질전환시켰다. 형질전환 후, 상기 CHO-S 세포주를 MTX (methotrexate) 500 mM 이상 존재 하에 계대 배양하여 scFVIII G4 B3 의 고발현 세포주(CHO-S G4 B3)를 선택하였다. 선정한 세포주 CHO-S G4 B3 clone은 CD FortCHO 세포 배양 배지 증식시킨 후 질소 탱크에 보존하였다.
실시예 1.2. scFVIII의 배양 및 정제
선정된 scFVIII G4 B3 고발현 세포주인 CHO-S G4 B3를 CD FortCHO 배지에 세포수 3 X 105/mL 되도록 첨가한 후 4일간 세포 배양하였다. 세포 배양 후 배양액을 회수하여 발현된 scFVIII G4 B3를 정제하였다. 배양액으로부터 scFVIII 을 정제하기 위하여, scFVIII G4 B3가 발현된 배양액에 NaCl의 최종 농도가 1.0M 되도록 5M NaCl 용액을 첨가 후, 0.2 ㎛ 멤브레인 필터를 통과 시켜 미세 부유물을 제거하였다. 이후, FVIII select 평형 용액 (20mM Histidine, 5mM CaCl2, 1M NaCl, 0.02% Tween®80, pH7.0)으로 평형된 FVIII select 수지 (GE healthcare) 에 주입하여 scFVIII G4 B3를 붙인 후, VIII select 평형 버퍼로 불순물을 제거하고, VIII select 용출버퍼 (20mM Histidine, 5mM CaCl2, 0.9M Arginie, 45% propyleneglycol, 0.02% Tween®80, pH6.5) 로 용출 시켰다(친화성 크로마토그래피 이용). 다음으로, VIII select 용출액은 이온교환 크로마토그래피 평형 버퍼 용액 (20mM Histidine, 5mM CaCl2, 0.02% Tween®80, pH7.0)으로 5배 이상 희석하여 후, 이온교환 크로마토그래피 평형용액으로 평형화된 SP Sepharose fast flow 이온교환 크로마토그래피 수지 (GE healthcare) 에 주입하였다. 이후, 불순물을 이온교환 크로마토그래피 평형용액로 제거하고 이온교환 크로마토그래피 용출액(20mM Histidine, 5mM CaCl2, 0.02% Tween®80, 400mM NaCl, pH6.5)으로 순수한 scFVIII G4 B3를 용출시켰다. 정제된 scFVIII G4 B3 의 FVIII 활성은 하기 실시예 1.3.에 기술된 CS 분석법으로 정량하였다. 정제 단계별 중간 물질의 분석을 위해 수행한 SDS PAGE 는 도 2에 나타난 바와 같다.
실시예 1.3. scFVIII 활성 측정
정제된 scFVIII G4_B3를 CS 방법으로 FVIII 활성을 측정하였다. Chromogenic method에 의한 활성 측정은 CHROMOGENIX(社)에서 판매하고 있는 chromogenic assay kit를 endpoint 방법으로 사용하였고, 제조사가 제공한 시험 방법을 다음과 같이 본 시험에 적합하게 변형하여 시험을 진행하였다. 구체적으로 시료를 1 희석버퍼를 사용하여 standard range (0.25-1 IU/mL)에 들어오도록 희석한다. 표준품(calibration plasma)을 0, 0.25, 0.5, 1 IU/mL 농도가 되게 1x 희석버퍼를 이용하여 준비하였다. 이렇게 준비한 시료와 표준품 10mL를 1x 희석버퍼 790mL로 희석한 후, 96 well plate에 50uL씩 분주하고, 37에서 5분간 정치하였다. 자동 디스펜서 파이펫을 사용하여 인자 시료를 50uL씩 각 well에 분주한 후 2분간 37에서 2분간 반응시켰다. 50uL 기질을 각 well에 분주한 후 2분간 37에서 2분간 정치한 후 발색시켰다. 발색된 시료에 50 uL 2% 시트르산을 넣어주어 반응을 정지하였다. 405nm 파장에서 흡광도를 측정하여 선형 검정선을 그린 후, 샘플의 흡광도를 검정선에 대입하여 시료의 활성을 측정하였고, 이를 아래 표 1에 나타내었다. 정제된 scFVIII G4_B3의 활성은 약 7000 IU/mg으로 혈우병 치료 목적의 상용화 재조합 FVIII (Advate®)의 활성과 유사하여 혈우병 치료제로 사용 가능한 수준으로 판단되었다.
시료 물질 비활성 (IU/mg)
scFVIII G4_B3 7,166
FVIII 6,000~7,000
실시예 2. 당 대사 공학((Metabolic labeling )을 이용한 scFVIII 표지
실시예 2.1. Ac4ManAl 를 이용한 scFVIII 표지
CHO-S scFVIII G4 B3 세포주를 세포 배양액(CD FortiCHO)에 세포 농도 0.3 ~ 3.0 x106 되게 부유시킨 후 4 일간 37℃, 5% CO2 조건에서 140 rpm 으로 교반하면서 세포 배양하였다. 세포 농도가 일정 수준에 달하면 Ac4ManAl를 최종 농도 100uM되게 첨가 후 24시간 동안 31℃, 5% CO2 조건에서 140rpm 으로 교반 하면서 세포 배양 한다. 세포 배양 종료 후 세포 배양액을 1,000rpm 으로 원심 분리하여 배양액을 제거 후, 회수된 세포를 Ac4ManAl 농도가 최종 100uM이 되게 첨가된 세포 배양액 (CD FortiCHO) 에 현탁하여 세포 농도의 수준을 약 0.1~1.5 x 107 수준으로 조절 후 24 시간 동안 31℃, 5% CO2 조건에서 140rpm으로 교반하면서 배양한다. 이후 상기 조건과 동일하게 24 시간마다 세포 배양액을 Ac4ManAl 농도가 최종 100uM이 되게 첨가된 새로운 세포 배양액으로 교환하여 배양하는 세포 배양 cycle을 3회 이상 진행한다(pseudo perfusion cycle). 세포 배양 과정은 도 3에 나타난 바와 같다.
배지 내 Ac4ManAl 첨가가 scFVIII G4 B3 세포의 성장과 scFVIII G4 B3 발현에 주는 영향을 파악하기 위하여 초기 4일간의 세포 성장 시기 후 Ac4ManAl을 첨가하지 않은 세포 배양액으로 이후의 세포 배양 cycle을 진행하며 세포 성장과 scFVIII G4 B3 발현을 FVIII 활성으로 비교 하였다. Ac4ManAl 100uM첨가는 CHO-S scFVIII G4 B3 세포 성장과 scFVIII G4 B3 발현량에 큰 영향을 주지 않았다. Ac4ManAl이 없는 초기 4일 동안 배양으로 세포 농도는 약 1.0 X 107 cells/mL 수준에 도달하였고 Ac4ManAl 100uM을 첨가한 후 추가 배양으로 1.7 X 107 cells/mL 수준에 도달되었으며 그 후 일정 수준을 유지하였다. 도 4a의 성장곡선 및 도 4b의 발현량 그래프에 나타난 바와 같이, scFVIII G4 B3 발현은 Ac4ManAl 100uM 첨가와는 상관없이 비슷한 수준으로 발현된 것을 확인하였다. 따라서, 배양에 사용한 농도 범위의 Ac4ManAl의 첨가는 scFVIII G4 B3 발현 세포주의 성장과 scFVIII G4 B3 발현량에 큰 영향이 없는 것을 알 수 있다.
실시예 2.2. Ac4ManAz에 의한 scFVIII 표지
실시예 2.1.과 동일한 방법으로 Ac4ManAl 대신 Ac4ManAz 100uM을 첨가하여 scFVIII G4 B3를 유사한 방법으로 배양하였다. 초기 3일 배양 이후 매 cycle 계대 배양 시 실시예 2.1.의 계대 배양 배지 부피의 50%의 계대 배양 배지로 배양함으로써 세포 농도를 높게 유지하였다 Ac4ManAl와 유사하게 Ac4ManAz 100uM 첨가는 세포 성장과 scFVIII 발현에 큰 영향을 주지 않았다. 세포 농도는 배양을 31 oC 로 이동 후 4일째부터 실시예 2.1.과 같이 매일 동일 부피의 새로운 배지로 교환하였다. 배양 종료까지 scFVIII G4 B3 세포는 1.5x107 수준 이상으로 유지되었으며 배양 종료까지 세포 생존율은 90% 이상을 유지하였다. 도 5에 나타난 바와 같이, scFVIII G4 B3 발현량은 실시예 2.1.에서 Ac4ManAl를 첨가한 scFVIII G4 B3 배양과 유사한 수준이었다. 결론적으로, 배양에 사용한 농도의 Ac4ManAz의 첨가는 scFVIII G4 B3 세포주의 세포 성장 및 scFVIII G4 B3 발현에도 큰 영향이 없음을 확인할 수 있었다.
실시예 3. 개질된 scFVIII의 제조
실시예 3.1. 아지드기 또는 알킨기로 표지된 scFVIII 의 정제 및 활성 측정
Ac4ManAz 와 Ac4ManAl 에 의해 각각 아지드기 및 알킨기로 표지된 scFVIII G4 B3Az (Ac4ManAz 로 표지)와 scFVIII G4 B3Al (Ac4ManAl 로 표지)는 상기 실시예 1.2.에 기재된 scFVIII G4 B3 정제와 동일한 방법으로 정제되었다. 정제된 scFVIII G4 B3Az 와 scFVIII G4 B3Al의 활성 측정 또한 상기 실시예 1.3.과 동일한 방법으로 측정되었으며, 그 결과는 아래 표 2에 나타난 바와 같다. CS 활성 측정으로 정제된 scFVIIIG4 B3Az와 scFVIIIG4 B3Al의 비활성은 표 2에 나타난 바와 같이 scFVIII G4 B3과 유사한 수준으로 Ac4ManAz 또는 Ac4ManAl 대사에 의한 scFVIII G4 B3의 표식은 scFVIII G4의 활성에 영향을 주지 않음을 확인할 수 있었다.
시료 물질 비활성 (IU/mg)
scFVIII G4 B3 7,166
scFVIII G4 B3Az (Ac4ManAz 에 의해 표지된 scFVIII G4 B3) 6,600
scFVIII G4 B3Al (Ac4ManAl 에 의해 표지된 scFVIII G4 B3) 5,860
실시예 3.2. 클릭 화학(click chemistry)을 통한 글리코페길화된 ( glycoPEGylated ) scFVIII의 제조
실시예 3.2.1. Cu2 + free click chemistry 에 의한 글리코페길화된 (glycoPEGylated) scFVIII의 제조
상기 실시예 3.1.에서 정제된 scFVIII G4 B3Az 를 접합 버퍼 (20mM HEPES, 150mM NaCl, 5mM CaCL2, 0.01%(w/v) Tween®80, pH7.5) 로 교환 후, DBCO-PEG(10kDa, 20kDa, 30kDa) vs scFVIII G4Az의 mole 비율이 각각 100 : 1이 되도록 DBCO-PEG10kDa, DBCO-PEG20kDa, DBCO-PEG30kDa을 첨가 후 4℃에서 48 시간 동안 반응하여 글리코페길화된 scFVIII (DBCOPEG10kDa-scFVIII G4 B3 Az, DBCOPEG20kDa-scFVIII G4 B3 Az, DBCO-PEG30kDa-scFVIII G4 B3 Az)를 생성하였다. 도 6a와 도 6b에 나타난 바와 같이 대부분의 Ac4ManAz로 당 수식된 scFVIII인 scFVIII G4 B3 Az 는 DBCO PEG에 의하여 접합된 것을 확인하였다. 그리고 scFVIII의 당쇄 중 Ac4ManAz에 의하여 수식되는 시알산이 복수인 것과 일치하게 다중 접합을 하여 고분자 접합체의 혼합물이 형성됨을 확인하였다. 상기의 DBCOPEG10kDa-, DBCOPEG20kDa-, DBCOPEG30kDa-scFVIII는 동일한 방법으로 정제되었다. 구체적으로, 반응 접합물을 평형 버퍼(20mM HEPES, 5mM CaCl2, 0.02%(w/v) Tween®80) 로 평형화된 DEAE Sepharose fast flow 이온 교환 수지에 주입하여 붙인 후, 페길화 안된 scFVIII G4 B3Az를 세척 버퍼(20mM HEPES, 5mM CaCl2, 0.02%(w/v) Tween®80) 로 제거 후, 글리코페길화된 scFVIII G4 B3Az를 용출 버퍼 (20mM HEPES, 5mM CaCl2, 500mM NaCl, 0.02%(w/v) Tween80)로 용출하였다. 글리코페길레이션 반응물과 정제된 글리코페길화된 scFVIII은 SDS PAGE를 통하여 확인하였고, 그 결과를 도 6c에 나타내었다. 용출된 글리코페길화된 scFVIII (DBCOPEG10kDa-scFVIII, DBCOPEG20kDa-scFVIII, DBCOPEG30kDa-scFVIII)의 활성은 상기 실시예 1.3.에 기술된 CS 방법으로 측정되었고 표 3에서 보듯이 이들의 활성은 글리코페길레이션 이전의 scFVIII G4_B3Az 대비 감소되지 않았다. 이로서 Ac4ManAz 대사에 의한 표식과 이후 글리코페길레이션은 scFVIII G4 B3Az의 활성을 감소시키지 않음을 확인할 수 있었다.
시료 물질 비활성 (IU/mg)
scFVIII G4_B3Az 6,600
DBCOPEG10kDa-scFVIII G4_B3Az 6,700
DBCOPEG20kDa-scFVIII G4_B3Az 6,100 / 5,800
DBCOPEG30kDa-scFVIII G4_B3Az 5,000
실시예 3.2.2. Cu 2 + click chemistry 에 의한 glycopegylated single-chain FVIII 제작
상기 실시예 3.1.에서 정제된 scFVIII G4 B3 Al을 접합 버퍼 (20mM HEPES, 150mM NaCl, 5mM CaCL2, 0.01%(w/v) Tween®80) 로 교환 후 azide-PEG40kDa (Nanocs, PG1-AZ-40k ) vs scFVIII G4 B3 Al의 mole 비율이 1:100 되게 azide-PEG40kDa 을 첨가하였다. scFVIII G4 B3 Al과 azide-PEG20kDa의 접합 반응의 시작을 위하여, Cu2 + 의 최종 농도가 0.1mM, THPTA의 최종 농도가 0.5mM이 되도록 Cu2 + 와 THPTA를 첨가한 후, ascorbate의 최종농도가 5mM이 되도록 ascorbate를 첨가 후, 상온에서 24 시간 반응하였다. 접합 반응 생성물은 SDS PAGE를 통하여 확인하였고, 그 결과를 도 7에 나타내었다. 대부분의 scFVIII G4 B3 Al이 접합되었다. 이는 Ac4ManAl 에 의해 대부분의 scFVIII G4 B3의 당쇄가 alkyne으로 수식됨을 의미한다. 24 시간 접합 반응 후 접합 반응물의 활성을 실시예 1.3.의 CS 법으로 측정하였고 접합 반응 전 scFVIII G4 B3 Al FVIII 활성의 50% 이상이 소실됨을 확인하였다. 이 결과는 알킨으로 표지된 scFVIII B3 G4Al과 azide-PEG40kDa의 접합 반응을 위하여 넣어준 Cu2 + 와 ascorbate가 반응하여 생성된 free radical 이 scFVIII G4 B3 Al 단백질의 변성을 초래하였기 때문인 것으로 추정된다.
실시예 4. 폴리에틸렌글리콜로 표지된 당쇄를 갖는 scFVIII의 체내 지속성 평가
실시예 4.1. 정맥 주사 투여 후 약동학
실시예 3.1.과 실시예 3.2.1.을 통하여 제조된 폴리에틸렌글리콜로 표지된 scFVIII(글리코페길화된 scFVIII)을 혈우병 마우스에 정맥 주사로 투여한 후 약동학을 측정하였다. DBCOPEG20kDa-scFVIII G4 B3 Az, DBCOPEG30kDa-scFVIII G4 B3 Az 및 양성 대조물질인 Advate®를 13주령 암컷 혈우병 마우스(B6;129S4-F8tm1Kaz/ J(FVIII-knock-out))의 꼬리에 정맥 주사 투여 후 혈액 내에 잔존하는 FVIII의 활성을 68시간까지 측정하였다. DBCOPEG20kDa-scFVIII G4 B3 Az, DBCOPEG30kDa-scFVIII G4 B3 Az과 Advate을 각각 200 IU/kg 용량으로 꼬리 정맥 주사로 투여하고 정해진 시간 대 (2min, 6hr, 16hr, 30hr, 40hr, 48hr, 64hr, 72hr)에 각 마우스로부터 안와 정맥 경로를 통하여 혈액을 채취하였다. 채취된 혈액은 항 응고제(3.2% sodium citrate)를 최종 10% (v/v) 되게 첨가한 후 원심 분리하여 혈장을 수득하였다. 투여 물질 용량과 혈장 중에 잔존하는 FVIII의 정량은 실시예 1.3.의 CS 측정법으로 수행하였다. 각 시료 군의 마우스로부터 시간 별로 채취된 혈장 내에 잔존하는 FVIII 활성은 도 8에 나타난 바와 같다. 또한, 혈장 내에 잔존하는 FVIII 활성 측정값을 WinNonlin software를 이용하여 NCA(Non Compartmental Analysis) 방법을 통해 PK parameter하였으며 그 결과는 표 4에 기재한 바와 같다. DBCOPEG20kDa-scFVIII G4 B3 Az과 DBCOPEG30kDa-scFVIII G4 B3 Az의 반감기는 마우스의 평균값을 기준으로 초기 2분부터 68시간 까지 계산되었고 Advate 대비 각각 2.8배 (DBCOPEG20kDa-scFVIII G4 B3 Az 경우), 3.2배 (DBCOPEG30kDa-scFVIII G4 B3 Az 경우) 증가 되었다. AUCINF (area under the curve) 역시 Advate 대비 각각 3.7배 (DBCOPEG20kDa-scFVIII G4 B3 Az 경우), 5.1배 (DBCOPEG30kDa-scFVIII G4 B3 Az 경우) 증가 되었다. 따라서, 본 발명에 따라 제조된 개질된 인자 VIII 단백질은 정맥 주사 투여 경로에서 기존의 FVIII 대비 체내에서 오래동안 잔존하고 그에 비례하여 효력이 지속됨을 확인하였다.
약동학 parameters Advate DBCOPEG20kDa-scFVIII G4 B3 Az DBCOPEG30kDa-scFVIII G4 B3 Az
T1/2, terminal (hr) 7.6 ± 0.8 21.1 ± 5.5 25.6 ± 1.9
Cmax (IU/mL) 3.9 ± 2.1 4.3 ± 0.0 5.7 ± 0.3
AUClast (hr*IU/mL) 34.0 ± 2.2 120.3 ± 12.2 153.7 ± 11.7
AUCINF _ obs (hr*IU/mL) 35.0 ± 2.4 131.1 ± 17.4 178.9 ± 17.6
AUC%_Extrap (%) 2.8 ± 0.9 7.9 ± 3.0 9.4 ± 1.7
CL (mL/hr/kg) 3.6 ± 0.3 1.0 ± 0.1 0.7 ± 0.1
MRTINF (hr) 9.6 ± 1.1 28.7 ± 2.8 31.7 ± 2.9
실시예 4.2.1. 피하 주사 투여 후 약동학
실시예 3.1.과 실시예 3.2.1.을 통하여 제작된 글리코페길화된 scFVIII을 혈우병 마우스에 피하 주사 투여하는 약동학 시험을 수행하였다. 글리코페길화된 scFVIII 인 DBCOPEG10kDa-scFVIII G4 B3 Az 그리고 양성 대조 물질인 Advate를 13주령 암컷 혈우병 마우스(B6;129S4-F8tm1Kaz/J(FVIII-knock-out))에 피하 주사 투여 후 혈액 내에 잔존하는 FVIII의 활성을 48 시간까지 측정하였다. 각 시료를 마우스에 FVIII 활성 기준 (FVIII 국제 역가 표준품의 역가 기준)으로 380 IU/kg 용량을 피하 주사로 투여하고 정해진 시간 대(1hr, 4hr, 8hr, 16hr, 24hr, 48hr)에 마우스로부터 안와 정맥 경로를 통하여 혈액을 채취하였다. 채취된 혈액은 항 응고제(3.2% sodium citrate)를 최종 10% (v/v) 첨가한 후 원심 분리하여 혈장을 수득하였으며 FVIII 활성 측정 전까지 냉동 보관하였다. 각 시료 군의 마우스로부터 각 시간대에 채취된 혈장 내에 잔존하는 FVIII 활성은 도 9과 같다. 혈장 내에 잔존하는 FVIII 활성 측정값을 WinNonlin software를 이용하여 NCA(Non Compartmental Analysis) 방법을 통해 PK parameter를 도출하였으며 그 결과는 표 5(DBCOPEG10kDa-scFVIII G4 B3 Az 피하 투여 약동학 parameters)에 나타낸 바와 같다. 각 마우스에서 DBCOPEG10kDa-scFVIII G4 B3 Az 의 반감기(terminal half-life) 는 14~24 시간 수준 이었고, 실시예 4.1.의 Advate의 반감기와 비교하였을 때 1.8~3.2 배 증가된 수준이었다. 기존 FVIII 의 생체 이용율이 마우스에서 피하 주사 투여 시 1% 미만 인 것(ASH (American society of hematology annual meeting) 2015, Recombinant FVIIIFc-VWF-XTEN demonstrates significant bioavailability following subcutaneous administration in hemophilia A mice)과 일치하게 Advate는 피하 투여 시 혈중에서 관측되지 않는 수준이었다. 그러나 DBCOPEG10kDa-scFVIII G4 B3 Az 은 48시간 까지 혈우병 마우스에서 출혈에 의한 지혈 반응이 진행 될 수 있을 정도의 높은 수준으로 관측되었다. 이는 글리코페길화된 scFVIII인 DBCOPEG10kDa-scFVIII G4 B3 Az 이 피하 환경에서 안정적이고 혈 중에 도달한 이후에도 안정적이어서 기존의 FVIII 보다 생체 이용율이 높아진 것을 의미한다. 이로서 글리코페길화된 scFVIII인 DBCOPEG10kDa-scFVIII G4 B3 Az은 기존의 FVIII 에 비해 피하 제형으로 개발 가능함을 확인할 수 있었다.
T1/2(hr) Tmax(hr) Cmax(IU/mL) AUClast (hr*IU/mL) AUCINF _ obs (hr*IU/mL)
19.2 18.7 0.618 18.1 21.7
실시예 4.2.2. 피하 주사 투여 후 약동학
실시예 3.1.과 실시예 3.2.1을 통하여 제작된 글리코페길화된 scFVIII 을 혈우병 마우스에 피하 주사 투여 후 약동학을 수행하였다. 글리코페길화된 scFVIII 인 DBCOPEG20kDa-scFVIII G4 B3 Az 과 DBCOPEG30kDa-scFVIII G4 B3 Az 를 13주령 암컷 혈우병 마우스 (B6;129S4-F8tm1Kaz/J(FVIII-knock-out))에 피하 주사 투여 후 혈액 내에서 측정되는 FVIII 의 활성을 시간 별로 측정하였다. DBCOPEG20kDa-scFVIII G4 B3 Az 과 DBCOPEG30kDa-scFVIII G4 B3 Az 시료를 마우스에 FVIII 활성 기준으로 180 IU/kg 용량을 피하 주사로 투여하고 정해진 시간 대(1hr, 4hr, 8hr, 16hr, 24hr, 48hr, 72h) 에 각 마우스로부터 안와 정맥 경로를 통하여 혈액을 채취하였다. 채취된 혈액은 항응고제 (3.2% sodium citrate) 를 최종 10% (v/v) 첨가한 후 원심 분리하여 혈장을 수득하였으며 FVIII 활성 측정 전까지 냉동 보관하였다. 투여 물질 정량과 혈장 중에 잔존하는 FVIII 활성의 정량은 실시예 1.3.의 CS 측정법으로 수행하였다. 피하 투여 시의 생체 이용율을 산출하기 위하여 실시예 4.2.1에서 DBCOPEG20kDa-scFVIII G4 B3 Az과 DBCOPEG30kDa-scFVIII G4 B3 Az을 200 IU/kg 용량으로 정맥 투여하였을 때의 AUC 를 피하 투여 용량인 180 IU/kg으로 보정하여 생체이용률을 계산하였다. 이와 같이 보정하여 계산되는 생체 이용률은 (AUCsc/AUCiv) x (doseiv/dosesc)와 같다(AUCsc : 피하 투여 시 AUC; AUCiv : 정맥 투여 시 AUC; doseiv : 정맥 투여 용량; AUCsc : 피하 투여 용량). FVIII과 FVIII의 PEG 접합물은 생체 내의 혈중에서 감소율이 오로지 물질 농도에만 의존적이어서 초기 농도의 보정으로 정맥 투여 시 혈중 농도의 예측이 가능하다(J Thromb Haemost 2017 15(6):1106-1114 Population pharmacokinetics of recombinant coagulation factor VIII-SingleChain in patients with severe hemophilia A; ISTH 2017 pharmacokinetics of N8-GP (turoctocog alfa pegol) dosed subcutaneously to non-human primates and prediction of human PK profile). 시료를 피하 투여한 마우스군으로부터 시간 별로 채취한 혈장 내에 잔존하는 FVIII 활성은 도 10에 나타난 바와 같다. 각 마우스의 혈장 내의 FVIII 활성의 평균을 WinNonlin software를 이용하여 NCA(Non Compartmental Analysis) 방법을 통해 PK parameter를 계산하였으며 그 결과는 표 6에 나타난 바와 와 같다. DBCOPEG20kDa-scFVIII G4 B3 Az 과 DBCOPEG30kDa-scFVIII G4 B3 Az의 반감기(terminal half-life)는 각각 14.6 시간 및 16.9 시간이다. 피하 투여 시 Advate의 AUC (area under the curve) 가 1% 미만인 것에 비하여 피하 주사 투여된 DBCOPEG20kDa-scFVIII G4 B3 Az과 DBCOPEG30kDa-scFVIII G4 B3 Az의 생체이용율은 각각 35 %, 43% 이었다. 즉, 본 발명에 따른 글리코페길화된 scFVIII의 생체 이용율이 기존의 FVIII (Advate) 보다 월등히 높은 것을 확인할 수 있으며 이로서 글리코페길화된 scFVIII인 DBCOPEG20kDa-scFVIII G4 B3 Az과 DBCOPEG30kDa-scFVIII G4 B3 Az은 기존의 FVIII(Advate)에 비해 피하 제형으로 개발 가능함을 확인할 수 있었다.
이와 같이 본 발명의 방법으로 생산된 DBCOPEG20kDa-scFVIII G4 B3 Az과 DBCOPEG30kDa-scFVIII G4 B3 Az이 피하 투여 시 생체이용율이 높은 것은 이들이 피하 환경에서 기존의 FVIIII 보다 더 안정하고 단백분해 효소로부터 더 완전하게 보호되어 효율적인 저항성을 가져 생체 이용율이 높아진 것으로 추론된다.
DBCOPEG20kDa-scFVIII G4 B3 Az DBCOPEG30kDa-scFVIII G4 B3 Az
T1/2, terminal (hr) 14.6±4.4 16.9±10.2
Cmax (IU/mL) 1.6±0.5 1.6±0.2
AUClast (hr*IU/mL) 37.9±4.8 59.5±14.5
AUCINF _ obs(hr*IU/mL) 40.9±3.1 65.9±13.0
*Bioavailability (%) 35 43
*(AUCsc/AUCiv) x (doseiv/dosesc)
이를 통해, 본 발명에 따른 방법에 의해 폴리에틸렌글리콜 중합체로 개질된 scFVIII는 기존의 FVIII인 Advate®대비 체내, 즉 혈중과 피하 조직에서 더 오래 잔존할 수 있어, 약물의 치료 효능이 보다 유지될 수 있음을 확인하였다.
이상, 본 발명의 일 실시예에 대하여 설명하였으나, 해당 기술 분야에서 통상의 지식을 가진 자라면 특허청구범위에 기재된 본 발명의 사상으로부터 벗어나지 않는 범위 내에서, 구성 요소의 부가, 변경, 삭제 또는 추가 등에 의해 본 발명을 다양하게 수정 및 변경시킬 수 있을 것이며, 이 또한 본 발명의 권리범위 내에 포함된다고 할 것이다.
<110> Mogam Institute for Biomedical Research <120> LONG-ACTING RECOMBINANT GLYCOPROTEINS AND MENUFACTURING METHOD THEREOF <130> FPD201711-0011C <160> 15 <170> KoPatentIn 3.0 <210> 1 <211> 2332 <212> PRT <213> Homo sapiens <400> 1 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His 900 905 910 Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro 915 920 925 Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp 930 935 940 Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp 945 950 955 960 Gly Lys Asn Val Ser Ser Thr Glu Ser Gly Arg Leu Phe Lys Gly Lys 965 970 975 Arg Ala His Gly Pro Ala Leu Leu Thr Lys Asp Asn Ala Leu Phe Lys 980 985 990 Val Ser Ile Ser Leu Leu Lys Thr Asn Lys Thr Ser Asn Asn Ser Ala 995 1000 1005 Thr Asn Arg Lys Thr His Ile Asp Gly Pro Ser Leu Leu Ile Glu Asn 1010 1015 1020 Ser Pro Ser Val Trp Gln Asn Ile Leu Glu Ser Asp Thr Glu Phe Lys 1025 1030 1035 1040 Lys Val Thr Pro Leu Ile His Asp Arg Met Leu Met Asp Lys Asn Ala 1045 1050 1055 Thr Ala Leu Arg Leu Asn His Met Ser Asn Lys Thr Thr Ser Ser Lys 1060 1065 1070 Asn Met Glu Met Val Gln Gln Lys Lys Glu Gly Pro Ile Pro Pro Asp 1075 1080 1085 Ala Gln Asn Pro Asp Met Ser Phe Phe Lys Met Leu Phe Leu Pro Glu 1090 1095 1100 Ser Ala Arg Trp Ile Gln Arg Thr His Gly Lys Asn Ser Leu Asn Ser 1105 1110 1115 1120 Gly Gln Gly Pro Ser Pro Lys Gln Leu Val Ser Leu Gly Pro Glu Lys 1125 1130 1135 Ser Val Glu Gly Gln Asn Phe Leu Ser Glu Lys Asn Lys Val Val Val 1140 1145 1150 Gly Lys Gly Glu Phe Thr Lys Asp Val Gly Leu Lys Glu Met Val Phe 1155 1160 1165 Pro Ser Ser Arg Asn Leu Phe Leu Thr Asn Leu Asp Asn Leu His Glu 1170 1175 1180 Asn Asn Thr His Asn Gln Glu Lys Lys Ile Gln Glu Glu Ile Glu Lys 1185 1190 1195 1200 Lys Glu Thr Leu Ile Gln Glu Asn Val Val Leu Pro Gln Ile His Thr 1205 1210 1215 Val Thr Gly Thr Lys Asn Phe Met Lys Asn Leu Phe Leu Leu Ser Thr 1220 1225 1230 Arg Gln Asn Val Glu Gly Ser Tyr Asp Gly Ala Tyr Ala Pro Val Leu 1235 1240 1245 Gln Asp Phe Arg Ser Leu Asn Asp Ser Thr Asn Arg Thr Lys Lys His 1250 1255 1260 Thr Ala His Phe Ser Lys Lys Gly Glu Glu Glu Asn Leu Glu Gly Leu 1265 1270 1275 1280 Gly Asn Gln Thr Lys Gln Ile Val Glu Lys Tyr Ala Cys Thr Thr Arg 1285 1290 1295 Ile Ser Pro Asn Thr Ser Gln Gln Asn Phe Val Thr Gln Arg Ser Lys 1300 1305 1310 Arg Ala Leu Lys Gln Phe Arg Leu Pro Leu Glu Glu Thr Glu Leu Glu 1315 1320 1325 Lys Arg Ile Ile Val Asp Asp Thr Ser Thr Gln Trp Ser Lys Asn Met 1330 1335 1340 Lys His Leu Thr Pro Ser Thr Leu Thr Gln Ile Asp Tyr Asn Glu Lys 1345 1350 1355 1360 Glu Lys Gly Ala Ile Thr Gln Ser Pro Leu Ser Asp Cys Leu Thr Arg 1365 1370 1375 Ser His Ser Ile Pro Gln Ala Asn Arg Ser Pro Leu Pro Ile Ala Lys 1380 1385 1390 Val Ser Ser Phe Pro Ser Ile Arg Pro Ile Tyr Leu Thr Arg Val Leu 1395 1400 1405 Phe Gln Asp Asn Ser Ser His Leu Pro Ala Ala Ser Tyr Arg Lys Lys 1410 1415 1420 Asp Ser Gly Val Gln Glu Ser Ser His Phe Leu Gln Gly Ala Lys Lys 1425 1430 1435 1440 Asn Asn Leu Ser Leu Ala Ile Leu Thr Leu Glu Met Thr Gly Asp Gln 1445 1450 1455 Arg Glu Val Gly Ser Leu Gly Thr Ser Ala Thr Asn Ser Val Thr Tyr 1460 1465 1470 Lys Lys Val Glu Asn Thr Val Leu Pro Lys Pro Asp Leu Pro Lys Thr 1475 1480 1485 Ser Gly Lys Val Glu Leu Leu Pro Lys Val His Ile Tyr Gln Lys Asp 1490 1495 1500 Leu Phe Pro Thr Glu Thr Ser Asn Gly Ser Pro Gly His Leu Asp Leu 1505 1510 1515 1520 Val Glu Gly Ser Leu Leu Gln Gly Thr Glu Gly Ala Ile Lys Trp Asn 1525 1530 1535 Glu Ala Asn Arg Pro Gly Lys Val Pro Phe Leu Arg Val Ala Thr Glu 1540 1545 1550 Ser Ser Ala Lys Thr Pro Ser Lys Leu Leu Asp Pro Leu Ala Trp Asp 1555 1560 1565 Asn His Tyr Gly Thr Gln Ile Pro Lys Glu Glu Trp Lys Ser Gln Glu 1570 1575 1580 Lys Ser Pro Glu Lys Thr Ala Phe Lys Lys Lys Asp Thr Ile Leu Ser 1585 1590 1595 1600 Leu Asn Ala Cys Glu Ser Asn His Ala Ile Ala Ala Ile Asn Glu Gly 1605 1610 1615 Gln Asn Lys Pro Glu Ile Glu Val Thr Trp Ala Lys Gln Gly Arg Thr 1620 1625 1630 Glu Arg Leu Cys Ser Gln Asn Pro Pro Val Leu Lys Arg His Gln Arg 1635 1640 1645 Glu Ile Thr Arg Thr Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr 1650 1655 1660 Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr 1665 1670 1675 1680 Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg 1685 1690 1695 His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser 1700 1705 1710 Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro 1715 1720 1725 Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr 1730 1735 1740 Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly 1745 1750 1755 1760 Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg 1765 1770 1775 Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr 1780 1785 1790 Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys 1795 1800 1805 Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala 1810 1815 1820 Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp 1825 1830 1835 1840 Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu 1845 1850 1855 Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr 1860 1865 1870 Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser 1875 1880 1885 Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn 1890 1895 1900 Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala 1905 1910 1915 1920 Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln 1925 1930 1935 Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn 1940 1945 1950 Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys 1955 1960 1965 Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu 1970 1975 1980 Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys 1985 1990 1995 2000 Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val 2005 2010 2015 Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile 2020 2025 2030 Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro 2035 2040 2045 Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr 2050 2055 2060 Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile 2065 2070 2075 2080 Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu 2085 2090 2095 Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp 2100 2105 2110 Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly 2115 2120 2125 Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile 2130 2135 2140 Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser 2145 2150 2155 2160 Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met 2165 2170 2175 Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala 2180 2185 2190 Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala 2195 2200 2205 Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn 2210 2215 2220 Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val 2225 2230 2235 2240 Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr 2245 2250 2255 Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr 2260 2265 2270 Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp 2275 2280 2285 Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg 2290 2295 2300 Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg 2305 2310 2315 2320 Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 2325 2330 <210> 2 <211> 1467 <212> PRT <213> Artificial Sequence <220> <223> G2 (scF2) <400> 2 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp 785 790 795 800 Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp 805 810 815 Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His 820 825 830 Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser 835 840 845 Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln 850 855 860 Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln 865 870 875 880 Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro 885 890 895 Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn 900 905 910 Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu 915 920 925 Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro 930 935 940 Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro 945 950 955 960 Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val 965 970 975 Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val 980 985 990 Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val 995 1000 1005 Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp 1010 1015 1020 Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile 1025 1030 1035 1040 Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile 1045 1050 1055 Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp 1060 1065 1070 Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile 1075 1080 1085 His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu 1090 1095 1100 Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr 1105 1110 1115 1120 Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu 1125 1130 1135 Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr 1140 1145 1150 Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg 1155 1160 1165 Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys 1170 1175 1180 Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys 1185 1190 1195 1200 Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile 1205 1210 1215 His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr 1220 1225 1230 Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln 1235 1240 1245 Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn 1250 1255 1260 Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile 1265 1270 1275 1280 Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr 1285 1290 1295 Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro 1300 1305 1310 Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser 1315 1320 1325 Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg 1330 1335 1340 Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn 1345 1350 1355 1360 Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr 1365 1370 1375 Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val 1380 1385 1390 Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu 1395 1400 1405 Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser 1410 1415 1420 Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr 1425 1430 1435 1440 Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met 1445 1450 1455 Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1460 1465 <210> 3 <211> 1511 <212> PRT <213> Artificial Sequence <220> <223> G3 (scF3) <400> 3 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser 835 840 845 Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn 850 855 860 Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala 865 870 875 880 Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val 885 890 895 Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val 900 905 910 Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg 915 920 925 Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala 930 935 940 Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg 945 950 955 960 Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg 965 970 975 Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys 980 985 990 Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu 995 1000 1005 Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys 1010 1015 1020 Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn 1025 1030 1035 1040 Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala 1045 1050 1055 Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu 1060 1065 1070 Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp 1075 1080 1085 Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile 1090 1095 1100 Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg 1105 1110 1115 1120 Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His 1125 1130 1135 Phe Ser Gly His Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met 1140 1145 1150 Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu 1155 1160 1165 Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His 1170 1175 1180 Leu His Ala Gly Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys 1185 1190 1195 1200 Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile 1205 1210 1215 Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu 1220 1225 1230 His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser 1235 1240 1245 Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys 1250 1255 1260 Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe 1265 1270 1275 1280 Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly 1285 1290 1295 Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser 1300 1305 1310 Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile 1315 1320 1325 Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu 1330 1335 1340 Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu 1345 1350 1355 1360 Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr 1365 1370 1375 Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln 1380 1385 1390 Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp 1395 1400 1405 Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr 1410 1415 1420 Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu 1425 1430 1435 1440 Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn 1445 1450 1455 Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val 1460 1465 1470 Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His 1475 1480 1485 Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly 1490 1495 1500 Cys Glu Ala Gln Asp Leu Tyr 1505 1510 <210> 4 <211> 1581 <212> PRT <213> Artificial Sequence <220> <223> G4 (scF4) <400> 4 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp 900 905 910 Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile 915 920 925 Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr 930 935 940 Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met 945 950 955 960 Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val 965 970 975 Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe 980 985 990 Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu 995 1000 1005 Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe 1010 1015 1020 Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser 1025 1030 1035 1040 Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val 1045 1050 1055 Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met 1060 1065 1070 Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser 1075 1080 1085 Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu 1090 1095 1100 Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val 1105 1110 1115 1120 Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys 1125 1130 1135 Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys 1140 1145 1150 Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His 1155 1160 1165 Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala 1170 1175 1180 Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu 1185 1190 1195 1200 Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys 1205 1210 1215 Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe 1220 1225 1230 Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu 1235 1240 1245 Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu 1250 1255 1260 Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His 1265 1270 1275 1280 Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala 1285 1290 1295 Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser 1300 1305 1310 Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met 1315 1320 1325 Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser 1330 1335 1340 Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys 1345 1350 1355 1360 Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe 1365 1370 1375 Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro 1380 1385 1390 Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg 1395 1400 1405 Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser 1410 1415 1420 Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr 1425 1430 1435 1440 Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys 1445 1450 1455 Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val 1460 1465 1470 Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys 1475 1480 1485 Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met 1490 1495 1500 Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp 1505 1510 1515 1520 Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln 1525 1530 1535 Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr 1540 1545 1550 Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu 1555 1560 1565 Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1570 1575 1580 <210> 5 <211> 1644 <212> PRT <213> Artificial Sequence <220> <223> G6 (scF5) <400> 5 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His 900 905 910 Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro 915 920 925 Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp 930 935 940 Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp 945 950 955 960 Gly Lys Asn Val Ser Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr 965 970 975 Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr 980 985 990 Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg 995 1000 1005 His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser 1010 1015 1020 Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro 1025 1030 1035 1040 Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr 1045 1050 1055 Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly 1060 1065 1070 Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg 1075 1080 1085 Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr 1090 1095 1100 Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys 1105 1110 1115 1120 Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala 1125 1130 1135 Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp 1140 1145 1150 Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu 1155 1160 1165 Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr 1170 1175 1180 Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser 1185 1190 1195 1200 Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn 1205 1210 1215 Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala 1220 1225 1230 Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln 1235 1240 1245 Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn 1250 1255 1260 Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys 1265 1270 1275 1280 Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu 1285 1290 1295 Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys 1300 1305 1310 Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val 1315 1320 1325 Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile 1330 1335 1340 Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro 1345 1350 1355 1360 Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr 1365 1370 1375 Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile 1380 1385 1390 Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu 1395 1400 1405 Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp 1410 1415 1420 Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly 1425 1430 1435 1440 Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile 1445 1450 1455 Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser 1460 1465 1470 Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met 1475 1480 1485 Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala 1490 1495 1500 Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala 1505 1510 1515 1520 Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn 1525 1530 1535 Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val 1540 1545 1550 Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr 1555 1560 1565 Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr 1570 1575 1580 Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp 1585 1590 1595 1600 Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg 1605 1610 1615 Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg 1620 1625 1630 Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1635 1640 <210> 6 <211> 1587 <212> PRT <213> Artificial Sequence <220> <223> G4_flex (scF6) <400> 6 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Ser Gln Asn Pro Pro Val Thr Leu Gln Ser 900 905 910 Asp Gln Glu Glu Ile Asp Tyr Asp Asp Thr Ile Ser Val Glu Met Lys 915 920 925 Lys Glu Asp Phe Asp Ile Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg 930 935 940 Ser Phe Gln Lys Lys Thr Arg His Tyr Phe Ile Ala Ala Val Glu Arg 945 950 955 960 Leu Trp Asp Tyr Gly Met Ser Ser Ser Pro His Val Leu Arg Asn Arg 965 970 975 Ala Gln Ser Gly Ser Val Pro Gln Phe Lys Lys Val Val Phe Gln Glu 980 985 990 Phe Thr Asp Gly Ser Phe Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn 995 1000 1005 Glu His Leu Gly Leu Leu Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp 1010 1015 1020 Asn Ile Met Val Thr Phe Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe 1025 1030 1035 1040 Tyr Ser Ser Leu Ile Ser Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu 1045 1050 1055 Pro Arg Lys Asn Phe Val Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp 1060 1065 1070 Lys Val Gln His His Met Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys 1075 1080 1085 Ala Trp Ala Tyr Phe Ser Asp Val Asp Leu Glu Lys Asp Val His Ser 1090 1095 1100 Gly Leu Ile Gly Pro Leu Leu Val Cys His Thr Asn Thr Leu Asn Pro 1105 1110 1115 1120 Ala His Gly Arg Gln Val Thr Val Gln Glu Phe Ala Leu Phe Phe Thr 1125 1130 1135 Ile Phe Asp Glu Thr Lys Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg 1140 1145 1150 Asn Cys Arg Ala Pro Cys Asn Ile Gln Met Glu Asp Pro Thr Phe Lys 1155 1160 1165 Glu Asn Tyr Arg Phe His Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu 1170 1175 1180 Pro Gly Leu Val Met Ala Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu 1185 1190 1195 1200 Ser Met Gly Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His 1205 1210 1215 Val Phe Thr Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn 1220 1225 1230 Leu Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Ala 1235 1240 1245 Gly Ile Trp Arg Val Glu Cys Leu Ile Gly Glu His Leu His Ala Gly 1250 1255 1260 Met Ser Thr Leu Phe Leu Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu 1265 1270 1275 1280 Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly 1285 1290 1295 Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu His Tyr Ser Gly 1300 1305 1310 Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe Ser Trp Ile Lys Val 1315 1320 1325 Asp Leu Leu Ala Pro Met Ile Ile His Gly Ile Lys Thr Gln Gly Ala 1330 1335 1340 Arg Gln Lys Phe Ser Ser Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr 1345 1350 1355 1360 Ser Leu Asp Gly Lys Lys Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly 1365 1370 1375 Thr Leu Met Val Phe Phe Gly Asn Val Asp Ser Ser Gly Ile Lys His 1380 1385 1390 Asn Ile Phe Asn Pro Pro Ile Ile Ala Arg Tyr Ile Arg Leu His Pro 1395 1400 1405 Thr His Tyr Ser Ile Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys 1410 1415 1420 Asp Leu Asn Ser Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile 1425 1430 1435 1440 Ser Asp Ala Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala 1445 1450 1455 Thr Trp Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn 1460 1465 1470 Ala Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp 1475 1480 1485 Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val Lys 1490 1495 1500 Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser 1505 1510 1515 1520 Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly Lys Val Lys 1525 1530 1535 Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val Val Asn Ser Leu 1540 1545 1550 Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile His Pro Gln Ser Trp 1555 1560 1565 Val His Gln Ile Ala Leu Arg Met Glu Val Leu Gly Cys Glu Ala Gln 1570 1575 1580 Asp Leu Tyr 1585 <210> 7 <211> 1644 <212> PRT <213> Artificial Sequence <220> <223> G6_opt (scF7) <400> 7 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Ile Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Ser Leu Gly Pro Pro Ser Met Pro Val His 900 905 910 Tyr Asp Ser Gln Leu Asp Thr Thr Leu Phe Gly Lys Lys Ser Ser Pro 915 920 925 Leu Thr Glu Ser Gly Gly Pro Leu Ser Leu Ser Glu Glu Asn Asn Asp 930 935 940 Ser Lys Leu Leu Glu Ser Gly Leu Met Asn Ser Gln Glu Ser Ser Trp 945 950 955 960 Gly Lys Asn Val Ser Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp Tyr 965 970 975 Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile Tyr 980 985 990 Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr Arg 995 1000 1005 His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met Ser 1010 1015 1020 Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val Pro 1025 1030 1035 1040 Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe Thr 1045 1050 1055 Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu Gly 1060 1065 1070 Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Arg 1075 1080 1085 Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr 1090 1095 1100 Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val Lys 1105 1110 1115 1120 Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met Ala 1125 1130 1135 Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp 1140 1145 1150 Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu 1155 1160 1165 Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val Thr 1170 1175 1180 Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser 1185 1190 1195 1200 Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys Asn 1205 1210 1215 Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His Ala 1220 1225 1230 Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala Gln 1235 1240 1245 Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu Asn 1250 1255 1260 Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys Lys 1265 1270 1275 1280 Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe Glu 1285 1290 1295 Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu Cys 1300 1305 1310 Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu Val 1315 1320 1325 Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His Ile 1330 1335 1340 Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro 1345 1350 1355 1360 Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr 1365 1370 1375 Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile 1380 1385 1390 Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu 1395 1400 1405 Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp 1410 1415 1420 Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly 1425 1430 1435 1440 Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro Ile 1445 1450 1455 Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg Ser 1460 1465 1470 Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser Met 1475 1480 1485 Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr Ala 1490 1495 1500 Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys Ala 1505 1510 1515 1520 Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val Asn 1525 1530 1535 Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys Val 1540 1545 1550 Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met Tyr 1555 1560 1565 Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp Thr 1570 1575 1580 Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln Asp 1585 1590 1595 1600 Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg 1605 1610 1615 Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg 1620 1625 1630 Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1635 1640 <210> 8 <211> 1581 <212> PRT <213> Artificial Sequence <220> <223> G4_B3 <400> 8 Ala Thr Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser Trp Asp Tyr 1 5 10 15 Met Gln Ser Asp Leu Gly Glu Leu Pro Val Asp Ala Arg Phe Pro Pro 20 25 30 Arg Val Pro Lys Ser Phe Pro Phe Asn Thr Ser Val Val Tyr Lys Lys 35 40 45 Thr Leu Phe Val Glu Phe Thr Asp His Leu Phe Asn Ile Ala Lys Pro 50 55 60 Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile Gln Ala Glu Val 65 70 75 80 Tyr Asp Thr Val Val Ile Thr Leu Lys Asn Met Ala Ser His Pro Val 85 90 95 Ser Leu His Ala Val Gly Val Ser Tyr Trp Lys Ala Ser Glu Gly Ala 100 105 110 Glu Tyr Asp Asp Gln Thr Ser Gln Arg Glu Lys Glu Asp Asp Lys Val 115 120 125 Phe Pro Gly Gly Ser His Thr Tyr Val Trp Gln Val Leu Lys Glu Asn 130 135 140 Gly Pro Met Ala Ser Asp Pro Leu Cys Leu Thr Tyr Ser Tyr Leu Ser 145 150 155 160 His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu Ile Gly Ala Leu 165 170 175 Leu Val Cys Arg Glu Gly Ser Leu Ala Lys Glu Lys Thr Gln Thr Leu 180 185 190 His Lys Phe Ile Leu Leu Phe Ala Val Phe Asp Glu Gly Lys Ser Trp 195 200 205 His Ser Glu Thr Lys Asn Ser Leu Met Gln Asp Arg Asp Ala Ala Ser 210 215 220 Ala Arg Ala Trp Pro Lys Met His Thr Val Asn Gly Tyr Val Asn Arg 225 230 235 240 Ser Leu Pro Gly Leu Ile Gly Cys His Arg Lys Ser Val Tyr Trp His 245 250 255 Val Ile Gly Met Gly Thr Thr Pro Glu Val His Ser Ile Phe Leu Glu 260 265 270 Gly His Thr Phe Leu Val Arg Asn His Arg Gln Ala Ser Leu Glu Ile 275 280 285 Ser Pro Ile Thr Phe Leu Thr Ala Gln Thr Leu Leu Met Asp Leu Gly 290 295 300 Gln Phe Leu Leu Phe Cys His Ile Ser Ser His Gln His Asp Gly Met 305 310 315 320 Glu Ala Tyr Val Lys Val Asp Ser Cys Pro Glu Glu Pro Gln Leu Arg 325 330 335 Met Lys Asn Asn Glu Glu Ala Glu Asp Tyr Asp Asp Asp Leu Thr Asp 340 345 350 Ser Glu Met Asp Val Val Arg Phe Asp Asp Asp Asn Ser Pro Ser Phe 355 360 365 Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr Trp Val His 370 375 380 Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro Leu Val Leu 385 390 395 400 Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn Asn Gly Pro 405 410 415 Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met Ala Tyr Thr 420 425 430 Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu Ser Gly Ile 435 440 445 Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu Leu Ile Ile 450 455 460 Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro His Gly Ile 465 470 475 480 Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys Gly Val Lys 485 490 495 His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe Lys Tyr Lys 500 505 510 Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp Pro Arg Cys 515 520 525 Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg Asp Leu Ala 530 535 540 Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu Ser Val Asp 545 550 555 560 Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val Ile Leu Phe 565 570 575 Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu Asn Ile Gln 580 585 590 Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp Pro Glu Phe 595 600 605 Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val Phe Asp Ser 610 615 620 Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp Tyr Ile Leu 625 630 635 640 Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe Ser Gly Tyr 645 650 655 Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr Leu Phe Pro 660 665 670 Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro Gly Leu Trp 675 680 685 Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly Met Thr Ala 690 695 700 Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp Tyr Tyr Glu 705 710 715 720 Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys Asn Asn Ala 725 730 735 Ile Glu Pro Arg Ser Phe Ser Gln Asn Ser Arg His Pro Ser Thr Arg 740 745 750 Gln Lys Gln Phe Asn Ala Thr Thr Ile Pro Glu Asn Asp Ile Glu Lys 755 760 765 Thr Asp Pro Trp Phe Ala His Arg Thr Pro Met Pro Lys Cys Gln Asn 770 775 780 Val Ser Ser Ser Asp Leu Leu Met Leu Leu Arg Gln Ser Pro Thr Pro 785 790 795 800 His Gly Leu Ser Leu Ser Asp Leu Gln Glu Ala Lys Tyr Glu Thr Phe 805 810 815 Ser Asp Asp Pro Ser Pro Gly Ala Ile Asp Ser Asn Asn Ser Leu Ser 820 825 830 Glu Met Thr His Phe Arg Pro Gln Leu His His Ser Gly Asp Met Val 835 840 845 Phe Thr Pro Glu Ser Gly Leu Gln Leu Arg Leu Asn Glu Lys Leu Gly 850 855 860 Thr Thr Ala Ala Thr Glu Leu Lys Lys Leu Asp Phe Lys Val Ser Ser 865 870 875 880 Thr Ser Asn Asn Leu Ile Ser Thr Ile Pro Ser Asp Asn Leu Ala Ala 885 890 895 Gly Thr Asp Asn Thr Ser Thr Leu Gln Ser Asp Gln Glu Glu Ile Asp 900 905 910 Tyr Asp Asp Thr Ile Ser Val Glu Met Lys Lys Glu Asp Phe Asp Ile 915 920 925 Tyr Asp Glu Asp Glu Asn Gln Ser Pro Arg Ser Phe Gln Lys Lys Thr 930 935 940 Arg His Tyr Phe Ile Ala Ala Val Glu Arg Leu Trp Asp Tyr Gly Met 945 950 955 960 Ser Ser Ser Pro His Val Leu Arg Asn Arg Ala Gln Ser Gly Ser Val 965 970 975 Pro Gln Phe Lys Lys Val Val Phe Gln Glu Phe Thr Asp Gly Ser Phe 980 985 990 Thr Gln Pro Leu Tyr Arg Gly Glu Leu Asn Glu His Leu Gly Leu Leu 995 1000 1005 Gly Pro Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe 1010 1015 1020 Arg Asn Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser 1025 1030 1035 1040 Tyr Glu Glu Asp Gln Arg Gln Gly Ala Glu Pro Arg Lys Asn Phe Val 1045 1050 1055 Lys Pro Asn Glu Thr Lys Thr Tyr Phe Trp Lys Val Gln His His Met 1060 1065 1070 Ala Pro Thr Lys Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser 1075 1080 1085 Asp Val Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu 1090 1095 1100 Leu Val Cys His Thr Asn Thr Leu Asn Pro Ala His Gly Arg Gln Val 1105 1110 1115 1120 Thr Val Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys 1125 1130 1135 Ser Trp Tyr Phe Thr Glu Asn Met Glu Arg Asn Cys Arg Ala Pro Cys 1140 1145 1150 Asn Ile Gln Met Glu Asp Pro Thr Phe Lys Glu Asn Tyr Arg Phe His 1155 1160 1165 Ala Ile Asn Gly Tyr Ile Met Asp Thr Leu Pro Gly Leu Val Met Ala 1170 1175 1180 Gln Asp Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly Ser Asn Glu 1185 1190 1195 1200 Asn Ile His Ser Ile His Phe Ser Gly His Val Phe Thr Val Arg Lys 1205 1210 1215 Lys Glu Glu Tyr Lys Met Ala Leu Tyr Asn Leu Tyr Pro Gly Val Phe 1220 1225 1230 Glu Thr Val Glu Met Leu Pro Ser Lys Ala Gly Ile Trp Arg Val Glu 1235 1240 1245 Cys Leu Ile Gly Glu His Leu His Ala Gly Met Ser Thr Leu Phe Leu 1250 1255 1260 Val Tyr Ser Asn Lys Cys Gln Thr Pro Leu Gly Met Ala Ser Gly His 1265 1270 1275 1280 Ile Arg Asp Phe Gln Ile Thr Ala Ser Gly Gln Tyr Gly Gln Trp Ala 1285 1290 1295 Pro Lys Leu Ala Arg Leu His Tyr Ser Gly Ser Ile Asn Ala Trp Ser 1300 1305 1310 Thr Lys Glu Pro Phe Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met 1315 1320 1325 Ile Ile His Gly Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser 1330 1335 1340 Leu Tyr Ile Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys 1345 1350 1355 1360 Trp Gln Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe 1365 1370 1375 Gly Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro 1380 1385 1390 Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile Arg 1395 1400 1405 Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser Cys Ser 1410 1415 1420 Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala Gln Ile Thr 1425 1430 1435 1440 Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp Ser Pro Ser Lys 1445 1450 1455 Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala Trp Arg Pro Gln Val 1460 1465 1470 Asn Asn Pro Lys Glu Trp Leu Gln Val Asp Phe Gln Lys Thr Met Lys 1475 1480 1485 Val Thr Gly Val Thr Thr Gln Gly Val Lys Ser Leu Leu Thr Ser Met 1490 1495 1500 Tyr Val Lys Glu Phe Leu Ile Ser Ser Ser Gln Asp Gly His Gln Trp 1505 1510 1515 1520 Thr Leu Phe Phe Gln Asn Gly Lys Val Lys Val Phe Gln Gly Asn Gln 1525 1530 1535 Asp Ser Phe Thr Pro Val Val Asn Ser Leu Asp Pro Pro Leu Leu Thr 1540 1545 1550 Arg Tyr Leu Arg Ile His Pro Gln Ser Trp Val His Gln Ile Ala Leu 1555 1560 1565 Arg Met Glu Val Leu Gly Cys Glu Ala Gln Asp Leu Tyr 1570 1575 1580 <210> 9 <211> 4404 <212> DNA <213> Artificial Sequence <220> <223> G2 <400> 9 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaaatacaaa atgtctcctc tagtactctt cagtcagatc aagaggaaat tgactatgat 2400 gataccatat cagttgaaat gaagaaggaa gattttgaca tttatgatga ggatgaaaat 2460 cagagccccc gcagctttca aaagaaaaca cgacactatt ttattgctgc agtggagagg 2520 ctctgggatt atgggatgag tagctcccca catgttctaa gaaacagggc tcagagtggc 2580 agtgtccctc agttcaagaa agttgttttc caggaattta ctgatggctc ctttactcag 2640 cccttatacc gtggagaact aaatgaacat ttgggactcc tggggccata tataagagca 2700 gaagttgaag ataatatcat ggtaactttc agaaatcagg cctctcgtcc ctattccttc 2760 tattctagcc ttatttctta tgaggaagat cagaggcaag gagcagaacc tagaaaaaac 2820 tttgtcaagc ctaatgaaac caaaacttac ttttggaaag tgcaacatca tatggcaccc 2880 actaaagatg agtttgactg caaagcctgg gcttatttct ctgatgttga cctggaaaaa 2940 gatgtgcact caggcctgat tggacccctt ctggtctgcc acactaacac actgaaccct 3000 gctcatggga gacaagtgac agtacaggaa tttgctctgt ttttcaccat ctttgatgag 3060 accaaaagct ggtacttcac tgaaaatatg gaaagaaact gcagggctcc ctgcaatatc 3120 cagatggaag atcccacttt taaagagaat tatcgcttcc atgcaatcaa tggctacata 3180 atggatacac tacctggctt agtaatggct caggatcaaa ggattcgatg gtatctgctc 3240 agcatgggca gcaatgaaaa catccattct attcatttca gtggacatgt gttcactgta 3300 cgaaaaaaag aggagtataa aatggcactg tacaatctct atccaggtgt ttttgagaca 3360 gtggaaatgt taccatccaa agctggaatt tggcgggtgg aatgccttat tggcgagcat 3420 ctacatgctg ggatgagcac actttttctg gtgtacagca ataagtgtca gactcccctg 3480 ggaatggctt ctggacacat tagagatttt cagattacag cttcaggaca atatggacag 3540 tgggccccaa agctggccag acttcattat tccggatcaa tcaatgcctg gagcaccaag 3600 gagccctttt cttggatcaa ggtggatctg ttggcaccaa tgattattca cggcatcaag 3660 acccagggtg cccgtcagaa gttctccagc ctctacatct ctcagtttat catcatgtat 3720 agtcttgatg ggaagaagtg gcagacttat cgaggaaatt ccactggaac cttaatggtc 3780 ttctttggca atgtggattc atctgggata aaacacaata tttttaaccc tccaattatt 3840 gctcgataca tccgtttgca cccaactcat tatagcattc gcagcactct tcgcatggag 3900 ttgatgggct gtgatttaaa tagttgcagc atgccattgg gaatggagag taaagcaata 3960 tcagatgcac agattactgc ttcatcctac tttaccaata tgtttgccac ctggtctcct 4020 tcaaaagctc gacttcacct ccaagggagg agtaatgcct ggagacctca ggtgaataat 4080 ccaaaagagt ggctgcaagt ggacttccag aagacaatga aagtcacagg agtaactact 4140 cagggagtaa aatctctgct taccagcatg tatgtgaagg agttcctcat ctccagcagt 4200 caagatggcc atcagtggac tctctttttt cagaatggca aagtaaaggt ttttcaggga 4260 aatcaagact ccttcacacc tgtggtgaac tctctagacc caccgttact gactcgctac 4320 cttcgaattc acccccagag ttgggtgcac cagattgccc tgaggatgga ggttctgggc 4380 tgcgaggcac aggacctcta ctga 4404 <210> 10 <211> 4536 <212> DNA <213> Artificial Sequence <220> <223> G3 <400> 10 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400 catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460 tcacctggag caatagacag taataacagc ctgtctactc ttcagtcaga tcaagaggaa 2520 attgactatg atgataccat atcagttgaa atgaagaagg aagattttga catttatgat 2580 gaggatgaaa atcagagccc ccgcagcttt caaaagaaaa cacgacacta ttttattgct 2640 gcagtggaga ggctctggga ttatgggatg agtagctccc cacatgttct aagaaacagg 2700 gctcagagtg gcagtgtccc tcagttcaag aaagttgttt tccaggaatt tactgatggc 2760 tcctttactc agcccttata ccgtggagaa ctaaatgaac atttgggact cctggggcca 2820 tatataagag cagaagttga agataatatc atggtaactt tcagaaatca ggcctctcgt 2880 ccctattcct tctattctag ccttatttct tatgaggaag atcagaggca aggagcagaa 2940 cctagaaaaa actttgtcaa gcctaatgaa accaaaactt acttttggaa agtgcaacat 3000 catatggcac ccactaaaga tgagtttgac tgcaaagcct gggcttattt ctctgatgtt 3060 gacctggaaa aagatgtgca ctcaggcctg attggacccc ttctggtctg ccacactaac 3120 acactgaacc ctgctcatgg gagacaagtg acagtacagg aatttgctct gtttttcacc 3180 atctttgatg agaccaaaag ctggtacttc actgaaaata tggaaagaaa ctgcagggct 3240 ccctgcaata tccagatgga agatcccact tttaaagaga attatcgctt ccatgcaatc 3300 aatggctaca taatggatac actacctggc ttagtaatgg ctcaggatca aaggattcga 3360 tggtatctgc tcagcatggg cagcaatgaa aacatccatt ctattcattt cagtggacat 3420 gtgttcactg tacgaaaaaa agaggagtat aaaatggcac tgtacaatct ctatccaggt 3480 gtttttgaga cagtggaaat gttaccatcc aaagctggaa tttggcgggt ggaatgcctt 3540 attggcgagc atctacatgc tgggatgagc acactttttc tggtgtacag caataagtgt 3600 cagactcccc tgggaatggc ttctggacac attagagatt ttcagattac agcttcagga 3660 caatatggac agtgggcccc aaagctggcc agacttcatt attccggatc aatcaatgcc 3720 tggagcacca aggagccctt ttcttggatc aaggtggatc tgttggcacc aatgattatt 3780 cacggcatca agacccaggg tgcccgtcag aagttctcca gcctctacat ctctcagttt 3840 atcatcatgt atagtcttga tgggaagaag tggcagactt atcgaggaaa ttccactgga 3900 accttaatgg tcttctttgg caatgtggat tcatctggga taaaacacaa tatttttaac 3960 cctccaatta ttgctcgata catccgtttg cacccaactc attatagcat tcgcagcact 4020 cttcgcatgg agttgatggg ctgtgattta aatagttgca gcatgccatt gggaatggag 4080 agtaaagcaa tatcagatgc acagattact gcttcatcct actttaccaa tatgtttgcc 4140 acctggtctc cttcaaaagc tcgacttcac ctccaaggga ggagtaatgc ctggagacct 4200 caggtgaata atccaaaaga gtggctgcaa gtggacttcc agaagacaat gaaagtcaca 4260 ggagtaacta ctcagggagt aaaatctctg cttaccagca tgtatgtgaa ggagttcctc 4320 atctccagca gtcaagatgg ccatcagtgg actctctttt ttcagaatgg caaagtaaag 4380 gtttttcagg gaaatcaaga ctccttcaca cctgtggtga actctctaga cccaccgtta 4440 ctgactcgct accttcgaat tcacccccag agttgggtgc accagattgc cctgaggatg 4500 gaggttctgg gctgcgaggc acaggacctc tactga 4536 <210> 11 <211> 4746 <212> DNA <213> Artificial Sequence <220> <223> G4 <400> 11 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400 catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460 tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520 ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580 gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640 acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700 acaagtactc ttcagtcaga tcaagaggaa attgactatg atgataccat atcagttgaa 2760 atgaagaagg aagattttga catttatgat gaggatgaaa atcagagccc ccgcagcttt 2820 caaaagaaaa cacgacacta ttttattgct gcagtggaga ggctctggga ttatgggatg 2880 agtagctccc cacatgttct aagaaacagg gctcagagtg gcagtgtccc tcagttcaag 2940 aaagttgttt tccaggaatt tactgatggc tcctttactc agcccttata ccgtggagaa 3000 ctaaatgaac atttgggact cctggggcca tatataagag cagaagttga agataatatc 3060 atggtaactt tcagaaatca ggcctctcgt ccctattcct tctattctag ccttatttct 3120 tatgaggaag atcagaggca aggagcagaa cctagaaaaa actttgtcaa gcctaatgaa 3180 accaaaactt acttttggaa agtgcaacat catatggcac ccactaaaga tgagtttgac 3240 tgcaaagcct gggcttattt ctctgatgtt gacctggaaa aagatgtgca ctcaggcctg 3300 attggacccc ttctggtctg ccacactaac acactgaacc ctgctcatgg gagacaagtg 3360 acagtacagg aatttgctct gtttttcacc atctttgatg agaccaaaag ctggtacttc 3420 actgaaaata tggaaagaaa ctgcagggct ccctgcaata tccagatgga agatcccact 3480 tttaaagaga attatcgctt ccatgcaatc aatggctaca taatggatac actacctggc 3540 ttagtaatgg ctcaggatca aaggattcga tggtatctgc tcagcatggg cagcaatgaa 3600 aacatccatt ctattcattt cagtggacat gtgttcactg tacgaaaaaa agaggagtat 3660 aaaatggcac tgtacaatct ctatccaggt gtttttgaga cagtggaaat gttaccatcc 3720 aaagctggaa tttggcgggt ggaatgcctt attggcgagc atctacatgc tgggatgagc 3780 acactttttc tggtgtacag caataagtgt cagactcccc tgggaatggc ttctggacac 3840 attagagatt ttcagattac agcttcagga caatatggac agtgggcccc aaagctggcc 3900 agacttcatt attccggatc aatcaatgcc tggagcacca aggagccctt ttcttggatc 3960 aaggtggatc tgttggcacc aatgattatt cacggcatca agacccaggg tgcccgtcag 4020 aagttctcca gcctctacat ctctcagttt atcatcatgt atagtcttga tgggaagaag 4080 tggcagactt atcgaggaaa ttccactgga accttaatgg tcttctttgg caatgtggat 4140 tcatctggga taaaacacaa tatttttaac cctccaatta ttgctcgata catccgtttg 4200 cacccaactc attatagcat tcgcagcact cttcgcatgg agttgatggg ctgtgattta 4260 aatagttgca gcatgccatt gggaatggag agtaaagcaa tatcagatgc acagattact 4320 gcttcatcct actttaccaa tatgtttgcc acctggtctc cttcaaaagc tcgacttcac 4380 ctccaaggga ggagtaatgc ctggagacct caggtgaata atccaaaaga gtggctgcaa 4440 gtggacttcc agaagacaat gaaagtcaca ggagtaacta ctcagggagt aaaatctctg 4500 cttaccagca tgtatgtgaa ggagttcctc atctccagca gtcaagatgg ccatcagtgg 4560 actctctttt ttcagaatgg caaagtaaag gtttttcagg gaaatcaaga ctccttcaca 4620 cctgtggtga actctctaga cccaccgtta ctgactcgct accttcgaat tcacccccag 4680 agttgggtgc accagattgc cctgaggatg gaggttctgg gctgcgaggc acaggacctc 4740 tactga 4746 <210> 12 <211> 4935 <212> DNA <213> Artificial Sequence <220> <223> G6 <400> 12 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400 catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460 tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520 ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580 gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640 acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700 acaagttcct taggaccccc aagtatgcca gttcattatg atagtcaatt agataccact 2760 ctatttggca aaaagtcatc tccccttact gagtctggtg gacctctgag cttgagtgaa 2820 gaaaataatg attcaaagtt gttagaatca ggtttaatga atagccaaga aagttcatgg 2880 ggaaaaaatg tatcgactct tcagtcagat caagaggaaa ttgactatga tgataccata 2940 tcagttgaaa tgaagaagga agattttgac atttatgatg aggatgaaaa tcagagcccc 3000 cgcagctttc aaaagaaaac acgacactat tttattgctg cagtggagag gctctgggat 3060 tatgggatga gtagctcccc acatgttcta agaaacaggg ctcagagtgg cagtgtccct 3120 cagttcaaga aagttgtttt ccaggaattt actgatggct cctttactca gcccttatac 3180 cgtggagaac taaatgaaca tttgggactc ctggggccat atataagagc agaagttgaa 3240 gataatatca tggtaacttt cagaaatcag gcctctcgtc cctattcctt ctattctagc 3300 cttatttctt atgaggaaga tcagaggcaa ggagcagaac ctagaaaaaa ctttgtcaag 3360 cctaatgaaa ccaaaactta cttttggaaa gtgcaacatc atatggcacc cactaaagat 3420 gagtttgact gcaaagcctg ggcttatttc tctgatgttg acctggaaaa agatgtgcac 3480 tcaggcctga ttggacccct tctggtctgc cacactaaca cactgaaccc tgctcatggg 3540 agacaagtga cagtacagga atttgctctg tttttcacca tctttgatga gaccaaaagc 3600 tggtacttca ctgaaaatat ggaaagaaac tgcagggctc cctgcaatat ccagatggaa 3660 gatcccactt ttaaagagaa ttatcgcttc catgcaatca atggctacat aatggataca 3720 ctacctggct tagtaatggc tcaggatcaa aggattcgat ggtatctgct cagcatgggc 3780 agcaatgaaa acatccattc tattcatttc agtggacatg tgttcactgt acgaaaaaaa 3840 gaggagtata aaatggcact gtacaatctc tatccaggtg tttttgagac agtggaaatg 3900 ttaccatcca aagctggaat ttggcgggtg gaatgcctta ttggcgagca tctacatgct 3960 gggatgagca cactttttct ggtgtacagc aataagtgtc agactcccct gggaatggct 4020 tctggacaca ttagagattt tcagattaca gcttcaggac aatatggaca gtgggcccca 4080 aagctggcca gacttcatta ttccggatca atcaatgcct ggagcaccaa ggagcccttt 4140 tcttggatca aggtggatct gttggcacca atgattattc acggcatcaa gacccagggt 4200 gcccgtcaga agttctccag cctctacatc tctcagttta tcatcatgta tagtcttgat 4260 gggaagaagt ggcagactta tcgaggaaat tccactggaa ccttaatggt cttctttggc 4320 aatgtggatt catctgggat aaaacacaat atttttaacc ctccaattat tgctcgatac 4380 atccgtttgc acccaactca ttatagcatt cgcagcactc ttcgcatgga gttgatgggc 4440 tgtgatttaa atagttgcag catgccattg ggaatggaga gtaaagcaat atcagatgca 4500 cagattactg cttcatccta ctttaccaat atgtttgcca cctggtctcc ttcaaaagct 4560 cgacttcacc tccaagggag gagtaatgcc tggagacctc aggtgaataa tccaaaagag 4620 tggctgcaag tggacttcca gaagacaatg aaagtcacag gagtaactac tcagggagta 4680 aaatctctgc ttaccagcat gtatgtgaag gagttcctca tctccagcag tcaagatggc 4740 catcagtgga ctctcttttt tcagaatggc aaagtaaagg tttttcaggg aaatcaagac 4800 tccttcacac ctgtggtgaa ctctctagac ccaccgttac tgactcgcta ccttcgaatt 4860 cacccccaga gttgggtgca ccagattgcc ctgaggatgg aggttctggg ctgcgaggca 4920 caggacctct actga 4935 <210> 13 <211> 4764 <212> DNA <213> Artificial Sequence <220> <223> G4-flex <400> 13 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaaatacaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400 catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460 tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520 ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580 gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640 acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700 acaagttctc aaaacccacc agtcactctt cagtcagatc aagaggaaat tgactatgat 2760 gataccatat cagttgaaat gaagaaggaa gattttgaca tttatgatga ggatgaaaat 2820 cagagccccc gcagctttca aaagaaaaca cgacactatt ttattgctgc agtggagagg 2880 ctctgggatt atgggatgag tagctcccca catgttctaa gaaacagggc tcagagtggc 2940 agtgtccctc agttcaagaa agttgttttc caggaattta ctgatggctc ctttactcag 3000 cccttatacc gtggagaact aaatgaacat ttgggactcc tggggccata tataagagca 3060 gaagttgaag ataatatcat ggtaactttc agaaatcagg cctctcgtcc ctattccttc 3120 tattctagcc ttatttctta tgaggaagat cagaggcaag gagcagaacc tagaaaaaac 3180 tttgtcaagc ctaatgaaac caaaacttac ttttggaaag tgcaacatca tatggcaccc 3240 actaaagatg agtttgactg caaagcctgg gcttatttct ctgatgttga cctggaaaaa 3300 gatgtgcact caggcctgat tggacccctt ctggtctgcc acactaacac actgaaccct 3360 gctcatggga gacaagtgac agtacaggaa tttgctctgt ttttcaccat ctttgatgag 3420 accaaaagct ggtacttcac tgaaaatatg gaaagaaact gcagggctcc ctgcaatatc 3480 cagatggaag atcccacttt taaagagaat tatcgcttcc atgcaatcaa tggctacata 3540 atggatacac tacctggctt agtaatggct caggatcaaa ggattcgatg gtatctgctc 3600 agcatgggca gcaatgaaaa catccattct attcatttca gtggacatgt gttcactgta 3660 cgaaaaaaag aggagtataa aatggcactg tacaatctct atccaggtgt ttttgagaca 3720 gtggaaatgt taccatccaa agctggaatt tggcgggtgg aatgccttat tggcgagcat 3780 ctacatgctg ggatgagcac actttttctg gtgtacagca ataagtgtca gactcccctg 3840 ggaatggctt ctggacacat tagagatttt cagattacag cttcaggaca atatggacag 3900 tgggccccaa agctggccag acttcattat tccggatcaa tcaatgcctg gagcaccaag 3960 gagccctttt cttggatcaa ggtggatctg ttggcaccaa tgattattca cggcatcaag 4020 acccagggtg cccgtcagaa gttctccagc ctctacatct ctcagtttat catcatgtat 4080 agtcttgatg ggaagaagtg gcagacttat cgaggaaatt ccactggaac cttaatggtc 4140 ttctttggca atgtggattc atctgggata aaacacaata tttttaaccc tccaattatt 4200 gctcgataca tccgtttgca cccaactcat tatagcattc gcagcactct tcgcatggag 4260 ttgatgggct gtgatttaaa tagttgcagc atgccattgg gaatggagag taaagcaata 4320 tcagatgcac agattactgc ttcatcctac tttaccaata tgtttgccac ctggtctcct 4380 tcaaaagctc gacttcacct ccaagggagg agtaatgcct ggagacctca ggtgaataat 4440 ccaaaagagt ggctgcaagt ggacttccag aagacaatga aagtcacagg agtaactact 4500 cagggagtaa aatctctgct taccagcatg tatgtgaagg agttcctcat ctccagcagt 4560 caagatggcc atcagtggac tctctttttt cagaatggca aagtaaaggt ttttcaggga 4620 aatcaagact ccttcacacc tgtggtgaac tctctagacc caccgttact gactcgctac 4680 cttcgaattc acccccagag ttgggtgcac cagattgccc tgaggatgga ggttctgggc 4740 tgcgaggcac aggacctcta ctga 4764 <210> 14 <211> 4935 <212> DNA <213> Artificial Sequence <220> <223> G6_opt <400> 14 gccacccggc ggtactacct gggcgccgtg gaactgtcct gggactacat gcagtccgac 60 ctgggcgagc tgcccgtgga cgccagattc cccccaagag tgcccaagtc cttccccttc 120 aacacctccg tggtgtacaa gaaaaccctg ttcgtggaat tcaccgacca cctgttcaat 180 atcgccaagc ctcggccccc ttggatgggc ctgctgggcc ctacaatcca ggccgaggtg 240 tacgacaccg tggtgatcac cctgaagaac atggcctccc accccgtgtc cctgcacgcc 300 gtgggcgtgt cctactggaa ggcctctgag ggcgccgagt acgacgacca gacctcccag 360 cgcgagaaag aggacgacaa ggtgttccct ggcggctccc acacctacgt gtggcaggtg 420 ctgaaagaaa acggccctat ggcctccgac cctctgtgcc tgacctactc ctacctgtcc 480 cacgtggacc tggtgaaaga cctgaactcc ggcctgatcg gcgccctgct ggtgtgcaga 540 gagggctccc tggccaaaga aaagacccag accctgcaca agttcatcct gctgttcgcc 600 gtgttcgacg agggcaagtc ctggcactcc gagacaaaga actccctgat gcaggaccgg 660 gacgccgcct ctgccagagc ctggcctaag atgcacaccg tgaacggcta cgtgaaccgg 720 tccctgcccg gactgatcgg ctgccaccgg aagtccgtgt actggcacgt gatcggcatg 780 ggcaccaccc ccgaggtgca ctccatcttt ctggaaggcc acacctttct ggtgcgaaac 840 caccggcagg cctccctgga aatctcccct atcaccttcc tgaccgctca gaccctgctg 900 atggacctgg gccagttcct gctgttttgc cacatctcca gccaccagca cgacggcatg 960 gaagcctacg tgaaggtgga ctcctgcccc gaggaacccc agctgcggat gaagaacaac 1020 gaggaagccg aggactacga cgacgacctg accgactccg agatggacgt ggtgcgattc 1080 gacgacgaca actcccccag cttcatccag atcagatccg tggccaagaa gcaccccaag 1140 acctgggtgc actatatcgc cgccgaggaa gaggactggg actacgcccc tctggtgctg 1200 gcccctgacg accggtccta caagtcccag tacctgaaca acggccccca gcggatcggc 1260 cggaagtaca agaaagtgcg gttcatggcc tacaccgacg agacattcaa gaccagagag 1320 gccatccagc acgagtccgg catcctgggc cccctgctgt acggcgaagt gggcgacaca 1380 ctgctgatca tcttcaagaa ccaggcctcc cggccctaca acatctaccc ccacggcatc 1440 accgacgtgc ggcccctgta ctctcggcgg ctgcctaagg gcgtgaagca cctgaaggac 1500 ttccccatcc tgcccggcga gatcttcaag tacaagtgga ccgtgaccgt ggaagatggc 1560 cccaccaagt ccgaccccag atgcctgacc cggtactact cctccttcgt gaacatggaa 1620 cgggacctgg ccagcggcct gattggacct ctgctgatct gctacaaaga atccgtggac 1680 cagcggggca accagatcat gtccgacaag cggaacgtga tcctgttcag cgtgttcgat 1740 gagaaccggt cctggtatct gaccgagaac atccagcggt ttctgcccaa ccctgccggc 1800 gtgcagctgg aagatcccga gttccaggcc tccaacatca tgcacagcat caatggctac 1860 gtgttcgact ccctgcagct gagcgtgtgc ctgcacgagg tggcctactg gtacatcctg 1920 tccatcggcg cccagaccga cttcctgtcc gtgttcttct ccggctacac cttcaagcac 1980 aagatggtgt acgaggatac cctgaccctg ttccccttct ccggcgaaac cgtgttcatg 2040 tccatggaaa accccggcct gtggatcctg ggctgccaca actccgactt ccggaaccgg 2100 ggcatgaccg ccctgctgaa ggtgtcctcc tgcgacaaga acaccggcga ctactacgag 2160 gactcttacg aggacatctc cgcctacctg ctgtccaaga acaacgccat cgagccccgg 2220 tccttcagcc agaactcccg gcacccttcc acccggcaga agcagttcaa cgccaccacc 2280 atccccgaga acgacatcga aaagaccgac ccttggtttg cccaccggac ccccatgccc 2340 aagatccaga acgtgtcctc ctctgacctg ctgatgctgc tgcggcagtc ccccacccct 2400 cacggcctgt ctctgagcga cctgcaggaa gctaagtacg agactttctc cgacgacccc 2460 tcccctggcg ccatcgactc caacaactcc ctgtccgaga tgacccactt ccggccccag 2520 ctgcaccact ccggcgacat ggtgttcacc cccgagtctg gcctgcagct gcggctgaac 2580 gagaagctgg gcaccacagc cgccaccgag ctgaagaaac tggacttcaa ggtgtccagc 2640 acctccaaca acctgatctc caccatccct tccgacaacc tggccgctgg caccgacaac 2700 acctcttccc tgggccctcc ctccatgccc gtgcactacg actcccagct ggacaccacc 2760 ctgttcggca agaagtccag ccccctgacc gagtccggcg gacccctgtc cctgtctgag 2820 gaaaacaacg actccaagct gctggaatct ggcctgatga actcccagga atcctcctgg 2880 ggcaagaatg tgtccaccct gcagagcgac caggaagaga tcgattacga cgacaccatc 2940 tccgtggaaa tgaagaaaga ggatttcgac atctacgacg aggacgagaa ccagtcccct 3000 cggtccttcc agaagaaaac ccggcactac tttatcgccg ctgtggaacg gctgtgggac 3060 tacggcatgt cctcctcccc ccacgtgctg cggaacagag cccagtccgg ctccgtgccc 3120 cagttcaaga aagtggtgtt ccaggaattc acagacggca gcttcaccca gcccctgtac 3180 cggggcgagc tgaatgagca cctgggactg ctgggacctt acatcagagc tgaggtggaa 3240 gataacatca tggtgacatt ccggaaccag gccagcagac cctactcctt ctactccagc 3300 ctgatctcct acgaagagga ccagcggcag ggcgctgagc cccggaagaa cttcgtgaag 3360 cccaacgaga ctaagaccta cttctggaag gtgcagcacc acatggctcc taccaaggac 3420 gagttcgact gcaaggcctg ggcctacttc tccgatgtgg acctggaaaa ggacgtgcac 3480 agcgggctga ttggcccact gctggtgtgc cacaccaaca ccctgaaccc cgcccacggc 3540 agacaggtga cagtgcagga attcgccctg ttcttcacca tcttcgacga gacaaagtcc 3600 tggtacttca ccgagaatat ggaacggaac tgcagagccc cctgcaacat ccagatggaa 3660 gatcctacct tcaaagagaa ctaccggttc cacgccatca acggctacat catggacacc 3720 ctgcccggcc tggtgatggc ccaggaccag agaatccggt ggtatctgct gtccatgggc 3780 tccaacgaga atatccactc catccacttc tccggccacg tgttcaccgt gcggaagaaa 3840 gaagagtaca agatggccct gtacaacctg taccccggcg tgttcgagac agtggaaatg 3900 ctgccctcca aggccggcat ctggcgggtg gaatgtctga tcggcgagca tctgcacgcc 3960 ggaatgtcta ccctgttcct ggtgtactcc aacaagtgcc agacccccct gggcatggcc 4020 tccggccaca tccgggattt ccagatcacc gcctctggcc agtacggcca gtgggcccct 4080 aagctggccc ggctgcacta cagcggctcc atcaacgcct ggtctaccaa agagcccttc 4140 agctggatca aggtggacct gctggccccc atgatcatcc atggcatcaa gacccagggc 4200 gccagacaga agttctcctc cctgtacatc tcccagttca tcatcatgta ctccctggat 4260 ggcaagaagt ggcagaccta ccggggcaac tccaccggca ccctgatggt gttcttcggc 4320 aacgtggact cctccggcat caagcacaac atcttcaacc cccccatcat tgcccggtac 4380 atccggctgc accccaccca ctactccatc cggtctaccc tgcggatgga actgatgggc 4440 tgcgacctga acagctgctc catgcctctg ggcatggaat ccaaggccat ctccgacgcc 4500 cagatcacag ccagctccta cttcaccaac atgttcgcca cctggtcccc cagcaaggcc 4560 agactgcatc tgcagggccg gtccaacgct tggcggcctc aggtgaacaa ccccaaagaa 4620 tggctgcagg tggacttcca gaaaaccatg aaggtgacag gcgtgaccac ccagggcgtg 4680 aaatccctgc tgacctctat gtacgtgaaa gagttcctga tcagctcctc ccaggacggc 4740 caccagtgga ccctgttctt tcagaacggc aaagtgaaag tgttccaggg caaccaggac 4800 tccttcaccc ctgtggtgaa ctccctggac cccccactgc tgaccagata cctgcggatc 4860 cacccccagt cttgggtgca ccagatcgcc ctgagaatgg aagtgctggg atgcgaggcc 4920 caggatctgt actga 4935 <210> 15 <211> 4746 <212> DNA <213> Artificial Sequence <220> <223> G4_B3 <400> 15 gccaccagaa gatactacct gggtgcagtg gaactgtcat gggactatat gcaaagtgat 60 ctcggtgagc tgcctgtgga cgcaagattt cctcctagag tgccaaaatc ttttccattc 120 aacacctcag tcgtgtacaa aaagactctg tttgtagaat tcacggatca ccttttcaac 180 atcgctaagc caaggccacc ctggatgggt ctgctaggtc ctaccatcca ggctgaggtt 240 tatgatacag tggtcattac acttaagaac atggcttccc atcctgtcag tcttcatgct 300 gttggtgtat cctactggaa agcttctgag ggagctgaat atgatgatca gaccagtcaa 360 agggagaaag aagatgataa agtcttccct ggtggaagcc atacatatgt ctggcaggtc 420 ctgaaagaga atggtccaat ggcctctgac ccactgtgcc ttacctactc atatctttct 480 catgtggacc tggtaaaaga cttgaattca ggcctcattg gagccctact agtatgtaga 540 gaagggagtc tggccaagga aaagacacag accttgcaca aatttatact actttttgct 600 gtatttgatg aagggaaaag ttggcactca gaaacaaaga actccttgat gcaggatagg 660 gatgctgcat ctgctcgggc ctggcctaaa atgcacacag tcaatggtta tgtaaacagg 720 tctctgccag gtctgattgg atgccacagg aaatcagtct attggcatgt gattggaatg 780 ggcaccactc ctgaagtgca ctcaatattc ctcgaaggtc acacatttct tgtgaggaac 840 catcgccagg cgtccttgga aatctcgcca ataactttcc ttactgctca aacactcttg 900 atggaccttg gacagtttct actgttttgt catatctctt cccaccaaca tgatggcatg 960 gaagcttatg tcaaagtaga cagctgtcca gaggaacccc aactacgaat gaaaaataat 1020 gaagaagcgg aagactatga tgatgatctt actgattctg aaatggatgt ggtcaggttt 1080 gatgatgaca actctccttc ctttatccaa attcgctcag ttgccaagaa gcatcctaaa 1140 acttgggtac attacattgc tgctgaagag gaggactggg actatgctcc cttagtcctc 1200 gcccccgatg acagaagtta taaaagtcaa tatttgaaca atggccctca gcggattggt 1260 aggaagtaca aaaaagtccg atttatggca tacacagatg aaacctttaa gactcgtgaa 1320 gctattcagc atgaatcagg aatcttggga cctttacttt atggggaagt tggagacaca 1380 ctgttgatta tatttaagaa tcaagcaagc agaccatata acatctaccc tcacggaatc 1440 actgatgtcc gtcctttgta ttcaaggaga ttaccaaaag gtgtaaaaca tttgaaggat 1500 tttccaattc tgccaggaga aatattcaaa tataaatgga cagtgactgt agaagatggg 1560 ccaactaaat cagatcctcg gtgcctgacc cgctattact ctagtttcgt taatatggag 1620 agagatctag cttcaggact cattggccct ctcctcatct gctacaaaga atctgtagat 1680 caaagaggaa accagataat gtcagacaag aggaatgtca tcctgttttc tgtatttgat 1740 gagaaccgaa gctggtacct cacagagaat atacaacgct ttctccccaa tccagctgga 1800 gtgcagcttg aggatccaga gttccaagcc tccaacatca tgcacagcat caatggctat 1860 gtttttgata gtttgcagtt gtcagtttgt ttgcatgagg tggcatactg gtacattcta 1920 agcattggag cacagactga cttcctttct gtcttcttct ctggatatac cttcaaacac 1980 aaaatggtct atgaagacac actcacccta ttcccattct caggagaaac tgtcttcatg 2040 tcgatggaaa acccaggtct atggattctg gggtgccaca actcagactt tcggaacaga 2100 ggcatgaccg ccttactgaa ggtttctagt tgtgacaaga acactggtga ttattacgag 2160 gacagttatg aagatatttc agcatacttg ctgagtaaaa acaatgccat tgaaccaaga 2220 agcttctccc agaattcaag acaccctagc actaggcaaa agcaatttaa tgccaccaca 2280 attccagaaa atgacataga gaagactgac ccttggtttg cacacagaac acctatgcct 2340 aaatgtcaaa atgtctcctc tagtgatttg ttgatgctct tgcgacagag tcctactcca 2400 catgggctat ccttatctga tctccaagaa gccaaatatg agactttttc tgatgatcca 2460 tcacctggag caatagacag taataacagc ctgtctgaaa tgacacactt caggccacag 2520 ctccatcaca gtggggacat ggtatttacc cctgagtcag gcctccaatt aagattaaat 2580 gagaaactgg ggacaactgc agcaacagag ttgaagaaac ttgatttcaa agtttctagt 2640 acatcaaata atctgatttc aacaattcca tcagacaatt tggcagcagg tactgataat 2700 acaagtactc ttcagtcaga tcaagaggaa attgactatg atgataccat atcagttgaa 2760 atgaagaagg aagattttga catttatgat gaggatgaaa atcagagccc ccgcagcttt 2820 caaaagaaaa cacgacacta ttttattgct gcagtggaga ggctctggga ttatgggatg 2880 agtagctccc cacatgttct aagaaacagg gctcagagtg gcagtgtccc tcagttcaag 2940 aaagttgttt tccaggaatt tactgatggc tcctttactc agcccttata ccgtggagaa 3000 ctaaatgaac atttgggact cctggggcca tatataagag cagaagttga agataatatc 3060 atggtaactt tcagaaatca ggcctctcgt ccctattcct tctattctag ccttatttct 3120 tatgaggaag atcagaggca aggagcagaa cctagaaaaa actttgtcaa gcctaatgaa 3180 accaaaactt acttttggaa agtgcaacat catatggcac ccactaaaga tgagtttgac 3240 tgcaaagcct gggcttattt ctctgatgtt gacctggaaa aagatgtgca ctcaggcctg 3300 attggacccc ttctggtctg ccacactaac acactgaacc ctgctcatgg gagacaagtg 3360 acagtacagg aatttgctct gtttttcacc atctttgatg agaccaaaag ctggtacttc 3420 actgaaaata tggaaagaaa ctgcagggct ccctgcaata tccagatgga agatcccact 3480 tttaaagaga attatcgctt ccatgcaatc aatggctaca taatggatac actacctggc 3540 ttagtaatgg ctcaggatca aaggattcga tggtatctgc tcagcatggg cagcaatgaa 3600 aacatccatt ctattcattt cagtggacat gtgttcactg tacgaaaaaa agaggagtat 3660 aaaatggcac tgtacaatct ctatccaggt gtttttgaga cagtggaaat gttaccatcc 3720 aaagctggaa tttggcgggt ggaatgcctt attggcgagc atctacatgc tgggatgagc 3780 acactttttc tggtgtacag caataagtgt cagactcccc tgggaatggc ttctggacac 3840 attagagatt ttcagattac agcttcagga caatatggac agtgggcccc aaagctggcc 3900 agacttcatt attccggatc aatcaatgcc tggagcacca aggagccctt ttcttggatc 3960 aaggtggatc tgttggcacc aatgattatt cacggcatca agacccaggg tgcccgtcag 4020 aagttctcca gcctctacat ctctcagttt atcatcatgt atagtcttga tgggaagaag 4080 tggcagactt atcgaggaaa ttccactgga accttaatgg tcttctttgg caatgtggat 4140 tcatctggga taaaacacaa tatttttaac cctccaatta ttgctcgata catccgtttg 4200 cacccaactc attatagcat tcgcagcact cttcgcatgg agttgatggg ctgtgattta 4260 aatagttgca gcatgccatt gggaatggag agtaaagcaa tatcagatgc acagattact 4320 gcttcatcct actttaccaa tatgtttgcc acctggtctc cttcaaaagc tcgacttcac 4380 ctccaaggga ggagtaatgc ctggagacct caggtgaata atccaaaaga gtggctgcaa 4440 gtggacttcc agaagacaat gaaagtcaca ggagtaacta ctcagggagt aaaatctctg 4500 cttaccagca tgtatgtgaa ggagttcctc atctccagca gtcaagatgg ccatcagtgg 4560 actctctttt ttcagaatgg caaagtaaag gtttttcagg gaaatcaaga ctccttcaca 4620 cctgtggtga actctctaga cccaccgtta ctgactcgct accttcgaat tcacccccag 4680 agttgggtgc accagattgc cctgaggatg gaggttctgg gctgcgaggc acaggacctc 4740 tactga 4746

Claims (18)

  1. 당단백질의 적어도 하나의 당쇄 말단의 시알산 유도체에 결합된 하기 화학식 1로 표시되는 링커를 포함하는, 체내 지속형 재조합 당단백질:
    [화학식 1]
    Figure pat00052

    R1 및 R2는 각각 독립적으로, C1- 8알킬, C6- 12아릴, C3- 6사이클로알킬, 3 내지 10원의 헤테로사이클로알킬, 아미노, (아미노)C1- 6알킬, (아미노)C3- 6사이클로알킬, (아미노)C6-12아릴, (아미노)(3 내지 10원의 헤테로사이클로알킬) 또는 5 내지 12원의 헤테로아릴이거나(이때, 상기 헤테로사이클로알킬 및 헤테로아릴은 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있고, 여기서, 상기 아미노는 H, 할로겐, CN, C1- 6알킬, 할로C1 - 3알킬 또는 C1- 6알콕시카보닐로 이루어진 군으로부터 선택되는 하나 이상의 치환기로 치환될 수 있다), 상기 R1과 R2는 서로 결합하여 8 내지 16원 헤테로융합고리를 형성할 수 있고(이때, 상기 헤테로융합고리는 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있다),
    상기 링커는 R1, R2 또는 R1과 R2가 서로 결합하여 형성하는 고리 중 적어도 하나에 연결된 생체적합성 중합체를 포함한다.
  2. 제1항에 있어서,
    상기 당단백질은 인자 VIIa, 인자 VIII, 인자 IX 및 이들의 조합으로 이루어진 군으로부터 선택된 적어도 하나인, 체내 지속형 재조합 당단백질.
  3. 제1항에 있어서,
    상기 생체적합성 중합체는, 폴리에틸렌글리콜(PEG), 폴리시알산(PSA), 폴리옥사졸린, 헤파로산(heparosan) 및 이들의 조합으로 이루어진 군으로부터 선택된 적어도 하나인, 체내 지속형 재조합 당단백질.
  4. 제3항에 있어서,
    상기 폴리에틸렌글리콜의 중량평균분자량은 5 내지 40 kDa인, 체내 지속형 재조합 당단백질.
  5. 제1항에 있어서,
    상기 화학식 1의 구조는 하기 화학식 2 내지 18 및 이들의 이성질체로 이루어진 군으로부터 선택된 적어도 하나인, 체내 지속형 재조합 당단백질:
    [화학식 2]
    Figure pat00053

    [화학식 3]
    Figure pat00054

    [화학식 4]
    Figure pat00055

    [화학식 5]
    Figure pat00056

    [화학식 6]
    Figure pat00057

    [화학식 7]
    Figure pat00058

    [화학식 8]
    Figure pat00059

    [화학식 9]
    Figure pat00060

    [화학식 10]
    Figure pat00061

    [화학식 11]
    Figure pat00062

    [화학식 12]
    Figure pat00063

    [화학식 13]
    Figure pat00064

    [화학식 14]
    Figure pat00065

    [화학식 15]
    Figure pat00066

    [화학식 16]
    Figure pat00067

    [화학식 17]
    Figure pat00068

    [화학식 18]
    Figure pat00069

    이때, L은 단일결합, 할로겐, C1- 8알킬, C6- 12아릴, -CO-, -R3CONR3-, -OCONR3- 또는 -R3NCOR3- 일 수 있고(상기 R3는 각각 독립적으로 H, C1- 4알킬, C6- 12아릴로부터 선택될 수 있다), X는 생체적합성 중합체이다.
  6. 제1항에 있어서,
    상기 화학식 1의 구조는 하기 화학식 19 내지 26으로 이루어진 군으로부터 선택된 적어도 하나인, 체내 지속형 재조합 당단백질:
    [화학식 19]
    Figure pat00070

    [화학식 20]
    Figure pat00071

    [화학식 21]
    Figure pat00072

    [화학식 22]
    Figure pat00073

    [화학식 23]
    Figure pat00074

    [화학식 24]
    Figure pat00075

    [화학식 25]
    Figure pat00076

    [화학식 26]
    Figure pat00077

    이때, n은 100 내지 3,000의 정수이다.
  7. (1) 당단백질을 코딩하는 뉴클레오타이드를 포함하는 발현 벡터를 숙주 세포에 도입하는 단계; 및
    (2) 상기 숙주 세포를 제1 작용기가 부착된 시알산 생성 대사물(sialic acid metabolite)의 유도체가 첨가된 배양액에서 배양하여, 적어도 하나의 당쇄 말단에 제1 작용기가 부착된 시알산 유도체가 도입된 당단백질을 수득하는 단계를 포함하는, 체내 지속형 재조합 당단백질의 제조방법.
  8. 제7항에 있어서,
    상기 당단백질은 인자 VIIa, 인자 VIII, 인자 IX 및 이들의 조합으로 이루어진 군으로부터 선택된 적어도 하나인, 체내 지속형 재조합 당단백질의 제조방법.
  9. 제7항에 있어서,
    상기 제1 작용기는 아지드기 또는 알킨기인, 체내 지속형 재조합 당단백질의 제조방법.
  10. 제7항에 있어서,
    상기 단계 (2)에서, 상기 시알산 생성 대사물의 유도체는 하기 화학식 27 내지 32 및 이들의 이성질체로 이루어진 군으로부터 선택된 적어도 하나의 화합물인, 체내 지속형 재조합 당단백질의 제조방법:
    [화학식 27]
    Figure pat00078

    [화학식 28]
    Figure pat00079

    [화학식 29]
    Figure pat00080

    [화학식 30]
    Figure pat00081

    [화학식 31]
    Figure pat00082

    [화학식 32]
    Figure pat00083
  11. 제7항에 있어서,
    상기 단계 (2)에서, 시알산 생성 대사물의 유도체는 상기 숙주 세포의 농도가 1.0 X 105 이상일 때, 0.1 내지 300 mM 농도로 첨가되는, 체내 지속형 재조합 당단백질의 제조방법.
  12. 제11항에 있어서,
    상기 단계 (2)에서, 시알산 생성 대사물의 유도체 첨가시 온도는 29 내지 35℃로 조절되는, 체내 지속형 재조합 당단백질의 제조방법.
  13. 제7항에 있어서,
    (3) 상기 배양액으로부터 시알산 생성 대사물의 유도체를 제거하는 단계;
    (4) 상기 배양액에 제2 작용기 및 생체적합성 중합체가 부착된 화합물을 첨가하여 클릭 반응(click reaction)을 시키는 단계; 및
    (5) 적어도 하나의 당쇄 말단에 생체적합성 중합체가 부착된 당단백질을 회수하는 단계를 포함하는, 체내 지속형 재조합 당단백질의 제조방법.
  14. 제13항에 있어서,
    상기 생체적합성 중합체는, 폴리에틸렌글리콜(PEG), 폴리시알산(PSA), 폴리옥사졸린, 헤파로산(heparosan) 및 이들의 조합으로 이루어진 군으로부터 선택된 적어도 하나인, 체내 지속형 재조합 당단백질의 제조방법.
  15. 제13항에 있어서,
    제1 작용기가 아지드기일 때, 제2 작용기는 알킨기 또는 사이클로알킨기 이고, 제1 작용기가 알킨기일 때, 제2 작용기는 아지드기인, 체내 지속형 재조합 당단백질의 제조방법.
  16. 제13항에 있어서,
    상기 단계 (4)에서, 제2 작용기 및 생체적합성 중합체가 부착된 화합물은 하기 화학식 33 내지 49 및 이들의 이성질체로 이루어진 군으로부터 선택된 적어도 하나의 화합물인, 체내 지속형 재조합 당단백질의 제조방법:
    [화학식 33]
    Figure pat00084

    [화학식 34]
    Figure pat00085

    [화학식 35]
    Figure pat00086

    [화학식 36]
    Figure pat00087

    [화학식 37]
    Figure pat00088

    [화학식 38]
    Figure pat00089

    [화학식 39]
    Figure pat00090

    [화학식 40]
    Figure pat00091

    [화학식 41]
    Figure pat00092

    [화학식 42]
    Figure pat00093

    [화학식 43]
    Figure pat00094

    [화학식 44]
    Figure pat00095

    [화학식 45]
    Figure pat00096

    [화학식 46]
    Figure pat00097

    [화학식 47]
    Figure pat00098

    [화학식 48]
    Figure pat00099

    [화학식 49]
    Figure pat00100

    이때, L은 단일결합, 할로겐, C1-8알킬, C6-12아릴, -CO-, -R3CONR3-, -OCONR3- 또는 -R3NCOR3- 일 수 있고(상기 R3는 각각 독립적으로 H, C1- 4알킬, C6- 12아릴로부터 선택될 수 있다), X는 생체적합성 중합체이다.
  17. 제7항에 있어서,
    상기 체내 지속형 재조합 당단백질은, 당단백질의 적어도 하나의 당쇄 말단의 시알산 유도체에 결합된 하기 화학식 1로 표시되는 링커를 포함하는, 체내 지속형 재조합 당단백질의 제조방법:
    [화학식 1]
    Figure pat00101

    R1 및 R2는 각각 독립적으로, C1- 8알킬, C6- 12아릴, C3- 6사이클로알킬, 3 내지 10원의 헤테로사이클로알킬, 아미노, (아미노)C1- 6알킬, (아미노)C3- 6사이클로알킬, (아미노)C6-12아릴, (아미노)(3 내지 10원의 헤테로사이클로알킬) 또는 5 내지 12원의 헤테로아릴이거나(이때, 상기 헤테로사이클로알킬 및 헤테로아릴은 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있고, 여기서, 상기 아미노는 H, 할로겐, CN, C1- 6알킬, 할로C1 - 3알킬 또는 C1- 6알콕시카보닐로 이루어진 군으로부터 선택되는 하나 이상의 치환기로 치환될 수 있다), 상기 R1과 R2는 서로 결합하여 8 내지 16원 헤테로융합고리를 형성할 수 있고(이때, 상기 헤테로융합고리는 각각 독립적으로 N, S 및 O로 이루어진 군으로부터 선택된 하나 이상의 헤테로원자를 함유할 수 있으며, 각각 독립적으로 할로겐, C1- 4알킬 및 CF3로 이루어진 군으로부터 선택된 하나 이상의 치환기로 치환될 수 있다),
    상기 링커는 R1, R2 또는 R1과 R2가 서로 결합하여 형성하는 고리 중 적어도 하나에 연결된 생체적합성 중합체를 포함한다.
  18. 제17항에 있어서,
    상기 화학식 1의 구조는 하기 화학식 19 내지 26으로 이루어진 군으로부터 선택된 적어도 하나인, 체내 지속형 재조합 당단백질의 제조방법:
    [화학식 19]
    Figure pat00102

    [화학식 20]
    Figure pat00103

    [화학식 21]
    Figure pat00104

    [화학식 22]
    Figure pat00105

    [화학식 23]
    Figure pat00106

    [화학식 24]
    Figure pat00107

    [화학식 25]
    Figure pat00108

    [화학식 26]
    Figure pat00109

    이때, n은 100 내지 3,000의 정수이다.
KR1020180004589A 2018-01-12 2018-01-12 체내 지속형 재조합 당단백질 및 이의 제조방법 Abandoned KR20190086269A (ko)

Priority Applications (6)

Application Number Priority Date Filing Date Title
KR1020180004589A KR20190086269A (ko) 2018-01-12 2018-01-12 체내 지속형 재조합 당단백질 및 이의 제조방법
JP2020536745A JP2021510683A (ja) 2018-01-12 2019-01-11 インビボ持続放出性組換え凝固因子viii及びその調製方法
EP19738515.6A EP3738978A4 (en) 2018-01-12 2019-01-11 In-vivo release sustained recombinant coagulation factor viii and preparation method therefor
US16/961,378 US20210079062A1 (en) 2018-01-12 2019-01-11 In-vivo release sustained recombinant coagulation factor viii and preparation method therefor
CN201980008176.2A CN111788220A (zh) 2018-01-12 2019-01-11 体内持续释放重组凝血因子ⅷ及其制备方法
PCT/KR2019/000479 WO2019139416A1 (ko) 2018-01-12 2019-01-11 체내 지속형 재조합 혈액응고 제 8인자 및 이의 제조방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180004589A KR20190086269A (ko) 2018-01-12 2018-01-12 체내 지속형 재조합 당단백질 및 이의 제조방법

Publications (1)

Publication Number Publication Date
KR20190086269A true KR20190086269A (ko) 2019-07-22

Family

ID=67219039

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180004589A Abandoned KR20190086269A (ko) 2018-01-12 2018-01-12 체내 지속형 재조합 당단백질 및 이의 제조방법

Country Status (6)

Country Link
US (1) US20210079062A1 (ko)
EP (1) EP3738978A4 (ko)
JP (1) JP2021510683A (ko)
KR (1) KR20190086269A (ko)
CN (1) CN111788220A (ko)
WO (1) WO2019139416A1 (ko)

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6358703B1 (en) * 1998-12-10 2002-03-19 Bayer Corporation Expression system for factor VIII
PT2363414T (pt) * 2004-11-12 2022-08-04 Bayer Healthcare Llc Modificação de fviii direcionada a sítio
EP1816201A1 (en) * 2006-02-06 2007-08-08 CSL Behring GmbH Modified coagulation factor VIIa with extended half-life
US7982010B2 (en) * 2006-03-31 2011-07-19 Baxter International Inc. Factor VIII polymer conjugates
US7645860B2 (en) * 2006-03-31 2010-01-12 Baxter Healthcare S.A. Factor VIII polymer conjugates
EP2444499A3 (en) * 2006-05-02 2012-05-09 Allozyne, Inc. Amino acid substituted molecules
DK2459224T3 (en) * 2009-07-27 2016-07-25 Baxalta GmbH Blodstørkningsproteinkonjugater
CN102939110A (zh) * 2010-04-21 2013-02-20 诺沃—诺迪斯克有限公司 蛋白质的选择性修饰
GB201007357D0 (en) * 2010-04-30 2010-06-16 Leverton Licence Holdings Ltd Conjugated factor VIII
GB201007356D0 (en) * 2010-04-30 2010-06-16 Leverton Licence Holdings Ltd Conjugated factor VIIa
WO2013051900A2 (en) * 2011-10-06 2013-04-11 Hanmi Science Co., Ltd. Blood coagulation factor ⅶ and ⅶa derivatives, conjugates and complexes comprising the same, and use thereof
EP2882457A1 (en) * 2012-08-13 2015-06-17 Novo Nordisk A/S Liquid factor viii formulations
CA2910110A1 (en) * 2013-04-22 2014-10-30 The Scripps Research Institute Methods and compositions for treating bleeding disorders
AR101060A1 (es) * 2014-02-12 2016-11-23 Novo Nordisk As Conjugados de fviii
JP2015155469A (ja) * 2015-06-01 2015-08-27 バクスター・インターナショナル・インコーポレイテッドBaxter International Incorp0Rated 第fviii因子ポリマー結合体
KR102539584B1 (ko) * 2016-06-15 2023-06-02 더 제너럴 하스피탈 코포레이션 생물직교 반응을 사용하는 생물학적 물질의 대사적 표지화 및 분자적 향상
US20230151078A1 (en) * 2016-06-24 2023-05-18 Mogam Instiitute For Biomedical Research Recombinant single-chain fviii and chemical conjugate thereof

Also Published As

Publication number Publication date
JP2021510683A (ja) 2021-04-30
EP3738978A4 (en) 2021-12-29
CN111788220A (zh) 2020-10-16
WO2019139416A1 (ko) 2019-07-18
EP3738978A1 (en) 2020-11-18
US20210079062A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
EP2257311B1 (en) Conjugated factor viii molecules
EP2536753B1 (en) Factor viii molecules with reduced vwf binding
US20160264645A1 (en) Stabilized Factor VIII Variants
KR100645843B1 (ko) 에리트로포이에틴 접합체
EP2536752B1 (en) Modified recombinant Factor VIII
AU2002213843A2 (en) Apolipoprotein analogues
BRPI0611221A2 (pt) polipeptÍdeos de g-csf peguilados e mÉtodos de produÇço dos mesmos
JP2019507587A (ja) 変異切断型フォンウィルブランド因子
JP2009533364A (ja) 治療用ポリペプチドのインビボでの回収を増大させる方法
US20120213728A1 (en) Granulocyte-colony stimulating factor produced in glycoengineered pichia pastoris
KR20190018013A (ko) 재조합 단쇄 fviii 및 그 화학 접합물
KR20190086269A (ko) 체내 지속형 재조합 당단백질 및 이의 제조방법
AU2008201887B2 (en) Apolipoprotein analogues
AU2013204960B2 (en) Conjugated factor VII molecules
ES2356181T3 (es) Construcción de apolipoproteínas.
HK1256525B (en) Mutated truncated von willebrand factor
HK1196565B (en) Blood coagulation factor vii and viia derivatives, conjugates and complexes comprising the same, and use thereof
KR20110038160A (ko) 아포리포단백질 유사체

Legal Events

Date Code Title Description
PA0109 Patent application

St.27 status event code: A-0-1-A10-A12-nap-PA0109

PG1501 Laying open of application

St.27 status event code: A-1-1-Q10-Q12-nap-PG1501

A201 Request for examination
PA0201 Request for examination

St.27 status event code: A-1-2-D10-D11-exm-PA0201

D13-X000 Search requested

St.27 status event code: A-1-2-D10-D13-srh-X000

D14-X000 Search report completed

St.27 status event code: A-1-2-D10-D14-srh-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

R18-X000 Changes to party contact information recorded

St.27 status event code: A-3-3-R10-R18-oth-X000

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

St.27 status event code: A-1-2-D10-D21-exm-PE0902

AMND Amendment
E13-X000 Pre-grant limitation requested

St.27 status event code: A-2-3-E10-E13-lim-X000

P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

E601 Decision to refuse application
PE0601 Decision on rejection of patent

St.27 status event code: N-2-6-B10-B15-exm-PE0601

AMND Amendment
P11-X000 Amendment of application requested

St.27 status event code: A-2-2-P10-P11-nap-X000

P13-X000 Application amended

St.27 status event code: A-2-2-P10-P13-nap-X000

PX0901 Re-examination

St.27 status event code: A-2-3-E10-E12-rex-PX0901

PX0701 Decision of registration after re-examination

St.27 status event code: A-3-4-F10-F13-rex-PX0701

X701 Decision to grant (after re-examination)
PC1904 Unpaid initial registration fee

St.27 status event code: A-2-2-U10-U13-oth-PC1904

St.27 status event code: N-2-6-B10-B12-nap-PC1904