[go: up one dir, main page]

KR102745604B1 - Glp-1 및 대사성 질환 치료용 조성물에서 이의 용도 - Google Patents

Glp-1 및 대사성 질환 치료용 조성물에서 이의 용도 Download PDF

Info

Publication number
KR102745604B1
KR102745604B1 KR1020187005975A KR20187005975A KR102745604B1 KR 102745604 B1 KR102745604 B1 KR 102745604B1 KR 1020187005975 A KR1020187005975 A KR 1020187005975A KR 20187005975 A KR20187005975 A KR 20187005975A KR 102745604 B1 KR102745604 B1 KR 102745604B1
Authority
KR
South Korea
Prior art keywords
leu
glu
gly
ala
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
KR1020187005975A
Other languages
English (en)
Other versions
KR20180057609A (ko
Inventor
크리스티안 힌더러
제임스 엠. 윌슨
매튜 윌슨
Original Assignee
더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 더 트러스티스 오브 더 유니버시티 오브 펜실베니아 filed Critical 더 트러스티스 오브 더 유니버시티 오브 펜실베니아
Publication of KR20180057609A publication Critical patent/KR20180057609A/ko
Application granted granted Critical
Publication of KR102745604B1 publication Critical patent/KR102745604B1/ko
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/22Hormones
    • A61K38/26Glucagons
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • A61K38/16Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • A61K38/17Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • A61K38/22Hormones
    • A61K38/28Insulins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P3/00Drugs for disorders of the metabolism
    • A61P3/08Drugs for disorders of the metabolism for glucose homeostasis
    • A61P3/10Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/745Blood coagulation or fibrinolysis factors
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/76Albumins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/64Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue
    • C12N9/6421Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from animal tissue from mammals
    • C12N9/6424Serine endopeptidases (3.4.21)
    • C12N9/644Coagulation factor IXa (3.4.21.22)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14171Demonstrated in vivo effect
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/22Vectors comprising a coding region that has been codon optimised for expression in a respective host
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/007Vectors comprising a special translation-regulating system cell or tissue specific

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Wood Science & Technology (AREA)
  • Endocrinology (AREA)
  • General Engineering & Computer Science (AREA)
  • Diabetes (AREA)
  • Toxicology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Hematology (AREA)
  • Virology (AREA)
  • Emergency Medicine (AREA)
  • Obesity (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)

Abstract

대상에게서 유형 II 당뇨병 치료를 위한 조성물 및 방법. GLP-1의 프로펩티드(propeptide) 및 활성 부분을 인코드하는 서열이 포함된 핵산 분자를 함유하는 바이러스 벡터가 제시되며, 여기에서, 발현되었을 때, GLP-1의 N-말단 아미노산은 상기 프로펩티드의 C-말단 아미노산의 바로 뒤에 있다. 바람직한 구체예들에서, 상기 대상은 고양이 또는 개이다.

Description

GLP-1 및 대사성 질환 치료용 조성물에서 이의 용도
전자 형식으로 제출된 자료들의 참고자료에 통합
출원인은 전자 형태로 서열 목록을 참고자료로 본 명세서에 통합시킨다. 이 파일은 "15-7471_Seq_Listing_ST25"로 표시한다.
발명의 배경
미국에서 고양이 400 마리 중 1 마리와 개 500 마리 중 1 마리는 인간의 2 형 당뇨병 (T2DM)과 유사한 질환을 가지고 있다. 현재의 표준 치료는 수의사의 빈번한 방문과 일회용 진단을 통하여 동물 소유자가 하루에 2회 인슐린을 주사하는 것으로써, 이것들은 모두 비용이 많이 들고, 시간이 많이 소요된다.
글루카곤-유사 펩티드 1 (GLP-1)은 내생성 펩티드 호르몬으로써, 포도당 항상성(glucose homeostasis)에 중심적 역할을 한다. GLP-1 유사체들은 당뇨병 치료를 위한 공통적인 인간의 치료 호르몬으로 현재 이용된다. GLP-1은 인슐린 방출을 강화하고, 인슐린 감수성을 높이고, 베타 세포 손실을 방지하고, 위 배출(emptying)을 지연시킴으로써 고혈당을 조절할 수 있는 능력을 가진다. 그러나, GLP-1은 혈액 순환에서 반감기가 짧기 때문에, 안정적인 벡터-매개된 전달이 아닌, 독립형 치료제로 개발하기가 어렵다. 상기 고유 호르몬의 짧은 반감기를 극복하도록 조작된 GLP-1 유사체들은 T2DM의 치료에 중요한 치료제로 부상했다. 그러나, 이들 약은 여전히 빈번하게 피하 주사해야 한다. GLP-1의 지속적인 치료 수준을 달성하기 위한 또다른 접근법은 아데노-연합 바이러스 또는 다른 바이러스 또는 비-바이러스 벡터에 의해 매개되는 유전자 전달(transfer)을 사용하여 상기 고유한 펩티드를 생체 내에서 연속적으로 생산하는 것이다. GLP-1은 짧은 반감기, 광범위한 치료 지수(index) 및 장기간 노출의 안전성 때문에, 이러한 전달 방법에 대한 이상적인 후보 물질이 된다. 이 방법은 상기 질환을 앓고 있는 사람 및 다른 종 모두에서 T2DM을 위한 편리하고 효과적인 치료법을 제공할 수 있다.
GLP-1은 전구체 폴리펩티드로부터 활성 펩티드를 방출하기 위하여 세포-특이적 프로테아제가 필요하기 때문에, 유전자 치료 벡터로부터 고유한 형태로 발현될 수 없다. 작은 단백질의 비효율적 해독 및 분비, 또는 활성 GLP-1을 생성하기 위한 신호 펩티드의 비효율적인 절단으로 인하여, 분비를 지시하는 신호 펩티드를 가진 상기 펩티드를 단순히 발현시키려는 시도는 실패했다. 벡터-매개된 GLP-1 발현에 대한 기존의 설치류 연구에서, 이 펩티드는 더 크고, 종-특이적이 아닌 프로펩티드에 이어서 인플루엔자 헤마글루티닌, 그리고 GLP-1 N-말단이 앞에 절단 부위가 있을 때 이 펩티드가 발현되어 GLP-1의 효과적인 순환 수준이 달성되었다. 가령, Gaddy et al, dsAAV8-mediated gene transfer and b-cell expression of IL-4 and b-cell growth factors are capable of reversing early-onset diabetes in NOD mice, Gene Therapy, 19:791-9 (2012) and Choi and Lee, Long-term, antidiabetogenic effects of GLP-1 gene therapy using a double-stranded, adeno- associated viral vector, Gene Therapy, 18:155- 63 (2011), 이들은 참고자료에 편입됨. 그러나, 이들 외래 프로펩티드는 형질도입된(transduced) 세포에 대한 파괴적인 면역 반응을 불법화시킬 가능성이 있다. 따라서, 대상, 특히 반려 동물의 유형 II 당뇨병을 효과적으로 치료하는데 유용한 조성물이 필요하다.
발명의 요약
신규한 조작된 글루카곤-유사 펩티드 1 (GLP-1) 구조체들이 제시된다. 이들 구조체에서 발현되는 GLP-1 단백질은 단독 치료제로써 제공되는 GLP-1 단백질과 비교하였을 때, 순환 반감기가 증가되는 적절한 특징을 갖고, 그리고 생체내에서 GLP-1의 활성 부분을 방출시키도록 효과적으로 프로세싱된다. 이들 구조체는 다수의 경로를 통하여 이를 필요로 하는 대상에게 전달될 수 있고, 구체적으로 재조합 벡터 이를 테면, 재조합 아데노-연합된 바이러스 (rAAV) 벡터에 의해 생체내에서 매개된 발현에 의해 전달될 수 있다.
일부 구체예들에서, GLP-1 구조체를 포함하는 바이러스 벡터가 제시된다. 일부 구체예들에서, 상기 GLP-1 구조체는 GLP-1의 프로펩티드 및 활성 부분을 인코드하고, 이것이 발현되었을 때, GLP-1의 N-말단 아미노산은 상기 프로펩티드의 C-말단 아미노산의 바로 뒤에 있다.
일부 구체예들에서, 상기 프로펩티드는 내생성 서열이다. 즉, 상기 프로펩티드 서열은 궁극적으로 투여하기로 의도된 대상과 동일한 종으로부터 유래된다.
일부 구체예들에서, 상기 프로펩티드는 응고 인자로부터 유래된 리더(leader) 서열이다. 한 구체예에서, 상기 프로펩티드 서열은 단백질 S, 인자 IX, 알부민, 알부민, IL2, 트롬빈, 및 만노시다제(mannosidase)로부터 선택된 리더 서열이다. 또다른 구체예에서, 상기 프로펩티드는 퓨린 부위를 함유한다.
일부 구체예들에서, 상기 GLP-1 구조체는 GLP-1의 활성 부분에 상응하는 GLP-1 서열을 인코드한다. 한 구체예에서, 상기 GLP-1 서열은 GLP-1의 아미노산 7-37을 인코드한다. 또다른 구체예에서, 상기 GLP-1 서열은 서열 번호: 1이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 5에서 제시된 아미노산 서열을 인코드한다. 한 구체예에서, 상기 GLP-1 구조체를 인코드하는 핵산 서열은 서열 번호: 6에서 제시된다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 5를 인코드하는 코돈 최적화된 서열이다.
일부 구체예들에서, 본 명세서에서 제시된 재조합 벡터는 상기 프로펩티드 및 GLP-1을 포함하는 발현 카세트(expression cassette)를 갖는다. 일부 구체예들에서, 상기 발현 카세트는 간 세포에서 상기 GLP-1의 발현을 특이적으로 지시하는 프로모터를 포함한다.
일부 구체예들에서, 상기 재조합 벡터는 재조합 아데노-연합된 바이러스 (rAAV) 벡터다. 일부 구체예들에서, 상기 rAAV는 AAV8, AAVrh64R1, AAV9, AAVhu.37 또는 AAVrh10으로부터 선택된 캡시드(capsid)를 갖는다. 특정 구체예에서, GLP-1의 프로펩티드 및 활성 부분이 포함된 발현 카세트를 갖는 rAAV 벡터가 제시된다. 특정 구체예에서, 상기 프로펩티드는 응고 인자 IX 리더 서열을 포함한다. 또다른 구체예에서, 상기 GLP-1 서열은 GLP-1의 aa 7-37을 인코드한다. 또다른 구체예에서, 상기 rAAV 벡터는 간 세포에서 상기 GLP-1의 발현을 특이적으로 지시하는 프로모터가 포함된 발현 카세트를 포함한다.
일부 구체예들에서, 본 명세서에서 기술된 바와 같이, 약학적으로 수용가능한 운반체 및 재조합 벡터가 포함된 약학 조성물이 제시된다. 발현 카세트를 갖는 본원에서 기술된 재조합 벡터를 이를 필요로 하는 대상에게 투여함으로써 T2DM을 치료하는 방법이 또한 제시되는데, 여기에서 전술한 발현 카세트는 상기 대상에서 GLP-1 구조체의 발현을 지시하는 조정 제어(regulatory control) 서열을 더 포함한다. 일부 구체예들에서, 치료되는 대상은 반려 동물이다. 한 구체예에서, 상기 대상은 고양이다. 또다른 구체예에서, 상기 대상은 개이다. 본 명세서에서 이용된 바와 같이, 용어 "환자"와 "대상(subject)"은 호환될 수 있고, 인간 또는 동물 대상을 지칭할 수 있다.
여전히 또다른 구체예에서, 대상에게서 GLP-1의 순환 반감기를 증가시키는 방법은 내생성 GLP-1의 프로펩티드 및 활성 부분을 인코드하는 발현 카세트를 갖는 본원에서 기술된 재조합 벡터를 제공하는 것을 포함하며, 이것이 발현되었을 때, GLP-1의 N-말단 아미노산은 상기 프로펩티드의 C-말단 아미노산의 바로 뒤에 있다.
상기에서 기술된 재조합 벡터는 유형 II 당뇨병 치료를 위한 요법(regimen)에 이용될 수 있다.
본 발명의 다른 측면 및 이점은 본 발명의 다음의 상세한 설명으로부터 용이하게 명백해질 것이다.
도 1은 실시예 2에서 설명된 바와 같이, 형질감염된(transfected) HEK293 세포에서 활성 GLP-1 발현의 시험관내 평가 결과를 제시한다. 왼쪽의 막대는 배지-만으로 된 대조에 해당한다. 중간 막대는 실시예 1에서 설명된 바와 같이, 인터루킨-2 신호 펩티드 다음에 GLP-1 (7-37)를 갖는 GLP-1 구조체에 해당된다. 우측 막대는 실시예 1에서 설명된 바와 같이, 인자 IX 프로펩티드 다음에 GLP-1 (7-37)을 갖는 GLP-1 구조체에 해당된다. 값은 중복 웰에서 평균 +/- SEM로 나타낸다.
도 2는 RAG -/- 마우스를 AAV8.CB.fFIX_GLP1으로 형질도입하여 생체내 GLP-1의 발현을 보여주는 연구 결과를 제시한다. 위의 3개 선 (사각형, 삼각형 및 다이아몬드형)은 AAV8.CB.fFIX_GLP1로 처리된 3마리 마우스에 해당된다. 바닥 선은 내부 대조 마우스에 해당된다.
도 3은 AAV8.CB.fFIX_GLP1 (Db+AAV)로 처리된 당뇨병 마우스(db/db) 의 연구 결과를 제시한다. 야생형 (WT), 연령 정합 대조는 벡터로 형질감염안된 당뇨병(Db) 마우스를 이용하였다. 혈청 포도당 수준은 매주 측정되었다. 값은 평균 +/- SEM이다.
도 4는 실시예 2와 3에 이용된 GLP-1 구조체에 대한 구조체 전략을 나타내는 지도다. 이 지도는 CB7 프로모터, 고양이 인자 IX 프로펩티드, GLP-1 (7-37) 및 poly A 서열을 보여준다.
도 5는 형질감염된 HuH7 세포에서 활성 GLP-1 발현의 시험관 평가 결과를 제공한다. 다음의 각 서열은 실시예 1에서 설명된 바와 같이 GLP-1 서열의 상류에 배치된다: 단백질 S 프로펩티드 (Prot S), 알부민 프로펩티드 (Alb), 퓨린 부위와 함께 IL2 리더(IL2 Fur), 퓨린 부위와 함께 알부민 프로펩티드 (Alb Fur), 인자 IX 프로펩티드 (FIX), 퓨린 부위 없는 IL2 리더(IL2), 그리고 형질감염안된 HuH7 세포. 이용된 모든 서열은 고양이 서열들이다.
도 6은 형질감염된 세포에서 활성 GLP-1 발현의 시험관 평가 결과를 제공한다. 다음의 각 서열은 실시예 1에서 설명된 바와 같이 GLP-1 서열의 상류에 배치된다: 퓨린 부위와 함께 IL2 리더 (IL2 Fur), 퓨린 부위와 함께 알부민 프로펩티드 (Alb Fur), 인자 IX 프로펩티드 (FIX), 트롬빈 리더 서열, 퓨린 부위와 함께 만노시다제 리더 (ManFur), 그리고 형질감염안된 세포 (tc+). 이용된 모든 서열은 고양이 서열들이다.
도 7은 실시예 5에서 기술된 바와 같이, 야생형 마우스에게 3가지 상이한 GLP-1 구조체를 투여한 결과를 제시한다. 각 4마리 마우스 코호트에게 5 x 1010 의 상응하는 벡터를 주사하였고, 활성 GLP-1 발현에 대하여 평가하였다.
도 8은 실시예 7에서 기술된 바와 같이, 건강한 고양이에게 3가지 상이한 GLP-1 구조체를 투여한 결과를 제시한다. 표시된 시점에서 활성 GLP-1 발현에 대하여 혈액을 평가하였다.
발명의 상세한 설명
반려 동물 및 인간을 포함하는 대상에서 사용하기 위해 GLP-1 발현 구조체가 개발되었으며, 이때 리더 프로펩티드는 동물 또는 인간 환자의 종에 내인성인 단백질로부터 유래되었다. 바람직하게는, 절단 및 분비 후에, 이들 구조체로부터 생성된 모든 생성물, 즉 유리 프로펩티드 및 활성 GLP-1은 비-면역원성 자가-펩티드이다.
본원에 기재된 GLP-1 구조체는 단독 치료제로서의 GLP-1 펩티드의 투여와 비교하였을 때, GLP-1의 순환 반감기를 증가시키는 것을 특징으로 한다. 이것은 GLP-1 활성 펩티드의 N-말단의 정확한 프로세싱과 함께, 벡터 내에 함유된 발현 카세트의 계속적인 발현 때문이다.
이들 구조체는 다수의 경로를 통하여 이를 필요로 하는 대상에게 전달될 수 있고, 구체적으로 재조합 벡터 이를 테면, rAAV 벡터에 의해 생체내에서 매개된 발현에 의해 전달될 수 있다. 또한, T2DM 또는 대사 증후군 치료를 필요로 하는 대상에서 이를 치료하고, 대상에게서 GLP-1의 반감기를 증가시키기 위한 요법에서 이들 구조체를 사용하는 방법이 제공된다. 또한, 대상에게서 GLP-1의 활성을 강화시키는 방법이 제공된다. 또한, 이를 필요로 하는 대상의 체중 감소를 유도하는 방법이 제공된다.
글루카곤-유사 펩티드 1, 또는 GLP-1은 프로글루카곤 유전자의 전사 산물로부터 유래된 인크레틴(incretin)이다. 생체 내에서, 글루카곤 유전자는 180개 아미노산으로 된 프레프로(prepro) 폴리펩티드를 발현시키고, 이것은 단백질 분해 과정을 통해 2가지 형태의 글루카곤, GLP-1 및 GLP-2를 형성한다. 원래 시퀀싱 연구에서 GLP-1은 37개 아미노산 잔기를 보유한다는 것을 알았다. 그러나, 후속적인 정보에 따르면, 이 펩티드는 프로펩티드이며, 추가적으로 아미노 말단으로부터 6 개의 아미노산을 제거되어, 활성 형태의 GLP-1인, GLP-1 (7-37)이 형성된다. 위치 37의 글리신은 생체내에서 아미드로 변형되어, GLP-1 (7-36) 아미드가 형성된다. GLP-1 (7-37) 및 GLP-1 (7-36) 아미드는 대등한 효능의 인슐린분비성 호르몬이다. 따라서, 본 명세서에서 이용된 바와 같이, 본원에서 유용한 GLP-1의 생물학적 "활성" 형태는 다음과 같다: GLP-1-(7-37) 및 GLP-1-(7-36)NH2.
편의성을 위하여, "야생형" GLP-1 (7-37)의 서열, 가령, 인간 GLP-1의 고유 서열은 서열 번호: 1에 나타낸다: HAEGTFTSDV SSYLEGQAAK EFIAWLVKGR G. 이 야생형 아미노산 서열은 하기 실시예들에서 이용되며, 인간, 고양이 및 개를 비롯한 다양한 종에 걸쳐 보존된다. 그러나, 본 명세서에서 이용된 바와 같이, 용어 GLP-1은 GLP-1의 임의의 활성 형태, 가령, GLP-1 (7-37) 또는 GLP-1 (7-36) 아미드를 지칭한다. 또한, 한 구체예에서, 용어 GLP-1은 상기 GLP-1 펩티드의 기능적 변이체를 지칭한다. 기능적 변이체는 상이한 종으로부터 유래된 동족체를 포함한다. GLP-1 및 이의 패밀리 펩티드의 N-말단(활성 부분)은 높은 수준의 서열 동일성(identity)을 공유한다. 그러나, 종간에 GLP-1 단백질 중에서 일부 변이를 볼 수 있는데, 구체적으로 하기에서 굵게 표시된 부분이다:
Figure 112018020725313-pct00001
한 구체예에서, GLP-1의 기능적 변이체는 본원에서 기술된 또는 당분야에 공지된 GLP-1 핵산 또는 아미노산 서열로부터 최대 약 10% 변이를 함유하지만, 여전히 상기 야생형 서열의 기능을 유지하는 변이체들을 포함한다. 본 명세서에서 이용된 바와 같이, "기능의 유지(retain function)"에서 이것은 발현 또는 활성이 반드시 동일한 수준일 필요는 없지만, 상기 핵산 또는 아미노산이 이의 야생형 서열과 동일한 방식으로 기능을 한다는 것을 의미한다. 예를 들면, 한 구체예에서, 기능적 변이체는 야생형 서열과 비교하였을 때, 발현 또는 활성은 증가된다. 또다른 구체예에서, 상기 기능적 변이체는 야생형 서열과 비교하였을 때, 발현 또는 활성은 감소된다. 한 구체예에서, 상기 기능적 변이체는 야생형 서열과 비교하였을 때, 발현 또는 활성은 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 그 이상으로 증가 또는 감소된다.
또다른 구체예에서, GLP-1의 기능적 변이체는 본원에서 기술된 또는 당분야에 공지된 GLP-1 핵산 또는 아미노산 서열로부터 최대 약 20% 변이를 함유하지만, 여전히 상기 야생형 서열의 기능을 유지하는 변이체들을 포함한다.
한 구체예에서, GLP-1의 기능적 변이체는 본원에서 기술된 또는 당분야에 공지된 GLP-1 핵산 또는 아미노산 서열로부터 최대 약 30% 변이를 함유하지만, 여전히 상기 야생형 서열의 기능을 유지하는 변이체들을 포함한다
한 구체예에서, 용어 GLP-1은 상기에서 생성된 서열(서열 번호: 1)과 비교하였을 때, 하나 또는 그 이상의 아미노산 치환이 있는 활성 GLP-1을 말한다. 한 구체예에서, 잔기에서 하나 또는 그 이상의 아미노산 치환이 있으며, 이는 종간의 변이로 나타난다(가령, 상기에서 굵게 표시된 잔기). 또다른 구체예에서, 잔기에서 하나 또는 그 이상의 아미노산 치환이 만들어지고, 이는 종간에 보존된다. 비록 GLP-1은 종간에 높은 정도의 동일성을 공유하지만, 벡터를 궁극적으로 투여하게 되는 대상의 종에 근거하여 상기 GLP-1 서열을 선택하는 것이 바람직할 수 있다. 한 실시예에서, 상기 대상은 포유류다. 예를 들면, 한 구체예에서, 상기 대상이 고양이라면, 상기 GLP-1 서열은 고양이 단백질로부터 유래된다. 또다른 구체예에서, 상기 GLP-1 서열은 개의 단백질로부터 유래된다. 여전히 또다른 구체예에서, 상기 GLP-1 서열은 인간 단백질로부터 유래된다. 또다른 구체예에서, 상기 GLP-1 서열은 비-인간 영장류 단백질로부터 유래된다. 또다른 구체예에서, 상기 GLP-1은 소, 양 또는 돼지 단백질로부터 유래된다. 여전히 또다른 구체예에서, 상기 GLP-1은 설치류로부터 유래된다. 한 구체예에서, 상기 GLP-1 서열은 GLP-1 (7-37)을 인코드한다. 또다른 구체예에서, 상기 GLP-1 서열은 서열 번호: 1이다. 또다른 구체예에서, 상기 GLP-1 서열은 서열 번호:1의 aa 1-29(야생형 GLP-1의 aa 7-36에 상응)이다.
본 명세서에서 이용된 바와 같이, 용어 "유래된(derived)" 또는 "~로부터 유래된"이란 서열 또는 단백질은 특정 대상 종으로부터 유래되거나, 또는 특정 대상 종으로부터 유래된 단백질 또는 서열과 동일한 서열을 공유한다는 것을 의미한다. 예를 들면, 개로부터 "유래된" 프로펩티드 서열은 개에서 발현되는 동일한 프로펩티드 서열과 동일한 서열 (또는 본원에서 정의된 바와 같은, 이의 변이체)을 공유한다. 그러나, 특정 핵산 또는 아미노산은 실제로 개로부터 기원될 필요는 없다. 유사한 단백질 (가령, 동족체)의 돌연변이 유발 또는 핵산 또는 아미노산 서열의 인위적 생산을 비롯한, 원하는 서열을 생성할 수 있는 다양한 기술이 당업계에 공지되어있다. "유래된" 핵산 또는 아미노산은 유래된 서열의 실제 공급원과는 무관하게, 그것이 "유래된" 종에서의 동일한 핵산 또는 아미노산 기능을 보유한다.
본 명세서에서 이용된 바와 같이, 용어 "GLP-1 구조체", "GLP-1 발현 구조체" 및 동의어는 프로펩티드 서열과 조합된 본원에서 기술된 GLP-1 서열을 포함한다. 용어 "GLP-1 구조체", "GLP-1 발현 구조체" 및 동의어는 상기 프로펩티드와 GLP-1를 인코드하는 핵산 서열 또는 이의 발현 산물을 지칭할 때 이용될 수 있다.
본원에서 기술된 GLP-1 구조체는 또한 프로펩티드 서열을 포함한다. 본 명세서에서 이용된 바와 같이, 용어 리더 서열, 프로펩티드, 신호 서열, 프레펩티드 및 유사한 용어는 생체내에서 최종 활성 GLP-1 펩티드로부터 절단되는 서열을 지칭한다. 이러한 "프로펩티드(propeptide)" 서열은 이러한 서열, 가령, 신호 서열 및 프로펩티드 서열을 하나 이상 포함할 수 있다. 비록 내생성 GLP-1이 프로호르몬 (프로글루카곤, 이것이 절단되어 활성형의 GLP-1이 됨)로 발현되지만, 바람직하게는 본 명세서에서 기술된 구조체에 이용된 프로펩티드는 GLP-1에 이종성(heterologous) 단백질로부터 유래된 리더 서열이다.
한 구체예에서, 상기 프로펩티드는 궁극적으로 투여하기로 의도된 대상과 동일한 종으로부터 유래된다. 예를 들면, 한 구체예에서, 바람직한 대상은 고양이이며, 상기 프로펩티드 서열은 고양이 단백질로부터 유래된다. 또다른 구체예에서, 상기 프로펩티드 서열은 개의 단백질로부터 유래된다. 여전히 또다른 구체예에서, 상기 프로펩티드 서열은 인간 단백질로부터 유래된다. 또다른 구체예에서, 상기 프로펩티드 서열은 비-인간 영장류 단백질로부터 유래된다. 또다른 구체예에서, 상기 프로펩티드는 소, 양 또는 돼지 단백질로부터 유래된다. 여전히 또다른 구체예에서, 상기 프로펩티드는 설치류로부터 유래된다.
생체내에서 GLP-1 구조체의 발현을 강화시키기 위하여, 상기 프로펩티드의 길이를 변화시키거나 및/또는 선택할 수 있다. 따라서, 내생성 프로펩티드는 바람직한 길이로 선택될 수 있거나, 또는 야생형 프로펩티드의 기능을 보유하지만, 더 바람직한 서열 길이로 유지되는 프로펩티드를 생성하도록 원하는 프로펩티드가 조작될 수 있다.
바람직하게는, 상기 프로펩티드는 최소한 약 19개의 아미노산을 GLP1 길이에 추가하여, 길이가 최소한 약 45-50개의 아미노산인, 프로펩티드-GLP-1 발현 최종 산물이 만들어진다. 한 구체예에서, 상기 프로펩티드는 최소한 약 35개의 아미노산을 추가하여, 길이가 최소한 약 65개의 아미노산인, 프로펩티드-GLP-1 발현 최종 산물이 만들어진다. 이러한 크기 요건 때문에, 알부민 및 응고 인자가 프로펩티드의 바람직한 원천이다. 본원에서 기술된 바와 같이, 이들 프로펩티드의 돌연변이체 및 변이체들은 본원에서 기술된 조성물 및 방법에 또한 유용하다. 특히, 본원에 기술된 프로 펩티드의 N-말단 절두된 단편 (즉, C- 말단 부분을 보유함)은 발현 산물을 활성 GLP-1로 적절히 가공하는데 필요한 절단 신호를 보유하는 조건에서 유용하다.
한 구체예에서, 바람직한 프로펩티드의 기능적 변이체는 본원에서 기술된 또는 당분야에 공지된 프로펩티드 핵산 또는 아미노산 서열로부터 최대 약 10% 변이를 함유하지만, 여전히 상기 야생형 서열의 기능을 유지하는 변이체들을 포함한다 본 명세서에서 이용된 바와 같이, "기능의 유지(retain function)"에서 이것은 발현 또는 활성이 반드시 동일한 수준일 필요는 없지만, 상기 핵산 또는 아미노산이 이의 야생형 서열과 동일한 방식으로 기능을 한다는 것을 의미한다. 예를 들면, 한 구체예에서, 기능적 변이체는 야생형 서열과 비교하였을 때, 발현 또는 활성은 증가된다. 또다른 구체예에서, 상기 기능적 변이체는 야생형 서열과 비교하였을 때, 발현 또는 활성이 감소된다. 한 구체예에서, 상기 기능적 변이체는 야생형 서열과 비교하였을 때, 발현 또는 활성이 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 또는 그 이상으로 증가 또는 감소된다.
또다른 구체예에서, 바람직한 프로펩티드의 기능적 변이체는 본원에서 기술된 또는 당분야에 공지된 프로펩티드 핵산 또는 아미노산 서열로부터 최대 약 20% 변이를 함유하지만, 여전히 상기 야생형 서열의 기능을 유지하는 변이체들을 포함한다
또다른 구체예에서, 바람직한 프로펩티드의 기능적 변이체는 본원에서 기술된 또는 당분야에 공지된 프로펩티드 핵산 또는 아미노산 서열로부터 최대 약 30% 변이를 함유하지만, 여전히 상기 야생형 서열의 기능을 유지하는 변이체들을 포함한다
한 구체예에서, 상기 프로펩티드 서열은 추가 서열과 조합되어 N-말단 프로세싱의 효율을 증가시킨다. 한 구체예에서, 상기 프로펩티드 서열은 퓨린 절단 부위와 복합된다. 한 구체예에서, 상기 퓨린 서열은 RX[R/K]R 콘센수스(consensus) 서열을 포함한다. 또다른 구체예에서, 상기 퓨린 서열은 서열 RKRR을 포함한다. 상기 퓨린 부위는 당업자에 의해 변형될 수 있고, FurinDB, 예시적으로 실증된 퓨린 절단 부위를 함유하는 데이터베이스, 기질, 종, 실험 방법, 실험 및 관련 약물 표적화 퓨린 기질의 원래 공개자료에 대한 논의는 Tian et al, Int. J. Mol. Sci, 2011, 12:1010-5을 참고하며, 이 자료는 본원에 참고자료에 편입된다.
한 구체예에서, 상기 프로펩티드는 인자(Factor) IX 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 인자 II 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 인자 VII 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 인자 X 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 단백질 C 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 단백질 S 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 알부민 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 만노시다제 프로펩티드다. 또다른 구체예에서, 상기 프로펩티드는 뼈 "gla" 단백질로부터 유래된다. 한 구체예에서, 상기 프로펩티드는 최소한 약 19-100개의 아미노산 길이를 갖는데, 이때 상기 범위 사이의 임의의 정수들이 포함된다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 25개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 35개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 40개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 40개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 45개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 50개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 55개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 60개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 65개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 70개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 75개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드의 길이는 약 80, 85, 90, 95 또는 100개 아미노산이다. 한 구체예에서, 상기 프로펩티드의 길이는 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 또는 49개의 아미노산이다.
용어 "아미노산 치환(substitution)" 및 이의 동의어는 아미노산을 다른 아미노산으로 대체함으로써, 아미노산 서열을 변형시키는 것을 포함한다. 상기 치환은 보존적 치환일 수 있다. 또는 비-보존적 치환일 수도 있다. 2 개의 아미노산을 언급 할 때, 보존적(conservative)이라는 용어는 아미노산이 당업자에 의해 인식되는 공통적인 특성을 공유함을 의미한다. 예를 들면, 소수성 비-산성 측쇄를 갖는 아미노산, 소수성 산성 측쇄를 갖는 아미노산, 친수성 비-산성 측쇄를 갖는 아미노산, 친수성 산성 측쇄를 갖는 아미노산 그리고 친수성 염기성 측쇄를 갖는 아미노산이 포함된다. 공통적인 특성은 소수성 측쇄를 갖는 아미노산, 지방족 소수성 측쇄를 갖는 아미노산, 방향족 소수성 측쇄를 갖는 아미노산, 극성 중성 측쇄를 갖는 아미노산, 전기적으로 하전된 측쇄를 갖는 아미노산, 전기적으로 하전된 산성 측쇄 그리고 전기적으로 하전된 염기성 측쇄를 가진 아미노산일 수도 있다. 자연 발생적, 그리고 비-자연 발생적 아미노산은 당업계에 공지되어 있고, 구체예에서 아미노산을 대체하는데 사용될 수 있다. 아미노산을 치환하는 방법은 당해 기술 분야의 숙련자에게 잘 알려져 있으며, 아미노산 서열을 코딩하는 뉴클레오티드 서열의 돌연변이를 포함하나, 이에 한정되지 않는다. 본 명세서에서의 "하나 또는 그 이상의"에 대한 언급은 예를 들어 1, 2, 3, 4, 5, 6개 또는 그 이상의 개별적인 구체예를 포함하는 것으로 의도된다.
또다른 구체예에서, 상기 GLP-1 펩티드 또는 프로펩티드는 상기 GLP-1 서열 또는 프로펩티드 서열로부터 최대 10% 변이를 함유하는 변이체들을 포함하며, 이들 용어는 본원에서 기술된다. 즉, 상기 GLP-1 펩티드 또는 프로펩티드는 본원에서 제시된 및/또는 당분야에 공지된 GLP-1 또는 프로펩티드 서열에 대하여 약 90% 동일성 내지 약 99.9 % 동일성, 약 95% 내지 약 99% 동일성 또는 약 97% 내지 약 98% 동일성을 공유한다.
본원에서 제공되는 GLP-1 펩티드 및 프로펩티드에 추가하여, 이들 펩티드를 인코드하는 핵산 서열들이 제시된다. 한 구체예에서, 본 명세서에서 기술된 GLP-1 펩티드를 인코드하는 핵산 서열이 제시된다. 또다른 구체예에서, 이 서열은 서열 번호:1의 GLP-1 서열을 인코드하는 임의의 핵산 서열을 포함한다. GLP-1 (7-37)의 야생형 핵산 서열은 서열 번호: 56에 제시된다. 고양이 글루카곤의 서열은 공지되어 있고, 가령, NCBI 참조 서열: XM_006935320.1로 찾아볼 수 있다. 개의 글루카곤의 서열은 공지되어 있고, 가령, NCBI 참조 서열: NM_001003044.1로 찾아볼 수 있다. 한 구체예에서, GLP-1을 코딩하는 핵산 서열은 본원에 기재된 GLP-1 펩티드 중 임의의 것을 코딩하는 코돈 최적화 서열이다. 한 구체예에서, 상기 코돈 최적화된 서열은 당분야에 공지된 또는 본원에서 기술된 GLP-1 핵산 서열과 최소한 약 60% 동일성을 공유한다. 한 구체예에서, 상기 코돈 최적화된 서열은 당분야에 공지된 또는 본원에서 기술된 GLP-1 핵산 서열과 최소한 약 70% 동일성을 공유한다. 한 구체예에서, 상기 코돈 최적화된 서열은 당분야에 공지된 또는 본원에서 기술된 GLP-1 핵산 서열과 최소한 약 80% 동일성을 공유한다. 한 구체예에서, 상기 코돈 최적화된 서열은 당분야에 공지된 또는 본원에서 기술된 GLP-1 핵산 서열과 최소한 약 90% 동일성을 공유한다. 한 구체예에서, 상기 GLP-1 서열은 고양이에게서 발현되도록 최적화된다. 한 구체예에서, GLP-1 (7-37)의 핵산 서열은 서열 번호: 2에 제시된다. 또다른 구체예에서, 본원에 기재된 임의의 프로 펩티드 서열을 인코드하는 핵산 서열이 제공된다. 한 구체예에서, 상기 핵산 서열은 인자 IX 프로펩티드 서열을 인코드한다. 또다른 구체예에서, 고양이 인자 IX 프로펩티드 서열을 인코드하는 핵산 서열은 서열 번호: 4이다.
한 구체예에서 상기 프로펩티드 및 GLP-1 펩티드는 생성물이 발현될 때, GLP-1 펩티드의 N-말단 아미노산 잔기가 프로펩티드의 C-단부 아미노산 잔기에 추가 잔기없이, 즉시 이어지도록 배열된다. 따라서, 바람직하게는, 프로펩티드 및 GLP-1 펩티드의 코딩 영역 모두는 프로펩티드와 GLP-1의 코딩 서열 사이의 링커 없이 단일 핵산 서열에 혼입된다.
GLP-1 펩티드 및/또는 프로펩티드의 변이체 또는 단편이 바람직한 경우, 이들 펩티드의 코딩 서열은 야생형 핵산 서열의 부위-지향된(site-directed) 돌연변이유발을 이용하여 생성될 수 있다. 대안으로 또는 추가적으로, 웹 기반 또는 상업적으로 이용가능한 컴퓨터 프로그램 뿐만 아니라, 서비스 기반 회사는 아미노산 서열을 RNA 및/또는 cDNA 둘 모두를 포함하는 핵산 코딩 서열로 역-해독하는 데 사용될 수 있다. 가령, backtranseq by EMBOSS, http://www.ebi.ac.uk/Tools/st/; Gene Infinity (http://www.geneinfinity.org/sms-/sms_backtranslation.html); ExPasy (http://www.expasy.org/tools/) 참고. 한 구체예에서, RNA 및/또는 cDNA 코딩 서열은 본원에서 논의된 바와 같이, 궁극적으로 투여하기로 의도된 대상 종에서 최적 발현되도록 기획된다. 따라서, 한 구체예에서, 상기 코딩 서열은 고양이에서 최적 발현되도록 기획된다. 따라서, 또다른 구체예에서, 상기 코딩 서열은 개에서 최적 발현되도록 기획된다. 따라서, 한 구체예에서, 상기 코딩 서열은 인간에서 최적 발현되도록 기획된다. 따라서, 한 구체예에서, 상기 상기 코딩 서열은 양장류에서 최적 발현되도록 기획된다. 또다른 구체예에서, 상기 코딩 서열은 양, 소 또는 돼지에서 최적 발현되도록 기획된다. 또다른 구체예에서, 상기 코딩 서열은 설치류에서 최적 발현되도록 기획된다.
상기 코딩 서열은 코돈 최적화(optimization)를 이용한 최적 발현을 위하여 기획된다. 코돈-최적화된 코딩 영역은 상이한 다양한 방법에 의해 기획될 수 있다. 이러한 최적화는 온라인, 공개된 방법 또는 코돈 최적화 서비스를 제공하는 회사에서 이용가능한 방법을 사용하여 수행될 수 있다. 코돈 최적화를 위한 한 가지 방법은 가령, 국제 특허 출원 공개 번호 WO 2015/012924에서 기술되며, 이는 본원의 참고자료에 편입된다. 간략하게 설명하자면, 생성물을 코딩하는 핵산 서열은 유사한 코돈 서열로 변형된다. 적합하게는, 생성의 개방 판독 틀 (ORF)의 전체 길이가 변경된다. 그러나, 일부 구체예들에서, ORF의 단편만 변경될 수 있다. 이들 방법 중 하나를 사용함으로써, 주어진 폴리티이드 서열에 빈도를 적용하고, 폴리펩티이드를 코딩하는 코돈-최적화된 코딩 영역의 핵산 단편을 생성할 수 있다.
핵산 서열의 문맥에서 "동일성 백분율(%)", "서열 동일성", "서열 동일성 백분율" 또는 "동일 백분율"이란 용어는 대응하도록 정렬 될 때, 두 서열에서 동일한 두 서열의 염기를 의미한다. 서열 동일성 비교 길이는 게놈의 전장, 유전자 코딩 서열의 전장, 또는 적어도 약 100 내지 150개의 뉴클레오티드의 단편, 또는 원하는 데로 될 수 있다. 그러나, 더 작은 단편들 사이의 동일성, 가령, 적어도 약 9 개 뉴클레오티드, 보통 약 20 내지 24개 뉴클레오티드, 약 28 내지 32 뉴클레오티드, 약 36 개 또는 그 이상의 뉴클레오티드가 또한 바람직할 수 있다. 다중 서열 정렬 프로그램은 핵산 서열에도 이용 가능하다. 이러한 프로그램의 예로는 인터넷상의 웹 서버를 통해 액세스할 수 있는 "Clustal W", "CAP Sequence Assembly", "BLAST", "MAP" 및 "MEME"가 있다. 그러한 프로그램의 다른 소스는 당업자에게 공지되어 있다. 또는 Vector NTI 유틸리티도 사용된다. 상기 기술된 프로그램에 포함된 것을 포함하여, 뉴클레오티드 서열 동일성을 측정하는데 사용될 수 있는 당업계에 공지된 다수의 알고리즘이 또한 존재한다. 다른 예로서, 폴리뉴클레오티드 서열은 GCG 버젼 6.1의 프로그램인 Fasta ™를 사용하여 비교될 수 있다. Fasta ™는 의문(query) 서열과 검색 서열 사이의 가장 잘 겹쳐지는 영역의 정렬 및 서열 동일성 백분율을 제공한다. 예를 들어, 핵산 서열 간의 서열 동일성 백분율은 참조로 포함된 GCG 버전 6.1에 제공된 바와 같이, 그의 디폴트 매개변수 (워드 크기 6 및 스코어링 매트릭스에 대한 NOP AM 인자)를 갖는 Fasta™를 사용하여 결정될 수 있다.
아미노산 서열의 문맥에서 "동일성 백분율(%)", "서열 동일성", "서열 동일성 백분율" 또는 "동일 백분율"이란 용어는 대응하도록 정렬 될 때, 두 서열에서 동일한 잔기를 의미한다. 동일성 백분율은 전장의 단백질, 폴리펩티드, 약 70개 아미노산 내지 약 100개의 아미노산, 또는 이의 펩티드 단편 또는 상응하는 핵산 서열 코딩 서열에 걸친 아미노산 서열에 대해 용이하게 결정될 수 있다. 적합한 아미노산 단편은 적어도 약 8개 아미노산 길이 일 수 있고, 최대 약 150개 아미노산일 수 있다. 일반적으로, 두 개의 다른 서열 사이의 "동일성", "상동성(homology)" 또는 "유사성(similarity)"을 언급 할 때, "동일성", "상동성" 또는 "유사성"은 "정렬된(aligned)"서열과 관련하여 결정된다. "정렬된" 서열 또는 "정렬(alignments)"은 다수의 핵산 서열 또는 단백질 (아미노산) 서열을 말하며, 종종 참조 서열과 비교하여 누락 또는 추가 염기 또는 아미노산에 대한 보정을 포함한다. 정렬은 공개적으로 또는 상업적으로 이용가능한 다양한 다중 서열 정렬 프로그램 중 임의의 것을 사용하여 수행된다. 서열 정렬 프로그램은 가령, "Clustal X", "MAP", "PIMA", "MSA", "BLOCKMAKER", "MEME" 및 "Match-Box" 프로그램과 같은 아미노산 서열에 사용할 수 있다. 일반적으로, 이들 프로그램 중 임의의 것은 디폴트 설정에서 사용되지만, 당업자는 필요에 따라 이들 설정을 변경할 수 있다. 대안적으로, 당업자는 적어도 참조된 알고리즘 및 프로그램에 의해 제공되는 것과 동일성 수준 또는 정렬 수준을 제공하는 다른 알고리즘 또는 컴퓨터 프로그램을 이용할 수 있다. 가령, J. D. Thomson et al, Nucl. Acids. Res., "A comprehensive comparison of multiple sequence alignments", 27(13):2682-2690 (1999) 참고.
프로펩티드 및 GLP-1 서열의 다양한 조합을 바람직한 GLP-1 발현 구조체를 생성하기 위한 본원의 교시에 따라 제조할 수 있다. 이것은 본원에 기재된 GLP-1 활성 펩티드 서열로 당업계에 공지 된 프로 펩티드 서열의 조합을 포함한다.
일부 구체예들에서, 응고 인자 프로펩티드를 이용하는 것이 바람직하다. 비타민 k-의존성 혈장 단백질의 프로펩티드 부분은 상당히 보존되어있다. Hemostasis and Thrombosis: Basic Principles and Clinical Practice, Colman, Ed., 1827 pp., illustrated. Philadelphia, Lippincott Williams & Wilkins, 2006 참고.
한 구체예에서, 상기 프로펩티드 서열은 인자 IX 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위와 조합된 인자 IX 서열을 포함한다. 하기 실시예에서 그리고 한 구체예에서 실증된 바와 같이, 프로펩티드 서열은 GLP-1 (7-37) 야생형 서열과 복합된 고양이(펠리스 카투스(felis catus)) 인자 IX 리더 서열이다. 한 구체예에서, 상기 인자 IX 리더 서열은 신호 및 활성화 서열 (프로-서열)을 포함하며, 길이는 약 46개 아미노산이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 5에서 제시된 아미노산 서열을 인코드한다. 한 구체예에서, 상기 GLP-1 구조체를 인코드하는 핵산 서열은 서열 번호: 6에서 제시된다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 5를 인코드하는 코돈 최적화된 서열이다. 고양이 인자 IX의 아미노산 서열은 공지되어 있고, GenBank 기탁번호 AAR26346.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 11로 다시 만들었다. 또다른 구체예에서, 상기 프로펩티드 서열은 상기 GLP-1(7-37) 야생형 서열과 복합된 개의(캐니스 루피스 팔말라리스(canis lupis familiaris)) 인자 IX 리더 서열이다. 개의 인자 IX의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: NP_001003323.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 12로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 12의 아미노산 1-39이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 13에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 13을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 GLP-1(7-37) 야생형 서열과 복합된 인간의 인자 IX 리더 서열이다. 인간 인자 IX의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: AAA98726.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 14로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 14의 아미노산 1-46이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 15에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 15을 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 인자 IX의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
또다른 구체예에서, 상기 프로펩티드 서열은 인자 VII 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위와 조합된 인자 VII 서열을 포함한다. 한 구체예에서, 상기 인자 VII 리더 서열은 신호 및 활성화 서열 (프로-서열)을 포함하며, 길이는 약 37-40개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드 서열은 GLP-1(7-37) 야생형 서열과 복합된 고양이 (펠리스 카투스) 인자 VII 리더 서열이다. 고양이 인자 VII의 아미노산 서열은 공지되어 있고, GenBank 기탁번호 XP 003980582.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 16으로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 16의 아미노산 1-40이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 17에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 17을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 GLP- 1(7-37) 야생형 서열과 복합된 개의 인자 VII 리더 서열이다. 개의 인자 VII의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: ABB02531.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 18로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 18의 아미노산 1-40이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 19에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 19을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 GLP-1 (7-37) 야생형 서열과 복합된 인간 인자 VII 리더 서열이다. 인간 인자 VII의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: ACB87203.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 20로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 20의 아미노산 1-60이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 21에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 21을 인코드하는 코돈 최적화된 서열이다. 38aa의 리더 서열을 갖는 인간 인자 VII의 다른 형태는 때로는 변이체 2로 불린다. 이러한 변이체 2는 5 '코딩 영역에서 엑손이 결핍되지만, 변이체 1과 비교하면, 리딩 프레임은 유지하고 있다. 인코드된 아이소폼(b)은 아이소폼(a) 보다 더 짧다. 인간 인자 VII, 변이체 2의 서열은 공지되어 있고, 가령 NCBI 참조 서열: NP_062562.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 22로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 22의 아미노산 1-38이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 23에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 23을 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 인자 VII의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
항응고(anticoagulant) 인자 II는 또한 프로트롬빈이라고도 한다. 본 명세서에서 이용된 바와 같이, 인자 II는 프로트롬빈 및 트롬빈과 호환사용된다. 한 구체예에서, 상기 프로펩티드 서열은 인자 II 리더 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위와 조합된 인자 II (트롬빈) 서열이다. 한 구체예에서, 상기 프로펩티드의 길이는 약 41-43개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드 서열은 상기 GLP-1 (7-37) 야생형 서열과 복합된 고양이 인자 II 리더 서열이다. 고양이 인자 II의 아미노산 서열은 공지되어 있고, GenBank 기탁번호 XP 003993267.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 24로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 24의 아미노산 1-43이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 25에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 25를 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1(7-37) 야생형 서열과 복합된 개의 인자 II 리더 서열이다. 개의 인자 II의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: XP_003639742.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 26로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 26의 아미노산 1-41이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 27에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 27을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1(7-37) 야생형 서열과 복합된 인간 인자 II 리더 서열이다. 인간 인자 II의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: NP_000497.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 28로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 28의 아미노산 1-43이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 29에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 29를 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 인자 II의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
또다른 구체예에서, 상기 프로펩티드 서열은 인자 IX 리더 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위와 조합된 인자 IX 서열을 포함한다. 한 구체예에서, 상기 프로펩티드의 길이는 약 39-46개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드 서열은 GLP-1(7-37) 야생형 서열과 복합된 고양이의 인자 IX 리더 서열이다. 고양이 인자 IX의 아미노산 서열은 공지되어 있고, GenBank 기탁번호 NP_001009377.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 30으로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 30의 아미노산 1-46이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 31에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 31을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 GLP- 1(7-37) 야생형 서열과 복합된 개의 인자 IX 리더 서열이다. 개의 인자 IX의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: NP_001003323.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 32로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 32의 아미노산 1-39이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 33에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 33을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1(7-37) 야생형 서열과 복합된 인간 인자 IX 리더 서열이다. 인간의 인자 IX의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: NP_000124.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 34로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 34의 아미노산 1-46이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 35에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 35를 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 인자 IX의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
또다른 구체예에서, 상기 프로펩티드 서열은 단백질 S (또한 소위 비타민 K-의존적 단백질 S) 리더 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위와 조합된 단백질 S 서열을 포함한다. 한 구체예에서, 상기 프로펩티드의 길이는 약 36-57개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드 서열은 상기 GLP-1 (7-37) 야생형 서열과 복합된 고양이의 단백질 S 리더 서열이다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 7의 아미노산 1-57이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 7에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 7을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 8, 또는 이의 코돈 최적화된 서열에 의해 인코드된다. 고양이 단백질 S의 아미노산 서열은 공지되어 있고, GenBank 기탁번호 XP 011284289로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 36으로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 36의 아미노산 1-36이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 37에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 37을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1(7-37) 야생형 서열과 복합된 고양이의 단백질 S 리더 서열이다. 고양이의 단백질 S의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: XP_005639500.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 38로 다시 만들었다. 한 구체예에서, 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 38의 아미노산 1-41이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 39에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 39을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1 (7-37) 야생형 서열과 복합된 인간 단백질 S 리더 서열이다. 인간 단백질 S의 아미노산 서열은 공지되어 있고, 가령: UniProtKB/Swiss-Prot: P07225.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 40으로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 40의 아미노산 1-41이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 41에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 41을 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 단백질 S의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
또다른 구체예에서, 상기 프로펩티드 서열은 단백질 Z (또한 비타민 K- 의존적 단백질 Z라고도 함) 리더 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위와 조합된 단백질 Z 서열을 포함한다. 한 구체예에서, 상기 프로펩티드의 길이는 약 62개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드 서열은 상기 GLP-1 (7-37) 야생형 서열과 복합된 고양이 단백질 Z 리더 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호:1에 나타낸 상기 GLP-1 (7-37) 서열과 복합된 고양이 단백질 Z 리더 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1 (7-37) 야생형 서열과 복합된 인간의 단백질 Z 리더 서열이다. 인간 단백질 Z의 아미노산 서열은 공지되어 있고, 가령: GenBank: AAA36501.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 42로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 42의 아미노산 1-62이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 43에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 43을 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 단백질 Z의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
또다른 구체예에서, 상기 프로펩티드 서열은 단백질 C (또한 비타민 K- 의존적 단백질 C라고도 함) 리더 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위와 조합된 단백질 C 서열을 포함한다. 한 구체예에서, 상기 프로펩티드의 길이는 약 42개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드 서열은 서열 번호:1에 나타낸 상기 GLP-1 (7-37) 서열과 복합된 고양이 단백질 Z 리더 서열이다. 고양이 단백질 C의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: XP_011283508.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 44로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 44의 아미노산 1-42이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 45에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 45를 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP- 1(7-37) 야생형 서열과 복합된 개의 단백질 C 리더 서열이다. 개의 단백질 C의 아미노산 서열은 공지되어 있고, NCBI 참조 서열: GenBank: CAA05126.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 46으로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 46의 아미노산 1-42이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 47에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 47을 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호:1에 나타낸 상기 GLP-1 (7-37) 서열과 복합된 인간 단백질 C 리더 서열이다. 인간 단백질 C의 아미노산 서열은 공지되어 있고, 가령: GenBank: AAA60166.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 48로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 48의 아미노산 1-42이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 49에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 49를 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 단백질 C의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
또다른 구체예에서, 상기 프로펩티드 서열은 알부민 리더 서열이다. 또다른 구체예에서, 상기 프로펩티드 서열은 퓨린 부위과 조합된 알부민 리더 서열을 포함한다. 한 구체예에서, 상기 프로펩티드의 길이는 약 24개 아미노산이다. 또다른 구체예에서, 상기 프로펩티드 서열은 상기 GLP-1 (7-37) 야생형 서열과 복합된 고양이 알부민 리더 서열이다. 고양이 알부민의 아미노산 서열은 공지되어 있고, GenBank 기탁번호 CAA59279.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 50으로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 50의 아미노산 1-24이다. 한 구체예에서, 상기 GLP-1 구조체는 서열 번호: 9에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 9를 인코드하는 코돈 최적화된 서열이다. 한 구체예에서, 고양이 알부민 프로펩티드-GLP-1 구조체를 인코드하는 핵산 서열은 서열 번호: 10이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1(7-37) 야생형 서열과 복합된 개의 알부민 리더 서열이다. 개의 알부민 아미노산 서열은 공지되어 있고, NCBI 참조 서열: CAB64867.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 51로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 51의 아미노산 1-24이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 52에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 52를 인코드하는 코돈 최적화된 서열이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 상기 GLP-1(7-37) 야생형 서열과 복합된 인간 알부민 리더 서열이다. 인간 알부민의 아미노산 서열은 공지되어 있고, 가령: NCBI 참조 서열: AAA98797.1로 찾아볼 수 있으며, 이는 편의를 위하여 서열 번호: 53으로 다시 만들었다. 한 구체예에서, 상기 프로펩티드 서열은 서열 번호: 53의 아미노산 1-24이다. 또다른 구체예에서, 상기 GLP-1 구조체 서열은 서열 번호: 54에서 제시된 아미노산 서열을 인코드한다. 여전히 또다른 구체예에서, 상기 GLP-1 구조체는 서열 번호: 54를 인코드하는 코돈 최적화된 서열이다. 유사한 구조가 당업계에 공지된 알부민의 다른 아이소폼(isoforms)을 사용하여 만들어질 수 있다.
한 구체예에서, 본원에서 기술된 GLP-1 구조체를 인코드하는 핵산 서열은 임의의 적합한 유전적 요소, 가령, 네이키드 DNA, 파아지, 트랜스포존, 코스미드, RNA 분자 (가령, mRNA), 에피좀 등등의 안으로 조작될 수 있고, 이것은 포장 숙주 세포에서 DNA 또는 RNA, 바이러스 벡터를 운반하는 나노입자를 만들거나 및/또는 대상의 숙주 세포로 전달하기 위하여, 숙주 세포로 이 안에 포함된 hLDLR 서열을 전달한다. 한 구체예에서, 상기 유전 요소는 플라스미드다. 선택된 유전 요소는 형질 감염, 전기천공, 리포좀 전달, 막 융합 기술, 고속 DNA-코팅된 펠렛, 바이러스 감염 및 원형질체 융합을 포함하는 임의의 적합한 방법에 의해 전달될 수 있다. 이러한 구조체를 제조하는 데 사용되는 방법은 유전 공학, 재조합 공학 및 합성 기술을 포함하는 핵산 조작 기술이 있는 사람들에게 공지되어 있다. 가령, Green and Sambrook, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참고.
본 명세서에서 이용된 바와 같이, "발현 카세트(expression cassette)"는 GLP-1 구조체 코딩 서열 (예를 들어, 프로펩티드 및 GLP-1 활성 펩티드의 코딩 서열), 프로모터, 프로모터를 포함하는 핵산 분자를 지칭하며, 그리고 이를 위한 임의의 다른 조정 서열을 포함할 수 있고, 이 카세트는 유전자 요소로 조작되거나, 또는 바이러스 벡터의 캡시드 (capsid)(예: 바이러스 입자)에 패키징된다. 전형적으로, 바이러스 벡터를 생성하기 위한 이러한 발현 카세트는 바이러스 게놈의 패키징 서열 및 다른 발현 제어 서열 측면에 위치하는 본원에 기술된 GLP-1 구조체 서열을 함유한다. 당분야에 공지된 기술, 본원에서 기술된 바와 같이 가령, 코돈 최적화를 포함하는 기술을 이용하여 특정 종에 대하여 최적화될 수 있다.
상기 발현 카세트는 발현 제어 서열의 일부분으로써 프로모터 서열을 전형적으로 포함한다. 한 구체예에서, 간-특이적 프로모터 티록신 결합 글로불린 (TBG)이 이용된다. 본원에서 기술된 플라스미드 및 벡터에서 CB7 프로모터가 이용된다. CB7은 사이토메갈로바이러스 인헨서 요소와 함께, 병아리 β-액틴 프로모터다. 대안으로, 다른 간-특이적 프로모터들이 이용된다[가령, The Liver Specific Gene Promoter Database, Cold Spring Harbor, http://rulai.schl.edu/LSPD, 알파 1 항-트립신 (A1AT); 인간 알부민 Miyatake et al., J. Virol., 71:5124 32 (1997), humAlb; 그리고 B형 간염 바이러스 코어 프로모터, Sandig et al., Gene Ther., 3:1002 9 (1996)]. TTR 최소 인헨서/프로모터, 알파-안티트립신 프로모터, LSP (845 nt)25(인트론이-적은 scAAV를 요구함). 비록 바람직한 정도가 덜하지만, 다른 프로모터, 이를 테면, 바이러스 프로모터, 구성 프로모터, 규제가능한 프로모터 [가령, WO 2011/126808 및 WO 2013/04943 참고], 또는 생리학적 신호에 반응성이 있는 프로모터가 본원에서 기술된 백터에 사용되고 이용될 수 있다.
프로모터에 추가하여, 발현 카세트 및/또는 벡터는 다른 적합한 전사 개시, 종료, 인헨서 서열, 효과적인 RNA 프로세싱 신호, 이를 테면, 스플라이싱 및 폴리아데닐화(polyA) 신호; 세포질 mRNA를 안정화시키는 서열; 해독 효과를 강화시키는 서열(가령, Kozak 콘센수스 서열); 단백질 안정성을 강화시키는 서열; 그리고 바람직한 경우, 인코드된 산물의 분비를 강화시키는 서열을 포함할 수 있다. 적합한 polyA 서열의 예로는 가령, 그중에서도 SV40, 소 성장 호르몬 (bGH), 및 TK poly A를 포함한다. 적합한 인헨서의 예로는 가령, 알파 훼토단백질 인헨서, TTR 최소 프로모터/인헨서, LSP (TH-결합 글로불린 프로모터/알파1-마이크로글로불린/비쿠민 인헨서)를 포함한다.
이들 제어 서열은 상기 GLP-1 구조체 서열에 "작동가능하도록 연계된다(operably linked)". 본 명세서에서 이용된 바와 같이, 용어 "작동가능하도록 연계된"이란 관심대상 유전자와 연접하는 발현 조절 서열과 관심대상 유전자를 조절하기 위해 트랜스(trans) 또는 먼 거리에서 작용하는 발현 제어 서열 모두를 지칭한다.
상기 발현 카세트는 바이러스 벡터의 생산에 사용되는 플라스미드 상에서 조작될 수 있다. 상기 발현 카세트를 AAV 바이러스 입자 안으로 패키지하는데 요구되는 최소 서열은 AAV 5' 및 3' ITRs이며, 이들은 캡시드와 동일한 AAV 기원이거나, 또는 상이한 AAV 기원 (AAV 위형(pseudotype)을 만들기 위하여)일 수 있다. 한 구체예에서, AAV2의 ITR 서열, 또는 이의 결손된 형태(△ITR)는 조정 승인을 가속화시키기 위하여 편리하게 이용된다. 그러나, 다른 AAV 원천의 ITRs이 선택될 수 있다. ITRs의 원천이 AAV2이고, 그리고 AAV 캡시드는 또다른 AAV 원천인 경우, 생성된 벡터는 위형(pseudotype)이라고 부를 수 있다. 전형적으로, AAV 벡터의 발현 카세트는 AAV 5' ITR, 상기 프로펩티드-GLP-1 활성 펩티드 코딩 서열 및 임의의 조정 서열, 그리고 AAV 3' ITR을 포함한다. 그러나, 이들 요소들의 다른 배위(configurations)가 적합할 수 있다. D-서열 및 말단 해리 부위 (trs)이 결손된 5' ITR의 단축형, △ITR이 기술되었다. 다른 구체예들에서, 전장의 AAV 5' 및 3' ITRs이 이용된다.
예시적인 플라스미드가 서열 목록에서 제시된다. 서열 번호: 57은 pn1044.CB7.GLP1feprotS로 명명된, 고양이 단백질 S 프로펩티드-GLP1 구조체를 인코드하는 플라스미드 서열이다. 한 구체예에서, 상기 발현 카세트는 서열 번호: 57의 플라스미드로 조작된다. 서열 번호: 58은 pn1044.CB7.GLP1feIL2fur로 명명된, 고양이 IL2 프로펩티드 (퓨린 부위 포함)-GLP1 구조체를 인코드하는 플라스미드 서열이다. 한 구체예에서, 상기 발현 카세트는 서열 번호: 58의 플라스미드로 조작된다. 서열 번호: 59는 p1044.CB7.GLP1feThrombin으로 명명된, 고양이 트롬빈 프로펩티드-GLP1 구조체를 인코드하는 플라스미드 서열이다. 한 구체예에서, 상기 발현 카세트는 서열 번호: 59의 플라스미드로 조작된다. 서열 번호: 60은 p1044.CB7.GLP1feManFur로 명명된, 고양이 만노시다제 (퓨린 부위와 함께) 프로펩티드-GLP1 구조체를 인코드하는 플라스미드 서열이다. 한 구체예에서, 상기 발현 카세트는 서열 번호: 60의 플라스미드로 조작된다. 서열 번호: 61은 p1044 GLP1fealb로 명명된, 고양이 알부민 프로펩티드-GLP1 구조체를 인코드하는 플라스미드 서열이다. 한 구체예에서, 상기 발현 카세트는 서열 번호: 61의 플라스미드로 조작된다. 서열 번호: 62은 p1044 GLP1fealbfur로 명명된, 고양이 알부민 (퓨린 부위와 함께) 프로펩티드-GLP1 구조체를 인코딩하는 플라스미드 서열이다. 한 구체예에서, 상기 발현 카세트는 서열 번호: 62의 플라스미드로 조작된다. 서열 번호: 63은 p1044 GLP1fealbfur로 명명된, 고양이 트롬빈 (퓨린 부위와 함께) 프로펩티드-GLP1 구조체를 인코딩하는 플라스미드 서열이다. 한 구체예에서, 상기 발현 카세트는 서열 번호: 62의 플라스미드로 조작된다.
약어 "sc"는 자가-상보성을 나타낸다. "자가-상보성(self-complementary) AAV"는 재조합 AAV 핵산 서열에 의해 운반되는 코딩 영역이 분자내 이중-가닥 DNA 주형을 형성하도록 기획된, 발현 카세트를 갖는 플라스미드 또는 벡터를 말한다. 감염시, 제2 가닥의 세포 매개된 합성을 기다리기보다는, scAAV의 두 개의 상보적인 절반은 연관되어 즉시 복제 및 전사가 가능한 한 개의 이중 가닥 DNA (dsDNA) 유닛을 형성할 것이다. 가령, D M McCarty et al, "Self-complementary recombinant adeno-associated virus (scAAV) vectors promote efficient transduction independently of DNA synthesis", Gene Therapy, (August 2001), Vol 8, Number 16, Pages 1248-1254 참고. 자가-상보성 AAVs는 가령, 미국 특허 번호 6,596,535; 7,125,717; 및 7,456,683에 기술되어 있으며, 이들 각각은 모두 전문이 본 명세서의 참고자료에 편입된다.
아데노-연합된 바이러스 (AAV) 바이러스 벡터는 표적 세포로 운반을 위하여 패키지된 핵산 서열인, AAV 단백질 캡시드를 갖는 AAV DNase-저항성 입자다. AAV 캡시드는 60개의 캡시드 (cap) 단백질 소단위, VP1, VP2, 및 VP3로 구성되며, 이들은 선택된 AAV에 따라, 대략적으로 1:1:10 내지 1:1:20의 비율의 정이십면체 대칭으로 정렬된다. AAV 혈청형(serotypes)은 AAV 바이러스 벡터 (DNase 저항성 바이러스 입자)의 캡시드의 원천으로 선택될 수 있는데, 가령, AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, rh10, AAVrh64R1, AAVrh64R2, rh8, rh.10, 임의의 공지의 또는 언급된 AAVs 또는 AAVs의 앞으로 발견될 변이체들이다. 가령, 미국 공개된 특허 출원 번호 2007-0036760-A1; 미국 공개된 특허 출원 번호. 2009-0197338-A1; EP 1310571 참고. WO 2003/042397 (AAV7 및 다른 유사한 AAV), 미국 특허 7790449 및 미국 특허 7282199 (AAV8), WO 2005/033321 및 미국 7,906,111 (AAV9), 그리고 WO 2006/110689, 그리고 WO 2003/042397 (rh. 10) 참고. 대안으로, 임의의 언급된 AAVs를 바탕으로 재조합 AAV는 AAV 캡시드의 원천으로 이용될 수 있다. 이 문서는 또한 AAV를 생성하기 위해 선택될 수 있는 다른 AAV를 기술하며, 이들은 참고자료에 편입된다. 일부 구체예들에서, 바이러스 벡터에서 이용되는 AAV cap는 전술한 AAV Caps 또는 이를 인코드하는 핵산의 돌연변이생성(가령, 삽입, 결손 또는 치환에 의해)에 의해 생성될 수 있다. 일부 구체예들에서, 상기 AAV 캡시드는 전술한 AAV 캡시드 단백질중 2개 또는 3개 또는 4개 또는 그 이상으로부터 유래된 도메인을 포함하는 키메라다. 일부 구체예들에서, 상기 AAV 캡시드는 상이한 2개 또는 3개의 AAVs 또는 재조합 AAVs로부터 Vp1, Vp2, 및 Vp3 단량체의 모자이크다. 일부 구체예들에서, rAAV 조성물은 전술한 Caps중 하나 이상을 포함한다.
발현 카세트를 비리온(virions)으로 패키징하기 위하여, 상기 ITRs는 동일한 구조체 안에서 이 유전자와 동일한 cis 형태로 요구되는 유일한 AAV 성분들이다. 한 구체예에서, AAV 벡터를 만들기 위하여, 복제 (rep) 및/또는 캡시드 (cap)를 위한 코딩 서열은 AAV 게놈으로부터 제거되고, trans로 공급되거나, 또는 패키징 세포 계통에 의해 공급된다. 예를 들면, 상기와 같이, 위형의(pseudotyped) AAV는 상기 AAV 캡시드의 원천과는 상이한 원천으로부터 유래된 ITRs을 함유할 수 있다. 추가적으로, 또는 대안으로, 키메라 AAV 캡시드를 이용할 수 있다. 여전히 다른 AAV 성분들이 선택될 수 있다. 그러한 AAV 서열의 출처는 여기에 기술되어 있으며, 학술, 상업 또는 공공 출처(가령, American Type Culture Collection, Manassas, VA)로부터 단리되거나 획득될 수도 있다. 대안으로, 상기 AAV 서열은 문헌, 또는 예를 들어 GenBank®, PubMed®, 등과 같은 데이터베이스에서 이용가능한 공개된 서열을 참조하여 합성 또는 다른 적절한 수단을 통해 수득할 수 있다.
대상에게 전달하기에 적합한 AAV 바이러스 벡터를 생성하고 단리하는 방법은 당업계에 공지되어 있다. 가령, 미국 특허 7790449; 미국 특허 7282199; WO 2003/042397; WO 2005/033321, WO 2006/110689; 및 미국 7588772 B2] 참고. 한 시스템에서, 생산자 세포주는 ITR의 측면에 위치하는 이식유전자(transgene) 및 rep와 cap을 인코딩하는 구조체 (들)에 의해 일시적으로 형질감염된다. 제 2 시스템에서, rep 및 cap을 안정적으로 공급하는 패키징 세포계통은 ITRs의 측면에 있는 이식유전자를 인코딩하는 구조체로 일시적으로 형질감염된다. 이들 각 시스템에서, AAV 비리온은 헬퍼(helper) 아데노바이러스 또는 헤르페스바이러스의 감염에 반응하여 생성되는데, 오염 바이러스로부터 상기 rAAVs의 분리가 필요하다. 더욱 최근에, AAV를 회수시키기 위하여, 헬퍼 바이러스를 이용한 감염이 요구되지 않는 시스템이 개발되었는데, 요구되는 헬퍼 기능 (가령, 아데노바이러스 E1, E2a, VA, 및 E4 또는 헤르페스바이러스 UL5, UL8, UL52, 및 UL29, 그리고 헤르페스바이러스 중합효소)이 이 시스템에 의해 trans로 또한 공급된다. 이들 신규 시스템에서, 헬퍼 기능은 요구되는 헬퍼 기능을 인코드하는 구조체로 이 세포의 일시적 형질감염에 의해 공급될 수 있거나, 또는 이 세포들은 헬퍼 기능을 인코드하는 유전자를 안정적으로 함유하도록 조작될 수 있고, 이의 발현은 전사 또는 전사후 수준에서 제어될 수 있다. 또다른 시스템에서, ITRs의 측면에 있는 이식유전자와 rep/cap 유전자는 베큘로바이러스-기반 벡터을 이용한 감염에 의해 곤충 세포로 도입된다. 이들 생산 시스템에 대한 검토는 일반적으로 가령, Zhang et al., 2009, "Adenovirus-adeno-associated virus hybrid for large-scale recombinant adeno-associated virus production," Human Gene Therapy 20:922-929를 참고하며, 이의 각 내용은 본 명세서의 참고자료에 전문이 편입된다. 이들 및 기타 AAV 생산 시스템을 만들고 이용하는 방법은 다음의 미국 특허에서 또한 설명되어 있으며, 이의 각 내용은 본 명세서의 참고자료에 전문이 편입된다: 5,139,941; 5,741,683; 6,057,152; 6,204,059; 6,268,213; 6,491,907; 6,660,514; 6,951,753; 7,094,604; 7,172,893; 7,201,898; 7,229,823; 및 7,439,065. 가령, Grieger & Samulski, 2005, "Adeno-associated virus as a gene therapy vector: Vector development, production and clinical applications," Adv. Biochem. Engin/Biotechnol. 99: 119-145; Buning et al., 2008, "Recent developments in adeno-associated virus vector technology," J. Gene Med. 10:717-733; 그리고 하기에서 언급된 문헌들을 참고하며, 이의 각 내용은 본 명세서의 참고자료에 전문이 편입된다: 본 발명의 임의의 구체예를 구축하는데 이용되는 방법은 유전 공학, 재조합 공학 및 합성 기술을 포함하는 핵산 조작 기술이 있는 사람들에게 공지되어 있다. 가령, Green and Sambrook et al, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Press, Cold Spring Harbor, NY (2012) 참고. 유사하게, rAAV 비리온을 생성하는 방법은 잘 알려져 있으며, 본 발명에서 적합한 방법의 선택은 제한되는 것은 아니다. 가령, K. Fisher et al, (1993) J. Virol., 70:520-532 및 미국 특허 번호 5,478,745 참고.
임의선택적으로, 본원에서 기술된 GLP-1 구조체는 rAAV이외에 바이러스 벡터로 전달될 수 있다. 이러한 다른 바이러스 벡터는 유전자 요법에 적합한 임의의 바이러스를 포함하며, 아데노바이러스; 헤르페스 바이러스; 렌티바이러스; 레트로바이러스; 등을 포함하나, 이에 국한되지 않는 것들이 이용될 수 있다. 적합하게는 이들 다른 벡터중 하나가 만들어질 때, 복제-결함성 바이러스 벡터로 만들어진다.
"복제-결함성(defective) 바이러스" 또는 "바이러스 벡터"는 관심대상 유전자를 함유하는 발현 카세트가 바이러스 캡시드 또는 외피 내에 포장된, 합성 또는 인위적 바이러스 입자를 지칭하며, 여기에서 바이러스 캡시드 또는 외피 내에 포장된 임의의 바이러스 게놈 서열은 복제-결함성이다; 즉, 이들은 후손 비리온을 만들 수 없지만, 표적 세포를 감염시키는 능력은 유지한다. 한 구체예에서, 바이러스 벡터의 게놈은 복제에 필요한 효소를 인코딩하는 유전자를 포함하지 않고(이 게놈은 인위적인 게놈의 증폭 및 패키징에 요구되는 신호 측면에 오직 관심대상의 이식유전자를 함유하는 "거트레스(gutless)"로 조작될 수 있지만, 그러나, 이들 유전자는 생산하는 동안 공급될 수 있다. 따라서, 복제에 필요한 바이러스 효소가 존재하는 경우를 제외하고, 자손 비리온에 의한 복제 및 감염이 발생할 수 없기 때문에, 유전자 요법에서의 이의 사용은 안전하다고 간주된다.
본원에서 기술된 바이러스 벡터 구조체를 포함하는 조성물이 또한 제시된다. 본원에서 기술된 약학 조성물은 임의의 적합한 경로 또는 상이한 경로의 조합에 의해 이를 필요로 하는 대상에게 전달되도록 기획된다. 간으로 직접 전달 (임의선택적으로 정맥을 경유하여, 간 동맥을 경유하여, 또는 이식에 의해), 경구, 흡입, 비강내, 기관내(intratracheal), 동맥내, 안구내, 정맥내, 근육내, 피하, 피내, 그리고 다른 비경구 투여. 본원에서 기술된 바이러스 벡터는 단일 조성물 또는 다중 조성물로 전달될 수 있다. 임의선택적으로, 2개 또는 그 이상의 상이한 AAV가 전달될 수 있거나, 또는 다중 바이러스[가령, WO 2011/126808 및 WO 2013/049493 참고], 또다른 구체예에서, 다중 바이러스는 상이한 복제-결함성 바이러스(가령, AAV 및 아데노바이러스)를 함유할 수 있다.
상기 복제-결함성 바이러스는 유전자 전달 및 유전자 치료 응용에 사용하기 위해 생리학적으로 수용가능한 담체와 함께 제형화될 수 있다. AAV 바이러스 벡터의 경우, 게놈 복사체 ("GC")의 정량화는 제형에 포함된 용량(dose)의 척도로 사용될 수 있다. 당업계에 공지된 임의의 방법을 사용하여 본 발명의 복제-결함성 바이러스 조성물의 게놈 복사체 (GC) 수를 결정할 수 있다. AAV GC 수 적정을 실행하는 한 가지 방법은 다음과 같다: 정제된 AAV 벡터 시료를 우선 DNase로 처리하여, 캡슐화되지 않은 AAV 게놈 DNA 또는 생산 과정에서 오염된 플라스미드 DNA를 제거한다. 그런 다음 DNase 저항성 입자는 열처리하여, 캡시드에서 게놈을 방출시킨다. 그런 다음 방출된 게놈은 바이러스 게놈의 특정 영역(통상적으로 poly A 신호)을 표적으로하는 프라이머/프로브 세트를 사용하여 실시간 PCR로 정량된다.
또한, 복제-결함성 바이러스 조성물은 약 1.0 × 109 GC 내지 약 1.0 × 1015 GC의 범위에 있는 복제-결함성 바이러스의 양을 함유하는 투약 단위로 제형화될 수 있다. 또다른 구체예에서, 이 양의 바이러스 게놈은 분할된 용량으로 전달될 수 있다. 한 구체예에서, 상기 투여량(dosage)은 평균 5kg의 고양이 또는 작은 개를 대상으로 하는 경우, 약 1.0 x 1011 GC 내지 약 1.0 x 1012 GC이다. 한 구체예에서, 평균 약 20 kg의 중간 개의 대상를 대상으로 하는 경우, 상기 투여량은 약 1.0 x 1012 GC 내지 약 1.0 x 1013 GC이다. 평균적으로 개는 체중이 약 5 내지 약 50 kg이다. 한 구체예에서, 평균 약 70 kg의 인간을 대상으로 하는 경우, 상기 투여량은 약 1.0 x 1012 GC 내지 약 1.0 x 1013 GC이다. 평균적으로 인간의 체중은 약 55 내지 약 80 kg이다. 한 구체예에서, 대상의 투여량은 약 1.0 x 1011 GC 내지 1.0 x 1013 GC이다. 또다른 구체예에서, 용량 약 3 x 1012 GC이다. 예를 들면, AAV 바이러스의 용량은 약 1 x 1011 GC, 약 5 X 1011 GC, 약 1 X 1012 GC, 약 5 X 1012 GC, 또는 약 1 X 1013 GC일 수 있다. 또다른 실시예에서, 상기 구조체는 mL당 약 0.001 mg 내지 약 10 mg의 양으로 전달될 수 있다. 한 구체예에서, 상기 구조체는 수의과 동물 대상의 경우 1 μL 내지 약 100 mL 용적으로 전달될 수 있다. 가령, 다양한 수의과 동물에 물질을 투여하기 위한 양호한 실행에 대한 논의는 Diehl et al, J. Applied Toxicology, 21:15-23 (2001) 참고. 이 문헌은 본 명에서의 참고자료에 편입된다. 본 명세서에서 이용된 바와 같이, 용어 "투여량(dosage)"이란 용어는 치료 과정에서 대상에게 전달되는 총 투여량 또는 단일 투여 (다중 투여)로 전달되는 양을 지칭할 수 있다.
상기 기술된 재조합 벡터는 공지된 방법에 따라 숙주 세포에 전달될 수 있다. 바람직하게는 생리학적으로 양립가능한 운반체에 현탁된 rAAV는 고양이, 개, 인간 또는 비-인간 포유동물 대상을 포함하나, 이에 국한되지 않는 원하는 대상에게 투여될 수 있다. 적합한 운반체는 전달 바이러스에 의해 지시되는 관점을 고려하여, 당업자에 의해 용이하게 선택될 수 있다. 예를 들면, 한 가지 적합한 운반체는 염수를 포함하는데, 이는 다양한 완충 용액 (가령, 인산염 완충된 염수)으로 제형화될 수 있다. 다른 예시적인 운반체는 염수, 락토스, 슈크로스, 인산 칼슘, 젤라틴, 덱스트린, 한천, 펙틴, 땅콩유, 참깨유, 및 물을 포함한다. 운반체의 선택은 본 발명에서 제한되지 않는다.
임의선택적으로, 본 발명의 조성물은 상기 rAAV 및/또는 변이체 및 운반체(들)에 추가하여, 다른 통상적인 약학 성분들, 이를 테면, 보존제 또는 화학적 안정제를 포함한다. 적절한 예시적인 보존제는 클로로부탄올, 소르빈산 칼륨, 소르 브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀 및 파라클로로페놀을 포함한다. 적합한 화학적 안정제는 젤라틴 및 알부민을 포함한다.
한 구체예에서, 하나 또는 그 이상의 바이러스 벡터를 포함하는 조성물이 제시되는데, 이때 각 벡터는 본원에서 기술된 바와 같이, 하나 또는 그 이상의 GLP-1 구조체를 포함한다. 예를 들면, 한 구체예에서, 조성물은 프로펩티드-GLP-1-(7-37) 구조체를 인코드하는 AAV 벡터를 포함한다. 동일한 조성물은 또한 프로펩티드 및 GLP-1-(7-36)NH2 구조체를 인코드하는 AAV 벡터를 포함한다. 상기 AAV 벡터 캡시드의 원천은 조성물 안에 포함된 각 구조체와 동일하거나 또는 상이할 수 있다.
본원에서 기술된 바이러스 벡터 및 다른 구조체는 대상에게 증가된 반감기를 갖는 GLP-1을 제공하고, 및/또는 대상의 유형 II 당뇨병 또는 대사성 증후군을 치료하기 위하여, 이를 필요로 하는 대상에게 GLP-1 구조체를 전달하기 위한 약물 제조에 이용될 수 있다. 따라서, 또다른 측면에서, 당뇨병을 치료하는 방법이 제시된다. 상기 방법은 이를 필요로 하는 대상에게 본원에서 기술된 바와 같은 조성물을 투여하는 것을 포함한다. 한 구체예에서, 상기 조성물은 본원에서 기술된 바와 같이, 프로펩티드-GLP-1 발현 카세트가 함유된 바이러스 벡터를 포함한다. 한 구체예에서, 상기 대상은 포유류다. 또다른 구체예에서, 상기 대상은 고양이 또는 개이다. 또다른 구체예에서, 상기 대상은 인간이다.
또다른 구체예에서, 고양이의 T2DM을 치료하는 방법이 제시된다. 상기 방법은 고양이 인자 IX의 프로펩티드 및 GLP-1 활성 부분을 인코드하는 서열이 포함된 핵산을 포함하는 바이러스 벡터를 투여하는 것을 포함하며, 여기에서, 발현되었을 때, GLP-1의 N-말단 아미노산은 상기 프로펩티드의 C-말단 아미노산의 바로 뒤에 있다.
또다른 측면에서 대사성 증후군을 치료하는 방법이 제시된다. 상기 방법은 이를 필요로 하는 대상에게 본원에서 기술된 바와 같은 조성물을 투여하는 것을 포함한다. 한 구체예에서, 상기 조성물은 본원에서 기술된 바와 같이, 프로펩티드- GLP-1 발현 카세트가 함유된 바이러스 벡터를 포함한다. 한 구체예에서, 상기 대상은 포유류다. 또다른 구체예에서, 상기 대상은 고양이 또는 개이다. 또다른 구체예에서, 상기 대상은 인간이다.
또다른 측면에서, 대상의 체중을 감소시키는 방법을 제공한다. 상기 방법은 이를 필요로 하는 대상에게 본원에서 기술된 바와 같은 조성물을 투여하는 것을 포함한다. 한 구체예에서, 상기 조성물은 본원에서 기술된 바와 같이, 프로펩티드-GLP-1 발현 카세트가 함유된 바이러스 벡터를 포함한다. 한 구체예에서, 상기 대상은 포유류다. 또다른 구체예에서, 상기 대상은 고양이 또는 개이다. 또다른 구체예에서, 상기 대상은 인간이다.
치료 과정은 임의선택적으로 동일한 바이러스 벡터 (가령, AAV8 벡터) 또는 상이한 바이러스 벡터 (가령, AAV8 및 AAVrh10)의 반복 투여를 포함할 수 있다. 또 다른 조합은 본원에 기재된 바이러스 벡터를 사용하여 선택될 수 있다. 임의선택적으로, 본원에서 기술된 조성물은 다른 당뇨 약물 또는 단백질-기반의 요법이 관련된 요법 (가령, GLP-1 유사체, 인슐린, 경구 항고혈당 약물 (술포닐우레아, 비구아니드, 티아졸리딘디온, 그리고 알파-글루코이다제 억제제) 포함과 복합될 수 있다. 임의선택적으로, 본원에 기재된 조성물은 식이 요법 및 운동 요법을 포함하는 생활 습관 변화를 포함하는 요법과 조합될 수 있다.
용어 "a" 또는 "an"은 하나 이상을 지칭한다는 것을 유의해야 한다. 이와 같이, 용어 "하나"("a" (또는 "an")), "하나 이상"및 "적어도 하나"는 여기서 상호 교환 적으로 사용된다.
단어 "포함한다", "포함한다" 및 "포함하는"이란 배타적이지 않고 포괄적으로 해석되어야 한다. 단어 "구성하다", "구성하는" 및 그 변형은 포괄적인 것이 아니라 배타으로 해석되어야 한다. 본 명세서의 다양한 구체예가 "포함하는(comprising)" 언어를 사용하여 제공되는 동안, 다른 상황 하에서, 관련된 구체예는 또한 "구성된(consisting of)" 또는 "본질적으로 구성된(consisting essentially of)"의 언어를 사용하는 것으로 해석되고, 설명되도록 의도된다.
본 명세서에서 이용된 바와 같이, 용어 "약(about)"은 달리 언급하지 않는 한, 주어진 기준으로부터 10 %의 변동성을 의미한다.
본원에서 사용된 용어 "조절(regulation)" 또는 이의 변형은 생물학적 경로의 하나 또는 그 이상의 성분을 저해하는 조성물의 능력을 지칭한다.
"대상(subject)"은 인간, 마우스, 렛, 기니아 피그, 개, 고양이, 말, 소, 돼지 또는 비-인간 영장류, 가령, 원숭이, 침팬지, 비비 또는 고릴라와 같은 포유 동물이다. 본 명세서에서 이용된 바와 같이, 용어 "대상"은 "환자"와 호환사용된다.
본 명세서에서 이용된 바와 같이, "질병", "장애" 및 "상태"는 상호 호환적으로 사용되어, 대상의 비정상 상태를 나타낸다.
본 명세서에서 다르게 정의되지 않는 한, 본 명세서에서 사용되는 기술적 및 과학적 용어는 당업자가 일반적으로 이해하는 것과 동일한 의미를 가지며, 그리고 본 출원에서 이용된 많은 용어들에 대한 일반적인 지침을 당업자에게 제공하는 출판된 텍스트를 참조한다.
다음의 실시예들은 오직 설명을 위한 것이며, 본 명세서의 범위를 제한하려는 의도는 아니다.
실시예 1 - GLP-1 벡터의 구축
공지된 절단 부위를 갖는 프로펩티드를 함유하는 몇 가지 분비된 단백질이 선택되었다. 여기에는 응고 인자 (인자 II, VII, IX, X, 단백질 C, 단백질 S) 및 간에서 생성되는 다른 단백질 (알부민)을 포함한다. 상기 프로펩티드 서열은 상기 GLP-1 (7-37) 아미노산 서열의 상류에 배치된다. 오직 인터루킨-2 신호 펩티드 다음에 GLP-1 (7-37)를 포함하는 대조 서열 또한 기획되었다. 생성된 단백질 서열은 역-해독되고, 코돈 최적화되고, kozak 콘센수스 서열, 정지 코돈, 및 클로닝 부위가 추가된다. 이 서열은 GeneArt에서 만들었으며, CMV 인헨서 (p1044)와 함께, 병아리-베타 액틴 프로모터를 함유하는 발현 벡터 안에 클론되었다. 상기 발현 구조체는 AAV2 ITRs 측면에 있다. 고양이 FIX_GLP1 아미노산 서열은 서열 번호: 5에 나타낸다. 고양이 ProtS_GLP1 아미노산 서열은 서열 번호: 7에 나타낸다. 고양이 Alb_GLP1 아미노산 서열은 서열 번호: 9에 나타낸다. 고양이 FVII_GLP1 아미노산 서열은 서열 번호: 17에 나타낸다. 고양이 FII_GLP1 아미노산 서열은 서열 번호: 25에 나타낸다. 고양이 ProtC_GLP1 아미노산 서열은 서열 번호: 45에 나타낸다.
실시예 2 -시험관 분석
GLP-1 서열의 상류에 IL-2 신호 펩티드 또는 고양이 인자 IX 프로펩티드 만을 함유하는 구조체를 위한 정제된 플라스미드는 제조업자의 지시에 따라 리포펙타민 2000을 이용하여 90% 합류 HEK 293 세포의 6개 웰 플레이트의 삼중 웰로 형질감염되었다. 형질감염 48 시간 후에 상층액을 수거하고, 고감도 N-말단 GLP-1 ELISA (Millipore)를 사용하여 활성 GLP-1을 측정하였다. 도 1에 2개 구조체의 발현을 나타낸다. 도 1은 IL-2 대조에서 GLP-1의 발현은 기본적으로 0이며, 한편 상기 인자 IX 구조체의 발현은 약 60pM임을 보여준다.
실시예 3 - 생체내 GLP-1 발현
이미 설명된 바와 같이, 고양이 인자 IX 프로펩티드를 함유하는 구조체는 삼중 형질감염 및 이딕사놀(iodixanol) 구배 정제에 의해 AAV 혈청형 8 벡터에 패키지되었다. RAG-/- 마우스 (n=4) 마우스는 50 마이크로리터의 PBS에서 벡터 (1012 GC/kg)의 정맥 주사를 맞았다. 정맥 주사는 내부 대조군으로 사용된 한 동물 (마우스 D)에서 달성 될 수 없을 것이다. 5 마이크로리터 DPP-IV 억제제 (Millipore)를 함유하는 혈청 분리기 튜브에서 전혈을 분리하여, 혈청을 연속적으로 수집하고 상기와 같이 활성 GLP-1을 분석하였다. 혈청 활성 GLP-1 농도는 도 2에 나타낸다. 도 2는 대조군 마우스의 활성 GLP-1 수준이 2 pM 미만임을 보여준다. 대조적으로, AAV8.CB.fFIX_GLP1을 주사맞은 3마리 마우스에서, 상기 GLP-1 농도는 1 pM 아래에서 출발하여, 14일차 정점을 찍고 (마우스 C에서 약 10pM), 21일차에 감소하고, 42일차에 재반등하였다. 프로펩티드의 절단 후, GLP-1은 상기 프로펩티드의 절단 후 인위적인 구조체에서 전달되며, 이 펩티드는 도 2에 나타낸 바와 같이 활성이 있다. 간에 추가하여 (도 2), 근육에서도 프로펩티드의 프로세싱이 특징화되었다(데이타 나타내지 않음). 과다발현하였을 때에도 프로세싱은 효과적이다.
실시예 4 - GLP-1 구조체로 당뇨병의 생체내 치료
6-7주령의 당뇨병 (db/db) 마우스에게 50 마이크로리터의 PBS내 인자 IX 프로펩티드 벡터 (3 x 1012 GC/kg, n = 5)의 정맥 주사하였다. 치료를 받지 않은 연령-정합된 db/db 마우스 (n = 5)와 치료되지 않은 db +/- 마우스 (n = 5) (WT)는 대조군으로 사용된다. 혈청 포도당은 플레이트 기반의 포도당 분석 (Caymen Chemical)을 이용하여 매주 측정되었다. 혈청 포도당 데이터는 도 3에 나타낸다. 도 3에서 AAV8.CB.fFIX_GLP1로 치료를 받은 당뇨병 마우스의 혈청 포도당 수준은 치료 후, 처리되지 않은 연령-정합된 당뇨병 (Db) 마우스보다 일관성이 적은 것을 보여준다.
실시예 5 - 다양한 구조체의 생체내 GLP-1 발현
AAV 매개된 GLP-1 발현에 대한 가능한 임상 후보를 분석하기 위하여 이 연구가 기획되었다. 인자 IX 퓨린 프로펩티드는 마우스에서 n-말단 절단된 glp1 (활성 glp-1)을 발현시킬 수 있다는 것을 이미 보여주었다. 그 다음 있을 수 있는 더 나은 구조체를 평가하기 위하여 6마리 야생형 검정 마우스에서 다양한 다른 구조체를 시험하였다. 코호느는 IV로 투여된 총 5 x1010 대응 벡터로 처리된 각 4마리 마우스이다. 트롬빈 퓨린 프로펩티드, 또다른 응고 인자는 인자 IX 및 만노시다제 퓨린 구조체보다 6마리 검정 마우스에서 활성이 더 큰 GLP-1를 생산하였다. 도 7.
실시예 6 - 고양이의 생체내 GLP-1 처리.
고객이 소유하는 6마리 동물에서 단일 용량의, 개방 라벨 파일롯 연구가 수행될 것이다. 포함 기준은 다음과 같다:
1. 최소한 2회 연속 측정에서 혈액 포도당 ≥ 200 mg/dL
2. 실험실 기준 범위 이상의 푸럭토사민(Fructosamine)
3. 대상은 인슐린 요법의 후보가 아님 (소유주가 치료 또는 기타 금기 사항을 제공할 수 없기 때문에)
4. 연구 프로토콜을 고수하고자 하는 소유자
배제 기준은 다음과 같다:
1. 고혈당증은 약물, 말단 비대증 등의 속발성으로 여겨진다.
2. 현재 인슐린 또는 경구용 저혈당 약물 사용
3. 제약 및 정맥천자를 수용하지 않음
4. 조사자의 의견으로는 대상에게 추가적인 위험을 초래하거나 연구 약물의 평가를 방해하는 임의의 상태.
상기 대상 동물은 0일째 1013 GC AAV8.CB7.thrGLP1을 제공받을 것이다. CBC/chem, 푸럭토사민, 포도당 곡선 및 혈청 GLP-1은 0, 14, 28, 42, 60, 90, 120, 150, 180 일차에 스크리닝에서 실행될 것이다.
실시예 7 - 건강한 고양이들에서 캡시드 및 투여량 비교
건강한 고양이에게 하기에서 설명된 GLP1을 발현시키는 벡터가 제공되었고, 90일차(d90) 까지 주단위로 Millipore 활성 GLP1 분석을 통하여 평가되었다. 분석용 혈액을 GLP1 보존 DPPIV 억제제 혈장 튜브(BD Biosciences, P700 혈장 튜브)에 수집하였다. CBC 및 화학 패널은 0일차, 14일차, 28일차, 42일차, 60일차 및 90일차에 취하였다. 90일 후 동물은 희생되었다.
디지털 비말 PCR (ddpcr)에 의해 측정하였을 때, AV8.CB7.CI.GLP1thrombin.rBG, 7x1012 gc/kg이 첫번째 고양이 코호트에 제공되었다. AAV3b.CB7.CI.GLP1thrombin.rBG, 7 x1012gc/kg (ddpcr)는 한 마리 고양이에게 제공되었다. AAV8.CB7.CI.GLP1thrombin.rBG 2 x1012 gc/kg (ddpcr)는 2 마리 고양이에게 제공되었다. glp1 활성 차이는 도 8에 나타낸다.
본 명세서에 인용된 모든 출판물 뿐만 아니라, 미국 가출원 62/201,803 및 62/356,289는 본원에 참고자료에 편입되어 있다. 유사하게, 본원에서 언급되고, 첨부된 서열 목록에 나타나는 서열 번호는 참고 문헌에 편입되어 있다. 본 발명은 특정 구체예를 참조하여 설명되었지만, 본 발명의 사상을 벗어나지 않고 수정이 이루어질 수 있음을 알 수 있을 것이다. 이러한 변형은 첨부된 청구범위의 범위 안에 속하는 것으로 의도된다.
SEQUENCE LISTING <110> The Trustees of the University of Pennsylvania <120> GLP-1 AND USE THEREOF IN COMPOSITIONS FOR TREATING METABOLIC DISEASES <130> UPN-14-7471 <160> 62 <170> PatentIn version 3.5 <210> 1 <211> 31 <212> PRT <213> Homo sapiens <400> 1 His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly 1 5 10 15 Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 20 25 30 <210> 2 <211> 96 <212> DNA <213> Homo sapiens <400> 2 cacgccgagg gcacctttac cagcgacgtg tccagctacc tggaaggcca ggccgccaaa 60 gagtttatcg cctggctcgt gaagggcaga ggctga 96 <210> 3 <211> 46 <212> PRT <213> Felis catus <400> 3 Met Arg Cys Leu Asn Met Ile Met Ala Glu Pro Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Gly Ala Asp Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asp Ala Thr Lys Val Leu Ser Arg Pro Lys Arg 35 40 45 <210> 4 <211> 138 <212> DNA <213> Felis catus <400> 4 atgcggtgcc tgaatatgat catggccgag ccccctggcc tgatcaccat ctgtctgctg 60 ggctacctgc tgggcgccga ctgcaccgtg tttctggatc acgaggacgc caccaaggtg 120 ctgagccggc ctaagaga 138 <210> 5 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> feline factor IX leader_GLP-1 active <400> 5 Met Arg Cys Leu Asn Met Ile Met Ala Glu Pro Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Gly Ala Asp Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asp Ala Thr Lys Val Leu Ser Arg Pro Lys Arg His Ala 35 40 45 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 50 55 60 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 75 <210> 6 <211> 234 <212> DNA <213> Artificial Sequence <220> <223> feline factor IX leader_GLP-1 active <400> 6 atgcggtgcc tgaatatgat catggccgag ccccctggcc tgatcaccat ctgtctgctg 60 ggctacctgc tgggcgccga ctgcaccgtg tttctggatc acgaggacgc caccaaggtg 120 ctgagccggc ctaagagaca cgccgagggc acctttacca gcgacgtgtc cagctacctg 180 gaaggccagg ccgccaaaga gtttatcgcc tggctcgtga agggcagagg ctga 234 <210> 7 <211> 88 <212> PRT <213> Artificial Sequence <220> <223> feline protein S propeptide_GLP-1 active <400> 7 Met Gly Val Asp Gly Arg Ile Phe Phe Leu Met Pro Ser Met Ala Phe 1 5 10 15 Gln Leu Leu Asn Glu Ser Arg Pro Ser Ser Leu Leu Ile Gln Met Phe 20 25 30 Pro Gly Leu Ser Phe Ile Cys Thr Thr Val Leu Ser Lys Gln His Ala 35 40 45 Ser Gln Val Leu Ile Arg Lys Arg Arg His Ala Glu Gly Thr Phe Thr 50 55 60 Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile 65 70 75 80 Ala Trp Leu Val Lys Gly Arg Gly 85 <210> 8 <211> 267 <212> DNA <213> Artificial Sequence <220> <223> feline protein S propeptide_GLP-1 active <400> 8 atgggcgtgg acggccggat attcttcctg atgcccagca tggccttcca gctgctgaac 60 gagagcagac ccagcagcct gctgatccag atgttccccg gcctgagctt catctgcacc 120 accgtgctga gcaagcagca cgccagccag gtgctgatcc ggaagagaag gcacgccgag 180 ggcaccttca ccagcgacgt gtccagctac ctggaaggac aggccgccaa agagtttatc 240 gcctggctcg tgaagggcag aggctga 267 <210> 9 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> feline albumin propeptide_GLP-1 active aa <400> 9 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Leu Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Val Thr Arg Arg His Ala Glu Gly Thr Phe Thr Ser 20 25 30 Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala 35 40 45 Trp Leu Val Lys Gly Arg Gly 50 55 <210> 10 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> feline albumin propeptide_GLP-1 active DNA <400> 10 atgaaatggg tcaccttcat cagcctgctg ctgctgttca gcagcgccta cagcagaggc 60 gtgaccagaa ggcacgccga gggcaccttt accagcgacg tgtccagcta cctggaaggc 120 caggccgcca aagagtttat cgcctggctc gtgaagggca ggggctga 168 <210> 11 <211> 466 <212> PRT <213> Felis catus <400> 11 Met Arg Cys Leu Asn Met Ile Met Ala Glu Pro Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Gly Ala Asp Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asp Ala Thr Lys Val Leu Ser Arg Pro Lys Arg Tyr Asn 35 40 45 Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys 50 55 60 Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn 65 70 75 80 Thr Glu Lys Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln 85 90 95 Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ile Cys Lys Asp Asp Ile 100 105 110 Asn Ser Tyr Glu Cys Trp Cys Gln Thr Gly Phe Glu Gly Lys Asn Cys 115 120 125 Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Lys Gln Phe 130 135 140 Cys Lys Leu Asp Ala Asp Asn Lys Val Val Cys Ser Cys Thr Thr Gly 145 150 155 160 Tyr Gln Leu Ala Glu Asp Gln Lys Ser Cys Glu Pro Ala Val Pro Phe 165 170 175 Pro Cys Gly Arg Val Ser Val Pro His Ile Ser Thr Thr His Thr Arg 180 185 190 Ala Glu Thr Leu Phe Leu Asn Met Asp Tyr Glu Asn Ser Thr Thr Asp 195 200 205 Tyr Glu Asn Ser Ala Glu Ala Glu Lys Asn Val Asp Asn Val Thr Gln 210 215 220 Pro Leu Asn Asp Leu Thr Arg Ile Val Gly Gly Lys Thr Ala Lys Pro 225 230 235 240 Gly Gln Phe Pro Trp Gln Val Leu Leu Lys Gly Lys Ile Asp Ala Phe 245 250 255 Cys Gly Gly Ser Ile Ile Asn Glu Lys Trp Val Val Thr Ala Ala His 260 265 270 Cys Ile Asn Pro Asp Val Glu Ile Thr Val Val Ala Gly Glu His Asn 275 280 285 Thr Glu Glu Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Thr 290 295 300 Ile Leu His His Ser Tyr Asn Ala Ser Val Asn Lys Tyr Ser His Asp 305 310 315 320 Ile Ala Leu Leu Glu Leu Asp Glu Pro Leu Thr Leu Asn Ser Tyr Val 325 330 335 Thr Pro Ile Cys Val Ala Asp Arg Glu Tyr Thr Asn Thr Phe Leu Lys 340 345 350 Phe Gly Tyr Gly Tyr Val Ser Gly Trp Gly Lys Val Phe Asn Lys Gly 355 360 365 Arg Pro Ala Thr Ile Leu Gln Tyr Leu Lys Val Pro Leu Val Asp Arg 370 375 380 Ala Thr Cys Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe 385 390 395 400 Cys Ala Gly Phe His Glu Gly Gly Lys Asp Ser Cys Gln Gly Asp Ser 405 410 415 Gly Gly Pro His Val Thr Glu Val Glu Gly Ile Asn Phe Leu Thr Gly 420 425 430 Ile Ile Ser Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile 435 440 445 Tyr Thr Lys Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys 450 455 460 Leu Thr 465 <210> 12 <211> 452 <212> PRT <213> Canis familiaris <400> 12 Met Ala Glu Ala Ser Gly Leu Val Thr Val Cys Leu Leu Gly Tyr Leu 1 5 10 15 Leu Ser Ala Glu Cys Ala Val Phe Leu Asp Arg Glu Asn Ala Thr Lys 20 25 30 Ile Leu Ser Arg Pro Lys Arg Tyr Asn Ser Gly Lys Leu Glu Glu Phe 35 40 45 Val Arg Gly Asn Leu Glu Arg Glu Cys Ile Glu Glu Lys Cys Ser Phe 50 55 60 Glu Glu Ala Arg Glu Val Phe Glu Asn Thr Glu Lys Thr Thr Glu Phe 65 70 75 80 Trp Lys Gln Tyr Val Asp Gly Asp Gln Cys Glu Ser Asn Pro Cys Leu 85 90 95 Asn Asp Gly Val Cys Lys Asp Asp Ile Asn Ser Tyr Glu Cys Trp Cys 100 105 110 Arg Ala Gly Phe Glu Gly Lys Asn Cys Glu Leu Asp Val Thr Cys Asn 115 120 125 Ile Lys Asn Gly Arg Cys Lys Gln Phe Cys Lys Leu Gly Pro Asp Asn 130 135 140 Lys Val Val Cys Ser Cys Thr Thr Gly Tyr Gln Leu Ala Glu Asp Gln 145 150 155 160 Arg Ser Cys Glu Pro Ala Val Pro Phe Pro Cys Gly Arg Val Ser Val 165 170 175 Pro His Ile Ser Met Thr Arg Thr Arg Ala Glu Thr Leu Phe Ser Asn 180 185 190 Met Asp Tyr Glu Asn Ser Thr Glu Val Glu Lys Ile Leu Asp Asn Val 195 200 205 Thr Gln Pro Leu Asn Asp Phe Thr Arg Val Val Gly Gly Lys Asp Ala 210 215 220 Lys Pro Gly Gln Phe Pro Trp Gln Val Leu Leu Asn Gly Lys Val Asp 225 230 235 240 Ala Phe Cys Gly Gly Ser Ile Ile Asn Glu Lys Trp Val Val Thr Ala 245 250 255 Ala His Cys Ile Glu Pro Asp Val Lys Ile Thr Ile Val Ala Gly Glu 260 265 270 His Asn Thr Glu Lys Arg Glu His Thr Glu Gln Lys Arg Asn Val Ile 275 280 285 Arg Thr Ile Leu His His Ser Tyr Asn Ala Thr Ile Asn Lys Tyr Asn 290 295 300 His Asp Ile Ala Leu Leu Glu Leu Asp Glu Pro Leu Thr Leu Asn Ser 305 310 315 320 Tyr Val Thr Pro Ile Cys Ile Ala Asp Arg Glu Tyr Ser Asn Ile Phe 325 330 335 Leu Lys Phe Gly Ser Gly Tyr Val Ser Gly Trp Gly Arg Val Phe Asn 340 345 350 Lys Gly Arg Ser Ala Ser Ile Leu Gln Tyr Leu Lys Val Pro Leu Val 355 360 365 Asp Arg Ala Thr Cys Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn 370 375 380 Met Phe Cys Ala Gly Phe His Glu Gly Gly Lys Asp Ser Cys Gln Gly 385 390 395 400 Asp Ser Gly Gly Pro His Val Thr Glu Val Glu Gly Ile Ser Phe Leu 405 410 415 Thr Gly Ile Ile Ser Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr 420 425 430 Gly Ile Tyr Thr Lys Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys 435 440 445 Thr Lys Leu Thr 450 <210> 13 <211> 70 <212> PRT <213> Canis familiaris <400> 13 Met Ala Glu Ala Ser Gly Leu Val Thr Val Cys Leu Leu Gly Tyr Leu 1 5 10 15 Leu Ser Ala Glu Cys Ala Val Phe Leu Asp Arg Glu Asn Ala Thr Lys 20 25 30 Ile Leu Ser Arg Pro Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp 35 40 45 Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp 50 55 60 Leu Val Lys Gly Arg Gly 65 70 <210> 14 <211> 462 <212> PRT <213> Homo sapiens <400> 14 Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Ser Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn 35 40 45 Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys 50 55 60 Met Glu Glu Lys Cys Ser Phe Glu Glu Pro Arg Glu Val Phe Glu Asn 65 70 75 80 Thr Glu Lys Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln 85 90 95 Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile 100 105 110 Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys 115 120 125 Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe 130 135 140 Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly 145 150 155 160 Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe 165 170 175 Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala 180 185 190 Glu Ala Val Phe Pro Asp Val Asp Tyr Val Asn Pro Thr Glu Ala Glu 195 200 205 Thr Ile Leu Asp Asn Ile Thr Gln Gly Thr Gln Ser Phe Asn Asp Phe 210 215 220 Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp 225 230 235 240 Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile 245 250 255 Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly 260 265 270 Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu 275 280 285 His Thr Glu Gln Lys Arg Asn Val Ile Arg Ala Ile Ile Pro His His 290 295 300 Asn Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu 305 310 315 320 Glu Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys 325 330 335 Ile Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly 340 345 350 Tyr Val Ser Gly Trp Ala Arg Val Phe His Lys Gly Arg Ser Ala Leu 355 360 365 Val Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu 370 375 380 Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe 385 390 395 400 His Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His 405 410 415 Val Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp 420 425 430 Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val 435 440 445 Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr 450 455 460 <210> 15 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 15 Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Ser Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg His Ala 35 40 45 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 50 55 60 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 75 <210> 16 <211> 446 <212> PRT <213> Felis catus <400> 16 Met Val Ser Gly Ser Arg Gly Pro Ala Leu Leu Cys Ser Leu Leu Gly 1 5 10 15 Leu Gln Ala Ser Leu Ala Ala Val Phe Leu Thr Gln Glu Glu Ala His 20 25 30 Gly Val Leu Arg Arg His Arg Arg Ala Asn Ser Phe Leu Glu Glu Leu 35 40 45 Arg Ser Gly Ser Leu Glu Arg Glu Cys Gly Glu Glu Arg Cys Ser Phe 50 55 60 Glu Glu Ala Arg Glu Ile Phe Gln Asn Ala Glu Arg Thr Lys Gln Phe 65 70 75 80 Trp Val Ser Tyr Val Asp Gly Asp Gln Cys Ala Ser Asn Pro Cys Gln 85 90 95 Asn Gly Gly Ser Cys Glu Asp Gln Leu Gln Ser Tyr Ile Cys Phe Cys 100 105 110 Leu Asp Asn Phe Glu Gly Arg Asn Cys Glu Thr Asn Lys Lys Asp Gln 115 120 125 Leu Ile Cys Val Asn Glu Asn Gly Gly Cys Glu Gln Tyr Cys Ser Asp 130 135 140 His Ala Glu Thr Arg Arg Ser Cys Arg Cys His Glu Gly Tyr Ala Leu 145 150 155 160 Gln Asp Asp Gly Val Ser Cys Ala Pro Thr Val Glu Tyr Pro Cys Gly 165 170 175 Arg Ile Pro Val Leu Glu Lys Arg Asn Gly Arg Asp Pro Gln Gly Arg 180 185 190 Ile Val Gly Gly Lys Val Cys Pro Lys Gly Glu Cys Pro Trp Gln Ala 195 200 205 Ala Leu Lys Leu Asp Gly Val Leu Val Cys Gly Gly Ala Leu Leu Asp 210 215 220 Ala Ala Trp Val Val Ser Ala Ala His Cys Phe Asp Arg Ile Arg Asn 225 230 235 240 Trp Glu Asn Leu Thr Val Val Leu Gly Glu His Asp Leu Arg Lys Glu 245 250 255 Glu Gly Glu Glu Gln Glu Arg His Val Ala Gln Ile Ile Ile Pro Asp 260 265 270 Lys Tyr Ile Pro Arg Lys Thr Asn His Asp Ile Ala Leu Leu Arg Leu 275 280 285 Arg Thr Pro Val Ala Phe Thr Asn His Val Val Pro Leu Cys Leu Pro 290 295 300 Glu Lys Ser Phe Ser Glu Arg Thr Leu Ala Phe Ile Arg Phe Ser Thr 305 310 315 320 Val Ser Gly Trp Gly Gln Leu Leu Asp Arg Gly Ile Thr Ala Leu Glu 325 330 335 Leu Met Ala Ile Asp Val Pro Arg Val Met Thr Gln Asp Cys Gln Glu 340 345 350 Gln Ser His Arg Lys Ala Gly Ser Pro Ala Ile Thr Glu Asn Met Phe 355 360 365 Cys Ala Gly Tyr Leu Asp Gly Ser Lys Asp Ala Cys Lys Gly Asp Ser 370 375 380 Gly Gly Pro His Ala Thr Lys Phe Gln Gly Thr Trp Tyr Leu Thr Gly 385 390 395 400 Ile Val Ser Trp Gly Glu Gly Cys Ala Ala Glu Gly His Phe Gly Val 405 410 415 Tyr Thr Arg Val Ser Gln Tyr Ile Glu Trp Leu Arg Arg Leu Met Ser 420 425 430 Gln Ser Pro Thr Ser Gly Gly Leu Leu Arg Ala Pro Leu Pro 435 440 445 <210> 17 <211> 71 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 17 Met Val Ser Gly Ser Arg Gly Pro Ala Leu Leu Cys Ser Leu Leu Gly 1 5 10 15 Leu Gln Ala Ser Leu Ala Ala Val Phe Leu Thr Gln Glu Glu Ala His 20 25 30 Gly Val Leu Arg Arg His Arg Arg His Ala Glu Gly Thr Phe Thr Ser 35 40 45 Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala 50 55 60 Trp Leu Val Lys Gly Arg Gly 65 70 <210> 18 <211> 446 <212> PRT <213> Canis familiaris <400> 18 Met Val Ala Trp Ala Gly Glu Leu Ala Leu Leu Cys Phe Leu Leu Gly 1 5 10 15 Leu Gln Gly Ser Leu Ala Ala Val Phe Leu Thr Gln Glu Glu Ala Gln 20 25 30 Gly Val Leu His Arg Gln Arg Arg Ala Asn Ser Phe Leu Glu Glu Leu 35 40 45 Arg Ala Gly Ser Leu Glu Arg Glu Cys Arg Glu Glu Gln Cys Ser Phe 50 55 60 Glu Glu Ala Arg Glu Ile Phe Gln Asp Val Asp Arg Thr Arg Gln Phe 65 70 75 80 Trp Ile Ser Tyr Lys Asp Gly Asp Gln Cys Ala Ser Asn Pro Cys Gln 85 90 95 Asn Gly Gly Ser Cys Glu Asp Gln Leu Gln Ser Tyr Ile Cys Phe Cys 100 105 110 Pro Asp Asp Phe Gln Gly Arg Asn Cys Glu Thr Asp Lys Lys Asp Gln 115 120 125 Leu Ile Cys Met Asn Glu Asn Gly Gly Cys Gln Gln Tyr Cys Ser Asp 130 135 140 His Ala Glu Ala Arg Arg Ser Cys Trp Cys His Glu Gly Tyr Thr Leu 145 150 155 160 Gln Asp Asp Gly Val Ser Cys Met Pro Ile Val Glu Tyr Pro Cys Gly 165 170 175 Lys Ile Pro Val Leu Glu Lys Arg Ile Gly Ser Asn Pro Gln Gly Arg 180 185 190 Ile Val Gly Gly Lys Val Cys Pro Lys Gly Glu Cys Pro Trp Gln Ala 195 200 205 Ala Val Lys Val Asp Gly Lys Leu Leu Cys Gly Gly Thr Leu Ile Asp 210 215 220 Ala Ala Trp Val Val Ser Ala Ala His Cys Phe Glu Arg Ile Lys Asn 225 230 235 240 Trp Lys Asn Leu Thr Val Val Leu Gly Glu His Asp Leu Ser Glu Asp 245 250 255 Asp Gly Asp Glu Gln Glu Arg His Val Ala Arg Val Ile Val Pro Asp 260 265 270 Lys Tyr Ile Pro Leu Lys Thr Asn His Asp Ile Ala Leu Leu His Leu 275 280 285 Arg Thr Pro Val Ala Tyr Thr Asp His Val Val Pro Leu Cys Leu Pro 290 295 300 Glu Lys Thr Phe Ser Glu Arg Thr Leu Ala Phe Ile Arg Phe Ser Thr 305 310 315 320 Val Ser Gly Trp Gly Gln Leu Leu Asp Arg Gly Ala Thr Ala Leu Gln 325 330 335 Leu Met Ala Ile Asp Val Pro Arg Val Met Thr Gln Asp Cys Gln Glu 340 345 350 Gln Ser Arg Arg Arg Ser Gly Ser Pro Ala Ile Thr Glu Asn Met Phe 355 360 365 Cys Ala Gly Tyr Leu Asp Gly Ser Lys Asp Ala Cys Gln Gly Asp Ser 370 375 380 Gly Gly Pro His Ala Thr Lys Phe Gln Gly Thr Trp Tyr Leu Thr Gly 385 390 395 400 Val Val Ser Trp Gly Glu Gly Cys Ala Ala Glu Gly His Phe Gly Val 405 410 415 Tyr Thr Arg Val Ser Gln Tyr Ile Glu Trp Leu Arg Gln Leu Met Val 420 425 430 Ser Ser His Thr Leu Arg Gly Leu Leu Arg Ala Pro Leu Pro 435 440 445 <210> 19 <211> 71 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 19 Met Val Ala Trp Ala Gly Glu Leu Ala Leu Leu Cys Phe Leu Leu Gly 1 5 10 15 Leu Gln Gly Ser Leu Ala Ala Val Phe Leu Thr Gln Glu Glu Ala Gln 20 25 30 Gly Val Leu His Arg Gln Arg Arg His Ala Glu Gly Thr Phe Thr Ser 35 40 45 Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala 50 55 60 Trp Leu Val Lys Gly Arg Gly 65 70 <210> 20 <211> 466 <212> PRT <213> Homo sapiens <400> 20 Met Val Ser Gln Ala Leu Arg Leu Leu Cys Leu Leu Leu Gly Leu Gln 1 5 10 15 Gly Cys Leu Ala Ala Gly Gly Val Ala Lys Ala Ser Gly Gly Glu Thr 20 25 30 Arg Asp Met Pro Trp Lys Pro Gly Pro His Arg Val Phe Val Thr Gln 35 40 45 Glu Glu Ala His Gly Val Leu His Arg Arg Arg Arg Ala Asn Ala Phe 50 55 60 Leu Glu Glu Leu Arg Pro Gly Ser Leu Glu Arg Glu Cys Lys Glu Glu 65 70 75 80 Gln Cys Ser Phe Glu Glu Ala Arg Glu Ile Phe Lys Asp Ala Glu Arg 85 90 95 Thr Lys Leu Phe Trp Ile Ser Tyr Ser Asp Gly Asp Gln Cys Ala Ser 100 105 110 Ser Pro Cys Gln Asn Gly Gly Ser Cys Lys Asp Gln Leu Gln Ser Tyr 115 120 125 Ile Cys Phe Cys Leu Pro Ala Phe Glu Gly Arg Asn Cys Glu Thr His 130 135 140 Lys Asp Asp Gln Leu Ile Cys Val Asn Glu Asn Gly Gly Cys Glu Gln 145 150 155 160 Tyr Cys Ser Asp His Thr Gly Thr Lys Arg Ser Cys Arg Cys His Glu 165 170 175 Gly Tyr Ser Leu Leu Ala Asp Gly Val Ser Cys Thr Pro Thr Val Glu 180 185 190 Tyr Pro Cys Gly Lys Ile Pro Ile Leu Glu Lys Arg Asn Ala Ser Lys 195 200 205 Pro Gln Gly Arg Ile Val Gly Gly Lys Val Cys Pro Lys Gly Glu Cys 210 215 220 Pro Trp Gln Val Leu Leu Leu Val Asn Gly Ala Gln Leu Cys Gly Gly 225 230 235 240 Thr Leu Ile Asn Thr Ile Trp Val Val Ser Ala Ala His Cys Phe Asp 245 250 255 Lys Ile Lys Asn Trp Arg Asn Leu Ile Ala Val Leu Gly Glu His Asp 260 265 270 Leu Ser Glu His Asp Gly Asp Glu Gln Ser Arg Arg Val Ala Gln Val 275 280 285 Ile Ile Pro Ser Thr Tyr Val Pro Gly Thr Thr Asn His Asp Ile Ala 290 295 300 Leu Leu Arg Leu His Gln Pro Val Val Leu Thr Asp His Val Val Pro 305 310 315 320 Leu Cys Leu Pro Glu Arg Thr Phe Ser Glu Arg Thr Leu Ala Phe Val 325 330 335 Arg Phe Ser Leu Val Ser Gly Trp Gly Gln Leu Leu Asp Arg Gly Ala 340 345 350 Thr Ala Leu Glu Leu Met Val Leu Asn Val Pro Arg Leu Met Thr Gln 355 360 365 Asp Cys Leu Gln Gln Ser Arg Lys Val Gly Asp Ser Pro Asn Ile Thr 370 375 380 Glu Tyr Met Phe Cys Ala Gly Tyr Ser Asp Gly Ser Lys Asp Ser Cys 385 390 395 400 Lys Gly Asp Ser Gly Gly Pro His Ala Thr His Tyr Arg Gly Thr Trp 405 410 415 Tyr Leu Thr Gly Ile Val Ser Trp Gly Gln Gly Cys Ala Thr Val Gly 420 425 430 His Phe Gly Val Tyr Thr Arg Val Ser Gln Tyr Ile Glu Trp Leu Gln 435 440 445 Lys Leu Met Arg Ser Glu Pro Arg Pro Gly Val Leu Leu Arg Ala Pro 450 455 460 Phe Pro 465 <210> 21 <211> 91 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 21 Met Val Ser Gln Ala Leu Arg Leu Leu Cys Leu Leu Leu Gly Leu Gln 1 5 10 15 Gly Cys Leu Ala Ala Gly Gly Val Ala Lys Ala Ser Gly Gly Glu Thr 20 25 30 Arg Asp Met Pro Trp Lys Pro Gly Pro His Arg Val Phe Val Thr Gln 35 40 45 Glu Glu Ala His Gly Val Leu His Arg Arg Arg Arg His Ala Glu Gly 50 55 60 Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys 65 70 75 80 Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 85 90 <210> 22 <211> 444 <212> PRT <213> Homo sapiens <400> 22 Met Val Ser Gln Ala Leu Arg Leu Leu Cys Leu Leu Leu Gly Leu Gln 1 5 10 15 Gly Cys Leu Ala Ala Val Phe Val Thr Gln Glu Glu Ala His Gly Val 20 25 30 Leu His Arg Arg Arg Arg Ala Asn Ala Phe Leu Glu Glu Leu Arg Pro 35 40 45 Gly Ser Leu Glu Arg Glu Cys Lys Glu Glu Gln Cys Ser Phe Glu Glu 50 55 60 Ala Arg Glu Ile Phe Lys Asp Ala Glu Arg Thr Lys Leu Phe Trp Ile 65 70 75 80 Ser Tyr Ser Asp Gly Asp Gln Cys Ala Ser Ser Pro Cys Gln Asn Gly 85 90 95 Gly Ser Cys Lys Asp Gln Leu Gln Ser Tyr Ile Cys Phe Cys Leu Pro 100 105 110 Ala Phe Glu Gly Arg Asn Cys Glu Thr His Lys Asp Asp Gln Leu Ile 115 120 125 Cys Val Asn Glu Asn Gly Gly Cys Glu Gln Tyr Cys Ser Asp His Thr 130 135 140 Gly Thr Lys Arg Ser Cys Arg Cys His Glu Gly Tyr Ser Leu Leu Ala 145 150 155 160 Asp Gly Val Ser Cys Thr Pro Thr Val Glu Tyr Pro Cys Gly Lys Ile 165 170 175 Pro Ile Leu Glu Lys Arg Asn Ala Ser Lys Pro Gln Gly Arg Ile Val 180 185 190 Gly Gly Lys Val Cys Pro Lys Gly Glu Cys Pro Trp Gln Val Leu Leu 195 200 205 Leu Val Asn Gly Ala Gln Leu Cys Gly Gly Thr Leu Ile Asn Thr Ile 210 215 220 Trp Val Val Ser Ala Ala His Cys Phe Asp Lys Ile Lys Asn Trp Arg 225 230 235 240 Asn Leu Ile Ala Val Leu Gly Glu His Asp Leu Ser Glu His Asp Gly 245 250 255 Asp Glu Gln Ser Arg Arg Val Ala Gln Val Ile Ile Pro Ser Thr Tyr 260 265 270 Val Pro Gly Thr Thr Asn His Asp Ile Ala Leu Leu Arg Leu His Gln 275 280 285 Pro Val Val Leu Thr Asp His Val Val Pro Leu Cys Leu Pro Glu Arg 290 295 300 Thr Phe Ser Glu Arg Thr Leu Ala Phe Val Arg Phe Ser Leu Val Ser 305 310 315 320 Gly Trp Gly Gln Leu Leu Asp Arg Gly Ala Thr Ala Leu Glu Leu Met 325 330 335 Val Leu Asn Val Pro Arg Leu Met Thr Gln Asp Cys Leu Gln Gln Ser 340 345 350 Arg Lys Val Gly Asp Ser Pro Asn Ile Thr Glu Tyr Met Phe Cys Ala 355 360 365 Gly Tyr Ser Asp Gly Ser Lys Asp Ser Cys Lys Gly Asp Ser Gly Gly 370 375 380 Pro His Ala Thr His Tyr Arg Gly Thr Trp Tyr Leu Thr Gly Ile Val 385 390 395 400 Ser Trp Gly Gln Gly Cys Ala Thr Val Gly His Phe Gly Val Tyr Thr 405 410 415 Arg Val Ser Gln Tyr Ile Glu Trp Leu Gln Lys Leu Met Arg Ser Glu 420 425 430 Pro Arg Pro Gly Val Leu Leu Arg Ala Pro Phe Pro 435 440 <210> 23 <211> 69 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 23 Met Val Ser Gln Ala Leu Arg Leu Leu Cys Leu Leu Leu Gly Leu Gln 1 5 10 15 Gly Cys Leu Ala Ala Val Phe Val Thr Gln Glu Glu Ala His Gly Val 20 25 30 Leu His Arg Arg Arg Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val 35 40 45 Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu 50 55 60 Val Lys Gly Arg Gly 65 <210> 24 <211> 622 <212> PRT <213> Felis catus <400> 24 Met Ala His Ile Arg Gly Leu Trp Leu Pro Gly Cys Leu Ala Leu Ala 1 5 10 15 Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln 20 25 30 Gln Ala Leu Ser Leu Leu Gln Arg Val Arg Arg Ala Asn Ser Gly Phe 35 40 45 Leu Glu Glu Val Arg Lys Gly Asn Leu Glu Arg Glu Cys Val Glu Glu 50 55 60 Leu Cys Ser Tyr Glu Glu Ala Phe Glu Ala Leu Glu Ser Ser Phe Ala 65 70 75 80 Thr Asp Val Phe Trp Ala Lys Tyr Thr Ala Cys Glu Ser Val Arg Lys 85 90 95 Pro Arg Asp Lys Leu Met Glu Cys Leu Glu Gly Asn Cys Ala Glu Gly 100 105 110 Leu Gly Met Asn Tyr Arg Gly Asn Val Asn Phe Thr Arg Ser Gly Ile 115 120 125 Glu Cys Gln Leu Trp Arg Ser Arg Tyr Pro His Lys Pro Glu Ile Asn 130 135 140 Tyr Thr Thr His Pro Gly Ala Asp Leu Lys Glu Asn Phe Cys Arg Asn 145 150 155 160 Pro Asp Gly Ser Thr Thr Gly Pro Trp Cys Tyr Thr Thr Asp Pro Thr 165 170 175 Val Arg Arg Glu Glu Cys Ser Ile Pro Ile Cys Gly Gln Gly Gly Val 180 185 190 Thr Val Gln Pro Thr Pro Arg Ser Arg Asn Ser Thr Val Asn Leu Pro 195 200 205 Pro Pro Ser Asp Ser Cys Ile Pro Glu Arg Gly Arg Tyr Tyr His Gly 210 215 220 Arg Leu Ala Val Thr Thr His Gly Ser Pro Cys Leu Ala Trp Asp Ser 225 230 235 240 Ser Gln Ala Lys Ala Leu Ser Glu Asn Gln Asp Phe Asn Pro Leu Val 245 250 255 Pro Leu Glu Lys Asn Phe Cys Arg Asn Pro Asp Gly Asp Glu Glu Gly 260 265 270 Val Trp Cys Tyr Val Ser Gly Gly Pro Gly Asp Phe Glu Tyr Cys Asn 275 280 285 Leu Asp Tyr Cys Glu Glu Pro Phe Glu Asp Val Ser Asp Gly Leu Ala 290 295 300 Glu Asp Pro Glu Ala Pro Ile Glu Gly Arg Thr Thr Ala Glu Glu Phe 305 310 315 320 Gln Thr Phe Phe Asn Glu Lys Thr Phe Gly Ala Gly Glu Ala Asp Cys 325 330 335 Gly Leu Arg Pro Leu Phe Glu Lys Lys Ser Leu Lys Asp Lys Thr Glu 340 345 350 Glu Glu Leu Leu Asp Ser Tyr Ile Asp Gly Arg Ile Val Lys Gly Trp 355 360 365 Asp Ala Glu Ile Gly Ile Ala Pro Trp Gln Val Met Leu Phe Arg Lys 370 375 380 Ser Pro Gln Glu Leu Leu Cys Gly Ala Ser Leu Ile Ser Asp Arg Trp 385 390 395 400 Val Leu Thr Ala Ala His Cys Leu Leu Tyr Pro Pro Trp Asp Lys Asn 405 410 415 Phe Thr Glu Asn Asp Leu Leu Val Arg Ile Gly Lys His Ser Arg Thr 420 425 430 Arg Tyr Glu Arg Ser Ile Glu Lys Ile Ser Met Leu Glu Lys Ile Tyr 435 440 445 Ile His Pro Arg Tyr Asn Trp Arg Glu Asn Leu Asp Arg Asp Ile Ala 450 455 460 Leu Leu Lys Leu Lys Lys Pro Ile Ala Phe Ser Ser Tyr Ile His Pro 465 470 475 480 Val Cys Leu Pro Asp Lys Ala Thr Val Ala Arg Leu Ile Gln Thr Gly 485 490 495 Tyr Lys Gly Arg Val Thr Gly Trp Gly Asn Leu Lys Glu Thr Trp Thr 500 505 510 Thr Ser Val Gly Glu Val Gln Pro Ser Val Leu Gln Val Val Asn Leu 515 520 525 Pro Leu Val Glu Gln Pro Val Cys Arg Ala Ser Thr Arg Ile Arg Ile 530 535 540 Thr Asp Asn Met Phe Cys Ala Gly Tyr Lys Pro Asn Glu Gly Lys Arg 545 550 555 560 Gly Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro Phe Val Met Lys Ser 565 570 575 Pro Phe Asn Asn Arg Trp Tyr Gln Met Gly Ile Val Ser Trp Gly Glu 580 585 590 Gly Cys Asp Arg Asp Gly Lys Tyr Gly Phe Tyr Thr His Val Phe Arg 595 600 605 Leu Lys Lys Trp Ile Arg Lys Val Ile Asp Gln Ser Gly Ser 610 615 620 <210> 25 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 25 Met Ala His Ile Arg Gly Leu Trp Leu Pro Gly Cys Leu Ala Leu Ala 1 5 10 15 Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln 20 25 30 Gln Ala Leu Ser Leu Leu Gln Arg Val Arg Arg His Ala Glu Gly Thr 35 40 45 Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu 50 55 60 Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 26 <211> 621 <212> PRT <213> Canis familiaris <400> 26 Met Ala His Ile Arg Gly Leu Trp Leu Pro Gly Cys Leu Val Ile Leu 1 5 10 15 Phe Ser Leu Ala His Ser Gln His Val Phe Leu Asp Pro Gln Gln Ala 20 25 30 Leu Ser Leu Leu His Arg Val Arg Arg Ala Asn Ser Gly Phe Leu Glu 35 40 45 Glu Leu Arg Lys Gly Asn Leu Glu Arg Glu Cys Val Glu Glu Gln Cys 50 55 60 Asn Tyr Glu Glu Ala Phe Glu Ala Leu Glu Ser Ser Thr Ala Thr Asp 65 70 75 80 Val Phe Trp Ser Lys Tyr Thr Ala Cys Glu Pro Val Arg Lys Pro Arg 85 90 95 Glu Lys Leu Val Glu Cys Leu Glu Gly Ser Cys Ala Glu Gly Leu Gly 100 105 110 Met Asn Tyr Arg Gly Asn Val Ser Phe Thr Arg Ser Gly Ile Glu Cys 115 120 125 Gln Leu Trp Arg Ser Arg Tyr Pro His Lys Pro Glu Ile Asn Ser Thr 130 135 140 Thr His Pro Gly Ala Asp Leu Gln Glu Asn Phe Cys Arg Asn Pro Asp 145 150 155 160 Gly Ser Thr Thr Gly Pro Trp Cys Tyr Thr Ile Asp Pro Thr Val Arg 165 170 175 Arg Glu Glu Cys Ser Ile Ser Leu Cys Gly Gln Gln Gly Gly Val Thr 180 185 190 Val Pro Leu Thr Pro Arg Ser Gly Gly Pro Thr Val Asn Leu Ser Pro 195 200 205 Pro Ser Glu His Cys Ile Pro Glu Arg Gly Arg Tyr Tyr Gln Gly Arg 210 215 220 Leu Ala Val Thr Thr His Gly Ser Pro Cys Leu Ala Trp Ala Ser Arg 225 230 235 240 Gln Ala Lys Ala Leu Ser Lys Asp Gln Asp Phe Asn Pro Ala Val Pro 245 250 255 Leu Val Glu Asn Phe Cys Arg Asn Pro Asp Gly Asp Glu Glu Gly Ala 260 265 270 Trp Cys Tyr Val Ser Glu Glu Pro Gly Gly Phe Glu Tyr Cys Asp Leu 275 280 285 Asp Tyr Cys Glu Glu Pro Val Glu Glu Val Gly Asp Gly Leu Ala Glu 290 295 300 Asp Gln Asp Thr Ala Ile Glu Gly Arg Thr Thr Ala Glu Glu Phe Gln 305 310 315 320 Pro Phe Phe Asn Glu Lys Thr Phe Gly Ala Gly Glu Ala Asp Cys Gly 325 330 335 Leu Arg Pro Leu Phe Glu Lys Arg Ser Val Lys Asp Lys Thr Glu Gly 340 345 350 Glu Leu Leu Glu Ser Tyr Ile Asp Gly Arg Ile Val Glu Gly Trp Asp 355 360 365 Ala Glu Ile Gly Leu Ala Pro Trp Gln Val Met Leu Phe Arg Lys Ser 370 375 380 Pro Gln Glu Leu Leu Cys Gly Ala Ser Leu Ile Ser Asp Arg Trp Val 385 390 395 400 Leu Thr Ala Ala His Cys Leu Leu Tyr Pro Pro Trp Asp Lys Asn Phe 405 410 415 Thr Glu Asn Asp Leu Leu Val Arg Ile Gly Lys His Ser Arg Thr Arg 420 425 430 Tyr Glu Arg Ser Ile Glu Lys Ile Ser Met Leu Glu Lys Ile Tyr Ile 435 440 445 His Pro Arg Tyr Asn Trp Arg Glu Asn Leu Asp Arg Asp Ile Ala Leu 450 455 460 Leu Lys Leu Lys Lys Pro Val Asn Phe Ser Asn Tyr Ile His Pro Val 465 470 475 480 Cys Leu Pro Asp Arg Asp Thr Ala Thr Arg Leu Leu Gln Ala Gly Tyr 485 490 495 Lys Gly Arg Val Thr Gly Trp Gly Asn Leu Arg Glu Thr Trp Thr Ser 500 505 510 Ser Ile Gly Glu Val Gln Pro Arg Val Leu Gln Val Val Asn Leu Pro 515 520 525 Ile Val Asp Arg Gln Val Cys Lys Ala Ser Thr Arg Ile Arg Ile Thr 530 535 540 Asp Asn Met Phe Cys Ala Gly Tyr Lys Pro Asn Glu Gly Lys Arg Gly 545 550 555 560 Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro Phe Val Met Lys Ser Pro 565 570 575 Phe Asn Asn Arg Trp Tyr Gln Met Gly Ile Val Ser Trp Gly Glu Gly 580 585 590 Cys Asp Arg Asp Gly Lys Tyr Gly Phe Tyr Thr His Val Phe Arg Leu 595 600 605 Lys Lys Trp Ile Gln Lys Val Ile Glu Lys Ser Gly Gly 610 615 620 <210> 27 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 27 Met Ala His Ile Arg Gly Leu Trp Leu Pro Gly Cys Leu Val Ile Leu 1 5 10 15 Phe Ser Leu Ala His Ser Gln His Val Phe Leu Asp Pro Gln Gln Ala 20 25 30 Leu Ser Leu Leu His Arg Val Arg Arg His Ala Glu Gly Thr Phe Thr 35 40 45 Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile 50 55 60 Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 28 <211> 622 <212> PRT <213> Homo sapiens <400> 28 Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala 1 5 10 15 Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln 20 25 30 Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg Ala Asn Thr Phe Leu 35 40 45 Glu Glu Val Arg Lys Gly Asn Leu Glu Arg Glu Cys Val Glu Glu Thr 50 55 60 Cys Ser Tyr Glu Glu Ala Phe Glu Ala Leu Glu Ser Ser Thr Ala Thr 65 70 75 80 Asp Val Phe Trp Ala Lys Tyr Thr Ala Cys Glu Thr Ala Arg Thr Pro 85 90 95 Arg Asp Lys Leu Ala Ala Cys Leu Glu Gly Asn Cys Ala Glu Gly Leu 100 105 110 Gly Thr Asn Tyr Arg Gly His Val Asn Ile Thr Arg Ser Gly Ile Glu 115 120 125 Cys Gln Leu Trp Arg Ser Arg Tyr Pro His Lys Pro Glu Ile Asn Ser 130 135 140 Thr Thr His Pro Gly Ala Asp Leu Gln Glu Asn Phe Cys Arg Asn Pro 145 150 155 160 Asp Ser Ser Thr Thr Gly Pro Trp Cys Tyr Thr Thr Asp Pro Thr Val 165 170 175 Arg Arg Gln Glu Cys Ser Ile Pro Val Cys Gly Gln Asp Gln Val Thr 180 185 190 Val Ala Met Thr Pro Arg Ser Glu Gly Ser Ser Val Asn Leu Ser Pro 195 200 205 Pro Leu Glu Gln Cys Val Pro Asp Arg Gly Gln Gln Tyr Gln Gly Arg 210 215 220 Leu Ala Val Thr Thr His Gly Leu Pro Cys Leu Ala Trp Ala Ser Ala 225 230 235 240 Gln Ala Lys Ala Leu Ser Lys His Gln Asp Phe Asn Ser Ala Val Gln 245 250 255 Leu Val Glu Asn Phe Cys Arg Asn Pro Asp Gly Asp Glu Glu Gly Val 260 265 270 Trp Cys Tyr Val Ala Gly Lys Pro Gly Asp Phe Gly Tyr Cys Asp Leu 275 280 285 Asn Tyr Cys Glu Glu Ala Val Glu Glu Glu Thr Gly Asp Gly Leu Asp 290 295 300 Glu Asp Ser Asp Arg Ala Ile Glu Gly Arg Thr Ala Thr Ser Glu Tyr 305 310 315 320 Gln Thr Phe Phe Asn Pro Arg Thr Phe Gly Ser Gly Glu Ala Asp Cys 325 330 335 Gly Leu Arg Pro Leu Phe Glu Lys Lys Ser Leu Glu Asp Lys Thr Glu 340 345 350 Arg Glu Leu Leu Glu Ser Tyr Ile Asp Gly Arg Ile Val Glu Gly Ser 355 360 365 Asp Ala Glu Ile Gly Met Ser Pro Trp Gln Val Met Leu Phe Arg Lys 370 375 380 Ser Pro Gln Glu Leu Leu Cys Gly Ala Ser Leu Ile Ser Asp Arg Trp 385 390 395 400 Val Leu Thr Ala Ala His Cys Leu Leu Tyr Pro Pro Trp Asp Lys Asn 405 410 415 Phe Thr Glu Asn Asp Leu Leu Val Arg Ile Gly Lys His Ser Arg Thr 420 425 430 Arg Tyr Glu Arg Asn Ile Glu Lys Ile Ser Met Leu Glu Lys Ile Tyr 435 440 445 Ile His Pro Arg Tyr Asn Trp Arg Glu Asn Leu Asp Arg Asp Ile Ala 450 455 460 Leu Met Lys Leu Lys Lys Pro Val Ala Phe Ser Asp Tyr Ile His Pro 465 470 475 480 Val Cys Leu Pro Asp Arg Glu Thr Ala Ala Ser Leu Leu Gln Ala Gly 485 490 495 Tyr Lys Gly Arg Val Thr Gly Trp Gly Asn Leu Lys Glu Thr Trp Thr 500 505 510 Ala Asn Val Gly Lys Gly Gln Pro Ser Val Leu Gln Val Val Asn Leu 515 520 525 Pro Ile Val Glu Arg Pro Val Cys Lys Asp Ser Thr Arg Ile Arg Ile 530 535 540 Thr Asp Asn Met Phe Cys Ala Gly Tyr Lys Pro Asp Glu Gly Lys Arg 545 550 555 560 Gly Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro Phe Val Met Lys Ser 565 570 575 Pro Phe Asn Asn Arg Trp Tyr Gln Met Gly Ile Val Ser Trp Gly Glu 580 585 590 Gly Cys Asp Arg Asp Gly Lys Tyr Gly Phe Tyr Thr His Val Phe Arg 595 600 605 Leu Lys Lys Trp Ile Gln Lys Val Ile Asp Gln Phe Gly Glu 610 615 620 <210> 29 <211> 74 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 29 Met Ala His Val Arg Gly Leu Gln Leu Pro Gly Cys Leu Ala Leu Ala 1 5 10 15 Ala Leu Cys Ser Leu Val His Ser Gln His Val Phe Leu Ala Pro Gln 20 25 30 Gln Ala Arg Ser Leu Leu Gln Arg Val Arg Arg His Ala Glu Gly Thr 35 40 45 Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu 50 55 60 Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 30 <211> 466 <212> PRT <213> Felis catus <400> 30 Met Arg Cys Leu Asn Met Ile Met Ala Glu Pro Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Gly Ala Asp Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asp Ala Thr Lys Val Leu Ser Arg Pro Lys Arg Tyr Asn 35 40 45 Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys 50 55 60 Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn 65 70 75 80 Thr Glu Lys Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln 85 90 95 Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ile Cys Lys Asp Asp Ile 100 105 110 Asn Ser Tyr Glu Cys Trp Cys Gln Thr Gly Phe Glu Gly Lys Asn Cys 115 120 125 Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Lys Gln Phe 130 135 140 Cys Lys Leu Asp Ala Asp Asn Lys Val Val Cys Ser Cys Thr Thr Gly 145 150 155 160 Tyr Gln Leu Ala Glu Asp Gln Lys Ser Cys Glu Pro Ala Val Pro Phe 165 170 175 Pro Cys Gly Arg Val Ser Val Pro His Ile Ser Thr Thr His Thr Arg 180 185 190 Ala Glu Thr Leu Phe Leu Asn Met Asp Tyr Glu Asn Ser Thr Thr Asp 195 200 205 Tyr Glu Asn Ser Ala Glu Ala Glu Lys Asn Val Asp Asn Val Thr Gln 210 215 220 Pro Leu Asn Asp Leu Thr Arg Ile Val Gly Gly Lys Thr Ala Lys Pro 225 230 235 240 Gly Gln Phe Pro Trp Gln Val Leu Leu Lys Gly Lys Ile Asp Ala Phe 245 250 255 Cys Gly Gly Ser Ile Ile Asn Glu Lys Trp Val Val Thr Ala Ala His 260 265 270 Cys Ile Asn Pro Asp Val Glu Ile Thr Val Val Ala Gly Glu His Asn 275 280 285 Thr Glu Glu Thr Glu His Thr Glu Gln Lys Arg Asn Val Ile Arg Thr 290 295 300 Ile Leu His His Ser Tyr Asn Ala Ser Val Asn Lys Tyr Ser His Asp 305 310 315 320 Ile Ala Leu Leu Glu Leu Asp Glu Pro Leu Thr Leu Asn Ser Tyr Val 325 330 335 Thr Pro Ile Cys Val Ala Asp Arg Glu Tyr Thr Asn Thr Phe Leu Lys 340 345 350 Phe Gly Tyr Gly Tyr Val Ser Gly Trp Gly Lys Val Phe Asn Lys Gly 355 360 365 Arg Pro Ala Thr Ile Leu Gln Tyr Leu Lys Val Pro Leu Val Asp Arg 370 375 380 Ala Thr Cys Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe 385 390 395 400 Cys Ala Gly Phe His Glu Gly Gly Lys Asp Ser Cys Gln Gly Asp Ser 405 410 415 Gly Gly Pro His Val Thr Glu Val Glu Gly Ile Asn Phe Leu Thr Gly 420 425 430 Ile Ile Ser Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile 435 440 445 Tyr Thr Lys Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys 450 455 460 Leu Thr 465 <210> 31 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 31 Met Arg Cys Leu Asn Met Ile Met Ala Glu Pro Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Gly Ala Asp Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asp Ala Thr Lys Val Leu Ser Arg Pro Lys Arg His Ala 35 40 45 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 50 55 60 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 75 <210> 32 <211> 452 <212> PRT <213> Canis familiaris <400> 32 Met Ala Glu Ala Ser Gly Leu Val Thr Val Cys Leu Leu Gly Tyr Leu 1 5 10 15 Leu Ser Ala Glu Cys Ala Val Phe Leu Asp Arg Glu Asn Ala Thr Lys 20 25 30 Ile Leu Ser Arg Pro Lys Arg Tyr Asn Ser Gly Lys Leu Glu Glu Phe 35 40 45 Val Arg Gly Asn Leu Glu Arg Glu Cys Ile Glu Glu Lys Cys Ser Phe 50 55 60 Glu Glu Ala Arg Glu Val Phe Glu Asn Thr Glu Lys Thr Thr Glu Phe 65 70 75 80 Trp Lys Gln Tyr Val Asp Gly Asp Gln Cys Glu Ser Asn Pro Cys Leu 85 90 95 Asn Asp Gly Val Cys Lys Asp Asp Ile Asn Ser Tyr Glu Cys Trp Cys 100 105 110 Arg Ala Gly Phe Glu Gly Lys Asn Cys Glu Leu Asp Val Thr Cys Asn 115 120 125 Ile Lys Asn Gly Arg Cys Lys Gln Phe Cys Lys Leu Gly Pro Asp Asn 130 135 140 Lys Val Val Cys Ser Cys Thr Thr Gly Tyr Gln Leu Ala Glu Asp Gln 145 150 155 160 Arg Ser Cys Glu Pro Ala Val Pro Phe Pro Cys Gly Arg Val Ser Val 165 170 175 Pro His Ile Ser Met Thr Arg Thr Arg Ala Glu Thr Leu Phe Ser Asn 180 185 190 Met Asp Tyr Glu Asn Ser Thr Glu Val Glu Lys Ile Leu Asp Asn Val 195 200 205 Thr Gln Pro Leu Asn Asp Phe Thr Arg Val Val Gly Gly Lys Asp Ala 210 215 220 Lys Pro Gly Gln Phe Pro Trp Gln Val Leu Leu Asn Gly Lys Val Asp 225 230 235 240 Ala Phe Cys Gly Gly Ser Ile Ile Asn Glu Lys Trp Val Val Thr Ala 245 250 255 Ala His Cys Ile Glu Pro Asp Val Lys Ile Thr Ile Val Ala Gly Glu 260 265 270 His Asn Thr Glu Lys Arg Glu His Thr Glu Gln Lys Arg Asn Val Ile 275 280 285 Arg Thr Ile Leu His His Ser Tyr Asn Ala Thr Ile Asn Lys Tyr Asn 290 295 300 His Asp Ile Ala Leu Leu Glu Leu Asp Glu Pro Leu Thr Leu Asn Ser 305 310 315 320 Tyr Val Thr Pro Ile Cys Ile Ala Asp Arg Glu Tyr Ser Asn Ile Phe 325 330 335 Leu Lys Phe Gly Ser Gly Tyr Val Ser Gly Trp Gly Arg Val Phe Asn 340 345 350 Lys Gly Arg Ser Ala Ser Ile Leu Gln Tyr Leu Lys Val Pro Leu Val 355 360 365 Asp Arg Ala Thr Cys Leu Arg Ser Thr Lys Phe Thr Ile Tyr Asn Asn 370 375 380 Met Phe Cys Ala Gly Phe His Glu Gly Gly Lys Asp Ser Cys Gln Gly 385 390 395 400 Asp Ser Gly Gly Pro His Val Thr Glu Val Glu Gly Ile Ser Phe Leu 405 410 415 Thr Gly Ile Ile Ser Trp Gly Glu Glu Cys Ala Met Lys Gly Lys Tyr 420 425 430 Gly Ile Tyr Thr Lys Val Ser Arg Tyr Val Asn Trp Ile Lys Glu Lys 435 440 445 Thr Lys Leu Thr 450 <210> 33 <211> 70 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 33 Met Ala Glu Ala Ser Gly Leu Val Thr Val Cys Leu Leu Gly Tyr Leu 1 5 10 15 Leu Ser Ala Glu Cys Ala Val Phe Leu Asp Arg Glu Asn Ala Thr Lys 20 25 30 Ile Leu Ser Arg Pro Lys Arg His Ala Glu Gly Thr Phe Thr Ser Asp 35 40 45 Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp 50 55 60 Leu Val Lys Gly Arg Gly 65 70 <210> 34 <211> 461 <212> PRT <213> Homo sapiens <400> 34 Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg Tyr Asn 35 40 45 Ser Gly Lys Leu Glu Glu Phe Val Gln Gly Asn Leu Glu Arg Glu Cys 50 55 60 Met Glu Glu Lys Cys Ser Phe Glu Glu Ala Arg Glu Val Phe Glu Asn 65 70 75 80 Thr Glu Arg Thr Thr Glu Phe Trp Lys Gln Tyr Val Asp Gly Asp Gln 85 90 95 Cys Glu Ser Asn Pro Cys Leu Asn Gly Gly Ser Cys Lys Asp Asp Ile 100 105 110 Asn Ser Tyr Glu Cys Trp Cys Pro Phe Gly Phe Glu Gly Lys Asn Cys 115 120 125 Glu Leu Asp Val Thr Cys Asn Ile Lys Asn Gly Arg Cys Glu Gln Phe 130 135 140 Cys Lys Asn Ser Ala Asp Asn Lys Val Val Cys Ser Cys Thr Glu Gly 145 150 155 160 Tyr Arg Leu Ala Glu Asn Gln Lys Ser Cys Glu Pro Ala Val Pro Phe 165 170 175 Pro Cys Gly Arg Val Ser Val Ser Gln Thr Ser Lys Leu Thr Arg Ala 180 185 190 Glu Thr Val Phe Pro Asp Val Asp Tyr Val Asn Ser Thr Glu Ala Glu 195 200 205 Thr Ile Leu Asp Asn Ile Thr Gln Ser Thr Gln Ser Phe Asn Asp Phe 210 215 220 Thr Arg Val Val Gly Gly Glu Asp Ala Lys Pro Gly Gln Phe Pro Trp 225 230 235 240 Gln Val Val Leu Asn Gly Lys Val Asp Ala Phe Cys Gly Gly Ser Ile 245 250 255 Val Asn Glu Lys Trp Ile Val Thr Ala Ala His Cys Val Glu Thr Gly 260 265 270 Val Lys Ile Thr Val Val Ala Gly Glu His Asn Ile Glu Glu Thr Glu 275 280 285 His Thr Glu Gln Lys Arg Asn Val Ile Arg Ile Ile Pro His His Asn 290 295 300 Tyr Asn Ala Ala Ile Asn Lys Tyr Asn His Asp Ile Ala Leu Leu Glu 305 310 315 320 Leu Asp Glu Pro Leu Val Leu Asn Ser Tyr Val Thr Pro Ile Cys Ile 325 330 335 Ala Asp Lys Glu Tyr Thr Asn Ile Phe Leu Lys Phe Gly Ser Gly Tyr 340 345 350 Val Ser Gly Trp Gly Arg Val Phe His Lys Gly Arg Ser Ala Leu Val 355 360 365 Leu Gln Tyr Leu Arg Val Pro Leu Val Asp Arg Ala Thr Cys Leu Arg 370 375 380 Ser Thr Lys Phe Thr Ile Tyr Asn Asn Met Phe Cys Ala Gly Phe His 385 390 395 400 Glu Gly Gly Arg Asp Ser Cys Gln Gly Asp Ser Gly Gly Pro His Val 405 410 415 Thr Glu Val Glu Gly Thr Ser Phe Leu Thr Gly Ile Ile Ser Trp Gly 420 425 430 Glu Glu Cys Ala Met Lys Gly Lys Tyr Gly Ile Tyr Thr Lys Val Ser 435 440 445 Arg Tyr Val Asn Trp Ile Lys Glu Lys Thr Lys Leu Thr 450 455 460 <210> 35 <211> 77 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 35 Met Gln Arg Val Asn Met Ile Met Ala Glu Ser Pro Gly Leu Ile Thr 1 5 10 15 Ile Cys Leu Leu Gly Tyr Leu Leu Ser Ala Glu Cys Thr Val Phe Leu 20 25 30 Asp His Glu Asn Ala Asn Lys Ile Leu Asn Arg Pro Lys Arg His Ala 35 40 45 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 50 55 60 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 75 <210> 36 <211> 670 <212> PRT <213> Felis catus <400> 36 Gly Arg Cys Gly Ala Leu Leu Ala Cys Leu Val Leu Val Leu Pro Val 1 5 10 15 Ser Glu Ala Asn Phe Leu Ser Lys Gln His Ala Ser Gln Val Leu Ile 20 25 30 Arg Lys Arg Arg Ala Asn Ser Met Phe Glu Glu Thr Lys Lys Gly Asn 35 40 45 Leu Glu Arg Glu Cys Ile Glu Glu Leu Cys Asn Lys Glu Glu Ala Arg 50 55 60 Glu Ile Phe Glu Asn Asn Pro Glu Thr Asp Tyr Phe Tyr Pro Lys Tyr 65 70 75 80 Leu Asp Cys Leu Gly Ser Phe Arg Ala Gly Leu Phe Thr Ala Ala Arg 85 90 95 Gln Ser Thr Asp Ala Tyr Pro Asp Leu Arg Ser Cys Val Thr Ala Ile 100 105 110 Pro Asp Gln Cys Ser Pro Leu Pro Cys Asn Glu Asp Gly Tyr Met Ser 115 120 125 Cys Lys Asp Gly Gln Ala Thr Phe Thr Cys Val Cys Lys Ser Gly Trp 130 135 140 Gln Gly Asp Lys Cys Glu Tyr Asp Ile Asn Glu Cys Lys Asp Pro Ser 145 150 155 160 Asn Val Asn Gly Gly Cys Ser Gln Ile Cys Asp Asn Thr Pro Gly Ser 165 170 175 Tyr His Cys Ser Cys Lys Ser Gly Phe Val Met Leu Ser Asn Lys Lys 180 185 190 Asp Cys Lys Asp Val Asp Glu Cys Ser Met Lys Pro Asp Ile Cys Gly 195 200 205 Thr Ala Val Cys Lys Asn Ile Pro Gly Asp Phe Glu Cys Glu Cys Ala 210 215 220 Glu Gly Tyr Arg Tyr Asn Pro Thr Leu Lys Ser Cys Glu Asp Val Asp 225 230 235 240 Glu Cys Ser Glu Asn Met Cys Ala Gln Leu Cys Val Asn Tyr Pro Gly 245 250 255 Gly Tyr Tyr Cys Tyr Cys Asp Gly Lys Lys Gly Phe Lys Leu Ala Gln 260 265 270 Asp His Arg Ser Cys Glu Ala Val Pro Val Cys Leu Pro Leu Asn Leu 275 280 285 Asp Lys Asn Tyr Glu Leu Leu Tyr Leu Ala Glu Gln Phe Val Gly Val 290 295 300 Val Leu Tyr Leu Lys Phe Arg Leu Pro Glu Ile Thr Arg Phe Ser Ala 305 310 315 320 Glu Phe Asp Phe Arg Thr Tyr Asp Ser Glu Gly Val Ile Leu Tyr Ala 325 330 335 Glu Ser Leu Asp His Ser Cys Trp Phe Leu Ile Ala Leu Arg Asp Gly 340 345 350 Lys Ile Glu Ile Gln Phe Lys Asn Glu Tyr Ala Thr Lys Ile Thr Thr 355 360 365 Gly Gly Lys Val Ile Asn Asn Gly Leu Trp Asn Thr Val Ser Val Glu 370 375 380 Glu Leu Glu Tyr Ser Ile Ser Val Lys Ile Ala Lys Glu Ala Val Met 385 390 395 400 Asn Ile Asn Lys Pro Arg Ser Leu Phe Lys Pro Ala Asn Gly Phe Leu 405 410 415 Glu Thr Lys Val Tyr Phe Ala Gly Leu Pro Arg Lys Gly Glu Asn Val 420 425 430 Leu Ile Lys Pro Ile Asn Pro Arg Leu Asp Gly Cys Ile Arg Gly Trp 435 440 445 Asn Leu Met Asn Gln Gly Ala Ser Gly Val Lys Glu Ile Ile Gln Glu 450 455 460 Lys Gln Asn Lys His Cys Leu Val Thr Val Glu Lys Gly Ser Tyr Tyr 465 470 475 480 Pro Gly Ser Gly Val Ala Leu Phe Ser Ile Asp Tyr Asn Asn Ile Ser 485 490 495 Asn Ala Glu Gly Trp Gln Val Asn Val Ser Leu Asn Ile Arg Pro Ser 500 505 510 Ala Gly Thr Gly Val Met Phe Ala Leu Val Ser Gly Tyr Thr Val Pro 515 520 525 Phe Ala Leu Ser Leu Val Asp Ser Ala Ser Glu Lys Leu Gln Asp Ile 530 535 540 Leu Val Ser Val Glu Asn Met Val Val Ser Arg Val Glu Ala Ile Ser 545 550 555 560 Leu Cys Ser Asn Glu Gln Phe His Leu Glu Val Arg Val Asn Arg Thr 565 570 575 Ser Leu Glu Leu Leu Thr Pro Leu Lys Lys Asp Ile Ile Tyr Ser Glu 580 585 590 Asp Leu Gln Ser Gln Leu Ala Ile Leu Asp Ile Ala Met Lys Glu Arg 595 600 605 Val Ser Thr Tyr Leu Gly Gly Leu Pro Asp Ile Pro Phe Ser Ala Thr 610 615 620 Pro Val Asn Ala Phe Tyr Asn Gly Cys Met Glu Met Ser Ile Asn Gly 625 630 635 640 Val Gln Leu Asp Leu Asp Glu Ala Ile Ser Lys His Asn Asp Ile Arg 645 650 655 Ala His Ser Cys Pro Ser Val Leu Lys Lys Thr Lys Asn Ser 660 665 670 <210> 37 <211> 67 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 37 Gly Arg Cys Gly Ala Leu Leu Ala Cys Leu Val Leu Val Leu Pro Val 1 5 10 15 Ser Glu Ala Asn Phe Leu Ser Lys Gln His Ala Ser Gln Val Leu Ile 20 25 30 Arg Lys Arg Arg His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser 35 40 45 Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys 50 55 60 Gly Arg Gly 65 <210> 38 <211> 1077 <212> PRT <213> Canis familiaris <400> 38 Met Arg Leu Leu Ala Gly Arg Cys Gly Ala Leu Leu Ala Cys Leu Val 1 5 10 15 Leu Val Leu Pro Val Ser Glu Ala Asn Phe Leu Ser Lys Glu His Ala 20 25 30 Ser Gln Val Leu Val Arg Lys Arg Arg Ala Asn Ser Met Phe Glu Glu 35 40 45 Thr Lys Lys Gly Asn Leu Glu Arg Glu Cys Ile Glu Glu Leu Cys Asn 50 55 60 Lys Glu Glu Ala Arg Glu Ile Phe Glu Asn Asp Pro Glu Thr Asp Tyr 65 70 75 80 Phe Tyr Pro Lys Tyr Leu Gly Cys Leu Gly Ser Phe Arg Ala Gly Leu 85 90 95 Phe Thr Ala Ala Arg Leu Ser Thr Asp Ala Tyr Pro Asp Leu Arg Ser 100 105 110 Cys Val Thr Ala Ile Pro Asp Gln Cys Ser Pro Leu Pro Cys Asn Glu 115 120 125 Asp Gly Tyr Lys Thr Cys Arg Asp Gly Gln Ala Thr Phe Thr Cys Ile 130 135 140 Cys Lys Pro Gly Trp Gln Gly Asp Arg Cys Glu Tyr Asp Ile Asn Glu 145 150 155 160 Cys Lys Asp Pro Ser Asn Ile Asn Gly Gly Cys Ser Gln Met Cys Asp 165 170 175 Asn Thr Pro Gly Ser Tyr His Cys Ser Cys Lys Ser Gly Phe Val Met 180 185 190 Leu Leu Asn Lys Lys Asp Cys Lys Asp Val Asp Glu Cys Ser Ile Met 195 200 205 Pro Asp Ile Cys Gly Ala Ala Val Cys Lys Asn Ile Pro Gly Asp Tyr 210 215 220 Glu Cys Glu Cys Ala Glu Gly Tyr Arg Tyr Asn Pro Ala Leu Lys Ser 225 230 235 240 Cys Glu Asp Val Asp Glu Cys Ser Glu Asn Leu Cys Ala Gln Leu Cys 245 250 255 Val Asn Tyr Pro Gly Gly Tyr Ser Cys Tyr Cys Asp Gly Arg Lys Gly 260 265 270 Phe Lys Leu Ala Gln Asp His Lys Ser Cys Glu Ala Val Pro Val Cys 275 280 285 Leu Pro Leu Asn Leu Asp Lys Asn Tyr Glu Leu Leu Tyr Leu Ala Glu 290 295 300 Gln Phe Val Gly Val Val Leu Tyr Leu Lys Phe Arg Leu Pro Glu Ile 305 310 315 320 Thr Arg Phe Ser Ala Glu Phe Asp Phe Arg Thr Tyr Asp Ser Glu Gly 325 330 335 Val Ile Leu Tyr Ala Glu Ser Leu Asp Arg Ser Ala Trp Phe Leu Ile 340 345 350 Ala Leu Arg Asp Gly Lys Ile Glu Ile Gln Phe Lys Asn Glu Phe Thr 355 360 365 Thr Lys Ile Thr Thr Gly Gly Lys Ala Ile Asn Asn Gly Leu Trp Asn 370 375 380 Thr Val Ser Val Glu Glu Leu Glu Tyr Ser Ile Ser Ile Lys Ile Ala 385 390 395 400 Lys Glu Ala Val Met Asn Ile Asn Lys Pro Gly Arg Leu Phe Lys Pro 405 410 415 Ser Asn Gly Phe Leu Glu Thr Lys Val Tyr Phe Ala Gly Leu Pro Arg 420 425 430 Lys Val Glu Asn Val Leu Ile Arg Pro Ile Asn Pro Arg Leu Asp Gly 435 440 445 Cys Ile Arg Gly Trp Asn Leu Met Asn Gln Gly Ala Ser Gly Val Lys 450 455 460 Glu Ile Ile Gln Glu Lys Gln Asn Lys His Cys Leu Val Thr Val Glu 465 470 475 480 Lys Gly Ser Tyr Tyr Pro Gly Ser Gly Val Ala Val Phe Gly Ile Asp 485 490 495 Tyr Lys Gly Gln Tyr Leu Arg Leu Arg Asp Cys Phe Val Pro Pro Pro 500 505 510 Pro Ala Ala Phe Pro Gly Phe Leu Arg Thr Ala Arg Leu Trp Phe Gly 515 520 525 Gly Gln Arg Pro Gly Arg Ala Ala Ala Glu Arg Pro Ser Leu Gly Gly 530 535 540 Arg Gly Val Ser Ala Gly Gly Glu Ser Arg Gln Leu Gly Gly Cys Glu 545 550 555 560 Leu Phe Ile Ala Pro Ser Gln Pro Pro Ala Gly Gly Gly Gly Gly Gly 565 570 575 Gly Gly Gly Gly Asp Leu Met Leu Arg Thr Gln Asp Val Phe Leu Leu 580 585 590 Leu Leu Gly Lys Gly Gln Leu Val Gly Trp Leu Val Leu Pro Arg Phe 595 600 605 Pro Ala Leu Ser Met Tyr Arg Val Ser Ala Gly Val Pro Arg Ala Thr 610 615 620 Gly Phe Val Ala Phe Arg Pro Ser Pro Lys Ala Leu Leu Pro Arg Glu 625 630 635 640 Gly Thr Arg Arg His Gly Ser Asn Gly Leu Cys Thr Ser Cys Gly Leu 645 650 655 Arg Ser Ser Pro Gln Ala Ala Gly Arg Gly Gly Tyr Thr Arg Gly Pro 660 665 670 Arg Gly Gly Ala Gly Gly Ile Lys Leu Leu Trp Lys Pro Ile Asn Ser 675 680 685 Ser Ile Cys Arg Val Thr Ser Val Glu Asn Lys Gly Val Pro Glu Ala 690 695 700 Arg Arg Val Cys Thr Pro Gly Gly Gly Thr Val Ser Pro Val Ala Arg 705 710 715 720 Lys Arg Asp Glu Lys Gln Gly Arg Gly Glu Lys Asp Cys Asp Glu Ala 725 730 735 Gln Arg Pro Arg Lys Glu Ser Ser Ala Ala Gly Ala Ala Gly Trp Ala 740 745 750 Cys Gly Glu Met Pro Val Gly Arg Ala Arg Ala Ala Glu Pro Asn Ala 755 760 765 Pro Ser Glu Ala Pro Ser Glu Ala Glu Ala Glu Ala Leu Arg Arg Val 770 775 780 Trp Ala Pro Pro Arg Arg Gly Pro Gly Ala Ala Pro Ala Pro Arg Leu 785 790 795 800 Ala Gly Gly Gly Arg Gly Trp Ala Glu Ala Pro Gly Lys Pro Cys Glu 805 810 815 His Gln Arg Gly Lys Pro Leu Val Ser Ala Pro Val Gln Arg Pro Arg 820 825 830 Arg Arg Ala Gly Pro Ala Pro Ser Arg Ala Ser Arg Arg Pro Val Pro 835 840 845 Arg Arg Ser Gln Arg Ser Gln Arg Ser Gln Glu Val Thr Ala Gly His 850 855 860 Ser Arg His Ser Arg His Ser Gly Leu Gln Gln Val Thr Ala Val Thr 865 870 875 880 Ala Val Thr Ala Gly His Ser Arg Ser Gln Pro Ala Gln Arg Val Ala 885 890 895 Ala Gly His Ser Gly Leu Gln Gln Val Ala Thr Gly His Ser Gly His 900 905 910 Cys Ala Gln Gln Val Ala Ala Gly Cys Asn Arg Ser Gln Arg Val Thr 915 920 925 Ala Gly His Ser Ser His Ser Gly Ser Gln Gln Val Thr Ala Ser His 930 935 940 Ser Gly Ser Gln Gln Asp Ile Leu Val Ser Val Glu Asn Ile Val Ile 945 950 955 960 Ser Arg Ile Glu Ala Val Asn Leu Cys Ser Asn Gln Gln Val His Leu 965 970 975 Glu Leu Lys Val Asn Arg Asn Asn Leu Glu Leu Ser Thr Pro Val Lys 980 985 990 Lys Asp Thr Ile Ser Ser Glu Asp Leu Pro Gln Gln Phe Ala Ser Leu 995 1000 1005 Asp Lys Ala Met Lys Gly Thr Val Thr Thr Tyr Leu Gly Gly Leu 1010 1015 1020 Pro Asp Ile Pro Phe Gly Ala Thr Pro Val Asn Val Phe Tyr Asn 1025 1030 1035 Gly Cys Met Glu Val Asn Ile Asn Gly Val Gln Leu Asp Leu Asp 1040 1045 1050 Glu Ala Ile Ser Lys His Asn Asp Ile Arg Ala His Ser Cys Pro 1055 1060 1065 Ser Val Leu Lys Ser Thr Lys Asn Ser 1070 1075 <210> 39 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 39 Met Arg Leu Leu Ala Gly Arg Cys Gly Ala Leu Leu Ala Cys Leu Val 1 5 10 15 Leu Val Leu Pro Val Ser Glu Ala Asn Phe Leu Ser Lys Glu His Ala 20 25 30 Ser Gln Val Leu Val Arg Lys Arg Arg His Ala Glu Gly Thr Phe Thr 35 40 45 Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile 50 55 60 Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 40 <211> 676 <212> PRT <213> Homo sapiens <400> 40 Met Arg Val Leu Gly Gly Arg Cys Gly Ala Leu Leu Ala Cys Leu Leu 1 5 10 15 Leu Val Leu Pro Val Ser Glu Ala Asn Phe Leu Ser Lys Gln Gln Ala 20 25 30 Ser Gln Val Leu Val Arg Lys Arg Arg Ala Asn Ser Leu Leu Glu Glu 35 40 45 Thr Lys Gln Gly Asn Leu Glu Arg Glu Cys Ile Glu Glu Leu Cys Asn 50 55 60 Lys Glu Glu Ala Arg Glu Val Phe Glu Asn Asp Pro Glu Thr Asp Tyr 65 70 75 80 Phe Tyr Pro Lys Tyr Leu Val Cys Leu Arg Ser Phe Gln Thr Gly Leu 85 90 95 Phe Thr Ala Ala Arg Gln Ser Thr Asn Ala Tyr Pro Asp Leu Arg Ser 100 105 110 Cys Val Asn Ala Ile Pro Asp Gln Cys Ser Pro Leu Pro Cys Asn Glu 115 120 125 Asp Gly Tyr Met Ser Cys Lys Asp Gly Lys Ala Ser Phe Thr Cys Thr 130 135 140 Cys Lys Pro Gly Trp Gln Gly Glu Lys Cys Glu Phe Asp Ile Asn Glu 145 150 155 160 Cys Lys Asp Pro Ser Asn Ile Asn Gly Gly Cys Ser Gln Ile Cys Asp 165 170 175 Asn Thr Pro Gly Ser Tyr His Cys Ser Cys Lys Asn Gly Phe Val Met 180 185 190 Leu Ser Asn Lys Lys Asp Cys Lys Asp Val Asp Glu Cys Ser Leu Lys 195 200 205 Pro Ser Ile Cys Gly Thr Ala Val Cys Lys Asn Ile Pro Gly Asp Phe 210 215 220 Glu Cys Glu Cys Pro Glu Gly Tyr Arg Tyr Asn Leu Lys Ser Lys Ser 225 230 235 240 Cys Glu Asp Ile Asp Glu Cys Ser Glu Asn Met Cys Ala Gln Leu Cys 245 250 255 Val Asn Tyr Pro Gly Gly Tyr Thr Cys Tyr Cys Asp Gly Lys Lys Gly 260 265 270 Phe Lys Leu Ala Gln Asp Gln Lys Ser Cys Glu Val Val Ser Val Cys 275 280 285 Leu Pro Leu Asn Leu Asp Thr Lys Tyr Glu Leu Leu Tyr Leu Ala Glu 290 295 300 Gln Phe Ala Gly Val Val Leu Tyr Leu Lys Phe Arg Leu Pro Glu Ile 305 310 315 320 Ser Arg Phe Ser Ala Glu Phe Asp Phe Arg Thr Tyr Asp Ser Glu Gly 325 330 335 Val Ile Leu Tyr Ala Glu Ser Ile Asp His Ser Ala Trp Leu Leu Ile 340 345 350 Ala Leu Arg Gly Gly Lys Ile Glu Val Gln Leu Lys Asn Glu His Thr 355 360 365 Ser Lys Ile Thr Thr Gly Gly Asp Val Ile Asn Asn Gly Leu Trp Asn 370 375 380 Met Val Ser Val Glu Glu Leu Glu His Ser Ile Ser Ile Lys Ile Ala 385 390 395 400 Lys Glu Ala Val Met Asp Ile Asn Lys Pro Gly Pro Leu Phe Lys Pro 405 410 415 Glu Asn Gly Leu Leu Glu Thr Lys Val Tyr Phe Ala Gly Phe Pro Arg 420 425 430 Lys Val Glu Ser Glu Leu Ile Lys Pro Ile Asn Pro Arg Leu Asp Gly 435 440 445 Cys Ile Arg Ser Trp Asn Leu Met Lys Gln Gly Ala Ser Gly Ile Lys 450 455 460 Glu Ile Ile Gln Glu Lys Gln Asn Lys His Cys Leu Val Thr Val Glu 465 470 475 480 Lys Gly Ser Tyr Tyr Pro Gly Ser Gly Ile Ala Gln Phe His Ile Asp 485 490 495 Tyr Asn Asn Val Ser Ser Ala Glu Gly Trp His Val Asn Val Thr Leu 500 505 510 Asn Ile Arg Pro Ser Thr Gly Thr Gly Val Met Leu Ala Leu Val Ser 515 520 525 Gly Asn Asn Thr Val Pro Phe Ala Val Ser Leu Val Asp Ser Thr Ser 530 535 540 Glu Lys Ser Gln Asp Ile Leu Leu Ser Val Glu Asn Thr Val Ile Tyr 545 550 555 560 Arg Ile Gln Ala Leu Ser Leu Cys Ser Asp Gln Gln Ser His Leu Glu 565 570 575 Phe Arg Val Asn Arg Asn Asn Leu Glu Leu Ser Thr Pro Leu Lys Ile 580 585 590 Glu Thr Ile Ser His Glu Asp Leu Gln Arg Gln Leu Ala Val Leu Asp 595 600 605 Lys Ala Met Lys Ala Lys Val Ala Thr Tyr Leu Gly Gly Leu Pro Asp 610 615 620 Val Pro Phe Ser Ala Thr Pro Val Asn Ala Phe Tyr Asn Gly Cys Met 625 630 635 640 Glu Val Asn Ile Asn Gly Val Gln Leu Asp Leu Asp Glu Ala Ile Ser 645 650 655 Lys His Asn Asp Ile Arg Ala His Ser Cys Pro Ser Val Trp Lys Lys 660 665 670 Thr Lys Asn Ser 675 <210> 41 <211> 72 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 41 Met Arg Val Leu Gly Gly Arg Cys Gly Ala Leu Leu Ala Cys Leu Leu 1 5 10 15 Leu Val Leu Pro Val Ser Glu Ala Asn Phe Leu Ser Lys Gln Gln Ala 20 25 30 Ser Gln Val Leu Val Arg Lys Arg Arg His Ala Glu Gly Thr Phe Thr 35 40 45 Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile 50 55 60 Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 42 <211> 422 <212> PRT <213> Homo sapiens <400> 42 Met Ala Gly Cys Val Pro Leu Leu Gln Gly Leu Val Leu Val Leu Ala 1 5 10 15 Leu His Arg Val Glu Pro Ser Ala Thr Ser Leu Lys Glu Arg His Gly 20 25 30 Leu His Ser Asp Ser Ala Cys Thr Gly Val Gln Glu Ser Leu Phe Leu 35 40 45 Pro Ala Ser Lys Ala Asn Asp Val Leu Val Arg Trp Lys Arg Ala Gly 50 55 60 Ser Tyr Leu Leu Glu Glu Leu Phe Glu Gly Asn Leu Glu Lys Glu Cys 65 70 75 80 Tyr Glu Glu Ile Cys Val Tyr Glu Glu Ala Arg Glu Val Phe Glu Asn 85 90 95 Glu Val Val Thr Asp Glu Phe Trp Arg Arg Tyr Lys Gly Gly Ser Pro 100 105 110 Cys Ile Ser Gln Pro Cys Leu His Asn Gly Ser Cys Gln Asp Ser Ile 115 120 125 Trp Gly Tyr Thr Cys Thr Cys Ser Pro Gly Tyr Glu Gly Ser Asn Cys 130 135 140 Glu Leu Ala Lys Asn Glu Cys His Pro Glu Arg Thr Asp Gly Cys Gln 145 150 155 160 His Phe Cys Leu Pro Gly Gln Glu Ser Tyr Thr Cys Ser Cys Ala Gln 165 170 175 Gly Tyr Arg Leu Gly Glu Asp His Lys Gln Cys Val Pro His Asp Gln 180 185 190 Cys Ala Cys Gly Val Leu Thr Ser Glu Lys Arg Ala Pro Asp Leu Gln 195 200 205 Asp Leu Pro Trp Gln Val Lys Leu Thr Asn Ser Glu Gly Lys Asp Phe 210 215 220 Cys Gly Gly Val Ile Ile Arg Glu Asn Phe Val Leu Thr Thr Ala Lys 225 230 235 240 Cys Ser Leu Leu His Arg Asn Ile Thr Val Lys Thr Tyr Phe Asn Arg 245 250 255 Thr Ser Gln Asp Pro Leu Met Ile Lys Ile Thr His Val His Val His 260 265 270 Met Arg Tyr Asp Ala Asp Ala Gly Glu Asn Asp Leu Ser Leu Leu Glu 275 280 285 Leu Glu Trp Pro Ile Gln Cys Pro Gly Ala Gly Leu Pro Val Cys Thr 290 295 300 Pro Glu Lys Asp Phe Ala Glu His Leu Leu Ile Pro Arg Thr Arg Gly 305 310 315 320 Leu Leu Ser Gly Trp Ala Arg Asn Gly Thr Asp Leu Gly Asn Ser Leu 325 330 335 Thr Thr Arg Pro Val Thr Leu Val Glu Gly Glu Glu Cys Gly Gln Val 340 345 350 Leu Asn Val Thr Val Thr Thr Arg Thr Tyr Cys Glu Arg Ser Ser Val 355 360 365 Ala Ala Met His Trp Met Asp Gly Ser Val Val Thr Arg Glu His Arg 370 375 380 Gly Ser Trp Phe Leu Thr Gly Val Leu Gly Ser Gln Pro Val Gly Gly 385 390 395 400 Gln Ala His Met Val Leu Val Thr Lys Val Ser Arg Tyr Ser Leu Trp 405 410 415 Phe Lys Gln Ile Met Asn 420 <210> 43 <211> 93 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 43 Met Ala Gly Cys Val Pro Leu Leu Gln Gly Leu Val Leu Val Leu Ala 1 5 10 15 Leu His Arg Val Glu Pro Ser Ala Thr Ser Leu Lys Glu Arg His Gly 20 25 30 Leu His Ser Asp Ser Ala Cys Thr Gly Val Gln Glu Ser Leu Phe Leu 35 40 45 Pro Ala Ser Lys Ala Asn Asp Val Leu Val Arg Trp Lys Arg His Ala 50 55 60 Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala 65 70 75 80 Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly 85 90 <210> 44 <211> 411 <212> PRT <213> Felis catus <400> 44 Met Trp Gln Leu Ser Ser Leu Phe Leu Leu Val Thr Ile Trp Gly Thr 1 5 10 15 Ser Ala Thr Pro Ala Pro Pro Asp Ser Val Phe Ser Ser Arg Glu Leu 20 25 30 Ser His Arg Val Leu Arg Ile Arg Lys Arg Ala Asn Thr Phe Leu Glu 35 40 45 Glu Leu Arg Ala Gly Ser Leu Glu Arg Glu Cys Val Glu Glu Ile Cys 50 55 60 Asp Leu Glu Glu Ala Gln Glu Ile Phe Gln Asn Val Asp Asp Thr Leu 65 70 75 80 Ala Phe Trp Ala Lys Tyr Ile Asp Glu Asp Gln Cys Ala Ala Pro Pro 85 90 95 Pro Asp His Pro Cys Asp Ser Pro Cys Cys Gly His Gly Asn Cys Ile 100 105 110 Asp Gly Ile Ser Ala Phe Arg Cys Asp Cys Asp Pro Gly Trp Glu Gly 115 120 125 Arg Phe Cys Leu Tyr Val Lys Phe Pro Cys Gly Arg Pro Gly Arg Arg 130 135 140 Met Glu Lys Lys Arg Lys Thr Val Lys Arg Asp Thr Ser Gln Ala Asp 145 150 155 160 Gln Ile Asp Pro Arg Leu Val Asn Gly Lys Leu Ser Gly Trp Gly Glu 165 170 175 Ser Pro Trp Gln Val Ile Leu Leu Asp Ser Lys Lys Lys Leu Ala Cys 180 185 190 Gly Ala Val Leu Ile His Thr Ser Trp Val Leu Thr Ala Ala His Cys 195 200 205 Met Glu Asp Ser Lys Lys Leu Met Val Arg Leu Gly Glu Tyr Asp Leu 210 215 220 Arg Arg Arg Glu Lys Trp Glu Leu Asp Leu Asp Ile Lys Glu Val Leu 225 230 235 240 Met His Pro Asn Tyr Ser Arg Ser Thr Ser Asp Asn Asp Ile Ala Leu 245 250 255 Leu Arg Leu Ala Gln Pro Ala Ile Leu Ser Gln Thr Ile Val Pro Ile 260 265 270 Cys Leu Pro Asp Ser Gly Leu Ala Glu Arg Glu Leu Thr Gln Ala Gly 275 280 285 Gln Glu Thr Val Val Thr Gly Trp Gly His Arg Ser Glu Ala Lys Arg 290 295 300 Asn Arg Thr Phe Val Leu Asn Phe Ile Lys Val Pro Val Val Pro Gln 305 310 315 320 Asn Glu Cys Ile Asn Ala Met His Asn Met Ile Ser Glu Asn Met Leu 325 330 335 Cys Ala Gly Ile Leu Gly Asp Ser Gln Asp Ala Cys Glu Gly Asp Ser 340 345 350 Gly Gly Pro Met Val Ala Ser Phe Arg Gly Thr Ser Phe Leu Val Gly 355 360 365 Leu Val Ser Trp Gly Glu Gly Cys Gly Arg Leu His Asn Tyr Gly Val 370 375 380 Tyr Thr Lys Val Ser Arg Tyr Leu Asp Trp Ile His Ser His Ile Arg 385 390 395 400 Ala Glu Glu Ala Ser Leu Glu Gly Gln Val Pro 405 410 <210> 45 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 45 Met Trp Gln Leu Ser Ser Leu Phe Leu Leu Val Thr Ile Trp Gly Thr 1 5 10 15 Ser Ala Thr Pro Ala Pro Pro Asp Ser Val Phe Ser Ser Arg Glu Leu 20 25 30 Ser His Arg Val Leu Arg Ile Arg Lys Arg His Ala Glu Gly Thr Phe 35 40 45 Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe 50 55 60 Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 46 <211> 456 <212> PRT <213> Canis familiaris <400> 46 Met Trp Gln Leu Ala Ser Leu Ser Leu Leu Leu Thr Ile Cys Gly Thr 1 5 10 15 Cys Ser Thr Ala Ala Pro Pro Gly Ser Val Phe Ser Ser Ser Glu Ser 20 25 30 Ala His Gln Val Leu Arg Ile Arg Lys Arg Ala Asn Ser Phe Leu Glu 35 40 45 Glu Ile Arg Ala Gly Ser Leu Glu Arg Glu Cys Met Glu Glu Ile Cys 50 55 60 Asp Phe Glu Glu Ala Lys Glu Ile Phe Gln Asn Val Asp Asp Thr Leu 65 70 75 80 Ala Tyr Trp Ser Lys Tyr Val Asp Gly Asp Gln Cys Ala Ala Leu Pro 85 90 95 Pro Glu His Ala Cys Asp Ser Pro Cys Cys Gly His Gly Ser Cys Ile 100 105 110 Asp Gly Ile Gly Ala Phe His Cys Asp Cys Gly Arg Gly Trp Glu Gly 115 120 125 Arg Phe Cys Gln His Glu Val Ser Tyr Ile Asn Cys Ser Leu Asp Asn 130 135 140 Gly Gly Cys Ser His Tyr Cys Leu Glu Glu Glu Gly Gly Arg His Cys 145 150 155 160 Ser Cys Ala Pro Gly Tyr Arg Leu Gly Asp Asp His Leu Gln Cys Gln 165 170 175 Pro Ala Val Lys Phe Pro Cys Gly Arg Pro Gly Lys Gln Met Glu Lys 180 185 190 Lys Arg Lys His Leu Lys Arg Asp Thr Asn Gln Thr Asp Gln Ile Asp 195 200 205 Pro Arg Leu Val Asn Gly Lys Val Thr Arg Arg Gly Glu Ser Pro Trp 210 215 220 Gln Val Val Leu Leu Asp Ser Lys Lys Lys Leu Ala Cys Gly Ala Val 225 230 235 240 Leu Ile His Thr Ser Trp Val Leu Thr Ala Ala His Cys Met Glu Asp 245 250 255 Ser Lys Lys Leu Ile Val Arg Leu Gly Glu Tyr Asp Leu Arg Arg Trp 260 265 270 Glu Lys Gly Glu Met Asp Val Asp Ile Lys Glu Val Leu Ile His Pro 275 280 285 Asn Tyr Ser Lys Ser Thr Thr Asp Asn Asp Ile Ala Leu Leu His Leu 290 295 300 Ala Gln Pro Ala Ile Phe Ser Gln Thr Ile Val Pro Ile Cys Leu Pro 305 310 315 320 Asp Ser Gly Leu Ala Glu Arg Glu Leu Thr Gln Val Gly Gln Glu Thr 325 330 335 Val Val Thr Gly Trp Gly Tyr Arg Ser Glu Thr Lys Arg Asn Arg Thr 340 345 350 Phe Val Leu Asn Phe Ile Asn Ile Pro Val Ala Pro His Asn Glu Cys 355 360 365 Ile Gln Ala Met Tyr Asn Met Ile Ser Glu Asn Met Leu Cys Ala Gly 370 375 380 Ile Leu Gly Asp Ser Arg Asp Ala Cys Glu Gly Asp Ser Gly Gly Pro 385 390 395 400 Met Val Thr Ser Phe Arg Gly Thr Trp Phe Leu Val Gly Leu Val Ser 405 410 415 Trp Gly Glu Gly Cys Gly Arg Leu His Asn Tyr Gly Ile Tyr Thr Lys 420 425 430 Val Ser Arg Tyr Leu Asp Trp Ile His Ser His Ile Arg Gly Glu Glu 435 440 445 Ala Ser Leu Glu Asn Gln Val Pro 450 455 <210> 47 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 47 Met Trp Gln Leu Ala Ser Leu Ser Leu Leu Leu Thr Ile Cys Gly Thr 1 5 10 15 Cys Ser Thr Ala Ala Pro Pro Gly Ser Val Phe Ser Ser Ser Glu Ser 20 25 30 Ala His Gln Val Leu Arg Ile Arg Lys Arg His Ala Glu Gly Thr Phe 35 40 45 Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe 50 55 60 Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 48 <211> 461 <212> PRT <213> Homo sapiens <400> 48 Met Trp Gln Leu Thr Ser Leu Leu Leu Phe Val Ala Thr Trp Gly Ile 1 5 10 15 Ser Gly Thr Pro Ala Pro Leu Asp Ser Val Phe Ser Ser Ser Glu Arg 20 25 30 Ala His Gln Val Leu Arg Ile Arg Lys Arg Ala Asn Ser Phe Leu Glu 35 40 45 Glu Leu Arg His Ser Ser Leu Glu Arg Glu Cys Ile Glu Glu Ile Cys 50 55 60 Asp Phe Glu Glu Ala Lys Glu Ile Phe Gln Asn Val Asp Asp Thr Leu 65 70 75 80 Ala Phe Trp Ser Lys His Val Asp Gly Asp Gln Cys Leu Val Leu Pro 85 90 95 Leu Glu His Pro Cys Ala Ser Leu Cys Cys Gly His Gly Thr Cys Ile 100 105 110 Asp Gly Ile Gly Ser Phe Ser Cys Asp Cys Arg Ser Gly Trp Glu Gly 115 120 125 Arg Phe Cys Gln Arg Glu Val Ser Phe Leu Asn Cys Ser Leu Asp Asn 130 135 140 Gly Gly Cys Thr His Tyr Cys Leu Glu Glu Val Gly Trp Arg Arg Cys 145 150 155 160 Ser Cys Ala Pro Gly Tyr Lys Leu Gly Asp Asp Leu Leu Gln Cys His 165 170 175 Pro Ala Val Lys Phe Pro Cys Gly Arg Pro Trp Lys Arg Met Glu Lys 180 185 190 Lys Arg Ser His Leu Lys Arg Asp Thr Glu Asp Gln Glu Asp Gln Val 195 200 205 Asp Pro Arg Leu Ile Asp Gly Lys Met Thr Arg Arg Gly Asp Ser Pro 210 215 220 Trp Gln Val Val Leu Leu Asp Ser Lys Lys Lys Leu Ala Cys Gly Ala 225 230 235 240 Val Leu Ile His Pro Ser Trp Val Leu Thr Ala Ala His Cys Met Asp 245 250 255 Glu Ser Lys Lys Leu Leu Val Arg Leu Gly Glu Tyr Asp Leu Arg Arg 260 265 270 Trp Glu Lys Trp Glu Leu Asp Leu Asp Ile Lys Glu Val Phe Val His 275 280 285 Pro Asn Tyr Ser Lys Ser Thr Thr Asp Asn Asp Ile Ala Leu Leu His 290 295 300 Leu Ala Gln Pro Ala Thr Leu Ser Gln Thr Ile Val Pro Ile Cys Leu 305 310 315 320 Pro Asp Ser Gly Leu Ala Glu Arg Glu Leu Asn Gln Ala Gly Gln Glu 325 330 335 Thr Leu Val Thr Gly Trp Gly Tyr His Ser Ser Arg Glu Lys Glu Ala 340 345 350 Lys Arg Asn Arg Thr Phe Val Leu Asn Phe Ile Lys Ile Pro Val Val 355 360 365 Pro His Asn Glu Cys Ser Glu Val Met Ser Asn Met Val Ser Glu Asn 370 375 380 Met Leu Cys Ala Gly Ile Leu Gly Asp Arg Gln Asp Ala Cys Glu Gly 385 390 395 400 Asp Ser Gly Gly Pro Met Val Ala Ser Phe His Gly Thr Trp Phe Leu 405 410 415 Val Gly Leu Val Ser Trp Gly Glu Gly Cys Gly Leu Leu His Asn Tyr 420 425 430 Gly Val Tyr Thr Lys Val Ser Arg Tyr Leu Asp Trp Ile His Gly His 435 440 445 Ile Arg Asp Lys Glu Ala Pro Gln Lys Ser Trp Ala Pro 450 455 460 <210> 49 <211> 73 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 49 Met Trp Gln Leu Thr Ser Leu Leu Leu Phe Val Ala Thr Trp Gly Ile 1 5 10 15 Ser Gly Thr Pro Ala Pro Leu Asp Ser Val Phe Ser Ser Ser Glu Arg 20 25 30 Ala His Gln Val Leu Arg Ile Arg Lys Arg His Ala Glu Gly Thr Phe 35 40 45 Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe 50 55 60 Ile Ala Trp Leu Val Lys Gly Arg Gly 65 70 <210> 50 <211> 608 <212> PRT <213> Felis catus <400> 50 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Leu Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Val Thr Arg Arg Glu Ala His Gln Ser Glu Ile Ala 20 25 30 His Arg Phe Asn Asp Leu Gly Glu Glu His Phe Arg Gly Leu Val Leu 35 40 45 Val Ala Phe Ser Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val 50 55 60 Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Gly Cys Val Ala Asp 65 70 75 80 Gln Ser Ala Ala Asn Cys Glu Lys Ser Leu His Glu Leu Leu Gly Asp 85 90 95 Lys Leu Cys Thr Val Ala Ser Leu Arg Asp Lys Tyr Gly Glu Met Ala 100 105 110 Asp Cys Cys Glu Lys Lys Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln 115 120 125 His Lys Asp Asp Asn Pro Gly Phe Gly Gln Leu Val Thr Pro Glu Ala 130 135 140 Asp Ala Met Cys Thr Ala Phe His Glu Asn Glu Gln Arg Phe Leu Gly 145 150 155 160 Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro 165 170 175 Glu Leu Leu Tyr Tyr Ala Glu Glu Tyr Lys Gly Val Phe Thr Glu Cys 180 185 190 Cys Glu Ala Ala Asp Lys Ala Ala Cys Leu Thr Pro Lys Val Asp Ala 195 200 205 Leu Arg Glu Lys Val Leu Ala Ser Ser Ala Lys Glu Arg Leu Lys Cys 210 215 220 Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ser Val 225 230 235 240 Ala Arg Leu Ser Gln Lys Phe Pro Lys Ala Glu Phe Ala Glu Ile Ser 245 250 255 Lys Leu Val Thr Asp Leu Ala Lys Ile His Lys Glu Cys Cys His Gly 260 265 270 Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile 275 280 285 Cys Glu Asn Gln Asp Ser Ile Ser Thr Lys Leu Lys Glu Cys Cys Gly 290 295 300 Lys Pro Val Leu Glu Lys Ser His Cys Ile Ser Glu Val Glu Arg Asp 305 310 315 320 Glu Leu Pro Ala Asp Leu Pro Pro Leu Ala Val Asp Phe Val Glu Asp 325 330 335 Lys Glu Val Cys Lys Asn Tyr Gln Glu Ala Lys Asp Val Phe Leu Gly 340 345 350 Thr Phe Leu Tyr Glu Tyr Ser Arg Arg His Pro Glu Tyr Ser Val Ser 355 360 365 Leu Leu Leu Arg Leu Ala Lys Glu Tyr Glu Ala Thr Leu Glu Lys Cys 370 375 380 Cys Ala Thr Asp Asp Pro Pro Ala Cys Tyr Ala His Val Phe Asp Glu 385 390 395 400 Phe Lys Pro Leu Val Glu Glu Pro His Asn Leu Val Lys Thr Asn Cys 405 410 415 Glu Leu Phe Glu Lys Leu Gly Glu Tyr Gly Phe Gln Asn Ala Leu Leu 420 425 430 Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val 435 440 445 Glu Val Ser Arg Ser Leu Gly Lys Val Gly Ser Lys Cys Cys Thr His 450 455 460 Pro Glu Ala Glu Arg Leu Ser Cys Ala Glu Asp Tyr Leu Ser Val Val 465 470 475 480 Leu Asn Arg Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Glu Arg 485 490 495 Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe 500 505 510 Ser Ala Leu Gln Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Ser Ala 515 520 525 Glu Thr Phe Thr Phe His Ala Asp Leu Cys Thr Leu Pro Glu Ala Glu 530 535 540 Lys Gln Ile Lys Lys Gln Ser Ala Leu Val Glu Leu Leu Lys His Lys 545 550 555 560 Pro Lys Ala Thr Glu Glu Gln Leu Lys Thr Val Met Gly Asp Phe Gly 565 570 575 Ser Phe Val Asp Lys Cys Cys Ala Ala Glu Asp Lys Glu Ala Cys Phe 580 585 590 Ala Glu Glu Gly Pro Lys Leu Val Ala Ala Ala Gln Ala Ala Leu Ala 595 600 605 <210> 51 <211> 608 <212> PRT <213> Canis familiaris <400> 51 Met Lys Trp Val Thr Phe Ile Ser Leu Phe Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Leu Val Arg Arg Glu Ala Tyr Lys Ser Glu Ile Ala 20 25 30 His Arg Tyr Asn Asp Leu Gly Glu Glu His Phe Arg Gly Leu Val Leu 35 40 45 Val Ala Phe Ser Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val 50 55 60 Lys Leu Ala Lys Glu Val Thr Glu Phe Ala Lys Ala Cys Ala Ala Glu 65 70 75 80 Glu Ser Gly Ala Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp 85 90 95 Lys Leu Cys Thr Val Ala Ser Leu Arg Asp Lys Tyr Gly Asp Met Ala 100 105 110 Asp Cys Cys Glu Lys Gln Glu Pro Asp Arg Asn Glu Cys Phe Leu Ala 115 120 125 His Lys Asp Asp Asn Pro Gly Phe Pro Pro Leu Val Ala Pro Glu Pro 130 135 140 Asp Ala Leu Cys Ala Ala Phe Gln Asp Asn Glu Gln Leu Phe Leu Gly 145 150 155 160 Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro 165 170 175 Glu Leu Leu Tyr Tyr Ala Gln Gln Tyr Lys Gly Val Phe Ala Glu Cys 180 185 190 Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Gly Pro Lys Ile Glu Ala 195 200 205 Leu Arg Glu Lys Val Leu Leu Ser Ser Ala Lys Glu Arg Phe Lys Cys 210 215 220 Ala Ser Leu Gln Lys Phe Gly Asp Arg Ala Phe Lys Ala Trp Ser Val 225 230 235 240 Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Asp Phe Ala Glu Ile Ser 245 250 255 Lys Val Val Thr Asp Leu Thr Lys Val His Lys Glu Cys Cys His Gly 260 265 270 Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Met 275 280 285 Cys Glu Asn Gln Asp Ser Ile Ser Thr Lys Leu Lys Glu Cys Cys Asp 290 295 300 Lys Pro Val Leu Glu Lys Ser Gln Cys Leu Ala Glu Val Glu Arg Asp 305 310 315 320 Glu Leu Pro Gly Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Asp 325 330 335 Lys Glu Val Cys Lys Asn Tyr Gln Glu Ala Lys Asp Val Phe Leu Gly 340 345 350 Thr Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Glu Tyr Ser Val Ser 355 360 365 Leu Leu Leu Arg Leu Ala Lys Glu Tyr Glu Ala Thr Leu Glu Lys Cys 370 375 380 Cys Ala Thr Asp Asp Pro Pro Thr Cys Tyr Ala Lys Val Leu Asp Glu 385 390 395 400 Phe Lys Pro Leu Val Asp Glu Pro Gln Asn Leu Val Lys Thr Asn Cys 405 410 415 Glu Leu Phe Glu Lys Leu Gly Glu Tyr Gly Phe Gln Asn Ala Leu Leu 420 425 430 Val Arg Tyr Thr Lys Lys Ala Pro Gln Val Ser Thr Pro Thr Leu Val 435 440 445 Glu Val Ser Arg Lys Leu Gly Lys Val Gly Thr Lys Cys Cys Lys Lys 450 455 460 Pro Glu Ser Glu Arg Met Ser Cys Ala Glu Asp Phe Leu Ser Val Val 465 470 475 480 Leu Asn Arg Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Glu Arg 485 490 495 Val Thr Lys Cys Cys Ser Glu Ser Leu Val Asn Arg Arg Pro Cys Phe 500 505 510 Ser Gly Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala 515 520 525 Glu Thr Phe Thr Phe His Ala Asp Leu Cys Thr Leu Pro Glu Ala Glu 530 535 540 Lys Gln Val Lys Lys Gln Thr Ala Leu Val Glu Leu Leu Lys His Lys 545 550 555 560 Pro Lys Ala Thr Asp Glu Gln Leu Lys Thr Val Met Gly Asp Phe Gly 565 570 575 Ala Phe Val Glu Lys Cys Cys Ala Ala Glu Asn Lys Glu Gly Cys Phe 580 585 590 Ser Glu Glu Gly Pro Lys Leu Val Ala Ala Ala Gln Ala Ala Leu Val 595 600 605 <210> 52 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 52 Met Lys Trp Val Thr Phe Ile Ser Leu Phe Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Leu Val Arg Arg His Ala Glu Gly Thr Phe Thr Ser 20 25 30 Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala 35 40 45 Trp Leu Val Lys Gly Arg Gly 50 55 <210> 53 <211> 609 <212> PRT <213> Homo sapiens <400> 53 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Val Phe Arg Arg Asp Ala His Lys Ser Glu Val Ala 20 25 30 His Arg Phe Lys Asp Leu Gly Glu Glu Asn Phe Lys Ala Leu Val Leu 35 40 45 Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys Pro Phe Glu Asp His Val 50 55 60 Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys Thr Cys Val Ala Asp 65 70 75 80 Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr Leu Phe Gly Asp 85 90 95 Lys Leu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly Glu Met Ala 100 105 110 Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe Leu Gln 115 120 125 His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu Val 130 135 140 Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys 145 150 155 160 Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro 165 170 175 Glu Leu Leu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys 180 185 190 Cys Gln Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu 195 200 205 Leu Arg Asp Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys 210 215 220 Ala Ser Leu Gln Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val 225 230 235 240 Ala Arg Leu Ser Gln Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser 245 250 255 Lys Leu Val Thr Asp Leu Thr Lys Val His Thr Glu Cys Cys His Gly 260 265 270 Asp Leu Leu Glu Cys Ala Asp Asp Arg Ala Asp Leu Ala Lys Tyr Ile 275 280 285 Cys Glu Asn Gln Asp Ser Ile Ser Ser Lys Leu Lys Glu Cys Cys Glu 290 295 300 Lys Pro Leu Leu Glu Lys Ser His Cys Ile Ala Glu Val Glu Asn Asp 305 310 315 320 Glu Met Pro Ala Asp Leu Pro Ser Leu Ala Ala Asp Phe Val Glu Ser 325 330 335 Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys Asp Val Phe Leu Gly 340 345 350 Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp Tyr Ser Val Val 355 360 365 Leu Leu Leu Arg Leu Ala Lys Thr Tyr Glu Thr Thr Leu Glu Lys Cys 370 375 380 Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe Asp Glu 385 390 395 400 Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn Cys 405 410 415 Glu Leu Phe Glu Gln Leu Gly Glu Tyr Lys Phe Gln Asn Ala Leu Leu 420 425 430 Val Arg Tyr Thr Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val 435 440 445 Glu Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His 450 455 460 Pro Glu Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val 465 470 475 480 Leu Asn Gln Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg 485 490 495 Val Thr Lys Cys Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe 500 505 510 Ser Ala Leu Glu Val Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala 515 520 525 Glu Thr Phe Thr Phe His Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu 530 535 540 Arg Gln Ile Lys Lys Gln Thr Ala Leu Val Glu Leu Val Lys His Lys 545 550 555 560 Pro Lys Ala Thr Lys Glu Gln Leu Lys Ala Val Met Asp Asp Phe Ala 565 570 575 Ala Phe Val Glu Lys Cys Cys Lys Ala Asp Asp Lys Glu Thr Cys Phe 580 585 590 Ala Glu Glu Gly Lys Lys Leu Val Ala Ala Ser Gln Ala Ala Leu Gly 595 600 605 Leu <210> 54 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> constructed sequence <400> 54 Met Lys Trp Val Thr Phe Ile Ser Leu Leu Phe Leu Phe Ser Ser Ala 1 5 10 15 Tyr Ser Arg Gly Val Phe Arg Arg His Ala Glu Gly Thr Phe Thr Ser 20 25 30 Asp Val Ser Ser Tyr Leu Glu Gly Gln Ala Ala Lys Glu Phe Ile Ala 35 40 45 Trp Leu Val Lys Gly Arg Gly 50 55 <210> 55 <211> 5428 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> polyA_signal <222> (56)..(182) <223> rabit globin poly a <220> <221> repeat_region <222> (271)..(400) <223> complement 3' ITR <220> <221> rep_origin <222> (577)..(1032) <220> <221> misc_feature <222> (1163)..(2020) <223> AP(R) <220> <221> rep_origin <222> (2194)..(2782) <220> <221> repeat_region <222> (3222)..(3351) <223> 5' ITR <220> <221> repeat_region <222> (3419)..(3800) <223> CMV/IE/Promoter <220> <221> promoter <222> (3803)..(4084) <220> <221> TATA_signal <222> (4057)..(4060) <220> <221> Intron <222> (4179)..(5151) <223> chicken\beta-actin\intron <400> 55 ctctagagtc gacccgggcg gcctcgagga cggggtgaac tacgcctgag gatccgatct 60 ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 120 ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 180 cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 240 agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 300 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 360 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac 420 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 480 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 540 cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 600 gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 660 ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 720 ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 780 aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 840 gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 900 cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 960 attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 1020 cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 1080 tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 1140 ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 1200 ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 1260 tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 1320 gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 1380 gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 1440 acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 1500 tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 1560 caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 1620 gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 1680 cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 1740 tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 1800 agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 1860 tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 1920 ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 1980 acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 2040 ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 2100 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 2160 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 2220 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 2280 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 2340 tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 2400 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 2460 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 2520 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 2580 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 2640 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 2700 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 2760 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 2820 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 2880 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 2940 gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 3000 gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 3060 caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct 3120 tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta 3180 tgaccatgat tacgccagat ttaattaagg ccttaattag gctgcgcgct cgctcgctca 3240 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 3300 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 3360 tgattaaccc gccatgctac ttatctacca gggtaatggg gatcctctag aactatagct 3420 agtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 3480 agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 3540 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 3600 gggactttcc attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta 3660 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 3720 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 3780 gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 3840 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 3900 gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 3960 cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 4020 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 4080 gcggggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 4140 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 4200 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 4260 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 4320 cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 4380 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 4440 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 4500 gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 4560 tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 4620 ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 4680 gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 4740 ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 4800 gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 4860 gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 4920 gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 4980 gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 5040 gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 5100 agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgcca 5160 ccatgggagc cgatgctaga cctctgggag tgcgggctgg cggcggagga agaggcgctg 5220 caagacctgg cacaagcagc agagcactgc ctccacctct gccccctctg agctttctcc 5280 tgctgctgct ggctgcccct ggcgctagag ccagaaaaag aaggcacgcc gagggcacct 5340 tcaccagcga cgtgtccagc tacctggaag gccaggccgc caaagagttt atcgcctggc 5400 tcgtgaaggg cagaggctga tgaggtac 5428 <210> 56 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <400> 56 catgctgaag ggacctttac cagtgatgta agttcttatt tggaaggcca agctgccaag 60 gaattcattg cttggctggt gaaaggccgg gga 93 <210> 57 <211> 5437 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> misc_feature <222> (12)..(170) <223> leader <220> <221> misc_feature <222> (171)..(182) <223> furin site <220> <221> misc_feature <222> (183)..(275) <223> GLP1 <220> <221> polyA_signal <222> (342)..(468) <223> Rabbit\globin\poly\A <220> <221> rep_origin <222> (863)..(1318) <223> f1\ori (complement) <220> <221> misc_feature <222> (1449)..(2306) <223> AP(R) <220> <221> rep_origin <222> (2480)..(3068) <223> Origin\of\replication <220> <221> repeat_region <222> (3508)..(3637) <223> 5' ITR <220> <221> misc_feature <222> (3705)..(4086) <223> CMV\IE\promoter <220> <221> promoter <222> (4089)..(4370) <223> CB promoter <220> <221> TATA_signal <222> (4343)..(4346) <220> <221> Intron <222> (4465)..(5437) <223> chicken\beta-actin\intron <400> 57 aattcgccac catgggcgtg gacggccgga tattcttcct gatgcccagc atggccttcc 60 agctgctgaa cgagagcaga cccagcagcc tgctgatcca gatgttcccc ggcctgagct 120 tcatctgcac caccgtgctg agcaagcagc acgccagcca ggtgctgatc cggaagagaa 180 ggcacgccga gggcaccttc accagcgacg tgtccagcta cctggaagga caggccgcca 240 aagagtttat cgcctggctc gtgaagggca gaggctgatg aggtacctct agagtcgacc 300 cgggcggcct cgaggacggg gtgaactacg cctgaggatc cgatcttttt ccctctgcca 360 aaaattatgg ggacatcatg aagccccttg agcatctgac ttctggctaa taaaggaaat 420 ttattttcat tgcaatagtg tgttggaatt ttttgtgtct ctcactcgga agcaattcgt 480 tgatctgaat ttcgaccacc cataataccc attaccctgg tagataagta gcatggcggg 540 ttaatcatta actacaagga acccctagtg atggagttgg ccactccctc tctgcgcgct 600 cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt tgcccgggcg 660 gcctcagtga gcgagcgagc gcgcagcctt aattaaccta attcactggc cgtcgtttta 720 caacgtcgtg actgggaaaa ccctggcgtt acccaactta atcgccttgc agcacatccc 780 cctttcgcca gctggcgtaa tagcgaagag gcccgcaccg atcgcccttc ccaacagttg 840 cgcagcctga atggcgaatg ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 900 gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 960 ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 1020 ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 1080 ggtgatggtt cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg 1140 gagtccacgt tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc 1200 tcggtctatt cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat 1260 gagctgattt aacaaaaatt taacgcgaat tttaacaaaa tattaacgct tacaatttag 1320 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 1380 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 1440 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 1500 gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 1560 tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 1620 ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 1680 tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 1740 atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 1800 gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 1860 caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 1920 ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 1980 ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 2040 ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 2100 ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 2160 gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 2220 ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 2280 taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 2340 agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 2400 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 2460 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 2520 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 2580 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgttctt ctagtgtagc 2640 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 2700 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 2760 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 2820 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 2880 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 2940 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 3000 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 3060 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 3120 ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt accgcctttg 3180 agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca gtgagcgagg 3240 aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat 3300 gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg 3360 tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt 3420 tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg 3480 ccagatttaa ttaaggcctt aattaggctg cgcgctcgct cgctcactga ggccgcccgg 3540 gcaaagcccg ggcgtcgggc gacctttggt cgcccggcct cagtgagcga gcgagcgcgc 3600 agagagggag tggccaactc catcactagg ggttccttgt agttaatgat taacccgcca 3660 tgctacttat ctaccagggt aatggggatc ctctagaact atagctagtc gacattgatt 3720 attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc catatatgga 3780 gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca acgacccccg 3840 cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga ctttccattg 3900 acgtcaatgg gtggactatt tacggtaaac tgcccacttg gcagtacatc aagtgtatca 3960 tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct ggcattatgc 4020 ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat tagtcatcgc 4080 tattaccatg gtcgaggtga gccccacgtt ctgcttcact ctccccatct cccccccctc 4140 cccaccccca attttgtatt tatttatttt ttaattattt tgtgcagcga tgggggcggg 4200 gggggggggg gggcgcgcgc caggcggggc ggggcggggc gaggggcggg gcggggcgag 4260 gcggagaggt gcggcggcag ccaatcagag cggcgcgctc cgaaagtttc cttttatggc 4320 gaggcggcgg cggcggcggc cctataaaaa gcgaagcgcg cggcgggcgg ggagtcgctg 4380 cgacgctgcc ttcgccccgt gccccgctcc gccgccgcct cgcgccgccc gccccggctc 4440 tgactgaccg cgttactccc acaggtgagc gggcgggacg gcccttctcc tccgggctgt 4500 aattagcgct tggtttaatg acggcttgtt tcttttctgt ggctgcgtga aagccttgag 4560 gggctccggg agggcccttt gtgcgggggg agcggctcgg ggggtgcgtg cgtgtgtgtg 4620 tgcgtgggga gcgccgcgtg cggctccgcg ctgcccggcg gctgtgagcg ctgcgggcgc 4680 ggcgcggggc tttgtgcgct ccgcagtgtg cgcgagggga gcgcggccgg gggcggtgcc 4740 ccgcggtgcg gggggggctg cgaggggaac aaaggctgcg tgcggggtgt gtgcgtgggg 4800 gggtgagcag ggggtgtggg cgcgtcggtc gggctgcaac cccccctgca cccccctccc 4860 cgagttgctg agcacggccc ggcttcgggt gcggggctcc gtacggggcg tggcgcgggg 4920 ctcgccgtgc cgggcggggg gtggcggcag gtgggggtgc cgggcggggc ggggccgcct 4980 cgggccgggg agggctcggg ggaggggcgc ggcggccccc ggagcgccgg cggctgtcga 5040 ggcgcggcga gccgcagcca ttgcctttta tggtaatcgt gcgagagggc gcagggactt 5100 cctttgtccc aaatctgtgc ggagccgaaa tctgggaggc gccgccgcac cccctctagc 5160 gggcgcgggg cgaagcggtg cggcgccggc aggaaggaaa tgggcgggga gggccttcgt 5220 gcgtcgccgc gccgccgtcc ccttctccct ctccagcctc ggggctgtcc gcggggggac 5280 ggctgccttc gggggggacg gggcagggcg gggttcggct tctggcgtgt gaccggcggc 5340 tctagagcct ctgctaacca tgttcatgcc ttcttctttt tcctacagct cctgggcaac 5400 gtgctggtta ttgtgctgtc tcatcatttt ggcaaag 5437 <210> 58 <211> 5338 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> polyA_signal <222> (56)..(182) <223> Rabbit\globin\poly\A <220> <221> repeat_region <222> (271)..(400) <223> 3' ITR (complement) <220> <221> rep_origin <222> (577)..(1032) <223> f1 ori (complement) <220> <221> misc_feature <222> (1163)..(2020) <223> AP(R) <220> <221> rep_origin <222> (2194)..(2782) <223> Origin\of\replication <220> <221> repeat_region <222> (3222)..(3351) <223> 5' ITR <220> <221> misc_feature <222> (3419)..(3800) <223> CMV\IE\promoter <220> <221> promoter <222> (3803)..(4084) <223> DB promoter <220> <221> TATA_signal <222> (4057)..(4060) <220> <221> Intron <222> (4179)..(5151) <223> chicken\beta-actin\intron <400> 58 ctctagagtc gacccgggcg gcctcgagga cggggtgaac tacgcctgag gatccgatct 60 ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 120 ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 180 cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 240 agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 300 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 360 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac 420 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 480 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 540 cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 600 gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 660 ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 720 ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 780 aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 840 gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 900 cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 960 attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 1020 cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 1080 tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 1140 ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 1200 ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 1260 tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 1320 gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 1380 gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 1440 acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 1500 tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 1560 caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 1620 gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 1680 cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 1740 tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 1800 agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 1860 tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 1920 ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 1980 acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 2040 ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 2100 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 2160 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 2220 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 2280 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 2340 tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 2400 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 2460 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 2520 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 2580 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 2640 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 2700 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 2760 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 2820 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 2880 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 2940 gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 3000 gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 3060 caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct 3120 tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta 3180 tgaccatgat tacgccagat ttaattaagg ccttaattag gctgcgcgct cgctcgctca 3240 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 3300 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 3360 tgattaaccc gccatgctac ttatctacca gggtaatggg gatcctctag aactatagct 3420 agtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 3480 agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 3540 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 3600 gggactttcc attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta 3660 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 3720 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 3780 gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 3840 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 3900 gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 3960 cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 4020 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 4080 gcggggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 4140 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 4200 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 4260 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 4320 cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 4380 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 4440 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 4500 gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 4560 tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 4620 ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 4680 gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 4740 ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 4800 gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 4860 gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 4920 gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 4980 gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 5040 gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 5100 agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgcca 5160 ccatgtacaa gatccagctg ctgagctgta tcgccctgac cctgatcctc gtgaccaaca 5220 gcagaaagaa gagacacgcc gagggcacct tcaccagcga cgtgtcctct tacctggaag 5280 gccaggccgc caaagagttt atcgcctggc tcgtgaaggg cagaggctga tgaggtac 5338 <210> 59 <211> 5395 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> polyA_signal <222> (56)..(182) <223> Rabbit\globin\poly\A <220> <221> repeat_region <222> (271)..(400) <223> 3' ITR (complement) <220> <221> rep_origin <222> (577)..(1032) <223> F1 ori <220> <221> misc_feature <222> (1163)..(2020) <223> AP(R) <220> <221> rep_origin <222> (2194)..(2782) <223> Origin\of\replication <220> <221> misc_feature <222> (3083)..(4084) <223> CB promoter <220> <221> repeat_region <222> (3222)..(3351) <223> 5' ITR <220> <221> repeat_region <222> (3419)..(3800) <223> CMV\IE\promoter <220> <221> TATA_signal <222> (4057)..(4060) <220> <221> Intron <222> (4179)..(5151) <223> chicken\beta-actin\intron <220> <221> misc_feature <222> (5163)..(5291) <223> leader <220> <221> misc_feature <222> (5292)..(5384) <223> GLP1 <400> 59 ctctagagtc gacccgggcg gcctcgagga cggggtgaac tacgcctgag gatccgatct 60 ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 120 ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 180 cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 240 agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 300 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 360 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac 420 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 480 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 540 cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 600 gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 660 ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 720 ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 780 aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 840 gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 900 cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 960 attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 1020 cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 1080 tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 1140 ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 1200 ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 1260 tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 1320 gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 1380 gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 1440 acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 1500 tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 1560 caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 1620 gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 1680 cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 1740 tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 1800 agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 1860 tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 1920 ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 1980 acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 2040 ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 2100 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 2160 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 2220 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 2280 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 2340 tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 2400 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 2460 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 2520 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 2580 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 2640 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 2700 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 2760 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 2820 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 2880 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 2940 gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 3000 gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 3060 caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct 3120 tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta 3180 tgaccatgat tacgccagat ttaattaagg ccttaattag gctgcgcgct cgctcgctca 3240 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 3300 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 3360 tgattaaccc gccatgctac ttatctacca gggtaatggg gatcctctag aactatagct 3420 agtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 3480 agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 3540 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 3600 gggactttcc attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta 3660 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 3720 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 3780 gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 3840 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 3900 gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 3960 cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 4020 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 4080 gcggggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 4140 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 4200 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 4260 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 4320 cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 4380 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 4440 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 4500 gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 4560 tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 4620 ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 4680 gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 4740 ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 4800 gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 4860 gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 4920 gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 4980 gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 5040 gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 5100 agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgcca 5160 ccatggccca catcagaggc ctgtggctgc ctggatgtct ggccctggct gccctgtgta 5220 gcctggtgca cagccagcat gtgtttctgg cccctcagca ggccctgagc ctgctgcaga 5280 gagtgcggag acacgccgag ggcaccttta cctccgacgt gtccagctac ctggaaggcc 5340 aggccgccaa agagtttatc gcctggctcg tgaagggcag aggctgatga ggtac 5395 <210> 60 <211> 5428 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> polyA_signal <222> (56)..(182) <223> Rabbit\globin\poly\A <220> <221> repeat_region <222> (271)..(400) <223> 3' ITR (complement) <220> <221> rep_origin <222> (577)..(1032) <223> F1 ori (Complement) <220> <221> misc_feature <222> (1163)..(2020) <223> AP(R) <220> <221> rep_origin <222> (2194)..(2784) <223> Origin\of\replication <220> <221> misc_feature <222> (3149)..(3800) <223> CMV\IE\promoter <220> <221> repeat_region <222> (3222)..(3351) <223> 5' ITR <220> <221> misc_feature <222> (3803)..(4084) <223> CB promoter <220> <221> TATA_signal <222> (4057)..(4060) <220> <221> Intron <222> (4179)..(5151) <223> chicken\beta-actin\intron <220> <221> misc_feature <222> (5163)..(5312) <223> leader <220> <221> misc_feature <222> (5313)..(5324) <223> furin site <220> <221> misc_feature <222> (5325)..(5417) <223> GLP1 <400> 60 ctctagagtc gacccgggcg gcctcgagga cggggtgaac tacgcctgag gatccgatct 60 ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 120 ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 180 cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 240 agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 300 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 360 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac 420 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 480 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 540 cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 600 gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 660 ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 720 ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 780 aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 840 gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 900 cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 960 attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 1020 cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 1080 tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 1140 ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 1200 ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 1260 tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 1320 gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 1380 gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 1440 acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 1500 tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 1560 caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 1620 gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 1680 cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 1740 tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 1800 agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 1860 tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 1920 ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 1980 acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 2040 ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 2100 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 2160 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 2220 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 2280 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 2340 tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 2400 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 2460 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 2520 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 2580 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 2640 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 2700 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 2760 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 2820 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 2880 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 2940 gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 3000 gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 3060 caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct 3120 tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta 3180 tgaccatgat tacgccagat ttaattaagg ccttaattag gctgcgcgct cgctcgctca 3240 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 3300 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 3360 tgattaaccc gccatgctac ttatctacca gggtaatggg gatcctctag aactatagct 3420 agtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 3480 agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 3540 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 3600 gggactttcc attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta 3660 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 3720 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 3780 gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 3840 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 3900 gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 3960 cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 4020 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 4080 gcggggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 4140 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 4200 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 4260 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 4320 cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 4380 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 4440 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 4500 gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 4560 tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 4620 ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 4680 gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 4740 ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 4800 gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 4860 gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 4920 gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 4980 gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 5040 gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 5100 agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgcca 5160 ccatgggagc cgatgctaga cctctgggag tgcgggctgg cggcggagga agaggcgctg 5220 caagacctgg cacaagcagc agagcactgc ctccacctct gccccctctg agctttctcc 5280 tgctgctgct ggctgcccct ggcgctagag ccagaaaaag aaggcacgcc gagggcacct 5340 tcaccagcga cgtgtccagc tacctggaag gccaggccgc caaagagttt atcgcctggc 5400 tcgtgaaggg cagaggctga tgaggtac 5428 <210> 61 <211> 5338 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> polyA_signal <222> (243)..(369) <223> Rabbit\globin\poly\A <220> <221> repeat_region <222> (458)..(587) <223> 3' ITR (complement) <220> <221> rep_origin <222> (764)..(1219) <223> f1 ori (complement) <220> <221> misc_feature <222> (1350)..(2270) <223> AP(R) <220> <221> rep_origin <222> (2381)..(2969) <223> origin of replication <220> <221> repeat_region <222> (3409)..(3538) <223> 5' ITR <220> <221> misc_feature <222> (3606)..(3987) <223> CMV\IE\promoter <220> <221> promoter <222> (3990)..(4271) <223> CB promoter <220> <221> TATA_signal <222> (4244)..(4247) <220> <221> Intron <222> (4366)..(5338) <223> chicken\beta-actin\intron <400> 61 aattcgccac catgaaatgg gtcaccttca tcagcctgct gctgctgttc agcagcgcct 60 acagcagagg cgtgaccaga aggcacgccg agggcacctt taccagcgac gtgtccagct 120 acctggaagg ccaggccgcc aaagagttta tcgcctggct cgtgaagggc aggggctgat 180 gaggtacctc tagagtcgac ccgggcggcc tcgaggacgg ggtgaactac gcctgaggat 240 ccgatctttt tccctctgcc aaaaattatg gggacatcat gaagcccctt gagcatctga 300 cttctggcta ataaaggaaa tttattttca ttgcaatagt gtgttggaat tttttgtgtc 360 tctcactcgg aagcaattcg ttgatctgaa tttcgaccac ccataatacc cattaccctg 420 gtagataagt agcatggcgg gttaatcatt aactacaagg aacccctagt gatggagttg 480 gccactccct ctctgcgcgc tcgctcgctc actgaggccg ggcgaccaaa ggtcgcccga 540 cgcccgggct ttgcccgggc ggcctcagtg agcgagcgag cgcgcagcct taattaacct 600 aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 660 aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 720 gatcgccctt cccaacagtt gcgcagcctg aatggcgaat gggacgcgcc ctgtagcggc 780 gcattaagcg cggcgggtgt ggtggttacg cgcagcgtga ccgctacact tgccagcgcc 840 ctagcgcccg ctcctttcgc tttcttccct tcctttctcg ccacgttcgc cggctttccc 900 cgtcaagctc taaatcgggg gctcccttta gggttccgat ttagtgcttt acggcacctc 960 gaccccaaaa aacttgatta gggtgatggt tcacgtagtg ggccatcgcc ctgatagacg 1020 gtttttcgcc ctttgacgtt ggagtccacg ttctttaata gtggactctt gttccaaact 1080 ggaacaacac tcaaccctat ctcggtctat tcttttgatt tataagggat tttgccgatt 1140 tcggcctatt ggttaaaaaa tgagctgatt taacaaaaat ttaacgcgaa ttttaacaaa 1200 atattaacgc ttacaattta ggtggcactt ttcggggaaa tgtgcgcgga acccctattt 1260 gtttattttt ctaaatacat tcaaatatgt atccgctcat gagacaataa ccctgataaa 1320 tgcttcaata atattgaaaa aggaagagta tgagtattca acatttccgt gtcgccctta 1380 ttcccttttt tgcggcattt tgccttcctg tttttgctca cccagaaacg ctggtgaaag 1440 taaaagatgc tgaagatcag ttgggtgcac gagtgggtta catcgaactg gatctcaaca 1500 gcggtaagat ccttgagagt tttcgccccg aagaacgttt tccaatgatg agcactttta 1560 aagttctgct atgtggcgcg gtattatccc gtattgacgc cgggcaagag caactcggtc 1620 gccgcataca ctattctcag aatgacttgg ttgagtactc accagtcaca gaaaagcatc 1680 ttacggatgg catgacagta agagaattat gcagtgctgc cataaccatg agtgataaca 1740 ctgcggccaa cttacttctg acaacgatcg gaggaccgaa ggagctaacc gcttttttgc 1800 acaacatggg ggatcatgta actcgccttg atcgttggga accggagctg aatgaagcca 1860 taccaaacga cgagcgtgac accacgatgc ctgtagcaat ggcaacaacg ttgcgcaaac 1920 tattaactgg cgaactactt actctagctt cccggcaaca attaatagac tggatggagg 1980 cggataaagt tgcaggacca cttctgcgct cggcccttcc ggctggctgg tttattgctg 2040 ataaatctgg agccggtgag cgtgggtctc gcggtatcat tgcagcactg gggccagatg 2100 gtaagccctc ccgtatcgta gttatctaca cgacggggag tcaggcaact atggatgaac 2160 gaaatagaca gatcgctgag ataggtgcct cactgattaa gcattggtaa ctgtcagacc 2220 aagtttactc atatatactt tagattgatt taaaacttca tttttaattt aaaaggatct 2280 aggtgaagat cctttttgat aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc 2340 actgagcgtc agaccccgta gaaaagatca aaggatcttc ttgagatcct ttttttctgc 2400 gcgtaatctg ctgcttgcaa acaaaaaaac caccgctacc agcggtggtt tgtttgccgg 2460 atcaagagct accaactctt tttccgaagg taactggctt cagcagagcg cagataccaa 2520 atactgttct tctagtgtag ccgtagttag gccaccactt caagaactct gtagcaccgc 2580 ctacatacct cgctctgcta atcctgttac cagtggctgc tgccagtggc gataagtcgt 2640 gtcttaccgg gttggactca agacgatagt taccggataa ggcgcagcgg tcgggctgaa 2700 cggggggttc gtgcacacag cccagcttgg agcgaacgac ctacaccgaa ctgagatacc 2760 tacagcgtga gctatgagaa agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc 2820 cggtaagcgg cagggtcgga acaggagagc gcacgaggga gcttccaggg ggaaacgcct 2880 ggtatcttta tagtcctgtc gggtttcgcc acctctgact tgagcgtcga tttttgtgat 2940 gctcgtcagg ggggcggagc ctatggaaaa acgccagcaa cgcggccttt ttacggttcc 3000 tggccttttg ctggcctttt gctcacatgt tctttcctgc gttatcccct gattctgtgg 3060 ataaccgtat taccgccttt gagtgagctg ataccgctcg ccgcagccga acgaccgagc 3120 gcagcgagtc agtgagcgag gaagcggaag agcgcccaat acgcaaaccg cctctccccg 3180 cgcgttggcc gattcattaa tgcagctggc acgacaggtt tcccgactgg aaagcgggca 3240 gtgagcgcaa cgcaattaat gtgagttagc tcactcatta ggcaccccag gctttacact 3300 ttatgcttcc ggctcgtatg ttgtgtggaa ttgtgagcgg ataacaattt cacacaggaa 3360 acagctatga ccatgattac gccagattta attaaggcct taattaggct gcgcgctcgc 3420 tcgctcactg aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc 3480 tcagtgagcg agcgagcgcg cagagaggga gtggccaact ccatcactag gggttccttg 3540 tagttaatga ttaacccgcc atgctactta tctaccaggg taatggggat cctctagaac 3600 tatagctagt cgacattgat tattgactag ttattaatag taatcaatta cggggtcatt 3660 agttcatagc ccatatatgg agttccgcgt tacataactt acggtaaatg gcccgcctgg 3720 ctgaccgccc aacgaccccc gcccattgac gtcaataatg acgtatgttc ccatagtaac 3780 gccaataggg actttccatt gacgtcaatg ggtggactat ttacggtaaa ctgcccactt 3840 ggcagtacat caagtgtatc atatgccaag tacgccccct attgacgtca atgacggtaa 3900 atggcccgcc tggcattatg cccagtacat gaccttatgg gactttccta cttggcagta 3960 catctacgta ttagtcatcg ctattaccat ggtcgaggtg agccccacgt tctgcttcac 4020 tctccccatc tcccccccct ccccaccccc aattttgtat ttatttattt tttaattatt 4080 ttgtgcagcg atgggggcgg gggggggggg ggggcgcgcg ccaggcgggg cggggcgggg 4140 cgaggggcgg ggcggggcga ggcggagagg tgcggcggca gccaatcaga gcggcgcgct 4200 ccgaaagttt ccttttatgg cgaggcggcg gcggcggcgg ccctataaaa agcgaagcgc 4260 gcggcgggcg gggagtcgct gcgacgctgc cttcgccccg tgccccgctc cgccgccgcc 4320 tcgcgccgcc cgccccggct ctgactgacc gcgttactcc cacaggtgag cgggcgggac 4380 ggcccttctc ctccgggctg taattagcgc ttggtttaat gacggcttgt ttcttttctg 4440 tggctgcgtg aaagccttga ggggctccgg gagggccctt tgtgcggggg gagcggctcg 4500 gggggtgcgt gcgtgtgtgt gtgcgtgggg agcgccgcgt gcggctccgc gctgcccggc 4560 ggctgtgagc gctgcgggcg cggcgcgggg ctttgtgcgc tccgcagtgt gcgcgagggg 4620 agcgcggccg ggggcggtgc cccgcggtgc ggggggggct gcgaggggaa caaaggctgc 4680 gtgcggggtg tgtgcgtggg ggggtgagca gggggtgtgg gcgcgtcggt cgggctgcaa 4740 ccccccctgc acccccctcc ccgagttgct gagcacggcc cggcttcggg tgcggggctc 4800 cgtacggggc gtggcgcggg gctcgccgtg ccgggcgggg ggtggcggca ggtgggggtg 4860 ccgggcgggg cggggccgcc tcgggccggg gagggctcgg gggaggggcg cggcggcccc 4920 cggagcgccg gcggctgtcg aggcgcggcg agccgcagcc attgcctttt atggtaatcg 4980 tgcgagaggg cgcagggact tcctttgtcc caaatctgtg cggagccgaa atctgggagg 5040 cgccgccgca ccccctctag cgggcgcggg gcgaagcggt gcggcgccgg caggaaggaa 5100 atgggcgggg agggccttcg tgcgtcgccg cgccgccgtc cccttctccc tctccagcct 5160 cggggctgtc cgcgggggga cggctgcctt cgggggggac ggggcagggc ggggttcggc 5220 ttctggcgtg tgaccggcgg ctctagagcc tctgctaacc atgttcatgc cttcttcttt 5280 ttcctacagc tcctgggcaa cgtgctggtt attgtgctgt ctcatcattt tggcaaag 5338 <210> 62 <211> 5344 <212> DNA <213> Artificial Sequence <220> <223> constructed sequence <220> <221> polyA_signal <222> (56)..(182) <223> Rabbit\globin\poly\A <220> <221> repeat_region <222> (271)..(400) <223> 3' ITR (complement) <220> <221> rep_origin <222> (577)..(1032) <223> f1 ori (complement) <220> <221> misc_feature <222> (1163)..(2020) <223> AP(R) <220> <221> misc_feature <222> (2194)..(2782) <223> origin of replication <220> <221> repeat_region <222> (3222)..(3351) <223> 5' ITR <220> <221> misc_feature <222> (3419)..(3800) <223> CMV\IE\promoter <220> <221> promoter <222> (3803)..(4084) <223> CB promoter <220> <221> TATA_signal <222> (4057)..(4060) <220> <221> Intron <222> (4197)..(5151) <223> chicken\beta-actin\intron <220> <221> misc_feature <222> (5163)..(5228) <223> leader <220> <221> misc_feature <222> (5229)..(5240) <223> furin site <220> <221> misc_feature <222> (5241)..(5333) <223> GLP1 <400> 62 ctctagagtc gacccgggcg gcctcgagga cggggtgaac tacgcctgag gatccgatct 60 ttttccctct gccaaaaatt atggggacat catgaagccc cttgagcatc tgacttctgg 120 ctaataaagg aaatttattt tcattgcaat agtgtgttgg aattttttgt gtctctcact 180 cggaagcaat tcgttgatct gaatttcgac cacccataat acccattacc ctggtagata 240 agtagcatgg cgggttaatc attaactaca aggaacccct agtgatggag ttggccactc 300 cctctctgcg cgctcgctcg ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg 360 gctttgcccg ggcggcctca gtgagcgagc gagcgcgcag ccttaattaa cctaattcac 420 tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg cgttacccaa cttaatcgcc 480 ttgcagcaca tccccctttc gccagctggc gtaatagcga agaggcccgc accgatcgcc 540 cttcccaaca gttgcgcagc ctgaatggcg aatgggacgc gccctgtagc ggcgcattaa 600 gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac acttgccagc gccctagcgc 660 ccgctccttt cgctttcttc ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag 720 ctctaaatcg ggggctccct ttagggttcc gatttagtgc tttacggcac ctcgacccca 780 aaaaacttga ttagggtgat ggttcacgta gtgggccatc gccctgatag acggtttttc 840 gccctttgac gttggagtcc acgttcttta atagtggact cttgttccaa actggaacaa 900 cactcaaccc tatctcggtc tattcttttg atttataagg gattttgccg atttcggcct 960 attggttaaa aaatgagctg atttaacaaa aatttaacgc gaattttaac aaaatattaa 1020 cgcttacaat ttaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt 1080 tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca 1140 ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt 1200 ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga 1260 tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa 1320 gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct 1380 gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat 1440 acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga 1500 tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc 1560 caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat 1620 gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa 1680 cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac 1740 tggcgaacta cttactctag cttcccggca acaattaata gactggatgg aggcggataa 1800 agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc 1860 tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc 1920 ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag 1980 acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag accaagttta 2040 ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa 2100 gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc 2160 gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat 2220 ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga 2280 gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt 2340 tcttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata 2400 cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac 2460 cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg 2520 ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg 2580 tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag 2640 cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct 2700 ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc 2760 aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt 2820 ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg 2880 tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga 2940 gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg 3000 gccgattcat taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg 3060 caacgcaatt aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct 3120 tccggctcgt atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta 3180 tgaccatgat tacgccagat ttaattaagg ccttaattag gctgcgcgct cgctcgctca 3240 ctgaggccgc ccgggcaaag cccgggcgtc gggcgacctt tggtcgcccg gcctcagtga 3300 gcgagcgagc gcgcagagag ggagtggcca actccatcac taggggttcc ttgtagttaa 3360 tgattaaccc gccatgctac ttatctacca gggtaatggg gatcctctag aactatagct 3420 agtcgacatt gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat 3480 agcccatata tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg 3540 cccaacgacc cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata 3600 gggactttcc attgacgtca atgggtggac tatttacggt aaactgccca cttggcagta 3660 catcaagtgt atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc 3720 gcctggcatt atgcccagta catgacctta tgggactttc ctacttggca gtacatctac 3780 gtattagtca tcgctattac catggtcgag gtgagcccca cgttctgctt cactctcccc 3840 atctcccccc cctccccacc cccaattttg tatttattta ttttttaatt attttgtgca 3900 gcgatggggg cggggggggg gggggggcgc gcgccaggcg gggcggggcg gggcgagggg 3960 cggggcgggg cgaggcggag aggtgcggcg gcagccaatc agagcggcgc gctccgaaag 4020 tttcctttta tggcgaggcg gcggcggcgg cggccctata aaaagcgaag cgcgcggcgg 4080 gcggggagtc gctgcgacgc tgccttcgcc ccgtgccccg ctccgccgcc gcctcgcgcc 4140 gcccgccccg gctctgactg accgcgttac tcccacaggt gagcgggcgg gacggccctt 4200 ctcctccggg ctgtaattag cgcttggttt aatgacggct tgtttctttt ctgtggctgc 4260 gtgaaagcct tgaggggctc cgggagggcc ctttgtgcgg ggggagcggc tcggggggtg 4320 cgtgcgtgtg tgtgtgcgtg gggagcgccg cgtgcggctc cgcgctgccc ggcggctgtg 4380 agcgctgcgg gcgcggcgcg gggctttgtg cgctccgcag tgtgcgcgag gggagcgcgg 4440 ccgggggcgg tgccccgcgg tgcggggggg gctgcgaggg gaacaaaggc tgcgtgcggg 4500 gtgtgtgcgt gggggggtga gcagggggtg tgggcgcgtc ggtcgggctg caaccccccc 4560 tgcacccccc tccccgagtt gctgagcacg gcccggcttc gggtgcgggg ctccgtacgg 4620 ggcgtggcgc ggggctcgcc gtgccgggcg gggggtggcg gcaggtgggg gtgccgggcg 4680 gggcggggcc gcctcgggcc ggggagggct cgggggaggg gcgcggcggc ccccggagcg 4740 ccggcggctg tcgaggcgcg gcgagccgca gccattgcct tttatggtaa tcgtgcgaga 4800 gggcgcaggg acttcctttg tcccaaatct gtgcggagcc gaaatctggg aggcgccgcc 4860 gcaccccctc tagcgggcgc ggggcgaagc ggtgcggcgc cggcaggaag gaaatgggcg 4920 gggagggcct tcgtgcgtcg ccgcgccgcc gtccccttct ccctctccag cctcggggct 4980 gtccgcgggg ggacggctgc cttcgggggg gacggggcag ggcggggttc ggcttctggc 5040 gtgtgaccgg cggctctaga gcctctgcta accatgttca tgccttcttc tttttcctac 5100 agctcctggg caacgtgctg gttattgtgc tgtctcatca ttttggcaaa gaattcgcca 5160 ccatgaaatg ggtcaccttc atcagcctgc tgctgctgtt cagcagcgcc tacagcagag 5220 gcgtgaccag aagaaagaga cacgccgagg gcaccttcac cagcgacgtg tcctcttacc 5280 tggaaggcca ggccgccaaa gagtttatcg cctggctcgt gaagggcagg ggctgatgag 5340 gtac 5344

Claims (41)

  1. 당뇨병 치료에 유용한 바이러스 벡터에 있어서, 벡터는 프로펩티드 및 GLP-1(7-37)을 인코딩하는 서열, 및 숙주 세포에서 프로펩티드 및 GLP-1(7-37)의 발현을 지시하는 발현 제어 서열을 포함하는 핵산 분자를 포함하며, 발현되었을 때, GLP-1(7-37)의 N-말단 아미노산은 프로펩티드의 C-말단 아미노산의 바로 뒤에 있고, 프로펩티드는 인자 II 리더 서열 및 퓨린 절단 부위를 포함하는 응고 인자 II 프로펩티드인, 바이러스 벡터.
  2. 제1 항에 있어서, 프로펩티드는 최소한 40개의 아미노산인 것을 특징으로 하는 바이러스 벡터.
  3. 제1 항에 있어서, GLP-1(7-37)은 서열 번호: 1인 것을 특징으로 하는 바이러스 벡터.
  4. 제1 항에 있어서, GLP-1(7-37)을 인코딩하는 핵산 서열은 서열 번호: 2를 포함하는 것을 특징으로 하는 바이러스 벡터.
  5. 제1 항에 있어서, 인자 II 리더 서열은 고양이 인자 II 리더 서열인 것을 특징으로 하는 바이러스 벡터.
  6. 제5 항에 있어서, 프로펩티드는 서열 번호: 24의 아미노산 1-43인 것을 특징으로 하는 바이러스 벡터.
  7. 제1 항에 있어서, 인코드된 프로펩티드 및 GLP-1(7-37)은 서열 번호: 25를 포함하는 것을 특징으로 하는 바이러스 벡터.
  8. 제1 항에 있어서, 인자 II 리더 서열은 개의 인자 II 리더 서열인 것을 특징으로 하는 바이러스 벡터.
  9. 제8 항에 있어서, 프로펩티드는 서열 번호: 26의 아미노산 1-41인 것을 특징으로 하는 바이러스 벡터.
  10. 제1 항에 있어서, 인코드된 프로펩티드 및 GLP-1(7-37)은 서열 번호: 27을 포함하는 것을 특징으로 하는 바이러스 벡터.
  11. 제1 항에 있어서, 인자 II 리더 서열은 인간 인자 II 리더 서열인 것을 특징으로 하는 바이러스 벡터.
  12. 제11 항에 있어서, 프로펩티드는 서열 번호: 28의 아미노산 1-43인 것을 특징으로 하는 바이러스 벡터.
  13. 제1 항에 있어서, 인코드된 프로펩티드 및 GLP-1(7-37)은 서열 번호: 29를 포함하는 것을 특징으로 하는 바이러스 벡터.
  14. 제1 항에 있어서, 발현 제어 서열은 프로모터를 포함하는 것을 특징으로 하는 바이러스 벡터.
  15. 제14 항에 있어서, 프로모터는 간-특이적 프로모터인 것을 특징으로 하는 바이러스 벡터.
  16. 제14 항에 있어서, 프로모터는 CB7 프로모터 또는 티록신-결합 글로불린 (TBG) 프로모터인 것을 특징으로 하는 바이러스 벡터.
  17. 제1 항에 있어서, 벡터는 아데노-연합된 바이러스 (AAV)인 것을 특징으로 하는 바이러스 벡터.
  18. 제17 항에 있어서, AAV는 AAV8 캡시드, AAVrh64R1 캡시드, AAV9 캡시드, AAVhu.37 캡시드, 또는 AAVrh10 캡시드인 것을 특징으로 하는 바이러스 벡터.
  19. 약학적으로 수용가능한 운반체와 제1 항 내지 제18 항 중 어느 한 항의 바이러스 벡터를 포함하는 당뇨병의 치료에 사용하기 위한 약학 조성물.
  20. 삭제
  21. 삭제
  22. 삭제
  23. 삭제
  24. 삭제
  25. 삭제
  26. 삭제
  27. 삭제
  28. 삭제
  29. 삭제
  30. 삭제
  31. 삭제
  32. 삭제
  33. 삭제
  34. 삭제
  35. 삭제
  36. 삭제
  37. 삭제
  38. 삭제
  39. 삭제
  40. 삭제
  41. 삭제
KR1020187005975A 2015-08-06 2016-08-05 Glp-1 및 대사성 질환 치료용 조성물에서 이의 용도 Active KR102745604B1 (ko)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562201803P 2015-08-06 2015-08-06
US62/201,803 2015-08-06
US201662356289P 2016-06-29 2016-06-29
US62/356,289 2016-06-29
PCT/US2016/045696 WO2017024198A1 (en) 2015-08-06 2016-08-05 Glp-1 and use thereof in compositions for treating metabolic diseases

Publications (2)

Publication Number Publication Date
KR20180057609A KR20180057609A (ko) 2018-05-30
KR102745604B1 true KR102745604B1 (ko) 2024-12-23

Family

ID=57943703

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187005975A Active KR102745604B1 (ko) 2015-08-06 2016-08-05 Glp-1 및 대사성 질환 치료용 조성물에서 이의 용도

Country Status (9)

Country Link
US (1) US12221615B2 (ko)
EP (1) EP3332012A4 (ko)
JP (1) JP6978407B2 (ko)
KR (1) KR102745604B1 (ko)
CN (1) CN108368521A (ko)
AU (2) AU2016302335B2 (ko)
CA (1) CA2994552A1 (ko)
HK (1) HK1256909A1 (ko)
WO (1) WO2017024198A1 (ko)

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BR112017009497A2 (pt) 2014-11-05 2018-02-06 Voyager Therapeutics, Inc. polinucleotídeos de aadc para o tratamento da doença de parkinson
US12221615B2 (en) 2015-08-06 2025-02-11 The Trustees Of The University Of Pennsylvania GLP-1 and use thereof in compositions for treating metabolic diseases
WO2017053732A2 (en) 2015-09-24 2017-03-30 The Trustees Of The University Of Pennsylvania Composition and method for treating complement-mediated disease
JOP20190269A1 (ar) 2017-06-15 2019-11-20 Voyager Therapeutics Inc بولي نوكليوتيدات aadc لعلاج مرض باركنسون
EP3676385A1 (en) 2017-07-06 2020-07-08 The Trustees of The University of Pennsylvania Aav9-mediated gene therapy for treating mucopolysaccharidosis type i
MX2020012077A (es) 2018-05-15 2021-03-09 Voyager Therapeutics Inc Composiciones y metodos para el tratamiento de la enfermedad de parkinson.
KR20210068068A (ko) 2018-09-28 2021-06-08 보이저 테라퓨틱스, 인크. 조작된 프로모터를 갖는 프라탁신 발현 구축물 및 그의 사용 방법
KR20210149803A (ko) * 2019-04-10 2021-12-09 유니버시티 오브 매사추세츠 인자 h 벡터 및 그의 용도
US20230372539A1 (en) * 2020-08-24 2023-11-23 The Trustees Of The University Of Pennsylvania Viral vectors encoding glp-1 receptor agonist fusions and uses thereof in treating metabolic diseases
WO2022046809A1 (en) * 2020-08-24 2022-03-03 The Trustees Of The University Of Pennsylvania Viral vector encoding glp-1 receptor agonist fusions and uses thereof in treating metabolic diseases in felines
AU2021373793A1 (en) * 2020-11-04 2023-06-08 The Trustees Of The University Of Pennsylvania Viral vectors encoding canine insulin for treatment of metabolic diseases in dogs
JP2024505257A (ja) 2021-02-01 2024-02-05 レジェンクスバイオ インコーポレーテッド 神経セロイドリポフスチン症の遺伝子治療
CN113416683B (zh) * 2021-06-01 2023-05-02 南昌大学 一种大肠杆菌Nissle 1917基因工程菌及其制备方法和应用
AU2023227894A1 (en) * 2022-03-03 2024-09-19 The Trustees Of The University Of Pennsylvania Aav vectors for delivery of glp-1 receptor agonist fusions
WO2024071382A1 (ja) * 2022-09-30 2024-04-04 株式会社セルージョン Glp-1分泌機能を有する多能性幹細胞及び幹細胞から分化誘導された細胞

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003014318A2 (en) 2001-08-08 2003-02-20 Genzyme Corporation Methods for treating diabetes and other blood sugar disorders
WO2003030946A1 (en) 2001-10-09 2003-04-17 Novartis Ag Regulation of insulin production
WO2014052789A1 (en) 2012-09-28 2014-04-03 The University Of North Carolina At Chapel Hill Aav vectors targeted to oligodendrocytes

Family Cites Families (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3676007A (en) 1971-02-09 1972-07-11 Kiess Instr Inc Direct reading filter photometer
US5139941A (en) 1985-10-31 1992-08-18 University Of Florida Research Foundation, Inc. AAV transduction vectors
DE3750402T3 (de) * 1986-05-05 1997-04-10 Gen Hospital Corp Insulinotropes hormon.
US5436146A (en) 1989-09-07 1995-07-25 The Trustees Of Princeton University Helper-free stocks of recombinant adeno-associated virus vectors
US6268213B1 (en) 1992-06-03 2001-07-31 Richard Jude Samulski Adeno-associated virus vector and cis-acting regulatory and promoter elements capable of expressing at least one gene and method of using same for gene therapy
US5869305A (en) 1992-12-04 1999-02-09 The University Of Pittsburgh Recombinant viral vector system
US5478745A (en) 1992-12-04 1995-12-26 University Of Pittsburgh Recombinant viral vector system
US6204059B1 (en) 1994-06-30 2001-03-20 University Of Pittsburgh AAV capsid vehicles for molecular transfer
US6093570A (en) 1995-06-07 2000-07-25 The University Of North Carolina At Chapel Hill Helper virus-free AAV production
US5741683A (en) 1995-06-07 1998-04-21 The Research Foundation Of State University Of New York In vitro packaging of adeno-associated virus DNA
EP1007637B1 (en) 1997-04-14 2004-06-30 Cell Genesys, Inc. Methods for increasing the efficiency of recombinant aav product
WO1999061643A1 (en) 1998-05-27 1999-12-02 University Of Florida Method of preparing recombinant adeno-associated virus compositions by using an iodixananol gradient
US6221349B1 (en) * 1998-10-20 2001-04-24 Avigen, Inc. Adeno-associated vectors for expression of factor VIII by target cells
DE69941905D1 (de) 1998-11-10 2010-02-25 Univ North Carolina Virusvektoren und verfahren für ihre herstellung und verabreichung.
ATE403715T1 (de) 1999-08-09 2008-08-15 Targeted Genetics Corp Erhöhung der expression einer einzelsträngigen, heterologen nukleotidsequenz von einem rekombinanten viralen vektor durch ausgestaltung der sequenz in einer art und weise, dass basenpaarungen innerhalb der sequenz entstehen
AU2001274809A1 (en) * 2000-04-12 2001-10-30 Human Genome Sciences, Inc. Albumin fusion proteins
NZ522841A (en) 2000-06-01 2004-12-24 Univ North Carolina Surgically implantable matrix with a viral vector dried onto it for controlled release of recombinant parvovirus vectors
US20040143104A1 (en) * 2001-08-08 2004-07-22 Wadsworth Samuel C. Methods of treating diabetes and other blood sugar disorders
US20030092013A1 (en) * 2001-08-16 2003-05-15 Vitivity, Inc. Diagnosis and treatment of vascular disease
CA2465868C (en) 2001-11-13 2017-02-28 The Trustees Of The University Of Pennsylvania A method of detecting and/or identifying adeno-associated virus (aav) sequences and isolating novel sequences identified thereby
AU2002360291A1 (en) 2001-12-17 2003-06-30 The Trustees Of The University Of Pennsylvania Adeno-associated virus (aav) serotype 8 sequences
US20070015238A1 (en) 2002-06-05 2007-01-18 Snyder Richard O Production of pseudotyped recombinant AAV virions
CN102174574B (zh) 2003-09-30 2016-08-03 宾夕法尼亚大学托管会 腺伴随病毒(aav)进化支、序列、含有这些序列的载体及它们的应用
WO2005062881A2 (en) * 2003-12-24 2005-07-14 Transgenrx, Inc. Gene therapy using transposon-based vectors
CN101203613B (zh) 2005-04-07 2012-12-12 宾夕法尼亚大学托管会 增强腺相关病毒载体功能的方法
EP1777906A1 (en) 2005-06-09 2007-04-25 Matsushita Electric Industrial Co., Ltd. Amplitude error compensating apparatus and orthogonality error compensating apparatus
WO2007120542A2 (en) 2006-03-30 2007-10-25 The Board Of Trustees Of The Leland Stanford Junior University Aav capsid library and aav capsid proteins
US8198421B2 (en) * 2006-06-19 2012-06-12 Asklepios Biopharmaceutical, Inc. Modified factor VIII and factor IX genes and vectors for gene therapy
US8734809B2 (en) * 2009-05-28 2014-05-27 University Of Massachusetts AAV's and uses thereof
US9315825B2 (en) 2010-03-29 2016-04-19 The Trustees Of The University Of Pennsylvania Pharmacologically induced transgene ablation system
MX342858B (es) 2010-03-29 2016-10-13 The Trustees Of The Univ Of Pennsylvania * Sistema de ablacion transgenica inducida farmacologicamente.
CN102823026A (zh) * 2010-04-02 2012-12-12 波士顿电力公司 电池组安全技术
TWI557135B (zh) 2010-11-03 2016-11-11 介控生化科技公司 經修飾之第九因子多胜肽及其用途
US9511103B2 (en) 2011-04-20 2016-12-06 The United States Of America, As Represented By The Secretary, Department Of Health And Human Services AAV mediated exendin-4 gene transfer to salivary glands to protect subjects from diabetes or obesity
FR2977562B1 (fr) 2011-07-06 2016-12-23 Gaztransport Et Technigaz Cuve etanche et thermiquement isolante integree dans une structure porteuse
US20130143800A1 (en) * 2011-11-07 2013-06-06 Research Development Foundation Combination therapies to treat diabetes
CA2867235C (en) 2012-03-14 2021-11-09 Innovative Targeting Solutions Inc. Generating targeted sequence diversity in fusion proteins
WO2014052693A2 (en) * 2012-09-29 2014-04-03 The Trustees Of The University Of Pennsylvania Veterinary composition and methods for non-surgical neutering and castration
US9719106B2 (en) 2013-04-29 2017-08-01 The Trustees Of The University Of Pennsylvania Tissue preferential codon modified expression cassettes, vectors containing same, and uses thereof
US12221615B2 (en) 2015-08-06 2025-02-11 The Trustees Of The University Of Pennsylvania GLP-1 and use thereof in compositions for treating metabolic diseases
WO2018009921A1 (en) 2016-07-08 2018-01-11 AskGene Pharma, Inc. Fusion protein comprising leptin and methods for producing and using the same
US20220064263A1 (en) 2018-12-27 2022-03-03 Kindred Biosciences, Inc. IGG FC Variants for Veterinary Use

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003014318A2 (en) 2001-08-08 2003-02-20 Genzyme Corporation Methods for treating diabetes and other blood sugar disorders
WO2003030946A1 (en) 2001-10-09 2003-04-17 Novartis Ag Regulation of insulin production
WO2014052789A1 (en) 2012-09-28 2014-04-03 The University Of North Carolina At Chapel Hill Aav vectors targeted to oligodendrocytes

Also Published As

Publication number Publication date
HK1256909A1 (zh) 2019-10-04
US12221615B2 (en) 2025-02-11
AU2022263552A1 (en) 2023-02-09
JP6978407B2 (ja) 2021-12-08
AU2016302335A1 (en) 2018-02-22
WO2017024198A1 (en) 2017-02-09
CN108368521A (zh) 2018-08-03
CA2994552A1 (en) 2017-02-09
NZ739568A (en) 2025-05-02
EP3332012A1 (en) 2018-06-13
US20180230488A1 (en) 2018-08-16
AU2016302335B2 (en) 2022-08-04
EP3332012A4 (en) 2019-01-16
KR20180057609A (ko) 2018-05-30
JP2018523477A (ja) 2018-08-23

Similar Documents

Publication Publication Date Title
KR102745604B1 (ko) Glp-1 및 대사성 질환 치료용 조성물에서 이의 용도
CN108753824B (zh) 用于治疗视网膜营养不良的病毒载体
AU2016229000B2 (en) Recombinant Glut1 adeno-associated viral vector constructs and related methods for restoring Glut1 expression
AU2016232146B2 (en) Optimized liver-specific expression systems for FVIII and FIX
KR102178322B1 (ko) 변형된 인자 ix, 및 세포, 기관 및 조직으로 유전자를 전달하기 위한 조성물, 방법 및 용도
AU2017330411B2 (en) AAV treatment of huntington&#39;s disease
AU2019261438B2 (en) Expression of FOXP3 in edited CD34+ cells
AU2018265531B2 (en) Gene therapy for neuronal ceroid lipofuscinoses
US6723551B2 (en) Production of adeno-associated virus in insect cells
CN108136048A (zh) 左旋多巴的系统合成和调节
AU2017248656A1 (en) Novel AAV8 mutant capsids and compositions containing same
KR20210092755A (ko) 신경원성 세로이드 리포푸신증에 대한 유전자 요법
AU2016315699B2 (en) AAV-EPO for treating companion animals
KR20210151785A (ko) 비바이러스성 dna 벡터 및 fviii 치료제 발현을 위한 이의 용도
CN114008209A (zh) Aav介导的枫糖尿症(msud)基因疗法
KR20210005178A (ko) X-연관 고 igm 증후군에서의 치료적 게놈 편집
KR20220023962A (ko) 파브리병을 치료하기 위한 조성물, 디바이스 및 방법
CN114846141B (zh) 一种分离的核酸分子及其应用
CN112203697A (zh) 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途
CN113061620B (zh) 一种t4噬菌体衣壳内腔目标蛋白包装系统及其构建方法和应用
CN117178057A (zh) 用于致心律失常性右心室心肌病的基因治疗
CN100345972C (zh) 分泌型大肠杆菌表达载体及其应用
CN108949691B (zh) 一种制备可实时检测间充质干细胞衰老的细胞模型的方法
CN114945673B (zh) 无限增殖化成肌细胞系及其用途
HK40024932B (en) Therapeutic agent comprising nucleic acid and car-modified immune cell and application thereof

Legal Events

Date Code Title Description
PA0105 International application

Patent event date: 20180228

Patent event code: PA01051R01D

Comment text: International Patent Application

PG1501 Laying open of application
A201 Request for examination
PA0201 Request for examination

Patent event code: PA02012R01D

Patent event date: 20210720

Comment text: Request for Examination of Application

E902 Notification of reason for refusal
PE0902 Notice of grounds for rejection

Comment text: Notification of reason for refusal

Patent event date: 20231120

Patent event code: PE09021S01D

GRNT Written decision to grant
PR0701 Registration of establishment

Comment text: Registration of Establishment

Patent event date: 20241218

Patent event code: PR07011E01D

PR1002 Payment of registration fee

Payment date: 20241219

End annual number: 3

Start annual number: 1

PG1601 Publication of registration