[go: up one dir, main page]

JP2023103421A - 製剤 - Google Patents

製剤 Download PDF

Info

Publication number
JP2023103421A
JP2023103421A JP2023082312A JP2023082312A JP2023103421A JP 2023103421 A JP2023103421 A JP 2023103421A JP 2023082312 A JP2023082312 A JP 2023082312A JP 2023082312 A JP2023082312 A JP 2023082312A JP 2023103421 A JP2023103421 A JP 2023103421A
Authority
JP
Japan
Prior art keywords
lipid
composition
mol
lnp
rna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2023082312A
Other languages
English (en)
Other versions
JP7645929B2 (ja
Inventor
ウッド,クリスティー,エム.
M Wood Kristy
ガードナー,ノア,ポール
P Gardner Noah
シャー,ルチ,ルドラプラサド
Rudraprasad Shah Ruchi
スカリー,スティーブン,エス.
S Scully Stephen
マジュゾウブ,ラムシー
Majzoub Ramsey
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intellia Therapeutics Inc
Original Assignee
Intellia Therapeutics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intellia Therapeutics Inc filed Critical Intellia Therapeutics Inc
Publication of JP2023103421A publication Critical patent/JP2023103421A/ja
Priority to JP2025033724A priority Critical patent/JP2025084955A/ja
Application granted granted Critical
Publication of JP7645929B2 publication Critical patent/JP7645929B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/48Preparations in capsules, e.g. of gelatin, of chocolate
    • A61K9/50Microcapsules having a gas, liquid or semi-solid filling; Solid microparticles or pellets surrounded by a distinct coating layer, e.g. coated microspheres, coated drug crystals
    • A61K9/51Nanocapsules; Nanoparticles
    • A61K9/5107Excipients; Inactive ingredients
    • A61K9/5123Organic compounds, e.g. fats, sugars
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/7088Compounds having three or more nucleosides or nucleotides
    • A61K31/7105Natural ribonucleic acids, i.e. containing only riboses attached to adenine, guanine, cytosine or uracil and having 3'-5' phosphodiester links
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0008Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'non-active' part of the composition delivered, e.g. wherein such 'non-active' part is not delivered simultaneously with the 'active' part of the composition
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/0012Galenical forms characterised by the site of application
    • A61K9/0019Injectable compositions; Intramuscular, intravenous, arterial, subcutaneous administration; Compositions to be administered through the skin in an invasive manner
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/10Dispersions; Emulsions
    • A61K9/127Synthetic bilayered vehicles, e.g. liposomes or liposomes with cholesterol as the only non-phosphatidyl surfactant
    • A61K9/1271Non-conventional liposomes, e.g. PEGylated liposomes or liposomes coated or grafted with polymers
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K9/00Medicinal preparations characterised by special physical form
    • A61K9/10Dispersions; Emulsions
    • A61K9/127Synthetic bilayered vehicles, e.g. liposomes or liposomes with cholesterol as the only non-phosphatidyl surfactant
    • A61K9/1271Non-conventional liposomes, e.g. PEGylated liposomes or liposomes coated or grafted with polymers
    • A61K9/1272Non-conventional liposomes, e.g. PEGylated liposomes or liposomes coated or grafted with polymers comprising non-phosphatidyl surfactants as bilayer-forming substances, e.g. cationic lipids or non-phosphatidyl liposomes coated or grafted with polymers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/88Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases [RNase]; Deoxyribonucleases [DNase]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/31Chemical structure of the backbone
    • C12N2310/315Phosphorothioates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/32Chemical structure of the sugar
    • C12N2310/3212'-O-R Modification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/34Spatial arrangement of the modifications
    • C12N2310/346Spatial arrangement of the modifications having a combination of backbone and sugar modifications
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/30Chemical structure
    • C12N2310/35Nature of the modification
    • C12N2310/352Nature of the modification linked to the nucleic acid via a carbon atom
    • C12N2310/3521Methyl
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2320/00Applications; Uses
    • C12N2320/30Special therapeutic applications
    • C12N2320/32Special delivery means, e.g. tissue-specific
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Epidemiology (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Dispersion Chemistry (AREA)
  • Dermatology (AREA)
  • Nanotechnology (AREA)
  • Optics & Photonics (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicinal Preparation (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

【課題】CRISPR/Cas遺伝子編集成分の送達に有用な特性を有する脂質ナノ粒子を用いる組成物を提供する。【解決手段】RNA成分と、約50~60モル%のアミン脂質と、約8~10モル%の中性脂質と、約2.5~4モル%のPEG脂質とを含み、ここで、前記脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約6である、脂質ナノ粒子(「LNP」)組成物とする。【選択図】なし

Description

本出願は、2017年9月29日に出願された米国仮特許出願第62/566,240号の優先権の利益を主張し、その記載内容は、参照によりその全体が本明細書に組み込まれる。
本明細書では、生物学的に活性な薬剤、特にRNA、mRNA、及びガイドRNAを送達するための特性が改善された脂質ナノ粒子(「LNP」)組成物を提供する。LNP組成物は、細胞膜を通過するRNA剤の送達を容易にし、特定の実施形態では、かかる組成物により、遺伝子編集用の成分及び組成物を生細胞内に導入する。
細胞への送達が特に困難な生物学的活性薬剤としては、タンパク質、核酸系薬物、及びその誘導体が挙げられる。有望な遺伝子編集技術を細胞内に送達するための組成物、例えば、CRISPR/Cas9システム成分を送達するための組成物は特に関心が持たれる。
現在、細胞の遺伝子をインビボで編集するための成分及びシステムは多数存在し、疾患の治療に非常に大きな可能性を提供している。CRISPR/Cas遺伝子編集システムは細胞内ではリボ核タンパク質複合体として活性である。RNA依存性ヌクレアーゼは細胞内のDNA配列に結合し、切断を導く。この部位特異的ヌクレアーゼ活性は、細胞自身の自然の過程を介した遺伝子編集を促進する。例えば、細胞は、二本鎖DNA切断(DSB)に応答して、非相同末端結合(「NHEJ」)として知られる誤りがちな修復過程を用いる。NHEJの際、細胞によりDNA末端でヌクレオチドの付加または除去が行われ、切断された配列から変化した配列が生じる場合がある。他の状況では、細胞は、相同組換え修復(「HDR」)または相同組換え(「HR」)という機構によりDSBを修復し、その際、内在性または外来性の鋳型を使用して切断の修復を導くことができる。これらの編集技術のいくつかでは、一本鎖切断(SSB)またはDSBを修復する細胞機構が利用される。
CRISPR/Casのタンパク質及び核酸成分を細胞、例えば、患者の細胞などに送達するための組成物が必要とされている。特に、CRISPRタンパク質成分をコードするmRNAを送達するための組成物、及びCRISPRガイドRNAを送達するための組成物は特に関心が持たれる。RNA成分を安定化させ送達することができる、インビトロ及びインビボでの送達に有用な特性を有する組成物も特に関心が持たれる。
本明細書では、有用な特性、特に、CRISPR/Cas遺伝子編集成分の送達に有用な特性を有する脂質ナノ粒子を用いる組成物を提供する。
特定の実施形態では、LNP組成物はRNA成分及び脂質成分を含み、ここで、かかる脂質成分は、(1)約50~60モル%のアミン脂質、(2)約8~10モル%の中性脂質、及び(3)約2.5~4モル%のPEG脂質を含み、脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約6である。さらなる実施形態では、LNP組成物は、(1)RNA成分、(2)約50~60モル%のアミン脂質、(3)約27~39.5モル%のヘルパー脂質、(4)約8~10モル%の中性脂質、及び(5)約2.5~4モル%のPEG脂質を含み、ここで、LNP組成物のN/P比は約5~7である。
他の実施形態では、LNP組成物はRNA成分及び脂質成分を含み、ここで、かかる脂質成分は、(1)約50~60モル%のアミン脂質、(2)約5~15モル%の中性脂質、及び(3)約2.5~4モル%のPEG脂質を含み、脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約3~10である。さらなる実施形態では、LNP組成物は、(1)約40~60モル%のアミン脂質、(2)約5~15モル%の中性脂質、及び(3)約2.5~4モル%のPEG脂質が含まれる脂質成分を含み、ここで、かかる脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約6である。別の実施形態では、LNP組成物は、(1)約50~60モル%のアミン脂質、(2)約5~15モル%の中性脂質、及び(3)約1.5~10モル%のPEG脂質が含まれる脂質成分を含み、ここで、かかる脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約6である。
いくつかの実施形態では、LNP組成物はRNA成分及び脂質成分を含み、ここで、かかる脂質成分は、(1)約40~60モル%のアミン脂質、(2)約0~5モル%の中性脂質、例えば、リン脂質、及び(3)約1.5~10モル%のPEG脂質を含み、脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約3~10である。いくつかの実施形態では、LNP組成物はRNA成分及び脂質成分を含み、ここで、かかる脂質成分は、(1)約40~60モル%のアミン脂質、(2)約1モル%未満の中性脂質、例えば、リン脂質、及び(3)約1.5~10モル%のPEG脂質を含み、脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約3~10である。特定の実施形態では、LNP組成物は中性脂質を本質的に含まない。いくつかの実施形態では、LNP組成物はRNA成分及び脂質成分を含み、ここで、脂質成分は、(1)約40~60モル%のアミン脂質、及び(2)約1.5~10モル%のPEG脂質を含み、脂質成分の残部はヘルパー脂質であり、LNP組成物のN/P比は約3~10であり、かつ、LNP組成物は中性脂質、例えば、リン脂質を含まない。特定の実施形態では、LNP組成物は中性リン脂質を本質的に含まないかまたは含まない。特定の実施形態では、LNP組成物は中性脂質、例えば、リン脂質を本質的に含まないかまたは含まない。
特定の実施形態では、RNA成分は、RNA誘導型DNA結合因子(例えば、Casヌクレアーゼまたはクラス2Casヌクレアーゼ)などのmRNAを含む。特定の実施形態では、RNA成分はgRNAを含む。
CRISPR/Cas遺伝子編集成分であるCas9 mRNA及びgRNAをLNP組成物に入れて送達した後のマウス肝臓において達成されたTTR遺伝子編集の割合を示し、1mpk(図1A))または0.5mpk(図1B)の単回投与の場合を示す。 Cas9 mRNA及びgRNAを含むLNP組成物の粒子分布データを示す。 LNP組成物の物理化学的性質を示し、対数で表す組成物のモル質量差(図3A)及び組成物の分子量測定値の平均(図3B)を比較する。 図3のLNP組成物を分析する、多分散度計算を図4Aに、またBurchard-Stockmeyer分析を図4Bに示す。 PEG脂質濃度を高めたLNP組成物がラットにおける単回投与後に及ぼす血清TTRノックダウン、肝臓での遺伝子編集、及びサイトカインMCP-1レベルに対する効果を評価する実験結果を記載する。図5Aは血清TTRレベルをグラフで表し、図5Bは肝臓試料での編集率をグラフで表し、図5CはMCP-1レベルをpg/mL単位で示している。 LNP組成物では各種PEG脂質で遺伝子編集効力が維持されることを示す(血清TTRレベル(図6A及び図6B)及び編集率(図6C)により測定)。 図6-1の続きである。 マウスにおいて、リピドA類似体は、単回投与後の肝臓での編集率(%)で測定した場合に、LNP組成物中の遺伝子編集カーゴを効果的に送達することを示す。 図7-1の続きである。 図7-2の続きである。 図7-3の続きである。 カニクイザル初代肝細胞における各種LNP組成物での編集率の用量反応曲線を示す。 図8-1の続きである。 図9A及び図9Bは、gRNAとmRNAの比をさまざまに変えた場合のマウスにおける単回投与後の血清TTR及び編集率についての結果を示し、図9C及び図9Dは、Cas9 mRNAの量は一定のままgRNAをさまざまに変えた場合のマウスにおける単回投与後の肝臓での血清TTR及び編集率についての結果を示す。 図9-1の続きである。 図10A及び図10Bは、中性脂質を用いたLNP組成物及び中性脂質を用いないLNP組成物を投与した後の血清TTR及び肝臓編集の結果を示す。
本開示は、細胞に送達するためのCRISPR/Cas成分RNA(「カーゴ」)などのRNAの脂質ナノ粒子(LNP)組成物の実施形態及びそれらの使用方法を提供する。LNP組成物は、従来の送達技術と比較して改善された特性を示し得る。LNP組成物は、本明細書で定義されるようなRNA成分及び脂質成分を含有してよい。特定の実施形態では、RNA成分には、クラス2CasヌクレアーゼなどのCasヌクレアーゼが含まれる。特定の実施形態では、カーゴまたはRNA成分には、クラス2CasヌクレアーゼをコードするmRNA、及びガイドRNAまたはガイドRNAをコードする核酸が含まれる。遺伝子編集方法及び工学的に操作された細胞の作製方法も提供される。
CRISPR/Casカーゴ
LNP製剤を介して送達されるCRISPR/Casカーゴには目的タンパク質をコードするmRNA分子が含まれてよい。例えば、緑色蛍光タンパク質(GFP)のようなタンパク質とRNA誘導型DNA結合因子とを発現させるためのmRNA、またはCasヌクレアーゼが含まれる。Cas9タンパク質の細胞内発現を可能にするCasヌクレアーゼmRNA、例えば、クラス2CasヌクレアーゼmRNAなどを含むLNP組成物を提供する。さらに、カーゴは、ガイドRNAまたはガイドRNAをコードする核酸を1つ以上含有してよい。組成物中に例えば、修復または組換えなどのための鋳型核酸も含まれてよく、または鋳型核酸を本明細書に記載する方法において使用してよい。
「mRNA」とは、ポリペプチドに翻訳され得る(すなわち、リボソーム及びアミノアシル化tRNAによる翻訳のための基質として使用され得る)オープンリーディングフレームを含むポリヌクレオチドを指す。mRNAは、リボース残基またはその類似体、例えば、2’-メトキシリボース残基など、リン酸塩-糖骨格を含むことができる。いくつかの実施形態では、mRNAリン酸塩-糖骨格の糖は本質的にリボース残基、2’-メトキシリボース残基、またはその組み合わせからなる。一般に、mRNAは実質的な量のチミジン残基を含有しない(例えば、チミジン残基が0であるかまたは30、20、10、5、4、3、もしくは2より少ない、あるいはチミジン含量が10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、4%未満、3%未満、2%未満、1%未満、0.5%未満、0.2%未満、または0.1%未満である)。mRNAは、そのウリジンの位置のうち一部または全部において修飾ウリジンを含有することができる。
CRISPR/Casヌクレアーゼ系
開示される製剤の成分の一つは、RNA誘導型DNA結合因子、例えば、CasヌクレアーゼなどをコードするmRNAである。
本明細書で使用する場合、「RNA誘導型DNA結合因子」とは、RNA及びDNA結合活性を有するポリペプチドもしくはポリペプチドの複合体、またはそのような複合体のDNA結合サブユニットを意味し、ここで、DNA結合活性は配列特異的であり、RNAの配列に依存する。例示的なRNA誘導型DNA結合因子としては、Casクリベース/ニッカーゼ及びその不活性型(「dCas DNA結合物質」)が挙げられる。本明細書で使用する場合、「Casヌクレアーゼ」には、Casクリベース、Casニッカーゼ、及びdCas DNA結合物質が包含される。Casクリベース/ニッカーゼ及びdCas DNA結合物質としては、III型CRISPR系のCsm複合体またはCmr複合体、そのサブユニットのCas10、Csm1、またはCmr2、I型CRISPR系のCascade複合体、そのサブユニットのCas3、及びクラス2Casヌクレアーゼが挙げられる。本明細書で使用する場合、「クラス2Casヌクレアーゼ」は、RNA誘導型のDNA結合活性のある一本鎖ポリペプチドである。クラス2Casヌクレアーゼには、RNA誘導によるDNAクリベース活性またはニッカーゼ活性をさらに有するクラス2Casクリベース/ニッカーゼ(例えば、H840A、D10A、またはN863Aという変異型)、及びクリベース/ニッカーゼ活性が不活性化されているクラス2 dCas DNA結合物質が含まれる。クラス2Casヌクレアーゼとしては、例えば、Cas9、Cpf1、C2c1、C2c2、C2c3、HF Cas9というタンパク質(例えば、N497A、R661A、Q695A、Q926Aという変異型)、HypaCas9タンパク質(例えば、N692A、M694A、Q695A、H698Aという変異型)、eSPCas9(1.0)タンパク質(例えば、K810A、K1003A、R1060Aという変異型)、及びeSPCas9(1.1)タンパク質(例えば、K848A、K1003A、R1060Aという変異型)、及びその改変体が挙げられる。Cpf1タンパク質(Zetsche et al.,Cell,163:1-13(2015))はCas9に相同であり、RuvC様ヌクレアーゼドメインを含有する。ZetscheのCpf1配列は、参照によりその全体が組み込まれる。例えば、Zetscheの表S1及び表S3を参照のこと。例えば、Makarova et al.,Nat Rev Microbiol,13(11):722-36(2015)、Shmakov et al.,Molecular Cell,60:385-397(2015)を参照のこと。
いくつかの実施形態では、RNA誘導型DNA結合因子はクラス2Casヌクレアーゼである。いくつかの実施形態では、RNA誘導型DNA結合因子はクリベース活性を有し、これは二本鎖エンドヌクレアーゼ活性とも呼ばれ得る。いくつかの実施形態では、RNA誘導型DNA結合因子は、クラス2Casヌクレアーゼ(これは、例えば、II型、V型、またはVI型のCasヌクレアーゼであってよい)などのCasヌクレアーゼを含む。クラス2Casヌクレアーゼとしては、例えば、Cas9、Cpf1、C2c1、C2c2、及びC2c3タンパク質ならびにその改変体が挙げられる。Cas9ヌクレアーゼの例としては、S.pyogenes、S.aureus、及び他の原核生物(例えば、次段落の一覧を参照のこと)のII型CRISPR系のもの、ならびにその改変型(例えば、工学的に操作されたもの、または変異体)が挙げられる。例えば、U.S.2016/0312198 A1、U.S.2016/0312199 A1を参照のこと。Casヌクレアーゼの他の例としては、III型CRISPR系のCsm複合体もしくはCmr複合体またはそのサブユニットのCas10、Csm1、もしくはCmr2、及びI型CRISPR系のCascade複合体、またはそのサブユニットのCas3が挙げられる。いくつかの実施形態では、Casヌクレアーゼは、IIA型、IIB型、またはIIC型の系のものであってよい。さまざまなCRISPR系及びCasヌクレアーゼの考察については、例えば、Makarova et al.,Nat.Rev.Microbiol.9:467-477(2011)、Makarova et al.,Nat.Rev.Microbiol,13:722-36(2015)、Shmakov et al.,Molecular Cell,60:385-397(2015)を参照のこと。
Casヌクレアーゼが由来し得る非限定的な例示的種としては、Streptococcus pyogenes、Streptococcus thermophilus、Streptococcus sp.、Staphylococcus aureus、Listeria innocua、Lactobacillus gasseri、Francisella novicida、Wolinella succinogenes、Sutterella wadsworthensis、Gammaproteobacterium、Neisseria meningitidis、Campylobacter jejuni、Pasteurella multocida、Fibrobacter succinogene、Rhodospirillum rubrum、Nocardiopsis dassonvillei、Streptomyces pristinaespiralis、Streptomyces viridochromogenes、Streptomyces viridochromogenes、Streptosporangium roseum、Streptosporangium roseum、Alicyclobacillus acidocaldarius、Bacillus pseudomycoides、Bacillus selenitireducens、Exiguobacterium sibiricum、Lactobacillus delbrueckii、Lactobacillus salivarius、Lactobacillus buchneri、Treponema denticola、Microscilla marina、Burkholderiales bacterium、Polaromonas naphthalenivorans、Polaromonas sp.、Crocosphaera watsonii、Cyanothece sp.、Microcystis aeruginosa、Synechococcus sp.、Acetohalobium arabaticum、Ammonifex degensii、Caldicelulosiruptor becscii、Candidatus Desulforudis、Clostridium botulinum、Clostridium difficile、Finegoldia magna、Natranaerobius thermophilus、Pelotomaculum thermopropionicum、Acidithiobacillus caldus、Acidithiobacillus ferrooxidans、Allochromatium vinosum、Marinobacter sp.、Nitrosococcus halophilus、Nitrosococcus watsoni、Pseudoalteromonas haloplanktis、Ktedonobacter racemifer、Methanohalobium evestigatum、Anabaena variabilis、Nodularia spumigena、Nostoc sp.、Arthrospira maxima、Arthrospira platensis、Arthrospira sp.、Lyngbya sp.、Microcoleus chthonoplastes、Oscillatoria sp.、Petrotoga mobilis、Thermosipho africanus、Streptococcus pasteurianus、Neisseria cinerea、Campylobacter lari、Parvibaculum lavamentivorans、Corynebacterium diphtheria、Acidaminococcus sp.、Lachnospiraceae bacterium ND2006、及びAcaryochloris marinaが挙げられる。
いくつかの実施形態では、CasヌクレアーゼはStreptococcus pyogenes由来のCas9ヌクレアーゼである。いくつかの実施形態では、CasヌクレアーゼはStreptococcus thermophilus由来のCas9ヌクレアーゼである。いくつかの実施形態では、CasヌクレアーゼはNeisseria meningitidis由来のCas9ヌクレアーゼである。いくつかの実施形態では、CasヌクレアーゼはStaphylococcus aureus由来のCas9ヌクレアーゼである。いくつかの実施形態では、CasヌクレアーゼはFrancisella novicida由来のCpf1ヌクレアーゼである。いくつかの実施形態では、CasヌクレアーゼはAcidaminococcus sp.由来のCpf1ヌクレアーゼである。いくつかの実施形態では、CasヌクレアーゼはLachnospiraceae bacterium ND2006由来のCpf1ヌクレアーゼである。さらなる実施形態では、CasヌクレアーゼはFrancisella tularensis、Lachnospiraceae bacterium、Butyrivibrio proteoclasticus、Peregrinibacteria bacterium、Parcubacteria bacterium、Smithella、Acidaminococcus、Candidatus Methanoplasma termitum、Eubacterium eligens、Moraxella bovoculi、Leptospira inadai、Porphyromonas crevioricanis、Prevotella disiens、またはPorphyromonas macacae由来のCpf1ヌクレアーゼである。特定の実施形態では、CasヌクレアーゼはAcidaminococcusまたはLachnospiraceaeに由来するCpf1ヌクレアーゼである。
野生型Cas9はRuvC及びHNHという2つのヌクレアーゼドメインを有する。RuvCドメインは非標的DNA鎖を切断し、HNHドメインは標的DNA鎖を切断する。いくつかの実施形態では、Cas9ヌクレアーゼは、2つ以上のRuvCドメイン及び/または2つ以上のHNHドメインを含む。いくつかの実施形態では、Cas9ヌクレアーゼは野生型Cas9である。いくつかの実施形態では、Cas9は、標的DNAに二本鎖切断を誘導することができる。特定の実施形態では、Casヌクレアーゼは、dsDNAを切断するか、dsDNAの1本鎖を切断するか、またはDNAのクリベース活性もニッカーゼ活性も持たない場合がある。例示的なCas9アミノ酸配列を配列番号3として記載する。開始コドン及び終止コドンを含む、例示的なCas9 mRNA ORF配列を配列番号4として記載する。融合タンパク質に含めるのに好適な例示的Cas9 mRNAコード配列を配列番号10として記載する。
いくつかの実施形態では、キメラCasヌクレアーゼを使用し、その場合、かかるタンパク質の1つのドメインまたは領域は、異なるタンパク質の一部で置換される。いくつかの実施形態では、Casヌクレアーゼドメインを、Fok1などの異なるヌクレアーゼに由来するドメインで置き換えてよい。いくつかの実施形態では、Casヌクレアーゼは修飾ヌクレアーゼであってよい。
他の実施形態では、CasヌクレアーゼはI型CRISPR/Cas系に由来してよい。いくつかの実施形態では、Casヌクレアーゼは、I型CRISPR/Cas系のCascade複合体の成分であってよい。いくつかの実施形態では、CasヌクレアーゼはCas3タンパク質であってよい。いくつかの実施形態では、CasヌクレアーゼはIII型CRISPR/Cas系に由来してよい。いくつかの実施形態では、CasヌクレアーゼはRNA切断活性を有してよい。
いくつかの実施形態では、RNA誘導型DNA結合因子は一本鎖ニッカーゼ活性を有し、すなわち、一本のDNA鎖を切断して、「ニック」としても知られる一本鎖の切れ目を生じさせることができる。いくつかの実施形態では、RNA誘導型DNA結合因子はCasニッカーゼを含む。ニッカーゼは、dsDNAにニックをつくる、すなわち、DNA二重らせんの1本の鎖を切断するが、もう1本の鎖は切断しない酵素である。いくつかの実施形態では、CasニッカーゼはCasヌクレアーゼ(例えば、上述のCasヌクレアーゼ)の変形の1種であり、例えば、触媒ドメイン内の1つ以上の変化(例えば、点変異)によって、エンドヌクレアーゼによる分解活性部位が不活性化されている。Casニッカーゼ及び例示的な触媒ドメイン改変に関する考察については、例えば、米国特許第8,889,356号を参照のこと。いくつかの実施形態では、Cas9ニッカーゼなどのCasニッカーゼは不活性化されたRuvCドメインまたはHNHドメインを有する。例示的なCas9ニッカーゼのアミノ酸配列を配列番号6として記載する。開始コドン及び終止コドンが含まれる例示的なCas9ニッカーゼmRNAのORF配列を配列番号7として記載する。融合タンパク質に含めるのに好適な例示的Cas9ニッカーゼmRNAのコード配列を配列番号11として記載する。
いくつかの実施形態では、RNA誘導型DNA結合因子は、機能するヌクレアーゼドメインを1つのみ含有するよう修飾される。例えば、因子のタンパク質は、ヌクレアーゼドメインの1つを変異させるかまたは完全もしくは部分的に欠失させてその核酸切断活性を低下させるよう修飾されてよい。いくつかの実施形態では、活性を低下させたRuvCドメインを有するニッカーゼを使用する。いくつかの実施形態では、不活性なRuvCドメインを有するニッカーゼを使用する。いくつかの実施形態では、活性を低下させたHNHドメインを有するニッカーゼを使用する。いくつかの実施形態では、不活性なHNHドメインを有するニッカーゼを使用する。
いくつかの実施形態では、Casタンパク質ヌクレアーゼドメイン内の保存されたアミノ酸を置換してヌクレアーゼ活性を低下または変化させる。いくつかの実施形態では、Casヌクレアーゼは、RuvCまたはRuvC様ヌクレアーゼドメインにアミノ酸置換を含んでよい。RuvCまたはRuvC様ヌクレアーゼドメインにおける例示的なアミノ酸置換としては、D10A(S.pyogenes Cas9タンパク質に基づく)が挙げられる。例えば、Zetsche et al.(2015)Cell Oct 22:163(3):759-771を参照のこと。いくつかの実施形態では、Casヌクレアーゼは、HNHまたはHNH様ヌクレアーゼドメインにアミノ酸置換を含んでよい。HNHまたはHNH様ヌクレアーゼドメインにおける例示的なアミノ酸置換としては、E762A、H840A、N863A、H983A、及びD986A(S.pyogenes Cas9タンパク質に基づく)が挙げられる。例えば、Zetsche et al.(2015)を参照のこと。さらなる例示的なアミノ酸置換としては、D917A、E1006A、及びD1255A(Francisella novicida U112 Cpf1(FnCpf1)配列(UniProtKB-A0Q7Q2(CPF1_FRATN)に基づく)が挙げられる。
いくつかの実施形態では、ニッカーゼをコードするmRNAは、標的配列のセンス鎖及びアンチセンス鎖のそれぞれに相補的な一対のガイドRNAと組み合わせて提供される。この実施形態では、ガイドRNAはニッカーゼを標的配列へと導き、標的配列の反対鎖にニックを生じさせることによりDSBを導入する(すなわち、ダブルニッキング)。いくつかの実施形態では、ダブルニッキングの使用により特異性が改善され、オフターゲット作用が低減され得る。いくつかの実施形態では、ニッカーゼを、対抗するDNA鎖を標的にする2つの別々のガイドRNAと共に使用して、標的DNAにダブルニックを作製する。いくつかの実施形態では、ニッカーゼを、近接するよう選択された2つの別々のガイドRNAと共に使用して、標的DNAにダブルニックを作製する。
いくつかの実施形態では、RNA誘導型DNA結合因子にはクリベース活性及びニッカーゼ活性がない。いくつかの実施形態では、RNA誘導型DNA結合因子はdCas DNA結合ポリペプチドを含む。dCasポリペプチドはDNA結合活性を有するが、本質的に触媒(クリベース/ニッカーゼ)活性がない。いくつかの実施形態では、dCasポリペプチドはdCas9ポリペプチドである。いくつかの実施形態では、クリベース活性及びニッカーゼ活性がないRNA誘導型DNA結合因子またはdCas DNA結合ポリペプチドは、Casヌクレアーゼ(例えば、上述のCasヌクレアーゼ)の変形の1種であり、例えば、その触媒ドメイン内の1つ以上の変化(例えば、点変異)によってそのエンドヌクレアーゼによる分解活性部位が不活性化されている。例えば、U.S.2014/0186958 A1、U.S.2015/0166980 A1を参照のこと。例示的なdCas9アミノ酸配列を配列番号8として記載する。開始コドン及び終止コドンが含まれる例示的なCas9 mRNA ORF配列を配列番号9として記載する。融合タンパク質に含めるのに好適な例示的Cas9 mRNAコード配列を配列番号12として記載する。
いくつかの実施形態では、RNA誘導型DNA結合因子は、1つ以上の異種機能ドメイン(例えば、融合ポリペプチドであるかまたはそれを含む)を含む。
いくつかの実施形態では、異種機能ドメインは、細胞の核内へのRNA誘導型DNA結合因子の輸送を容易にし得る。例えば、異種機能ドメインは核局在化シグナル(NLS)であってよい。いくつかの実施形態では、RNA誘導型DNA結合因子を1~10のNLS(複数可)と融合させてよい。いくつかの実施形態では、RNA誘導型DNA結合因子を1~5のNLS(複数可)と融合させてよい。いくつかの実施形態では、RNA誘導型DNA結合因子を1つのNLSと融合させてよい。1つのNLSを使用する場合、かかるNLSを、RNA誘導型DNA結合因子配列のN末端またはC末端にて連結させてよい。かかる1つのNLSを、RNA誘導型DNA結合因子配列の内部に挿入してもよい。他の実施形態では、RNA誘導型DNA結合因子を2つ以上のNLSと融合させてよい。いくつかの実施形態では、RNA誘導型DNA結合因子を2つ、3つ、4つ、または5つのNLSと融合させてよい。いくつかの実施形態では、RNA誘導型DNA結合因子を2つのNLSと融合させてよい。特定の状況では、2つのNLSは同一であっても(例えば、SV40 NLSが2つ)異なっていてもよい。いくつかの実施形態では、RNA誘導型DNA結合因子を、2つのSV40 NLS配列とカルボキシ末端で連結して融合させる。いくつかの実施形態では、RNA誘導型DNA結合因子を2つのNLSと融合させて、その際、1つはN末端で連結し、1つはC末端で連結してよい。いくつかの実施形態では、RNA誘導型DNA結合因子を3つのNLSと融合させてよい。いくつかの実施形態では、RNA誘導型DNA結合因子をNLSと融合させなくてよい。いくつかの実施形態では、NLSは、例えば、SV40 NLSであるPKKKRKVまたはPKKKRRVのような一分(monopartite)配列であってよい。いくつかの実施形態では、NLSは、ヌクレオプラスミンのNLSであるKRPAATKKAGQAKKKKのような二分(bipartite)配列であってよい。特定の実施形態では、単一のPKKKRKV NLSをRNA誘導型DNA結合因子のC末端で連結させてよい。任意選択で1つ以上のリンカーが融合部位において含まれる。
いくつかの実施形態では、異種機能ドメインは、RNA誘導型DNA結合因子の細胞内半減期を改変する能力があってよい。いくつかの実施形態では、RNA誘導型DNA結合因子の半減期を延長させる能力があってよい。いくつかの実施形態では、RNA誘導型DNA結合因子の半減期は短縮されてよい。いくつかの実施形態では、異種機能ドメインは、RNA誘導型DNA結合因子の安定性を増大させる能力があってよい。いくつかの実施形態では、異種機能ドメインは、RNA誘導型DNA結合因子の安定性を低下させる能力があってよい。いくつかの実施形態では、異種機能ドメインは、タンパク質分解のシグナルペプチドとして作用してよい。いくつかの実施形態では、タンパク質分解は、例えば、プロテアソーム、リソソームのプロテアーゼ、またはカルパインプロテアーゼなどのタンパク質分解酵素によって媒介されてよい。いくつかの実施形態では、異種機能ドメインはPEST配列を含んでよい。いくつかの実施形態では、RNA誘導型DNA結合因子は、ユビキチンまたはポリユビキチン鎖の付加によって修飾されてよい。いくつかの実施形態では、ユビキチンはユビキチン様タンパク質(UBL)であってよい。ユビキチン様タンパク質の非限定的な例としては、低分子ユビキチン様修飾因子(SUMO)、ユビキチン交差反応性タンパク質(UCRP;インターフェロン誘導性遺伝子15(ISG15)としても知られる)、ユビキチン関連修飾因子1(URM1)、神経前駆細胞発現し発生段階で下方制御されたタンパク質8(NEDD8;S.cerevisiaeではRub1とも呼ばれる)、ヒト白血球抗原F関連(FAT10)、オートファジー8(ATG8)及びオートファジー12(ATG12)、Fauユビキチン様タンパク質(FUB1)、膜アンカー型UBL(MUB)、ユビキチンフォールド修飾因子1(UFM1)、及びユビキチン様タンパク質5(UBL5)が挙げられる。
いくつかの実施形態では、異種機能ドメインはマーカードメインであってよい。マーカードメインの非限定的な例としては、蛍光タンパク質、精製タグ、エピトープタグ、及びレポーター遺伝子配列が挙げられる。いくつかの実施形態では、マーカードメインは蛍光タンパク質であってよい。適切な蛍光タンパク質の非限定的な例としては、緑色蛍光タンパク質(例えば、GFP、GFP-2、タグGFP、turboGFP、sfGFP、EGFP、Emerald、Azami Green、単量体Azami Green、CopGFP、AceGFP、ZsGreen1)、黄色蛍光タンパク質(例えば、YFP、EYFP、Citrine、Venus、YPet、PhiYFP、ZsYellow1)、青色蛍光タンパク質(例えば、EBFP、EBFP2、Azurite、mKalamal、GFPuv、Sapphire、T-sapphire)、シアン蛍光タンパク質(例えば、ECFP、Cerulean、CyPet、AmCyan1、Midoriishi-Cyan)、赤色蛍光タンパク質(例えば、mKate、mKate2、mPlum、DsRed単量体、mCherry、mRFP1、DsRed-Express、DsRed2、DsRed-Monomer、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)、及びオレンジ色蛍光タンパク質(mOrange、mKO、Kusabira-Orange、単量体Kusabira-Orange、mTangerine、tdTomato)または他の適切な任意の蛍光タンパク質が挙げられる。他の実施形態では、マーカードメインは精製タグ及び/またはエピトープタグであってよい。非限定的な例示的タグとしては、グルタチオン-S-トランスフェラーゼ(GST)、キチン結合タンパク質(CBP)、マルトース結合タンパク質(MBP)、チオレドキシン(TRX)、ポリ(NANP)、タンデムアフィニティー精製(TAP)タグ、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、8xHis、ビオチンカルボキシルキャリアタンパク質(BCCP)、ポリ-His、及びカルモジュリンが挙げられる。非限定的な例示的レポーター遺伝子としては、グルタチオン-S-トランスフェラーゼ(GST)、西洋わさびペルオキシダーゼ(HRP)、クロラムフェニコールアセチルトランスフェラーゼ(CAT)、ベータ-ガラクトシダーゼ、ベータ-グルクロニダーゼ、ルシフェラーゼ、または蛍光タンパク質が挙げられる。
さらなる実施形態では、異種機能ドメインは、RNA誘導型DNA結合因子を、特定の細胞小器官、細胞型、組織、または臓器に指向させてよい。いくつかの実施形態では、異種機能ドメインは、RNA誘導型DNA結合因子をミトコンドリアに指向させてよい。
さらなる実施形態では、異種機能ドメインはエフェクタードメインであってよい。RNA誘導型DNA結合因子をその標的配列へ配向させる場合、例えば、CasヌクレアーゼをgRNAによって標的配列へ配向させる場合、エフェクタードメインは標的配列を修飾するかまたはそれに影響を与えてよい。いくつかの実施形態では、エフェクタードメインは、核酸結合ドメイン、ヌクレアーゼドメイン(例えば、非Casヌクレアーゼドメイン)、エピジェネティック修飾ドメイン、転写活性化ドメイン、または転写抑制因子ドメインから選んでよい。いくつかの実施形態では、異種機能ドメインはFokIヌクレアーゼなどのヌクレアーゼである。例えば、米国特許第9,023,649号を参照のこと。いくつかの実施形態では、異種機能ドメインは転写活性化因子または転写抑制因子である。例えば、Qi et al.,“Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression,”Cell 152:1173-83(2013)、Perez-Pinera et al.,“RNA-guided gene activation by CRISPR-Cas9-based transcription factors,”Nat.Methods 10:973-6(2013)、Mali et al.,”CAS9 transcriptionalactivatorsfortarget specificity screening and paired nickases for cooperative genome engineering,”Nat.Biotechnol.31:833-8(2013)、Gilbert et al.,“CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes,”Cell 154:442-51(2013)を参照のこと。したがって、RNA誘導型DNA結合因子は本質的に、ガイドRNAを使用して所望の標的配列と結合させるために配向可能な転写因子になる。特定の実施形態では、DNA修飾ドメインは脱メチル化ドメインまたはメチルトランスフェラーゼドメインなどのメチル化ドメインである。特定の実施形態では、エフェクタードメインは塩基編集ドメインなどのDNA修飾ドメインである。特定の実施形態では、DNA修飾ドメインは、デアミナーゼドメインなど、DNA内に特定の修飾を導入する核酸編集ドメインである。例えば、WO2015/089406、U.S.2016/0304846を参照のこと。WO2015/089406及びU.S.2016/0304846に記載の核酸編集ドメイン、デアミナーゼドメイン、及びCas9変異型は参照により本明細書に組み込まれる。
ヌクレアーゼは、ガイドRNA(「gRNA」)と相互作用する少なくとも1つのドメインを含んでよい。さらに、ヌクレアーゼをgRNAによって標的配列に配向させてよい。クラス2Casヌクレアーゼ系では、gRNAはヌクレアーゼ及び標的配列と相互作用し、それにより標的配列への結合が導かれるようにする。いくつかの実施形態では、gRNAは目標とする切断に対する特異性を提供する一方、ヌクレアーゼは汎用性があってよく、異なるgRNAと対形成して異なる標的配列を切断し得る。クラス2Casヌクレアーゼは、上掲の型、オルソログ、及び例示的種のgRNA足場構造と対形成してよい。
ガイドRNA(gRNA)
本開示のいくつかの実施形態では、LNP製剤のカーゴには少なくとも1つのgRNAが含まれる。gRNAは、Casヌクレアーゼまたはクラス2Casヌクレアーゼを標的核酸分子上の標的配列に誘導してよい。いくつかの実施形態では、gRNAはクラス2Casヌクレアーゼと結合して、クラス2Casヌクレアーゼによる切断の特異性を提供する。いくつかの実施形態では、gRNAとCasヌクレアーゼは、LNP組成物により送達され得るリボ核タンパク質(RNP)、例えば、CRISPR/Cas9複合体のようなCRISPR/Cas複合体などを形成してよい。いくつかの実施形態では、CRISPR/Cas複合体はII型CRISPR/Cas9複合体であってよい。いくつかの実施形態では、CRISPR/Cas複合体はCpf1/ガイドRNA複合体などのV型CRISPR/Cas複合体であってよい。Casヌクレアーゼと特異的gRNAとを対形成させてよい。各クラス2Casヌクレアーゼと対形成するgRNA足場構造は個々のCRISPR/Cas系によって異なる。
「ガイドRNA」、「gRNA」、及び単に「ガイド」は本明細書では同じ意味で使用され、crRNA(CRISPR RNAとしても知られる)、またはcrRNAとtrRNAの組み合わせ(tracrRNAとしても知られる)のいずれも指す。crRNAとtrRNAは、単一RNA分子として会合していても(単一ガイドRNA、sgRNA)、または2つの別々のRNA分子(デュアルガイドRNA、dgRNA)であってもよい。「ガイドRNA」または「gRNA」とはそれぞれの型を指す。trRNAは、天然に生じる配列、または天然に生じる配列と比較して修飾または変形を有するtrRNA配列のいずれであってもよい。
本明細書で使用する場合、「ガイド配列」とは、ガイドRNA内にある配列であって、標的配列に相補的であり、かつ、RNA誘導型DNA結合因子が結合または修飾(例えば、切断)を行うためにガイドRNAを標的配列へと導くよう機能する配列を指す。「ガイド配列」は、「指向性配列」または「スペーサー配列」とも呼ばれ得る。ガイド配列は、例えば、Streptococcus pyogenes(すなわち、Spy Cas9)及び関連Cas9相同体/オルソログの場合、長さが20塩基対であり得る。それより短いかまたは長い配列、例えば、15ヌクレオチド長、16ヌクレオチド長、17ヌクレオチド長、18ヌクレオチド長、19ヌクレオチド長、21ヌクレオチド長、22ヌクレオチド長、23ヌクレオチド長、24ヌクレオチド長、または25ヌクレオチド長の配列をガイドとして使用することができる。いくつかの実施形態では、標的配列は、例えば、遺伝子内または染色体上にあり、ガイド配列に相補的である。いくつかの実施形態では、ガイド配列とその対応する標的配列の間の相補性または同一性の程度は約75%、80%、85%、90%、95%、96%、97%、98%、99%、または100%であってよい。いくつかの実施形態では、ガイド配列と標的領域は100%相補的であっても同一であってもよい。他の実施形態では、ガイド配列と標的領域には少なくとも1つのミスマッチが含有されてよい。例えば、ガイド配列と標的配列には、1つ、2つ、3つ、または4つのミスマッチが含有されてよく、その場合、標的配列の全長は少なくとも17塩基対、18塩基対、19塩基対、20塩基対、またはそれ以上である。いくつかの実施形態では、ガイド配列と標的領域には1~4つのミスマッチが含有されてよく、その場合、ガイド配列は少なくとも17個、18個、19個、20個、またはそれ以上のヌクレオチドを含む。いくつかの実施形態では、ガイド配列と標的領域には1つ、2つ、3つ、または4つのミスマッチが含有されてよく、その場合、ガイド配列は20個のヌクレオチドを含む。
Casタンパク質のための基質となる核酸は二本鎖核酸であるため、Casタンパク質の標的配列にはゲノムDNAのプラス鎖とマイナス鎖の両方(すなわち、所与の配列と、かかる配列の逆相補鎖)が含まれる。したがって、ガイド配列が「標的配列に相補的である」という場合は、かかるガイド配列がガイドRNAを導いて標的配列の逆相補鎖に結合させ得ることを理解されるべきである。したがって、いくつかの実施形態では、ガイド配列が標的配列の逆相補鎖と結合する場合、かかるガイド配列は、ガイド配列のTがUで置換される以外は標的配列(例えば、PAMを含まない標的配列)の特定のヌクレオチドと同一である。
指向性配列の長さは使用するCRISPR/Cas系及び成分によって異なってよい。例えば、異なる細菌種に由来する異なるクラス2Casヌクレアーゼでは最適な指向性配列長がさまざまである。したがって、指向性配列は、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または50超のヌクレオチド長を含んでよい。いくつかの実施形態では、指向性配列長は、天然に生じるCRISPR/Cas系のガイド配列よりも0ヌクレオチド、1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、4ヌクレオチド、または5ヌクレオチド長いかまたは短い。特定の実施形態では、Casヌクレアーゼ及びgRNA足場は同じCRISPR/Cas系に由来する。いくつかの実施形態では、指向性配列は18~24個のヌクレオチドを含むかまたはそれからなってよい。いくつかの実施形態では、指向性配列は19~21個のヌクレオチドを含むかまたはそれからなってよい。いくつかの実施形態では、指向性配列は20個のヌクレオチドを含むかまたはそれからなってよい。
いくつかの実施形態では、sgRNAは、Cas9タンパク質によるRNA誘導性DNA切断を媒介することができる「Cas9 sgRNA」である。いくつかの実施形態では、sgRNAは、Cpf1タンパク質によるRNA誘導性DNA切断を媒介することができる「Cpf1 sgRNA」である。特定の実施形態では、gRNAは、Cas9タンパク質との活性複合体を形成してRNA誘導性DNA切断を媒介するのに十分な、crRNA及びtracrRNAを含む。特定の実施形態では、gRNAは、Cpf1タンパク質との活性複合体を形成してRNA誘導性DNA切断を媒介するのに十分なcrRNAを含む。Zetsche 2015を参照のこと。
本発明の特定の実施形態はまた、本明細書に記載のgRNAをコードする核酸、例えば、発現カセットも提供する。「ガイドRNA核酸」は、本明細書ではガイドRNA(例えば、sgRNAまたはdgRNA)及びガイドRNA発現カセットを指すために使用される、1つ以上のガイドRNAをコードする核酸である。
いくつかの実施形態では、核酸はDNA分子であってよい。いくつかの実施形態では、核酸は、crRNAをコードするヌクレオチド配列を含んでよい。いくつかの実施形態では、crRNAをコードするヌクレオチド配列は、天然に生じるCRISPR/Cas系由来の繰り返し配列の全部または一部が隣接する指向性配列を含む。いくつかの実施形態では、核酸は、tracrRNAをコードするヌクレオチド配列を含んでよい。いくつかの実施形態では、crRNA及びtracrRNAは、2つの別々の核酸によってコードされてよい。他の実施形態では、crRNA及びtracrRNAは単一核酸によってコードされてよい。いくつかの実施形態では、crRNA及びtracrRNAは単一核酸の反対鎖によってコードされてよい。他の実施形態では、crRNA及びtracrRNAは単一核酸の同一鎖によってコードされてよい。いくつかの実施形態では、gRNA核酸はsgRNAをコードする。いくつかの実施形態では、gRNA核酸はCas9ヌクレアーゼsgRNAをコードする。いくつかの実施形態では、gRNA核酸はCpf1ヌクレアーゼsgRNAをコードする。
ガイドRNAをコードするヌクレオチド配列は、少なくとも1つの転写性または調節性の制御配列、例えば、プロモーター、3’UTR、または5’UTRなどに機能的に連結されてよい。一例では、プロモーターは、tRNAプロモーター、例えば、tRNALys3、またはtRNAキメラであってよい。Mefferd et al.,RNA.2015 21:1683-9、Scherer et al.,Nucleic Acids Res.2007 35:2620-2628を参照のこと。特定の実施形態では、プロモーターは、RNAポリメラーゼIII(Pol III)によって認識されてよい。Pol IIIプロモーターの非限定的な例としてはU6プロモーター及びH1プロモーターも挙げられる。いくつかの実施形態では、ガイドRNAをコードするヌクレオチド配列は、マウスまたはヒトのU6プロモーターに機能的に連結されてよい。いくつかの実施形態では、gRNA核酸は修飾核酸である。特定の実施形態では、gRNA核酸には、修飾されたヌクレオシドまたはヌクレオチドが含まれる。いくつかの実施形態では、gRNA核酸には、5’末端修飾、例えば、核酸を安定させ、かつ、核酸の組み込みを妨げる修飾されたヌクレオシドまたはヌクレオチドなどが含まれる。いくつかの実施形態では、gRNA核酸は、各鎖に5’末端修飾を有する二本鎖DNAを含む。特定の実施形態では、gRNA核酸には、逆位ジデオキシ-Tまたは逆位脱塩基ヌクレオシドもしくはヌクレオチドが5’末端修飾として含まれる。いくつかの実施形態では、gRNA核酸には、ビオチン、デスチオビオテン-TEG、ジゴキシゲニン、ならびに蛍光マーカー、例えば、FAM、ROX、TAMRA、及びAlexaFluorなどといった標識が含まれる。
特定の実施形態では、2つ以上のgRNA核酸、例えば、gRNAなどをCRISPR/Casヌクレアーゼ系と共に使用することができる。CRISPR/Cas系により2つ以上の標的配列が切断されるよう、gRNA核酸ごとに異なる指向性配列を含有してよい。いくつかの実施形態では、1つ以上のgRNAは、CRISPR/Cas複合体内で特性、例えば、活性または安定性などが同一であっても異なっていてもよい。2つ以上のgRNAを使用する場合、それぞれのgRNAは同一gRNA核酸上または異なるgRNA核酸上のいずれでもコードされ得る。2つ以上のgRNAの発現誘導に使用するプロモーターは同一であっても異なっていてもよい。
修飾RNA
特定の実施形態では、LNP組成物は修飾RNAを含む。
修飾されたヌクレオシドまたはヌクレオチドは、RNA、例えば、gRNAまたはmRNAなどに存在し得る。例えば、1つ以上の修飾されたヌクレオシドまたはヌクレオチドを含むgRNAまたはmRNAは「修飾」RNAと呼ばれ、標準残基A、G、C、及びUの代わりまたは追加で使用される、天然に生じない成分もしくは構成及び/または天然に生じる成分もしくは構成が1つ以上存在することを表す。いくつかの実施形態では、修飾RNAは、本明細書で「修飾」と呼ばれる非標準ヌクレオシドまたはヌクレオチドを用いて合成される。
修飾ヌクレオシド及び修飾ヌクレオチドには、(i)ホスホジエステル骨格結合におけるリン酸基の非連結酸素のうちの一方もしくは両方及び/またはリン酸基の連結酸素のうち1つ以上の変化、例えば、置換(例示的な骨格修飾)、(ii)リボース糖の構成要素、例えば、リボース糖の2’位のヒドロキシルなどの変化、例えば、置換(例示的な糖修飾)、(iii)「デホスホ」リンカーでのリン酸部分の大幅な置換(例示的な骨格修飾)、(iv)非標準核酸塩基を用いるなど、天然に生じる核酸塩基の修飾または置換(例示的な塩基修飾)、(v)リボース-リン酸骨格の置換または修飾(例示的な骨格修飾)、(vi)オリゴヌクレオチドの3’末端または5’末端の修飾、例えば、末端リン酸基を除去、修飾もしくは置換するか、または部分、キャップもしくリンカーを結合させる修飾(そのような3’または5’のキャップ修飾は糖修飾及び/または骨格修飾を含んでよい)、及び(vii)糖の修飾または置換(例示的な糖修飾)のうち1つ以上が含まれ得る。特定の実施形態は、mRNA、gRNA、または核酸に対する5’末端修飾を含む。特定の実施形態は、mRNA、gRNA、または核酸に対する3’末端修飾を含む。修飾RNAは、5’末端及び3’末端の修飾を含有し得る。修飾RNAは、末端ではない位置に1つ以上の修飾残基を含有し得る。特定の実施形態では、gRNAには少なくとも1つの修飾残基が含まれる。特定の実施形態では、mRNAには少なくとも1つの修飾残基が含まれる。
本明細書で使用する場合、第1の配列と第2の配列のアラインメントにより、第1の配列が、第2の配列全体の位置のX%以上と一致することが示される場合、第1の配列は、第2の配列「に対する同一性が少なくともX%である配列を含む」とみなされる。例えば、配列AAGAは、配列AAGに対する同一性が100%の配列を含むが、これは、アラインメントにより、第2の配列の3つの位置すべてに対して一致が見られる100%という同一性が示されると考えられるためである。関連するヌクレオチド(チミジン、ウリジン、または修飾ウリジンなど)が同一の補体を有する限り(例えば、チミジン、ウリジン、または修飾ウリジンのいずれについてもアデノシンであり、別の例では、シトシン及び5-メチルシトシンはいずれもグアノシンまたは修飾グアノシンを補体として有する)、RNAとDNAの違い(一般に、ウリジンをチミジンに交換、またはその逆)及び修飾ウリジンなどのヌクレオシド類似体の存在は、ポリヌクレオチド間の同一性または相補性の違いに寄与しない。したがって、例えば、Xが任意の修飾ウリジン、例えば、プソイドウリジン、N1-メチルプソイドウリジン、または5-メトキシウリジンなどである5’-AXGという配列はAUGと100%同一であるとみなされ、両配列とも同じ配列(5’-CAU)に対して完全に相補的である。例示的なアラインメントアルゴリズムは、Smith-Waterman及びNeedleman-Wunschアルゴリズムであり、これらは当該技術分野で周知である。当業者は、所与の整列させるべき配列対にどのアルゴリズム及びパラメータ設定を選択するのが適切かを理解するが、概して長さが同様で、期待されるアミノ酸同一性が50%超またはヌクレオチド同一性が75%超である配列の場合、Needleman-Wunschアルゴリズムを、www.ebi.ac.ukウェブサーバーにてEBIより提供されているNeedleman-Wunschアルゴリズムインターフェースのデフォルト設定で用いるのが一般に適切である。
mRNA
いくつかの実施形態では、本明細書に開示する組成物または製剤は、本明細書に記載するようなCasヌクレアーゼ、またはクラス2CasヌクレアーゼなどのRNA誘導型DNA結合因子をコードするオープンリーディングフレーム(ORF)を含むmRNAを含む。いくつかの実施形態では、Casヌクレアーゼまたはクラス2CasヌクレアーゼなどのRNA誘導型DNA結合因子をコードするORFを含むmRNAを提供するか、使用するか、または投与する。いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFは、「修飾RNA誘導型DNA結合因子ORF」または単に「修飾ORF」であり、ORFが、以下の方法のうち1つ以上の方法で修飾されることを示す簡略表現として使用される:(1)修飾ORFはウリジン含量が、その最小ウリジン含量から、かかる最小ウリジン含量の150%までの範囲である、(2)修飾ORFはウリジンジヌクレオチド含量が、その最小ウリジンジヌクレオチド含量から、かかる最小ウリジンジヌクレオチド含量の150%までの範囲である、(3)修飾ORFは、配列番号1、4、7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つに対する同一性が少なくとも90%である、(4)修飾ORFは、コドンの少なくとも75%が所与のアミノ酸についての最小ウリジンコドン(複数可)、例えば、ウリジンが最も少ないコドン(複数可)(最小ウリジンコドンは、ウリジンを2つ有するフェニルアラニンのコドンを除いては、通常0または1つである)である、1セットのコドンからなる、または(5)修飾ORFは少なくとも1つの修飾ウリジンを含む。いくつかの実施形態では、修飾ORFは、上述の方法のうち少なくとも2つ、3つ、または4つの方法で修飾される。いくつかの実施形態では、修飾ORFは少なくとも1つの修飾ウリジンを含み、上記(1)~(4)のうち少なくとも1つ、2つ、3つ、またはすべての方法で修飾される。
本明細書では「修飾ウリジン」は、水素結合受容体がウリジンの場合と同じであり、かつ、ウリジンとの構造上の違いが1つ以上ある、チミジン以外のヌクレオシドを指すために使用される。いくつかの実施形態では、修飾ウリジンは、置換ウリジン、すなわち、1つ以上の非プロトン置換基(例えば、メトキシなどのアルコキシ)がプロトンに取って代わるウリジンである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンである。いくつかの実施形態では、修飾ウリジンは、置換プソイドウリジン、すなわち、1つ以上の非プロトン置換基(例えば、メチルなどのアルキル)がプロトンに取って代わるプソイドウリジンである。いくつかの実施形態では、修飾ウリジンは、置換ウリジン、プソイドウリジン、または置換プソイドウリジンのいずれかである。
本明細書で使用する「ウリジン位置」とは、ポリヌクレオチドにおいてウリジンまたは修飾ウリジンが占めている位置を指す。したがって、例えば、「ウリジン位置の100%が修飾ウリジン」であるポリヌクレオチドは、それと同じ配列の従来のRNA(この場合、塩基はいずれも標準塩基のA、U、C、またはGである)ではウリジンであるはずのどの位置においても修飾ウリジンを含有する。特に明記しない限り、本開示内または本開示に添付の配列表(sequence table)もしくは配列表(sequence listing)に記載のポリヌクレオチド配列におけるUはウリジンまたは修飾ウリジンであり得る。
Figure 2023103421000001
上述の実施形態のいずれにおいても、修飾ORFは、コドンのうち少なくとも75%、80%、85%、90%、95%、98%、99%、または100%が最小ウリジンコドンの表に記載のコドンである、1セットのコドンで構成されてよい。上述の実施形態のいずれにおいても、修飾ORFは、配列番号1、4、7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つに対する同一性が少なくとも90%、95%、98%、99%、または100%である配列を含んでよい。
上述の実施形態のいずれにおいても、修飾ORFは、配列番号1、4、7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つに対する同一性が少なくとも90%、95%、98%、99%、または100%である配列を含んでよい。
上述の実施形態のいずれにおいても、修飾ORFは、ウリジン含量が、その最小ウリジン含量から、かかる最小ウリジン含量の150%、145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%、または101%までの範囲であってよい。
上述の実施形態のいずれにおいても、修飾ORFは、ウリジンジヌクレオチド含量が、その最小ウリジンジヌクレオチド含量から、かかる最小ウリジンジヌクレオチド含量の150%、145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%、または101%までの範囲であってよい。
上述の実施形態のいずれにおいても、修飾ORFはウリジン位置の少なくとも1つ、複数、またはすべてにおいて修飾ウリジンを含んでよい。いくつかの実施形態では、修飾ウリジンは、5位において、例えば、ハロゲン、メチル、またはエチルなどで修飾されたウリジンである。いくつかの実施形態では、修飾ウリジンは、1位において、例えば、ハロゲン、メチル、またはエチルなどで修飾されたプソイドウリジンである。修飾ウリジンは、例えば、プソイドウリジン、N1-メチル-プソイドウリジン、5-メトキシウリジン、5-ヨードウリジン、またはその組み合わせであり得る。いくつかの実施形態では、修飾ウリジンは5-メトキシウリジンである。いくつかの実施形態では、修飾ウリジンは5-ヨードウリジンである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンである。いくつかの実施形態では、修飾ウリジンはN1-メチル-プソイドウリジンである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンとN1-メチル-プソイドウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンと5-メトキシウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンはN1-メチルプソイドウリジンと5-メトキシウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンは5-ヨードウリジンとN1-メチル-プソイドウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンと5-ヨードウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンは5-ヨードウリジンと5-メトキシウリジンの組み合わせである。
いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%は修飾ウリジンである。いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は修飾ウリジン、例えば、5-メトキシウリジン、5-ヨードウリジン、N1-メチルプソイドウリジン、プソイドウリジン、またはその組み合わせである。いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-メトキシウリジンである。いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%はプソイドウリジンである。いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%はN1-メチルプソイドウリジンである。いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-ヨードウリジンである。いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-メトキシウリジンであり、残りのウリジン位置はN1-メチルプソイドウリジンである。いくつかの実施形態では、本開示によるmRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-ヨードウリジンであり、残りのウリジン位置はN1-メチルプソイドウリジンである。
上述の実施形態のいずれにおいても、修飾ORFは、可能な限り低いウリジンジヌクレオチド(UU)含量など、低いウリジンジヌクレオチド含量を含んでよく、例えば、(a)どの位置にも最小ウリジンコドン(上述)を使用し、(b)所与のORFと同じアミノ酸配列をコードするORFである。ウリジンジヌクレオチド(UU)含量は、ORF内のUUジヌクレオチドの計数として絶対値で表すか、またはウリジンジヌクレオチドのウリジンが占めている位置の割合として比率で表すことができる(例えば、AUUAUの場合であれば、5つの位置のうち2つがウリジンジヌクレオチドのウリジンで占められているのでウリジンジヌクレオチド含量は40%となる)。最小ウリジンジヌクレオチド含量を評価するために、修飾ウリジン残基はウリジンと同等であるとみなす。
いくつかの実施形態では、mRNAは、発現された哺乳類mRNA、例えば、構成的に発現しているmRNAなどに由来するUTRを少なくとも1つ含む。mRNAは、健常成体哺乳類の少なくとも1つの組織で継続的に転写されている場合、哺乳類で構成的に発現されているとみなされる。いくつかの実施形態では、mRNAは、発現された哺乳類のRNA、例えば、構成的に発現された哺乳類のmRNAなどに由来する5’UTR、3’UTR、または5’と3’の両UTRを含む。アクチンmRNAは構成的に発現しているmRNAの一例である。
いくつかの実施形態では、mRNAは、17-ベータヒドロキシステロイドデヒドロゲナーゼ4(HSD17B4またはHSD)由来の少なくとも1つのUTR、例えば、HSD由来の5’UTRなどを含む。いくつかの実施形態では、mRNAは、グロビンmRNA、例えば、ヒトアルファグロビン(HBA)mRNA、ヒトベータグロビン(HBB)mRNA、またはアフリカツメガエル(Xenopus laevis)ベータグロビン(XBG)mRNAなどに由来する少なくとも1つのUTRを含む。いくつかの実施形態では、mRNAは、グロビンmRNA、例えば、HBA、HBB、またはXBGなどに由来する5’UTR、3’UTR、または5’と3’の両UTRを含む。いくつかの実施形態では、mRNAは、ウシ成長ホルモン、サイトメガロウイルス(CMV)、マウスHba-a1、HSD、アルブミン遺伝子、HBA、HBB、またはXBGに由来する5’UTRを含む。いくつかの実施形態では、mRNAは、ウシ成長ホルモン、サイトメガロウイルス、マウスHba-a1、HSD、アルブミン遺伝子、HBA、HBB、またはXBGに由来する3’UTRを含む。いくつかの実施形態では、mRNAは、ウシ成長ホルモン、サイトメガロウイルス、マウスHba-a1、HSD、アルブミン遺伝子、HBA、HBB、XBG、熱ショックタンパク質90(Hsp90)、グリセルアルデヒド3-リン酸デヒドロゲナーゼ(GAPDH)、ベータ-アクチン、アルファ-チューブリン、腫瘍タンパク質(p53)、または上皮成長因子受容体(EGFR)に由来する5’と3’の両UTRを含む。
いくつかの実施形態では、mRNAは、同じ供給源に由来する5’と3’の両UTR、例えば、アクチン、アルブミン、またはグロビン、例えば、HBA、HBB、もしくはXBGなどのような構成的に発現しているmRNAなどに由来する5’と3’の両UTRを含む。
いくつかの実施形態では、mRNAは5’UTRを含まず、例えば、5’キャップと開始コドンの間にはさらなるヌクレオチドはない。いくつかの実施形態では、mRNAは5’キャップと開始コドンの間にコザック配列(以下に記載)を含むが、さらなる5’UTRは何もない。いくつかの実施形態では、mRNAは3’UTRを含まず、例えば、終止コドンとポリA尾部の間にはさらなるヌクレオチドはない。
いくつかの実施形態では、mRNAはコザック配列を含む。コザック配列は、翻訳開始及びmRNAから翻訳されたポリペプチドの全体としての収率に影響を及ぼし得る。コザック配列には、開始コドンとして機能し得るメチオニンコドンが含まれる。最小コザック配列はNNNRUGNであり、以下のうち少なくとも1つが真である、すなわち、1番目のNはAまたはGであり、かつ2番目のNはGである。ヌクレオチド配列においては、Rはプリン(AまたはG)を意味する。いくつかの実施形態では、コザック配列はRNNRUGN、NNNRUGG、RNNRUGG、RNNAUGN、NNNAUGG、またはRNNAUGGである。いくつかの実施形態では、コザック配列はrccRUGgであり、ミスマッチがゼロであるか、または小文字の位置に対するミスマッチを最高で1つもしくは2つ有する。いくつかの実施形態では、コザック配列はrccAUGgであり、ミスマッチがゼロであるか、または小文字の位置に対するミスマッチを最高で1つもしくは2つ有する。いくつかの実施形態では、コザック配列はgccRccAUGGであり、ミスマッチがゼロであるか、または小文字の位置に対するミスマッチを最高で1つ、2つ、もしくは3つ有する。いくつかの実施形態では、コザック配列はgccAccAUGであり、ミスマッチがゼロであるか、または小文字の位置に対するミスマッチを最高で1つ、2つ、3つ、もしくは4つ有する。いくつかの実施形態では、コザック配列はGCCACCAUGである。いくつかの実施形態では、コザック配列はgccgccRccAUGGであり、ミスマッチがゼロであるか、または小文字の位置に対するミスマッチを最高で1つ、2つ、3つ、もしくは4つ有する。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号43に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号43のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号44に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号44のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号56に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号56のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号57に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号57のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号58に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号58のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号59に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号59のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号60に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号60のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、RNA誘導型DNA結合因子をコードするORFを含むmRNAは、配列番号61に対する同一性が少なくとも90%である配列を含み、ここで、任意選択で、配列番号61のORF(すなわち、配列番号4)は、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFで置換される。
いくつかの実施形態では、mRNAは、配列番号7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つの代替的ORFを含む。
いくつかの実施形態では、任意選択で置換された、配列番号43、44、または56~61の配列に対する同一性の程度は95%である。いくつかの実施形態では、任意選択で置換された、配列番号43、44、または56~61の配列に対する同一性の程度は98%である。いくつかの実施形態では、任意選択で置換された、配列番号43、44、または56~61の配列に対する同一性の程度は99%である。いくつかの実施形態では、任意選択で置換された、配列番号43、44、または56~61の配列に対する同一性の程度は100%である。
いくつかの実施形態では、本明細書に開示するmRNAは、5’キャップ、例えば、Cap0、Cap1、またはCap2などを含む。5’キャップは一般に、mRNAの5’から3’方向への鎖の1番目のヌクレオチドの5’位に5’-三リン酸を介して連結されている7-メチルグアニンリボヌクレオチド(これを、以下に考察するように、例えば、ARCAに関してさらに修飾してよい)であり、すなわち、第1のキャップ近傍ヌクレオチドである。Cap0では、mRNAの第1及び第2のキャップ近傍ヌクレオチドのリボースはいずれも2’-ヒドロキシルを含む。Cap1では、mRNAの第1及び第2の転写されたヌクレオチドのリボースはそれぞれ、2’-メトキシ及び2’-ヒドロキシルを含む。Cap2では、mRNAの第1及び第2のキャップ近傍ヌクレオチドのリボースはいずれも2’-メトキシを含む。例えば、Katibah et al.(2014)Proc Natl Acad Sci USA 111(33):12025-30、Abbas et al.(2017)Proc Natl Acad Sci USA 114(11):E2106-E2115を参照のこと。ヒトmRNAなど哺乳類mRNAを含め、高等真核生物のほとんどの内在性mRNAはCap1またはCap2を含む。Cap0、ならびにCap1及びCap2とは異なる他のキャップ構造は、ヒトなどの哺乳類ではIFIT-1及びIFIT-5などの自然免疫系の成分によって「非自己」として認識されるために免疫原性である場合があり、これによりI型インターフェロンを含めサイトカインレベルが上昇し得る。IFIT-1及びIFIT-5などの自然免疫系の成分はまた、Cap1またはCap2以外のキャップを有するmRNAの結合についてeIF4Eと競合する場合もあり、mRNAの翻訳を阻害する可能性がある。
キャップは共転写によって含めることができる。例えば、ARCA(アンチリバースキャップアナログ;Thermo Fisher Scientificカタログ番号AM8045)は、グアニンリボヌクレオチドの5’位に連結された7-メチルグアニン3’-メトキシ-5’-三リン酸を含む、インビトロでの転写開始時に転写産物内に組み込まれ得るキャップアナログである。ARCAでは、第1キャップ近傍ヌクレオチドの2’位がヒドロキシルであるCap0のキャップになる。例えば、Stepinski et al.,(2001)“Synthesis and properties of mRNAs containing the novel ‘anti-reverse’ cap analogs 7-methyl(3’-O-methyl)GpppG and 7-methyl(3’deoxy)GpppG,”RNA 7:1486-1495を参照のこと。ARCAの構造を以下に示す。
Figure 2023103421000002
CleanCap(商標)AG(m7G(5’)ppp(5’)(2’OMeA)pG;TriLink Biotechnologiesカタログ番号N-7113)またはCleanCap(商標)GG(m7G(5’)ppp(5’)(2’OMeG)pG;TriLink Biotechnologiesカタログ番号N-7133)を使用すると、共転写によってCap1構造を得ることができる。CleanCap(商標)AG及びCleanCap(商標)GGの3’-O-メチル化型もそれぞれTriLink Biotechnologiesよりカタログ番号N-7413及びN-7433として入手可能である。CleanCap(商標)AG構造を以下に示す。
Figure 2023103421000003
別法として、転写後にRNAにキャップを付加することができる。例えば、ワクシニアのキャッピング酵素が市販されているが(New England Biolabsカタログ番号M2080S)、これは、そのD1サブユニットにより与えられるRNAトリホスファターゼ活性及びグアニリルトランスフェラーゼ活性、ならびにそのD12サブユニットにより与えられるグアニンメチルトランスフェラーゼを有する。したがって、この酵素は、S-アデノシルメチオニン及びGTPの存在下、Cap0を与えるようRNAに7-メチルグアニンを付加することができる。例えば、Guo,P.and Moss,B.(1990)Proc.Natl.Acad.Sci.USA 87,4023-4027、Mao,X.and Shuman,S.(1994)J.Biol.Chem.269,24472-24479を参照のこと。
いくつかの実施形態では、mRNAはさらにポリアデニル化(ポリA)尾部を含む。いくつかの実施形態では、ポリA尾部は少なくとも20個、30個、40個、50個、60個、70個、80個、90個、または100個のアデニン、任意選択で最高300個のアデニンを含む。いくつかの実施形態では、ポリA尾部は、95個、96個、97個、98個、99個、または100個のアデニンヌクレオチドを含む。いくつかの例では、ポリA尾部は、ポリA尾部内の1つ以上の位置において1個以上の非アデニンヌクレオチド「アンカー」で「中断」される。ポリA尾部は少なくとも8個の連続するアデニンヌクレオチドを含んでよいが、1個以上の非アデニンヌクレオチドも含む。本明細書で使用する場合、「非アデニンヌクレオチド」とは、アデニンを含まない任意の天然または非天然のヌクレオチドを指す。グアニン、チミン、及びシトシンヌクレオチドは例示的な非アデニンヌクレオチドである。したがって、本明細書に記載するmRNAのポリA尾部は、RNA誘導型DNA結合因子または目的配列をコードするヌクレオチドの3’に位置する連続するアデニンヌクレオチドを含んでよい。いくつかの例では、mRNAのポリA尾部は、RNA誘導型DNA結合因子または目的配列をコードするヌクレオチドの3’に位置する非連続的なアデニンヌクレオチドを含み、ここで、非アデニンヌクレオチドによりアデニンヌクレオチドが規則的または不規則に空いた間隔で中断される。
いくつかの実施形態では、mRNAはさらにポリアデニル化(ポリA)尾部を含む。いくつかの実施形態では、ポリA尾部は少なくとも20個、30個、40個、50個、60個、70個、80個、90個、または100個のアデニン、任意選択で最高300個のアデニンを含む。いくつかの実施形態では、ポリA尾部は、95個、96個、97個、98個、99個、または100個のアデニンヌクレオチドを含む。いくつかの例では、ポリA尾部は、ポリA尾部内の1つ以上の位置において1個以上の非アデニンヌクレオチド「アンカー」で「中断」される。ポリA尾部は少なくとも8個の連続するアデニンヌクレオチドを含んでよいが、1個以上の非アデニンヌクレオチドも含む。本明細書で使用する場合、「非アデニンヌクレオチド」とは、アデニンを含まない任意の天然または非天然のヌクレオチドを指す。グアニン、チミン、及びシトシンヌクレオチドは例示的な非アデニンヌクレオチドである。したがって、本明細書に記載するmRNAのポリA尾部は、RNA誘導型DNA結合因子または目的配列をコードするヌクレオチドの3’に位置する連続するアデニンヌクレオチドを含んでよい。いくつかの例では、mRNAのポリA尾部は、RNA誘導型DNA結合因子または目的配列をコードするヌクレオチドの3’に位置する非連続的なアデニンヌクレオチドを含み、ここで、非アデニンヌクレオチドによりアデニンヌクレオチドが規則的または不規則に空いた間隔で中断される。
いくつかの実施形態では、連続するアデニンヌクレオチドの長く伸びた領域にポリ(A)結合タンパク質が結合できるよう、連続するアデニンヌクレオチドを中断するため1個以上の非アデニンヌクレオチドを配する。いくつかの実施形態では、少なくとも8個、9個、10個、11個、または12個連続するアデニンヌクレオチドの後に1個以上の非アデニンヌクレオチド(複数可)を位置させる。いくつかの実施形態では、少なくとも8~50個連続するアデニンヌクレオチドの後に1個以上の非アデニンヌクレオチドを位置させる。いくつかの実施形態では、少なくとも8~100個連続するアデニンヌクレオチドの後に1個以上の非アデニンヌクレオチドを位置させる。いくつかの実施形態では、非アデニンヌクレオチドは1個、2個、3個、4個、5個、6個、または7個のアデニンヌクレオチドの後にあり、その後に少なくとも8個連続するアデニンヌクレオチドが続く。
ポリA尾部は、連続するアデニンヌクレオチドの配列を1つ、その後に1個以上の非アデニンヌクレオチド、任意選択でその後にさらなるアデニンヌクレオチドを含んでよい。
いくつかの実施形態では、ポリA尾部は、非アデニンヌクレオチドを1個、または非アデニンヌクレオチドが2~10個連続する長い領域を1つ含むかまたは含有する。いくつかの実施形態では、少なくとも8個、9個、10個、11個、または12個連続するアデニンヌクレオチドの後に非アデニンヌクレオチド(複数可)を位置させる。いくつかの例では、少なくとも8~50個連続するアデニンヌクレオチドの後に1個以上の非アデニンヌクレオチドを位置させる。いくつかの実施形態では、少なくとも8個、9個、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個、20個、21個、22個、23個、24個、25個、26個、27個、28個、29個、30個、31個、32個、33個、34個、35個、36個、37個、38個、39個、40個、41個、42個、43個、44個、45個、46個、47個、48個、49個、または50個連続するアデニンヌクレオチドの後に1個以上の非アデニンヌクレオチドを位置させる。
いくつかの実施形態では、非アデニンヌクレオチドはグアニン、シトシン、またはチミンである。いくつかの例では、非アデニンヌクレオチドはグアニンヌクレオチドである。いくつかの実施形態では、非アデニンヌクレオチドはシトシンヌクレオチドである。いくつかの実施形態では、非アデニンヌクレオチドはチミンヌクレオチドである。2個以上の非アデニンヌクレオチドが存在するいくつかの例では、非アデニンヌクレオチドは、a)グアニンヌクレオチド及びチミンヌクレオチド、b)グアニンヌクレオチド及びシトシンヌクレオチド、c)チミンヌクレオチド及びシトシンヌクレオチド、またはd)グアニンヌクレオチド、チミンヌクレオチド及びシトシンヌクレオチドから選択してよい。非アデニンヌクレオチドを含む例示的なポリA尾部を配列番号62として記載する。
いくつかの実施形態では、mRNAを精製する。いくつかの実施形態では、沈殿方法(例えば、LiCl沈殿、アルコール沈殿など、または同等の方法、例えば、本明細書に記載の方法など)を使用してmRNAを精製する。いくつかの実施形態では、HPLCを用いる方法など、クロマトグラフィーを用いる方法または同等の方法(例えば、本明細書に記載の方法)を使用してmRNAを精製する。いくつかの実施形態では、沈殿方法(例えば、LiCl沈殿)及びHPLCを用いる方法の両方を使用してmRNAを精製する。
いくつかの実施形態では、本明細書に開示のmRNAと組み合わせて少なくとも1つのgRNAを提供する。いくつかの実施形態では、gRNAは、mRNAとは別の分子として提供される。いくつかの実施形態では、gRNAは、本明細書に開示のmRNAの一部として、例えば、UTRの一部として提供される。
化学修飾gRNA
いくつかの実施形態では、gRNAを化学的に修飾する。1つ以上の修飾されたヌクレオシドまたはヌクレオチドを含むgRNAは「修飾」gRNAまたは「化学修飾」gRNAと呼ばれ、標準残基A、G、C、及びUの代わりに使用されるかまたは追加で使用される天然には生じない成分もしくは構成及び/または天然に生じる成分もしくは構成が1つ以上存在することを表す。いくつかの実施形態では、修飾gRNAは非標準のヌクレオシドまたはヌクレオチドを用いて合成され、これを本明細書では「修飾」と呼ぶ。修飾ヌクレオシド及び修飾ヌクレオチドには、(i)ホスホジエステル骨格結合におけるリン酸基の非連結酸素のうちの一方もしくは両方及び/またはリン酸基の連結酸素のうち1つ以上の変化、例えば、置換(例示的な骨格修飾)、(ii)リボース糖の構成要素、例えば、リボース糖の2’位のヒドロキシルなどの変化、例えば、置換(例示的な糖修飾)、(iii)「デホスホ」リンカーでのリン酸部分の大幅な置換(例示的な骨格修飾)、(iv)非標準核酸塩基を用いるなど、天然に生じる核酸塩基の修飾または置換(例示的な塩基修飾)、(v)リボース-リン酸骨格の置換または修飾(例示的な骨格修飾)、(vi)オリゴヌクレオチドの3’末端または5’末端の修飾、例えば、末端リン酸基を除去、修飾もしくは置換するか、または部分、キャップもしくリンカーを結合させる修飾(そのような3’または5’のキャップ修飾は糖修飾及び/または骨格修飾を含んでよい)、及び(vii)糖の修飾または置換(例示的な糖修飾)のうち1つ以上が含まれ得る。
いくつかの実施形態では、gRNAは、一部または全部のウリジン位置において修飾ウリジンを含む。いくつかの実施形態では、修飾ウリジンは、5位において、例えば、ハロゲンまたはC1-C6アルコキシなどで修飾されたウリジンである。いくつかの実施形態では、修飾ウリジンは、1位において、例えば、C1-C6アルキルなどで修飾されたプソイドウリジンである。修飾ウリジンは、例えば、プソイドウリジン、N1-メチル-プソイドウリジン、5-メトキシウリジン、5-ヨードウリジン、またはその組み合わせであり得る。いくつかの実施形態では、修飾ウリジンは5-メトキシウリジンである。いくつかの実施形態では、修飾ウリジンは5-ヨードウリジンである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンである。いくつかの実施形態では、修飾ウリジンはN1-メチル-プソイドウリジンである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンとN1-メチル-プソイドウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンと5-メトキシウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンはN1-メチルプソイドウリジンと5-メトキシウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンは5-ヨードウリジンとN1-メチル-プソイドウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンはプソイドウリジンと5-ヨードウリジンの組み合わせである。いくつかの実施形態では、修飾ウリジンは5-ヨードウリジンと5-メトキシウリジンの組み合わせである。
いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち少なくとも10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%、または100%は修飾ウリジンである。いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は修飾ウリジン、例えば、5-メトキシウリジン、5-ヨードウリジン、N1-メチルプソイドウリジン、プソイドウリジン、またはその組み合わせである。いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-メトキシウリジンである。いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%はプソイドウリジンである。いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%はN1-メチルプソイドウリジンである。いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-ヨードウリジンである。いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-メトキシウリジンであり、残りのウリジン位置はN1-メチルプソイドウリジンである。いくつかの実施形態では、本開示によるgRNAのウリジン位置のうち10%~25%、15~25%、25~35%、35~45%、45~55%、55~65%、65~75%、75~85%、85~95%、または90~100%は5-ヨードウリジンであり、残りのウリジン位置はN1-メチルプソイドウリジンである。
上掲のような化学修飾を組み合わせて、2つ、3つ、4つ、またはそれ以上の修飾を有し得るヌクレオシド及びヌクレオチド(総称して「残基」と呼ぶ)を含む修飾gRNAを得ることができる。例えば、修飾残基は修飾糖及び修飾核酸塩基を有し得る。いくつかの実施形態では、gRNAのどの塩基も修飾する、例えば、塩基すべてがホスホロチオアート基などの修飾リン酸基を有する。特定の実施形態では、gRNA分子のリン酸基の全部または実質的に全部をホスホロチオアート基で置き換える。いくつかの実施形態では、修飾gRNAは、RNAの5’末端またはその近傍に少なくとも1つの修飾残基を含む。いくつかの実施形態では、修飾gRNAは、RNAの3’末端またはその近傍に少なくとも1つの修飾残基を含む。
いくつかの実施形態では、gRNAは修飾残基を1つ、2つ、3つ、またはそれ以上含む。いくつかの実施形態では、修飾gRNAの位置のうち少なくとも5%(例えば、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、または100%)は修飾されたヌクレオシドまたはヌクレオチドである。
非修飾核酸は、例えば、細胞内または血清中に見られるヌクレアーゼなどによって分解される傾向があり得る。例えば、ヌクレアーゼは核酸のホスホジエステル結合を加水分解することができる。したがって、一態様では、本明細書に記載するgRNAは、1つ以上の修飾されたヌクレオシドまたはヌクレオチドを含有して、例えば、細胞内または血清中のヌクレアーゼに対する安定性を導入することができる。いくつかの実施形態では、本明細書に記載の修飾gRNA分子は、インビボでもエキソビボでも細胞集団に導入した場合に低い自然免疫応答を示し得る。用語「自然免疫応答」には、一本鎖核酸などの外来性核酸に対する細胞応答が含まれ、サイトカインの発現及び放出、特にインターフェロンの放出、ならびに細胞死の誘導を行う。
骨格修飾のいくつかの実施形態では、修飾残基のリン酸基は、酸素の1つ以上を異なる置換基で置き換えることによって修飾することができる。さらに、修飾残基、例えば、修飾核酸に存在する修飾残基には、本明細書に記載する修飾リン酸基での非修飾リン酸部分の大幅な置換が含まれ得る。いくつかの実施形態では、リン酸骨格の骨格修飾には、非荷電リンカーまたは電荷分布が非対称的な荷電リンカーのいずれかをもたらす変化が含まれ得る。
修飾リン酸基の例としては、ホスホロチオアート、ホスホロセレナート、ボラノリン酸、ボラノリン酸エステル、ホスホン酸水素、ホスホロアミダート、ホスホン酸アルキルまたはホスホン酸アリール及びホスホトリエステルが挙げられる。非修飾リン酸基のリン原子はアキラルである。ただし、非架橋酸素のうちの1個を上記の原子または原子団の1つで置き換えることにより、そのリン原子をキラルにすることができる。不斉リン原子は、「R」立体配置(本明細書ではRp)または「S」立体配置(本明細書ではSp)のいずれも有することができる。骨格はまた、架橋酸素(すなわち、リン酸基とヌクレオシドを連結する酸素)を窒素(架橋ホスホロアミダート)、硫黄(架橋ホスホロチオアート)及び炭素(架橋メチレンホスホナート)で置き換えることによって修飾することもできる。置き換えは、連結酸素のいずれか、または連結酸素の両方において出現してよい。
特定の骨格修飾では、リン酸基をリン不含のコネクタで置き換えることができる。いくつかの実施形態では、荷電リン酸基を中性部分で置き換えることができる。リン酸基に換わることができる部分の例としては、限定することなく、例えば、メチルホスホナート、ヒドロキシルアミノ、シロキサン、カルボナート、カルボキシメチル、カルバマート、アミド、チオエーテル、エチレンオキシドリンカー、スルホナート、スルホンアミド、チオホルムアセタール、ホルムアセタール、オキシム、メチレンイミノ、メチレンメチルイミノ、メチレンヒドラゾ、メチレンジメチルヒドラゾ及びメチレンオキシメチルイミノを挙げることができる。
鋳型核酸
本明細書に開示する組成物及び方法には鋳型核酸が含まれ得る。鋳型を使用して、Casヌクレアーゼの標的部位またはその近傍にて核酸配列を変化させるかまたは挿入してよい。いくつかの実施形態では、方法は、細胞に鋳型を導入することを含む。いくつかの実施形態では、単一の鋳型が提供され得る。他の実施形態では、2つ以上の標的部位にて編集が生じるよう2つ以上の鋳型が提供され得る。例えば、ある細胞の単一遺伝子、またはある細胞の2つの異なる遺伝子を編集するため、異なる鋳型が提供され得る。
いくつかの実施形態では、鋳型を相同組換えで使用してよい。いくつかの実施形態では、相同組換えにより、標的核酸分子内への鋳型配列または鋳型配列の一部の組み込みがもたらされ得る。他の実施形態では、鋳型を、核酸の切断部位でDNA鎖の侵入が起こる相同組換え修復で使用してよい。いくつかの実施形態では、相同組換え修復により、鋳型配列が、編集された標的核酸分子内に含まれるということがもたらされ得る。さらに別の実施形態では、非相同末端結合によって媒介される遺伝子編集で鋳型を使用してよい。いくつかの実施形態では、鋳型配列には、切断部位近傍の核酸配列に対する類似性は全くない。いくつかの実施形態では、鋳型または鋳型配列の一部を組み込む。いくつかの実施形態では、鋳型には、隣接する末端逆位反復(ITR)配列が含まれる。
いくつかの実施形態では、鋳型は、切断部位のそれぞれ上流及び下流に位置する配列に相補的な、第1のホモロジーアーム及び第2のホモロジーアーム(第1のヌクレオチド配列及び第2のヌクレオチド配列とも呼ばれる)を含んでよい。鋳型が2つのホモロジーアームを含有する場合、各アームは長さが同じであっても異なっていてもよく、ホモロジーアームに挟まれた配列は、ホモロジーアームに挟まれた標的配列と実質的に類似であるかもしくは同一であり得る、または全く無関係の配列であり得る。いくつかの実施形態では、鋳型上の第1のヌクレオチド配列と切断部位の上流の配列との相補性または同一性パーセントの程度、及び鋳型上の第2のヌクレオチド配列と切断部位の下流の配列との相補性または同一性パーセントの程度により、鋳型と標的核酸分子の間の相同組換え、例えば、高忠実度相同組換えなどが可能になり得る。いくつかの実施形態では、相補性の程度は約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%であってよい。いくつかの実施形態では、相補性の程度は約95%、97%、98%、99%、または100%であってよい。いくつかの実施形態では、相補性の程度は少なくとも98%、99%、または100%であってよい。いくつかの実施形態では、相補性の程度は100%であってよい。いくつかの実施形態では、同一性パーセントは約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%であってよい。いくつかの実施形態では、同一性パーセントは約95%、97%、98%、99%、または100%であってよい。いくつかの実施形態では、同一性パーセントは少なくとも98%、99%、または100%であってよい。いくつかの実施形態では、同一性パーセントは100%であってよい。
いくつかの実施形態では、鋳型配列は、標的細胞の内在性配列に対応するか、それを含むか、またはそれからなってよい。さらに、または別法として、鋳型配列は、標的細胞の外来配列に対応するか、それを含むか、またはそれからなってよい。本明細書で使用する場合、用語「内在性配列」とは、その細胞にとって天然である配列を指す。用語「外来配列」とは、その細胞にとって天然ではない配列、またはその細胞のゲノムにおける天然での位置が別の異なる位置にある配列を指す。いくつかの実施形態では、内在性配列は細胞のゲノム配列であってよい。いくつかの実施形態では、内在性配列は染色体の配列または染色体外の配列であってよい。いくつかの実施形態では、内在性配列は細胞のプラスミド配列であってよい。いくつかの実施形態では、鋳型配列は、切断部位またはその近傍において細胞の内在性配列の一部と実質的に同一であってよいが、少なくとも1つのヌクレオチドの変化を含む。いくつかの実施形態では、切断された標的核酸分子を鋳型で編集することにより、標的核酸分子の1つ以上のヌクレオチドの挿入、欠失、または置換を含む変異がもたらされ得る。いくつかの実施形態では、変異により、標的配列を含む遺伝子により発現されたタンパク質において1つ以上のアミノ酸の変化がもたらされ得る。いくつかの実施形態では、変異は、標的遺伝子により発現されたRNAに1つ以上のヌクレオチドの変化をもたらし得る。いくつかの実施形態では、変異は標的遺伝子の発現レベルを変化させ得る。いくつかの実施形態では、変異は標的遺伝子の発現の増大または低下をもたらし得る。いくつかの実施形態では、変異は遺伝子ノックダウンをもたらし得る。いくつかの実施形態では、変異は遺伝子ノックアウトをもたらし得る。いくつかの実施形態では、変異は遺伝子機能の回復をもたらし得る。いくつかの実施形態では、切断された標的核酸分子を鋳型で編集することにより、DNAなどの標的核酸分子エキソン配列、イントロン配列、制御配列、転写制御配列、翻訳制御配列、スプライシング部位、または非コード配列の変化がもたらされ得る。
他の実施形態では、鋳型配列は外来配列を含んでよい。いくつかの実施形態では、外来配列は、外来性プロモーター配列に機能的に連結された、タンパク質またはRNAをコードする配列を含んでよく、外来配列が標的核酸分子に組み込まれた際に、かかる組み込み配列でコードされたタンパク質またはRNAを細胞が発現することができるようにしてよい。他の実施形態では、外来配列が標的核酸分子内に組み込まれた際、かかる組み込み配列の発現は内在性プロモーター配列によって制御されてよい。いくつかの実施形態では、外来配列は、タンパク質または該タンパク質の一部をコードするcDNA配列を提供してよい。さらに別の実施形態では、外来配列は、エキソン配列、イントロン配列、制御配列、転写制御配列、翻訳制御配列、スプライシング部位、または非コード配列を含むかまたはそれからなってよい。いくつかの実施形態では、外来配列の組み込みにより遺伝子機能の回復がもたらされ得る。いくつかの実施形態では、外来配列の組み込みにより遺伝子ノックインがもたらされ得る。いくつかの実施形態では、外来配列の組み込みにより遺伝子ノックアウトがもたらされ得る。
鋳型は、適切な任意の長さであってよい。いくつかの実施形態では、鋳型は、10ヌクレオチド長、15ヌクレオチド長、20ヌクレオチド長、25ヌクレオチド長、50ヌクレオチド長、75ヌクレオチド長、100ヌクレオチド長、150ヌクレオチド長、200ヌクレオチド長、500ヌクレオチド長、1000ヌクレオチド長、1500ヌクレオチド長、2000ヌクレオチド長、2500ヌクレオチド長、3000ヌクレオチド長、3500ヌクレオチド長、4000ヌクレオチド長、4500ヌクレオチド長、5000ヌクレオチド長、5500ヌクレオチド長、6000ヌクレオチド長、またはそれ以上のヌクレオチド長を含んでよい。鋳型は一本鎖核酸であってよい。鋳型は二本鎖または部分的二本鎖の核酸であり得る。特定の実施形態では、一本鎖鋳型は、20ヌクレオチド長、30ヌクレオチド長、40ヌクレオチド長、50ヌクレオチド長、75ヌクレオチド長、100ヌクレオチド長、125ヌクレオチド長、150ヌクレオチド長、175ヌクレオチド長、または200ヌクレオチド長である。いくつかの実施形態では、鋳型は、標的配列(すなわち、「ホモロジーアーム」)を含む標的核酸分子の一部に相補的なヌクレオチド配列を含んでよい。いくつかの実施形態では、鋳型は、標的核酸分子上の切断部位の上流または下流に位置する配列に相補的なホモロジーアームを含んでよい。
いくつかの実施形態では、鋳型は、末端逆位反復(ITR)配列が隣接して含有されるssDNAまたはdsDNAを含有する。いくつかの実施形態では、鋳型は、ベクター、プラスミド、ミニサークル、ナノサークル、またはPCR産物として提供される。
核酸の精製
いくつかの実施形態では、核酸を精製する。いくつかの実施形態では、沈殿方法(例えば、LiCl沈殿、アルコール沈殿、または同等の方法、例えば、本明細書に記載の方法など)を使用して核酸を精製する。いくつかの実施形態では、HPLCを用いる方法など、クロマトグラフィーを用いる方法または同等の方法(例えば、本明細書に記載の方法)を使用して核酸を精製する。いくつかの実施形態では、沈殿方法(例えば、LiCl沈殿)及びHPLCを用いる方法の両方を使用して核酸を精製する。
標的配列
いくつかの実施形態では、本開示のCRISPR/Cas系を標的核酸分子上の標的配列に配向させ、切断してよい。例えば、標的配列は、Casヌクレアーゼによって認識され、切断されてよい。特定の実施形態では、Casヌクレアーゼの標的配列は、かかるヌクレアーゼの特異的PAM配列の近傍に位置する。いくつかの実施形態では、gRNAによって標的核酸分子の標的配列にクラス2Casヌクレアーゼを配向させ、そこで、gRNAは標的配列とハイブリダイズし、クラス2Casタンパク質が標的配列を切断してよい。いくつかの実施形態では、ガイドRNAは、クラス2Casヌクレアーゼの特異的PAMに隣接するかまたはそれを含む標的配列とハイブリダイズし、クラス2Casヌクレアーゼはかかる標的配列を切断する。いくつかの実施形態では、標的配列は、ガイドRNAの指向性配列に相補的であってよい。いくつかの実施形態では、ガイドRNAの指向性配列と、それに対応する、ガイドRNAがハイブリダイズする標的配列の部分との相補性の程度は、約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%であってよい。いくつかの実施形態では、ガイドRNAの指向性配列と、それに対応する、ガイドRNAがハイブリダイズする標的配列の部分との同一性パーセントは、約50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%、または100%であってよい。いくつかの実施形態では、標的の相同性領域は特異的PAM配列に隣接している。いくつかの実施形態では、標的配列は、ガイドRNAの指向性配列と100%相補的な配列を含んでよい。他の実施形態では、標的配列は、ガイドRNAの指向性配列と比べて少なくとも1つのミスマッチ、欠失、または挿入を含んでよい。
標的配列の長さは使用するヌクレアーゼ系によって異なってよい。例えば、CRISPR/Cas系用のガイドRNAの指向性配列は、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、または50超のヌクレオチド長を含んでよく、標的配列は対応する長さであり、任意選択でPAM配列に隣接する。いくつかの実施形態では、標的配列は15~24ヌクレオチド長を含んでよい。いくつかの実施形態では、標的配列は17~21ヌクレオチド長を含んでよい。いくつかの実施形態では、標的配列は20ヌクレオチド長を含んでよい。ニッカーゼを使用する場合、標的配列は、DNA分子の反対鎖を切断する一対のニッカーゼによって認識される一対の標的配列を含んでよい。いくつかの実施形態では、標的配列は、DNA分子の同じ鎖を切断する一対のニッカーゼによって認識される一対の標的配列を含んでよい。いくつかの実施形態では、標的配列は、1つ以上のCasヌクレアーゼによって認識される標的配列の一部を含んでよい。
標的核酸分子は、細胞にとって内在性または外来性であるどのDNA分子またはRNA分子であってもよい。いくつかの実施形態では、標的核酸分子は、細胞由来または細胞内のエピソームDNA、プラスミド、ゲノムDNA、ウイルスゲノム、ミトコンドリアDNA、または染色体DNAであってよい。いくつかの実施形態では、標的核酸分子の標的配列は、ヒト細胞などの細胞由来または細胞内のゲノム配列であってよい。
さらなる実施形態では、標的配列はウイルス配列であってよい。さらなる実施形態では、標的配列は病原体配列であってよい。さらに別の実施形態では、標的配列は合成配列であってよい。さらなる実施形態では、標的配列は染色体配列であってよい。特定の実施形態では、標的配列は転座接合部、例えば、がんに関連した転座を含んでよい。いくつかの実施形態では、標的配列はヒト染色体など真核生物の染色体上にあってよい。特定の実施形態では、標的配列は肝臓特異的配列であり、その場合、その配列は肝細胞に発現する。
いくつかの実施形態では、標的配列は遺伝子のコード配列内、遺伝子のイントロン配列内、制御配列内、遺伝子の転写制御配列内、遺伝子の翻訳制御配列内、スプライシング部位または遺伝子間の非コード配列内に位置してよい。いくつかの実施形態では、遺伝子は、タンパク質をコードする遺伝子であってよい。他の実施形態では、遺伝子はノンコーディングRNA遺伝子であってよい。いくつかの実施形態では、標的配列は疾患関連遺伝子の全部または一部を含んでよい。いくつかの実施形態では、標的配列は、ゲノムの非遺伝子機能部位、例えば、足場部位または遺伝子座制御領域のようなクロマチン組織の側面を制御する部位に位置してよい。
クラス2CasヌクレアーゼなどのCasヌクレアーゼが関係する実施形態では、標的配列は、プロトスペーサー隣接モチーフ(「PAM」)に隣接してよい。いくつかの実施形態では、PAMは、標的配列の3’末端に隣接するかまたはその1ヌクレオチド、2ヌクレオチド、3ヌクレオチド、または4ヌクレオチド以内にあってよい。PAMの長さ及び配列は、使用するCasタンパク質によって異なってよい。例えば、PAMは、特定のCas9タンパク質またはCas9オルソログについてのコンセンサス配列または特定のPAM配列から選択してよく、これには、関連開示それぞれが参照により本明細書に組み込まれる、Ran et al.,Nature,520:186-191(2015)の図1、及びZetsche 2015の図S5に開示のものが含まれる。いくつかの実施形態では、PAMは、2ヌクレオチド長、3ヌクレオチド長、4ヌクレオチド長、5ヌクレオチド長、6ヌクレオチド長、7ヌクレオチド長、8ヌクレオチド長、9ヌクレオチド長、または10ヌクレオチド長であってよい。非限定的な例示的PAM配列としては、NGG、NGGNG、NG、NAAAAN、NNAAAAW、NNNNACA、GNNNCNNA、TTN、及びNNNNGATTが挙げられる(ここで、Nは任意のヌクレオチドとして定義され、WはAまたはTのいずれかとして定義される)。いくつかの実施形態では、PAM配列はNGGであってよい。いくつかの実施形態では、PAM配列はNGGNGであってよい。いくつかの実施形態では、PAM配列はTTNであってよい。いくつかの実施形態では、PAM配列はNNAAAAWであってよい。
脂質製剤
本明細書では、CRISPR/Casカーゴなど、RNAのLNP製剤のさまざまな実施形態を開示する。そのようなLNP製剤には、ヘルパー脂質、中性脂質、及びPEG脂質とともに「アミン脂質」が含まれる。いくつかの実施形態では、そのようなLNP製剤には、ヘルパー脂質及びPEG脂質とともに「アミン脂質」が含まれる。いくつかの実施形態では、LNP製剤には、1パーセント未満の中性リン脂質が含まれる。いくつかの実施形態では、LNP製剤には、0.5パーセント未満の中性リン脂質が含まれる。「脂質ナノ粒子」は、互いに分子間力によって物理的に会合している複数(すなわち2つ以上)の脂質分子を含む粒子を意味する。
アミン脂質
生物学的に活性な薬剤を送達するためのLNP組成物は、リピドAのアセタール類似体など、リピドAまたはその同等物として定義される「アミン脂質」を含む。
いくつかの実施形態では、アミン脂質はリピドAであり、これは(9Z,12Z)-3-((4,4-ビス(オクチルオキシ)ブタノイル)オキシ)-2-((((3-(ジエチルアミノ)プロポキシ)カルボニル)オキシ)メチル)プロピルオクタデカ-9,12-ジエノアートであり、3-((4,4-ビス(オクチルオキシ)ブタノイル)オキシ)-2-((((3-(ジエチルアミノ)プロポキシ)カルボニル)オキシ)メチル)プロピル(9Z,12Z)-オクタデカ-9,12-ジエノアートとも呼ばれる。リピドAは、
Figure 2023103421000004
のように表され得る。
リピドAはWO2015/095340(例えば、84~86頁)に従って合成してよい。特定の実施形態では、アミン脂質はリピドAと同等物である。
特定の実施形態では、アミン脂質はリピドAの類似体である。特定の実施形態では、リピドA類似体はリピドAのアセタール類似体である。特定のLNP組成物では、アセタール類似体はC4-C12アセタール類似体である。いくつかの実施形態では、アセタール類似体はC5-C12アセタール類似体である。さらなる実施形態では、アセタール類似体はC5-C10アセタール類似体である。さらなる実施形態では、アセタール類似体は、C4、C5、C6、C7、C9、C10、C11、及びC12のアセタール類似体から選ばれる。
本明細書に記載するLNPでの使用に好適なアミン脂質はインビボで生物分解性であり、RNAなどの生物学的に活性な物質を細胞に送達するのに好適である。アミン脂質は毒性が低い(例えば、10mg/kg以上のRNAカーゴ量で動物モデルでの忍容性があり、有害作用がない)。特定の実施形態では、アミン脂質を含むLNPには、アミン脂質の少なくとも75%が8時間以内、10時間以内、12時間以内、24時間以内、もしくは48時間以内、または3日以内、4日以内、5日以内、6日以内、7日以内、もしくは10日以内に血漿から消失するものが含まれる。特定の実施形態では、アミン脂質を含むLNPには、mRNAまたはgRNAの少なくとも50%が8時間以内、10時間以内、12時間以内、24時間以内、もしくは48時間以内、または3日以内、4日以内、5日以内、6日以内、7日以内、もしくは10日以内に血漿から消失するものが含まれる。特定の実施形態では、アミン脂質を含むLNPには、例えば、脂質(例えば、アミン脂質)、RNA(例えば、mRNA)、または別の成分を測定して、LNPの少なくとも50%が8時間以内、10時間以内、12時間以内、24時間以内、もしくは48時間以内、または3日以内、4日以内、5日以内、6日以内、7日以内、もしくは10日以内に血漿から消失するものが含まれる。特定の実施形態では、LNPの脂質、RNA、または核酸成分を脂質に封入した場合と遊離の場合とで測定する。
脂質クリアランスは、文献に記載のとおり測定してよい。Maier,M.A.,et al.Biodegradable Lipids Enabling Rapidly Eliminated Lipid Nanoparticles for Systemic Delivery of RNAi Therapeutics.Mol.Ther.2013,21(8),1570-78(「Maier」)を参照のこと。例えば、Maierでは、ルシフェラーゼ-指向性siRNAを含有するLNP-siRNA系を0.3mg/kgにて6~8週齢雄C57Bl/6マウスに側尾静脈を介して静脈内ボーラス注射により投与した。投与から0.083時間、0.25時間、0.5時間、1時間、2時間、4時間、8時間、24時間、48時間、96時間、及び168時間の後、血液、肝臓、及び脾臓の各試料を採取した。マウスを生理食塩水で灌流してから組織を採取し、血液試料を処理して血漿を得た。全試料を処理し、LC-MSで分析した。さらに、Maierは、LNP-siRNA製剤投与後の毒性評価の手法を記載している。例えば、雄Sprague-Dawleyラットに対しルシフェラーゼ-指向性siRNAを0mg/kg、1mg/kg、3mg/kg、5mg/kg、及び10mg/kg(動物5匹/群)にて5mL/kgの投与容量で単一静脈内ボーラス注射により投与した。24時間後、約1mLの血液を覚醒動物の頚静脈から得、血清を単離した。投与から72時間後、全動物を剖検用に安楽死させた。臨床徴候、体重、血清化学検査、臓器重量及び組織病理学の評価を実施した。Maierは、siRNA-LNP製剤を評価するための方法を記載しており、これらの方法を本開示のLNP組成物の投与に関するクリアランス、薬物動態、及び毒性の評価に適用してよい。
アミン脂質はクリアランス速度の増大を引き起こし得る。いくつかの実施形態では、クリアランス速度は、脂質クリアランス速度、例えば、血液、血清、または血漿から脂質が消失する速度である。いくつかの実施形態では、クリアランス速度は、RNAクリアランス速度、例えば、血液、血清、または血漿からmRNAまたはgRNAが消失する速度である。いくつかの実施形態では、クリアランス速度は、血液、血清、または血漿からLNPが消失する速度である。いくつかの実施形態では、クリアランス速度は、肝組織または脾臓組織などの組織からLNPが消失する速度である。特定の実施形態では、高クリアランス速度は実質的に有害作用のない安全性プロファイルをもたらす。アミン脂質は、循環中及び組織内でのLNPの蓄積を低下させ得る。いくつかの実施形態では、循環中及び組織内でのLNPの蓄積低下は、実質的に有害作用のない安全性プロファイルをもたらす。
本開示のアミン脂質は、それが含まれている培地のpHに応じてイオン化され得る(例えば、塩を形成してよい)。例えば、わずかに酸性の培地では、アミン脂質はプロトン化されてよく、したがって正電荷を帯びてよい。逆に、例えば、血液などのようにpHが約7.35であるわずかに塩基性の培地ではアミン脂質はプロトン化されない場合があり、したがって電荷を帯びない場合がある。いくつかの実施形態では、本開示のアミン脂質は、pHが少なくとも約9でプロトン化され得る。いくつかの実施形態では、本開示のアミン脂質は、pHが少なくとも約9でプロトン化され得る。いくつかの実施形態では、本開示のアミン脂質は、pHが少なくとも約10でプロトン化され得る。
アミン脂質が優勢にプロトン化されるpHは、その内因性pKaに関連している。いくつかの実施形態では、本開示のアミン脂質は各々独立して、pKaが約5.1~約7.4の範囲にあってよい。いくつかの実施形態では、本開示のアミン脂質は各々独立して、pKaが約5.5~約6.6の範囲にあってよい。いくつかの実施形態では、本開示のアミン脂質は各々独立して、pKaが約5.6~約6.4の範囲にあってよい。いくつかの実施形態では、本開示のアミン脂質は各々独立して、pKaが約5.8~約6.2の範囲にあってよい。例えば、本開示のアミン脂質は各々独立して、pKaが約5.8~約6.5の範囲にあってよい。pKaが約5.1~約7.4の範囲のカチオン性脂質はカーゴをインビボで、例えば、肝臓などに送達する際に有効であることが見出されていることから、アミン脂質のpKaはLNPの製剤化において考慮すべき重要な事項であり得る。さらに、pKaが約5.3~約6.4の範囲のカチオン性脂質はインビボで、例えば、腫瘍などに送達する際に有効であることが見出されている。例えば、WO2014/136086を参照のこと。
さらなる脂質
本開示の脂質組成物での使用に好適な「中性脂質」としては、例えば、多種多様な中性脂質、非荷電脂質または両性イオン型脂質などが挙げられる。本開示での使用に好適な中性リン脂質の例としては、5-ヘプタデシルベンゼン-1,3-ジオール(レゾルシン)、ジパルミトイルホスファチジルコリン(DPPC)、ジステアロイルホスファチジルコリン(DSPC)、ホスホコリン(DOPC)、ジミリストイルホスファチジルコリン(DMPC)、ホスファチジルコリン(PLPC)、1,2-ジステアロイル-sn-グリセロ-3-ホスホコリン(DAPC)、ホスファチジルエタノールアミン(PE)、卵ホスファチジルコリン(EPC)、ジラウリロイルホスファチジルコリン(dilauryloylphosphatidylcholine)(DLPC)、ジミリストイルホスファチジルコリン(DMPC)、1-ミリストイル-2-パルミトイルホスファチジルコリン(MPPC)、1-パルミトイル-2-ミリストイルホスファチジルコリン(PMPC)、1-パルミトイル-2-ステアロイルホスファチジルコリン(PSPC)、1,2-ジアラキドイル-sn-グリセロ-3-ホスホコリン(DBPC)、1-ステアロイル-2-パルミトイルホスファチジルコリン(SPPC)、1,2-ジエイコセノイル-sn-グリセロ-3-ホスホコリン(DEPC)、パルミトイルオレオイルホスファチジルコリン(POPC)、リゾホスファチジルコリン、ジオレオイルホスファチジルエタノールアミン(DOPE)、ジリノレオイルホスファチジルコリン、ジステアロイルホスファチジルエタノールアミン(DSPE)、ジミリストイルホスファチジルエタノールアミン(DMPE)、ジパルミトイルホスファチジルエタノールアミン(DPPE)、パルミトイルオレオイルホスファチジルエタノールアミン(POPE)、リゾホスファチジルエタノールアミン及びその組み合わせが挙げられるが、これに限定されるものではない。一実施形態では、中性リン脂質は、ジステアロイルホスファチジルコリン(DSPC)及びジミリストイルホスファチジルエタノールアミン(DMPE)からなる群から選択されてよい。別の実施形態では、中性リン脂質はジステアロイルホスファチジルコリン(DSPC)であってよい。別の実施形態では、中性リン脂質はジパルミトイルホスファチジルコリン(DPPC)であってよい。
「ヘルパー脂質」としては、ステロイド、ステロール、及びアルキルレソルシノールが挙げられる。本開示での使用に好適なヘルパー脂質としては、コレステロール、5-ヘプタデシルレソルシノール、及びコレステロールヘミスクシナートが挙げられるが、これに限定されるものではない。一実施形態では、ヘルパー脂質はコレステロールであってよい。一実施形態では、ヘルパー脂質はコレステロールヘミスクシナートであってよい。
PEG脂質は、ナノ粒子がインビボ(例えば、血液中)で存在できる時間の長さを変化させるステルス脂質である。PEG脂質は、例えば、粒子の凝集抑制及び粒径制御などにより製剤工程の補助となり得る。本明細書で使用するPEG脂質により、LNPの薬物動態特性が調節され得る。典型的に、PEG脂質は、脂質部分と、PEGに基づくポリマー部分とを含む。
いくつかの実施形態では、脂質部分はジアシルグリセロールまたはジアシルグリカミドから得ることができ、これには、独立して、アルキル鎖長に約C4から約C40の飽和もしくは不飽和の炭素原子を含むジアルキルグリセロール基またはジアルキルグリカミド基を含むものが含まれ、ここで、かかる鎖は、例えば、アミドまたはエステルなど、1つ以上の官能基を含んでよい。いくつかの実施形態では、アルキル鎖長は約C10からC20を含む。ジアルキルグリセロール基またはジアルキルグリカミド基はさらに1つ以上の置換アルキル基を含むことができる。鎖長は対称でも非対称でもよい。
特に明記しない限り、本明細書で使用する「PEG」という用語は、任意のポリエチレングリコールまたは他のポリアルキレンエーテルポリマーを意味する。一実施形態では、PEG部分は、任意選択で置換された、エチレングリコールまたはエチレンオキシドの直鎖ポリマーまたは分岐ポリマーである。別法として、PEG部分を、例えば、1つ以上のアルキル基、アルコキシ基、アシル基、ヒドロキシ基、またはアリール基などによって置換してよい。一実施形態では、PEG部分には、PEG-ポリウレタンまたはPEG-ポリプロピレンなどのPEG共重合体(例えば、J.Milton Harris,Poly(ethylene glycol)chemistry:biotechnical and biomedical applications(1992)を参照のこと)が含まれ、別法として、PEG部分はPEG共重合体を含まず、例えば、PEGモノポリマーであってよい。一実施形態では、PEGは分子量が約130~約50,000であり、下位実施形態では約150~約30,000であり、下位実施形態では約150~約20,000であり、下位実施形態では約150~約15,000であり、下位実施形態では、約150~約10,000であり、下位実施形態では約150~約6,000であり、下位実施形態では約150~約5,000であり、下位実施形態では約150~約4,000であり、下位実施形態では約150~約3,000であり、下位実施形態では約300~約3,000であり、下位実施形態では約1,000~約3,000であり、下位実施形態では約1,500~約2,500である。
特定の実施形態では、PEG(例えば、ステルス脂質などの脂質部分または脂質に結合させたもの)は「PEG-2K」であり、「PEG 2000」とも呼ばれ、平均分子量は約2,000ダルトンである。PEG-2Kは本明細書では以下の式(I)
Figure 2023103421000005
で表され、ここで、nは45であり、数平均重合度は約45のサブユニッを含むことを意味する。しかしながら、当該技術分野で公知の他のPEG実施形態を使用してよく、これには、例えば、数平均重合度が約23のサブユニット(n=23)、及び/または68のサブユニット(n=68)を含む実施形態が含まれる。いくつかの実施形態では、nは約30から約60であってよい。いくつかの実施形態では、nは約35から約55であってよい。いくつかの実施形態では、nは約40から約50であってよい。いくつかの実施形態では、nは約42から約48であってよい。いくつかの実施形態では、nは45であってよい。いくつかの実施形態では、Rは、H、置換アルキル、及び非置換アルキルから選択してよい。いくつかの実施形態では、Rは非置換アルキルであってよい。いくつかの実施形態では、Rはメチルであってよい。
本明細書に記載のいずれの実施形態においても、PEG脂質は、PEG-ジラウロイルグリセロール、PEG-ジミリストイルグリセロール(PEG-DMG)(カタログ番号GM-020、NOF(Tokyo,Japan)製)、PEG-ジパルミトイルグリセロール、PEG-ジステアロイルグリセロール(PEG-DSPE)(カタログ番号DSPE-020CN、NOF(Tokyo,Japan)製)、PEG-ジラウリルグリカミド、PEG-ジミリストイルグリカミド、PEG-ジパルミトイルグリカミド、及びPEG-ジステアロイルグリカミド、PEG-コレステロール(1-[8’-(コレスタ-5-エン-3[ベータ]-オキシ)カルボキサミド-3’,6’-ジオキサオクタニル]カルバモイル-[オメガ]-メチル-ポリ(エチレングリコール)、PEG-DMB(3,4-ジテトラデコキシルベンジル-[オメガ]-メチル-ポリ(エチレングリコール)エーテル)、1,2-ジミリストイル-sn-グリセロ-3-ホスホエタノールアミン-N-[メトキシ(ポリエチレングリコール)-2000](PEG2k-DMG)(カタログ番号880150P、Avanti Polar Lipids(Alabaster,Alabama,USA)製)、1,2-ジステアロイル-sn-グリセロ-3-ホスホエタノールアミン-N-[メトキシ(ポリエチレングリコール)-2000](PEG2k-DSPE)(カタログ番号880120C、Avanti Polar Lipids(Alabaster,Alabama,USA)製)、1,2-ジステアロイル-sn-グリセロール、メトキシポリエチレングリコール(PEG2k-DSG;GS-020、NOF(Tokyo,Japan)製)、ポリ(エチレングリコール)-2000-ジメタクリラート(PEG2k-DMA)、及び1,2-ジステアリルオキシプロピル-3-アミン-N-[メトキシ(ポリエチレングリコール)-2000](PEG2k-DSA)から選択してよい。一実施形態では、PEG脂質はPEG2k-DMGであってよい。いくつかの実施形態では、PEG脂質はPEG2k-DSGであってよい。一実施形態では、PEG脂質はPEG2k-DSPEであってよい。一実施形態では、PEG脂質はPEG2k-DMAであってよい。一実施形態では、PEG脂質はPEG2k-C-DMAであってよい。一実施形態では、PEG脂質は、WO2016/010840で段落[00240]から段落[00244]までにて開示されている化合物S027であってよい。一実施形態では、PEG脂質はPEG2k-DSAであってよい。一実施形態では、PEG脂質はPEG2k-C11であってよい。いくつかの実施形態では、PEG脂質はPEG2k-C14であってよい。いくつかの実施形態では、PEG脂質はPEG2k-C16であってよい。いくつかの実施形態では、PEG脂質はPEG2k-C18であってよい。
LNP製剤
本開示の実施形態は、製剤中の成分脂質のそれぞれのモル比に従って表される脂質組成物を提供する。一実施形態では、アミン脂質のモル%は約30モル%~約60モル%であってよい。一実施形態では、アミン脂質のモル%は約40モル%~約60モル%であってよい。一実施形態では、アミン脂質のモル%は約45モル%~約60モル%であってよい。一実施形態では、アミン脂質のモル%は約50モル%~約60モル%であってよい。一実施形態では、アミン脂質のモル%は約55モル%~約60モル%であってよい。一実施形態では、アミン脂質のモル%は約50モル%~約55モル%であってよい。一実施形態では、アミン脂質のモル%は約50モル%であってよい。一実施形態では、アミン脂質のモル%は約55モル%であってよい。いくつかの実施形態では、LNPバッチのアミン脂質のモル%は、標的モル%の±30%、±25%、±20%、±15%、±10%、±5%、または±2.5%になる。いくつかの実施形態では、LNPバッチのアミン脂質のモル%は、標的モル%の±4モル%、±3モル%、±2モル%、±1.5モル%、±1モル%、±0.5モル%、または±0.25モル%になる。モル%数値はいずれもLNP組成物脂質成分に対する割合として与えられる。特定の実施形態では、アミン脂質のモル%のLNPロット間変動は15%未満、10%未満または5%未満になる。
一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約5モル%~約15モル%であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約7モル%~約12モル%であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約0モル%~約5モル%であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約0モル%~約10モル%であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約5モル%~約10モル%であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約8モル%~約10モル%であってよい。
一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約5モル%、約6モル%、約7モル%、約8モル%、約9モル%、約10モル%、約11モル%、約12モル%、約13モル%、約14モル%、または約15モル%であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約9モル%であってよい。
一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約1モル%~約5モル%であってよい。一実施形態では、中性脂質のモル%は約0.1モル%~約1モル%であってよい。一実施形態では、中性リン脂質などの中性脂質のモル%は約0.1モル%、約0.2モル%、約0.5モル%、1モル%、約1.5モル%、約2モル%、約2.5モル%、約3モル%、約3.5モル%、約4モル%、約4.5モル%、または約5モル%であってよい。
一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約1モル%未満であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約0.5モル%未満であってよい。一実施形態では、中性脂質、例えば、中性リン脂質などのモル%は約0モル%、約0.1モル%、約0.2モル%、約0.3モル%、約0.4モル%、約0.5モル%、約0.6モル%、約0.7モル%、約0.8モル%、約0.9モル%、または約1モル%であってよい。いくつかの実施形態では、本明細書に開示の製剤は中性脂質を含まない(すなわち、中性脂質は0モル%)。いくつかの実施形態では、本明細書に開示の製剤は中性脂質を本質的に含まない(すなわち、中性脂質は約0モル%)。いくつかの実施形態では、本明細書に開示の製剤は中性リン脂質を含まない(すなわち、中性リン脂質は0モル%)。いくつかの実施形態では、本明細書に開示の製剤は中性リン脂質を本質的に含まない(すなわち、中性リン脂質は約0モル%)。
いくつかの実施形態では、LNPバッチの中性脂質のモル%は、標的中性脂質のモル%の±30%、±25%、±20%、±15%、±10%、±5%、または±2.5%になる。特定の実施形態では、LNPロット間変動は15%未満、10%未満または5%未満になる。
一実施形態では、ヘルパー脂質のモル%は約20モル%~約60モル%であってよい。一実施形態では、ヘルパー脂質のモル%は約25モル%~約55モル%であってよい。一実施形態では、ヘルパー脂質のモル%は約25モル%~約50モル%であってよい。一実施形態では、ヘルパー脂質のモル%は約25モル%~約40モル%であってよい。一実施形態では、ヘルパー脂質のモル%は約30モル%~約50モル%であってよい。一実施形態では、ヘルパー脂質のモル%は約30モル%~約40モル%であってよい。一実施形態では、脂質成分が100モル%となるようアミン脂質、中性脂質、及びPEG脂質の濃度に基づいてヘルパー脂質のモル%を調整する。一実施形態では、脂質成分が100モル%となるようアミン脂質及びPEG脂質の濃度に基づいてヘルパー脂質のモル%を調整する。一実施形態では、脂質成分が少なくとも99モル%となるようアミン脂質及びPEG脂質の濃度に基づいてヘルパー脂質のモル%を調整する。いくつかの実施形態では、LNPバッチのヘルパーのモル%は、標的のモル%の±30%、±25%、±20%、±15%、±10%、±5%、または±2.5%になる。特定の実施形態では、LNPロット間変動は15%未満、10%未満または5%未満になる。
一実施形態では、PEG脂質のモル%は約1モル%~約10モル%であってよい。一実施形態では、PEG脂質のモル%は約2モル%~約10モル%であってよい。一実施形態では、PEG脂質のモル%は約2モル%~約8モル%であってよい。一実施形態では、PEG脂質のモル%は約2モル%~約4モル%であってよい。一実施形態では、PEG脂質のモル%は約2.5モル%~約4モル%であってよい。一実施形態では、PEG脂質のモル%は約3モル%であってよい。一実施形態では、PEG脂質のモル%は約2.5モル%であってよい。いくつかの実施形態では、LNPバッチのPEG脂質のモル%は、標的PEG脂質のモル%の±30%、±25%、±20%、±15%、±10%、±5%、または±2.5%になる。特定の実施形態では、LNPロット間変動は15%未満、10%未満または5%未満になる。
特定の実施形態では、カーゴには、RNA誘導型DNA結合因子(例えば、Casヌクレアーゼ、クラス2Casヌクレアーゼ、またはCas9)をコードするmRNA、及びgRNAもしくはgRNAをコードする核酸、またはmRNAとgRNAの組み合わせが含まれる。一実施形態では、LNP組成物はリピドAまたはその同等物を含んでよい。いくつかの態様では、アミン脂質はリピドAである。いくつかの態様では、アミン脂質はリピドA同等物、例えば、リピドAの類似体である。特定の態様では、アミン脂質はリピドAのアセタール類似体である。さまざまな実施形態では、LNP組成物は、アミン脂質、中性脂質、ヘルパー脂質、及びPEG脂質を含む。特定の実施形態では、ヘルパー脂質はコレステロールである。特定の実施形態では、中性脂質はDSPCである。具体的な実施形態では、PEG脂質はPEG2k-DMGである。いくつかの実施形態では、LNP組成物は、リピドA、ヘルパー脂質、中性脂質、及びPEG脂質を含んでよい。いくつかの実施形態では、LNP組成物は、アミン脂質、DSPC、コレステロール、及びPEG脂質を含む。いくつかの実施形態では、LNP組成物は、DMGを含むPEG脂質を含む。特定の実施形態では、アミン脂質は、リピドA、及びリピドAのアセタール類似体などリピドA同等物から選択される。さらなる実施形態では、LNP組成物は、リピドA、コレステロール、DSPC、及びPEG2k-DMGを含む。
さまざまな実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、中性脂質、及びPEG脂質を含む。さまざまな実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、中性リン脂質、及びPEG脂質を含む。さまざまな実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、中性脂質、及びPEG脂質からなる脂質成分を含む。さまざまな実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、及びPEG脂質を含む。特定の実施形態では、LNP組成物は中性リン脂質などの中性脂質を含まない。さまざまな実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、及びPEG脂質からなる脂質成分を含む。特定の実施形態では、中性脂質は、DSPC、DPPC、DAPC、DMPC、DOPC、DOPE、及びDSPEのうち1つ以上から選ばれる。特定の実施形態では、中性脂質はDSPCである。特定の実施形態では、中性脂質はDPPCである。特定の実施形態では、中性脂質はDAPCである。特定の実施形態では、中性脂質はDMPCである。特定の実施形態では、中性脂質はDOPCである。特定の実施形態では、中性脂質はDOPEである。特定の実施形態では、中性脂質はDSPEである。特定の実施形態では、ヘルパー脂質はコレステロールである。具体的な実施形態では、PEG脂質はPEG2k-DMGである。いくつかの実施形態では、LNP組成物は、リピドA、ヘルパー脂質、及びPEG脂質を含んでよい。いくつかの実施形態では、LNP組成物は、リピドA、ヘルパー脂質、及びPEG脂質からなる脂質成分を含んでよい。いくつかの実施形態では、LNP組成物は、アミン脂質、コレステロール、及びPEG脂質を含む。いくつかの実施形態では、LNP組成物は、アミン脂質、コレステロール、及びPEG脂質からなる脂質成分を含む。いくつかの実施形態では、LNP組成物は、DMGを含むPEG脂質を含む。特定の実施形態では、アミン脂質は、リピドA及びリピドAのアセタール類似体などリピドA同等物から選択される。特定の実施形態では、アミン脂質は、C5-C12またはC4-C12の、リピドAのアセタール類似体である。さらなる実施形態では、LNP組成物は、リピドA、コレステロール、及びPEG2k-DMGを含む。
本開示の実施形態はまた、アミン脂質の正電荷のアミン基(N)と封入されるべき核酸の負電荷のリン酸基(P)とのモル比に従って表される脂質組成物も提供する。これは、式N/Pで数学的に表され得る。いくつかの実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、中性脂質、及びPEG脂質を含む脂質成分と、核酸成分とを含んでよく、ここで、N/P比は約3~10である。いくつかの実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、及びPEG脂質を含む脂質成分と、核酸成分とを含んでよく、ここで、N/P比は約3~10である。いくつかの実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、中性脂質、及びヘルパー脂質を含む脂質成分と、RNA成分とを含んでよく、ここで、N/P比は約3~10である。いくつかの実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、及びPEG脂質を含む脂質成分と、RNA成分とを含んでよく、ここで、N/P比は約3~10である。一実施形態では、N/P比は約5~7であってよい。一実施形態では、N/P比は約3~7であってよい。一実施形態では、N/P比は約4.5~8であってよい。一実施形態では、N/P比は約6であってよい。一実施形態では、N/P比は6±1であってよい。一実施形態では、N/P比は6±0.5であってよい。いくつかの実施形態では、N/P比は標的N/P比の±30%、±25%、±20%、±15%、±10%、±5%、または±2.5%になる。特定の実施形態では、LNPロット間変動は15%未満、10%未満または5%未満になる。
いくつかの実施形態では、核酸成分、例えば、RNA成分は、mRNA、例えば、CasヌクレアーゼをコードするmRNAなどを含んでよい。RNA成分には、RNAが、任意選択でさらなる核酸及び/またはタンパク質、例えば、RNPカーゴなどと共に含まれる。一実施形態では、RNAはCas9 mRNAを含む。CasヌクレアーゼをコードするmRNAを含むいくつかの組成物では、LNPはさらにgRNAなどのgRNA核酸を含む。いくつかの実施形態では、RNA成分はCasヌクレアーゼmRNA及びgRNAを含む。いくつかの実施形態では、RNA成分はクラス2CasヌクレアーゼmRNA及びgRNAを含む。
特定の実施形態では、LNP組成物は、クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNA、アミン脂質、ヘルパー脂質、中性脂質、及びPEG脂質を含んでよい。特定の実施形態では、LNP組成物は、クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNA、アミン脂質、ヘルパー脂質、及びPEG脂質を含んでよい。クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNAを含む特定のLNP組成物では、ヘルパー脂質はコレステロールである。クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNAを含む他の組成物では、中性脂質はDSPCである。クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNAを含むさらなる実施形態では、PEG脂質はPEG2k-DMGまたはPEG2k-C11である。クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNAを含む特定の組成物では、アミン脂質は、リピドA及びその同等物、例えば、リピドAのアセタール類似体などから選択される。
いくつかの実施形態では、LNP組成物はgRNAを含んでよい。特定の実施形態では、LNP組成物は、アミン脂質、gRNA、ヘルパー脂質、中性脂質、及びPEG脂質を含んでよい。特定の実施形態では、LNP組成物は、アミン脂質、gRNA、ヘルパー脂質、及びPEG脂質を含んでよい。gRNAを含む特定のLNP組成物では、ヘルパー脂質はコレステロールである。gRNAを含むいくつかの組成物では、中性脂質はDSPCである。gRNAを含むさらなる実施形態では、PEG脂質はPEG2k-DMGまたはPEG2k-C11である。特定の実施形態では、アミン脂質は、リピドA及びその同等物、例えば、リピドAのアセタール類似体などから選択される。
一実施形態では、LNP組成物はsgRNAを含んでよい。一実施形態では、LNP組成物はCas9 sgRNAを含んでよい。一実施形態では、LNP組成物はCpf1 sgRNAを含んでよい。sgRNAを含むいくつかの組成物では、LNPには、アミン脂質、ヘルパー脂質、中性脂質、及びPEG脂質が含まれる。sgRNAを含むいくつかの組成物では、LNPには、アミン脂質、ヘルパー脂質、及びPEG脂質が含まれる。sgRNAを含む特定の組成物では、ヘルパー脂質はコレステロールである。sgRNAを含む他の組成物では、中性脂質はDSPCである。sgRNAを含むさらなる実施形態では、PEG脂質はPEG2k-DMGまたはPEG2k-C11である。特定の実施形態では、アミン脂質は、リピドA及びその同等物、例えば、リピドAのアセタール類似体などから選択される。
特定の実施形態では、LNP組成物は、CasヌクレアーゼをコードするmRNAと、sgRNAであってよいgRNAとを含む。一実施形態では、LNP組成物は、アミン脂質、CasヌクレアーゼをコードするmRNA、gRNA、ヘルパー脂質、中性脂質、及びPEG脂質を含んでよい。一実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、中性脂質、及びPEG脂質からなる脂質成分、ならびにCasヌクレアーゼをコードするmRNAとgRNAとからなる核酸成分を含んでよい。一実施形態では、LNP組成物は、アミン脂質、ヘルパー脂質、及びPEG脂質からなる脂質成分、ならびにCasヌクレアーゼをコードするmRNAとgRNAとからなる核酸成分を含んでよい。CasヌクレアーゼをコードするmRNA及びgRNAを含む特定の組成物では、ヘルパー脂質はコレステロールである。CasヌクレアーゼをコードするmRNA及びgRNAを含むいくつかの組成物では、中性脂質はDSPCである。CasヌクレアーゼをコードするmRNA及びgRNAを含む特定の組成物は、約1モル%未満の中性脂質、例えば、中性リン脂質を含む。CasヌクレアーゼをコードするmRNA及びgRNAを含む特定の組成物は、約0.5モル%未満の中性脂質、例えば、中性リン脂質を含む。特定の組成物では、LNPは中性脂質、例えば、中性リン脂質を含まない。CasヌクレアーゼをコードするmRNA及びgRNAを含むさらなる実施形態では、PEG脂質はPEG2k-DMGまたはPEG2k-C11である。特定の実施形態では、アミン脂質は、リピドA及びその同等物、例えば、リピドAのアセタール類似体などから選択される。
特定の実施形態では、LNP組成物には、クラス2Cas mRNAなどのCasヌクレアーゼmRNA及び少なくとも1つのgRNAが含まれる。特定の実施形態では、LNP組成物には、gRNAと、クラス2CasヌクレアーゼmRNAなどのCasヌクレアーゼmRNAとが約25:1~約1:25の比で含まれる。特定の実施形態では、LNP製剤には、gRNAと、クラス2CasヌクレアーゼmRNAなどのCasヌクレアーゼmRNAとが約10:1~約1:10の比で含まれる。特定の実施形態では、LNP製剤には、gRNAと、クラス2CasヌクレアーゼmRNAなどのCasヌクレアーゼmRNAとが約8:1~約1:8の比で含まれる。本明細書で測定した比は重量基準である。いくつかの実施形態では、LNP製剤には、gRNAと、クラス2Cas mRNAなどのCasヌクレアーゼmRNAとが約5:1~約1:5の比で含まれる。いくつかの実施形態では、比の範囲は、約3:1~1:3、約2:1~1:2、約5:1~1:2、約5:1~1:1、約3:1~1:2、約3:1~1:1、約3:1、約2:1~1:1である。いくつかの実施形態では、gRNAとmRNAの比は約3:1または約2:1である。いくつかの実施形態では、gRNAとクラス2CasヌクレアーゼなどのCasヌクレアーゼmRNAとの比は約1:1である。比は、約25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10、または1:25であってよい。
本明細書に開示するLNP組成物には鋳型核酸が含まれ得る。鋳型核酸を、CasヌクレアーゼをコードするmRNA、例えば、クラス2CasヌクレアーゼmRNAなどと共に合剤にしてよい。いくつかの実施形態では、鋳型核酸をガイドRNAと共に合剤にしてよい。いくつかの実施形態では、鋳型核酸を、CasヌクレアーゼをコードするmRNA及びガイドRNAの両方と共に合剤にしてよい。いくつかの実施形態では、鋳型核酸を、CasヌクレアーゼをコードするmRNAまたはガイドRNAとは別に製剤化してよい。鋳型核酸をLNP組成物と共に送達しても、LNP組成物とは別に送達してもよい。いくつかの実施形態では、鋳型核酸は、所望の修復機構に応じて一本鎖でも二本鎖でもよい。鋳型は、標的DNAまたは標的DNAに隣接する配列に対する相同性領域を有してよい。
いくつかの実施形態では、水性RNA溶液と有機溶媒系脂質溶液、例えば、100%エタノールなどとを混合することによってLNPを形成する。適切な溶液または溶媒には、水、PBS、Tris緩衝液、NaCl、クエン酸緩衝液、エタノール、クロロホルム、ジエチルエーテル、シクロヘキサン、テトラヒドロフラン、メタノール、イソプロパノールが含まれるか、またはそれらを含有してよい。薬理学的に許容される緩衝液を、例えば、LNPをインビボで投与するためなどに使用してよい。特定の実施形態では、緩衝液を使用して、LNPを含む組成物のpHをpH6.5以上に維持する。特定の実施形態では、緩衝液を使用して、LNPを含む組成物のpHをpH7.0以上に維持する。特定の実施形態では、組成物はpHが約7.2~約7.7の範囲である。さらなる実施形態では、組成物はpHが約7.3~約7.7の範囲、または約7.4~約7.6の範囲である。さらなる実施形態では、組成物はpHが約7.2、7.3、7.4、7.5、7.6、または7.7である。マイクロpHプローブで組成物のpHを測定してよい。特定の実施形態では、組成物に凍結保護剤が含まれる。凍結保護剤の非限定的な例としては、ショ糖、トレハロース、グリセロール、DMSO、及びエチレングリコールが挙げられる。例示的な組成物には、例えば、ショ糖などの凍結保護剤が最高10%まで含まれてよい。特定の実施形態では、LNP組成物には約1%、2%、3%、4%、5%、6%、7%、8%、9、または10%の凍結保護剤が含まれてよい。特定の実施形態では、LNP組成物には約1%、2%、3%、4%、5%、6%、7%、8%、9、または10%のショ糖が含まれてよい。いくつかの実施形態では、LNP組成物には緩衝液が含まれてよい。いくつかの実施形態では、緩衝液は、リン酸緩衝液(PBS)、Tris緩衝液、クエン酸緩衝液、またはその混合物を含んでよい。特定の例示的な実施形態では、緩衝液はNaClを含む。特定の実施形態では、NaClを除外する。NaClの例示的な量は、約20mMから約45mMに及んでよい。NaClの例示的な量は、約40mMから約50mMに及んでよい。いくつかの実施形態では、NaClの量は約45mMである。いくつかの実施形態では、緩衝液はTris緩衝液である。Trisの例示的な量は、約20mMから約60mMに及んでよい。Trisの例示的な量は、約40mMから約60mMに及んでよい。いくつかの実施形態では、Trisの量は約50mMである。いくつかの実施形態では、緩衝液はNaCl及びTrisを含む。LNP組成物の特定の例示的な実施形態では、5%のショ糖と45mMのNaClとを溶解させたTris緩衝液が含有される。他の例示的な実施形態では、組成物は、約5w/v%の量のショ糖、約45mMのNaCl、及び約50mMのpH7.5のTrisを含有する。塩、緩衝液、及び凍結保護剤の量は、製剤全体としての浸透圧が維持されるよう変えてよい。例えば、最終浸透圧は450mOsm/L未満に維持してよい。さらなる実施形態では、浸透圧は350mOsm/Lと250mOsm/Lの間である。特定の実施形態では最終浸透圧は300+/-20mOsm/Lである。
いくつかの実施形態では、マイクロ流体混合、T-混合、または交差混合を使用する。特定の態様では、流量、合流部サイズ、合流部の位置関係、合流部の形状、管径、溶液、及び/またはRNA濃度及び脂質濃度を変えてよい。LNPまたはLNP組成物を、例えば、透析、接線流ろ過、またはクロマトグラフィーなどにより濃縮または精製してよい。LNPは、例えば、懸濁液、エマルジョン、または凍結乾燥粉末などとして保存してよい。いくつかの実施形態では、LNP組成物を2~8℃で保存し、特定の態様では、LNP組成物を室温で保存する。さらなる実施形態では、LNP組成物を、例えば、-20℃または-80℃などで凍結保存する。他の実施形態では、LNP組成物を約0℃~約-80℃の範囲の温度で保存する。凍結LNP組成物を、使用前に、例えば、氷上、室温、または25℃で解凍してよい。
LNPは、例えば、ミクロ粒子(単層小胞及び多層小胞、例えば、「リポソーム」という、いくつかの実施形態では実質的に球状である、ラメラ相の脂質二重層などを含み、さらに特定の実施形態では水性核、例えば、RNA分子の実質的な部分を含むことができる)、エマルジョンの分散相、ミセル、または懸濁液の内相などであってよい。
さらに、LNP組成物は生物分解性であり、治療的有効量において細胞毒性濃度まで生体内に蓄積することがない。いくつかの実施形態では、LNP組成物は、治療用量において、実質的有害作用をもたらす自然免疫応答を引き起こさない。いくつかの実施形態では、本明細書で提供されるLNP組成物は、治療用量において毒性を生じない。
いくつかの実施形態では、pdiは約0.005から約0.75に及んでよい。いくつかの実施形態では、pdiは約0.01から約0.5に及んでよい。いくつかの実施形態では、pdiは約ゼロから約0.4に及んでよい。いくつかの実施形態では、pdiは約ゼロから約0.35に及んでよい。いくつかの実施形態では、pdiは約ゼロから約0.35に及んでよい。いくつかの実施形態では、pdiは約ゼロから約0.3に及んでよい。いくつかの実施形態では、pdiは約ゼロから約0.25に及んでよい。いくつかの実施形態では、pdiは約ゼロから約0.2に及んでよい。いくつかの実施形態では、pdiは約0.08未満、0.1未満、0.15未満、0.2未満、または0.4未満であってよい。
本明細書に開示するLNPは大きさ(例えば、Z-平均径)が約1~約250nmである。いくつかの実施形態では、LNPは大きさが約10~約200nmである。さらなる実施形態では、LNPは大きさが約20~約150nmである。いくつかの実施形態では、LNPは大きさが約50~約150nmである。いくつかの実施形態では、LNPは大きさが約50~約100nmである。いくつかの実施形態では、LNPは大きさが約50~約120nmである。いくつかの実施形態では、LNPは大きさが約60~約100nmである。いくつかの実施形態では、LNPは大きさが約75~約150nmである。いくつかの実施形態では、LNPは大きさが約75~約120nmである。いくつかの実施形態では、LNPは大きさが約75~約100nmである。特に指定しない限り、本明細書で言及する大きさはいずれも、Malvern Zetasizerで動的光散乱法により測定した完全形成粒子の平均サイズ(径)である。計数率が約200~400kcpsとなるよう、ナノ粒子試料をリン酸緩衝食塩水(PBS)で希釈する。データは強度測定値の加重平均として提示される(Z-平均径)。
いくつかの実施形態では、LNPは、平均封入率が約50%~約100%の範囲で形成される。いくつかの実施形態では、LNPは、平均封入率が約50%~約70%の範囲で形成される。いくつかの実施形態では、LNPは、平均封入率が約70%~約90%の範囲で形成される。いくつかの実施形態では、LNPは、平均封入率が約90%~約100%の範囲で形成される。いくつかの実施形態では、LNPは、平均封入率が約75%~約95%の範囲で形成される。
いくつかの実施形態では、LNPは、平均分子量が約1.00E+05g/mol~約1.00E+10g/molの範囲で形成される。いくつかの実施形態では、LNPは、平均分子量が約5.00E+05g/mol~約7.00E+07g/molの範囲で形成される。いくつかの実施形態では、LNPは、平均分子量が約1.00E+06g/mol~約1.00E+10g/molの範囲で形成される。いくつかの実施形態では、LNPは、平均分子量が約1.00E+07g/mol~約1.00E+09g/molの範囲で形成される。いくつかの実施形態では、LNPは、平均分子量が約5.00E+06g/mol~約5.00E+09g/molの範囲で形成される。
いくつかの実施形態では、多分散度(Mw/Mn;重量平均モル質量(Mw)と数平均モル質量(Mn)の比)は約1.000から約2.000に及んでよい。いくつかの実施形態では、Mw/Mnは約1.00から約1.500に及んでよい。いくつかの実施形態では、Mw/Mnは約1.020から約1.400に及んでよい。いくつかの実施形態では、Mw/Mnは約1.010から約1.100に及んでよい。いくつかの実施形態では、Mw/Mnは約1.100から約1.350に及んでよい。
細胞を工学的に操作する方法;工学的に操作された細胞
本明細書に開示するLNP組成物は、インビボ及びインビトロの両方において、遺伝子編集による細胞の工学的操作方法で使用してよい。いくつかの実施形態では、方法には、細胞と本明細書に記載のLNP組成物との接触を伴う。
いくつかの実施形態では、方法には、ヒトなどの哺乳類などの対象の細胞を接触させることを伴う。いくつかの実施形態では、細胞は臓器、例えば、肝臓、例えば、哺乳類の肝臓、例えば、ヒトの肝臓にある。いくつかの実施形態では、細胞は肝臓細胞、例えば、哺乳類の肝臓細胞、例えば、ヒト肝臓細胞である。いくつかの実施形態では、細胞は肝細胞、例えば、哺乳類の肝細胞、例えば、ヒト肝細胞である。いくつかの実施形態では、肝臓細胞は幹細胞である。いくつかの実施形態では、ヒト肝臓細胞は肝臓の類洞壁内皮細胞(LSEC)であってよい。いくつかの実施形態では、ヒト肝臓細胞はクッパー細胞であってよい。いくつかの実施形態では、ヒト肝臓細胞は肝星細胞であってよい。いくつかの実施形態では、ヒト肝臓細胞は腫瘍細胞であってよい。いくつかの実施形態では、ヒト肝臓細胞は肝臓幹細胞であってよい。さらなる実施形態では、細胞はApoE結合受容体を含む。いくつかの実施形態では、肝細胞などの肝臓細胞はインサイチュである。いくつかの実施形態では、肝細胞などの肝臓細胞は、例えば、初代培養のような培養などで単離されている。本明細書に開示する使用に対応する方法も提供し、これは、本明細書に開示するLNP組成物を対象に投与すること、または上記のような細胞と本明細書に開示するLNP組成物とを接触させることを含む。
いくつかの実施形態では、工学的に操作された細胞、例えば、先行段落での細胞型のうちいずれか1つに由来する工学的に操作された細胞を提供する。そのような工学的に操作された細胞は本明細書に記載する方法に従って作製される。いくつかの実施形態では、工学的に操作された細胞は対象体内の組織または臓器、例えば、肝臓などの内部にある。
本明細書に記載する方法及び細胞のいくつかでは、細胞は、標的配列のヌクレオチドの修飾、例えば、挿入もしくは欠失(「インデル」)または置換を含む。いくつかの実施形態では、修飾は、標的配列の1個、2個、3個、4個または5個またはそれ以上のヌクレオチドの挿入を含む。いくつかの実施形態では、修飾は、標的配列の1個または2個のヌクレオチドの挿入を含む。他の実施形態では、修飾は、標的配列の1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個または25個またはそれ以上のヌクレオチドの欠失を含む。いくつかの実施形態では、修飾は、標的配列の1個または2個のヌクレオチドの欠失を含む。いくつかの実施形態では、修飾は、標的配列にフレームシフト突然変異をもたらすインデルを含む。いくつかの実施形態では、修飾は、標的配列の1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個または25個またはそれ以上のヌクレオチドの置換を含む。いくつかの実施形態では、修飾は、標的配列の1個または2個のヌクレオチドの置換を含む。いくつかの実施形態では、修飾は、鋳型核酸、例えば、本明細書に記載する鋳型核酸のいずれかの組み込みにより生じたヌクレオチドの挿入、欠失、または置換のうち1つ以上を含む。
いくつかの実施形態では、工学的に操作された細胞を含む細胞集団、例えば、本明細書に記載する方法に従って工学的に操作された細胞を含む細胞集団を提供する。いくつかの実施形態では、集団は、インビトロで培養された工学的操作をされた細胞を含む。いくつかの実施形態では、集団は、対象体内の組織または臓器、例えば、肝臓などの内部にある。いくつかの実施形態では、集団内の細胞のうち少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%または少なくとも95%またはそれ以上を工学的に操作する。特定の実施形態では、本明細書に開示する方法により、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%または少なくとも95%の編集効率(または「編集率」)がもたらされ、これはインデルの検出により定義される。他の実施形態では、本明細書に開示する方法により、少なくとも5%、少なくとも10%、少なくとも15%、少なくとも20%、少なくとも25%、少なくとも30%、少なくとも35%、少なくとも40%、少なくとも45%、少なくとも50%、少なくとも55%、少なくとも60%、少なくとも65%、少なくとも70%、少なくとも75%、少なくとも80%、少なくとも85%、少なくとも90%または少なくとも95%のDNA修飾効率がもたらされ、これは、挿入、欠失、置換によるか、または他の方法によるかを問わず、配列変化の検出により定義される。特定の実施形態では、本明細書に開示する方法により、細胞集団における編集効率レベルまたはDNA修飾効率レベルは、約5%~約100%、約10%~約50%、約20~約100%、約20~約80%、約40~約100%、または約40~約80%になる。
本明細書に記載する方法及び細胞のいくつかでは、集団内の細胞は、標的配列における修飾、例えば、インデルまたは置換などを含む。いくつかの実施形態では、修飾は、標的配列の1個、2個、3個、4個または5個またはそれ以上のヌクレオチドの挿入を含む。いくつかの実施形態では、修飾は、標的配列の1個または2個のヌクレオチドの挿入を含む。他の実施形態では、修飾は、標的配列の1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個または25個またはそれ以上のヌクレオチドの欠失を含む。いくつかの実施形態では、修飾は、標的配列の1個または2個のヌクレオチドの欠失を含む。いくつかの実施形態では、修飾により標的配列にフレームシフト突然変異がもたらされる。いくつかの実施形態では、修飾は、標的配列にフレームシフト突然変異をもたらすインデルを含む。いくつかの実施形態では、集団の工学的操作された細胞のうち少なくとも80%、少なくとも85%、少なくとも90%、少なくとも91%、少なくとも92%、少なくとも93%、少なくとも94%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、または少なくとも99%またはそれ以上はフレームシフト突然変異を含む。いくつかの実施形態では、修飾は、標的配列の1個、2個、3個、4個、5個、6個、7個、8個、9個、10個、15個、20個または25個またはそれ以上のヌクレオチドの置換を含む。いくつかの実施形態では、修飾は、標的配列の1個または2個のヌクレオチドの置換を含む。いくつかの実施形態では、修飾は、鋳型核酸、例えば、本明細書に記載する鋳型核酸のいずれかの組み込みにより生じたヌクレオチドの挿入、欠失、または置換のうち1つ以上を含む。
遺伝子編集方法
インビボ及びインビトロで遺伝子編集を行うために本明細書に開示するLNP組成物を使用してよい。一実施形態では、本明細書に記載の1つ以上のLNP組成物を、それを必要とする対象に投与してよい。一実施形態では、本明細書に記載の1つ以上のLNP組成物は細胞と接触し得る。一実施形態では、治療的有効量の本明細書に記載する組成物は、それを必要とする対象の細胞と接触し得る。一実施形態では、遺伝子操作された細胞は、細胞と本明細書に記載のLNP組成物とを接触させることにより作製され得る。さまざまな実施形態では、方法は、上記のように鋳型核酸を細胞または対象に導入することを含む。
いくつかの実施形態では、方法には、肝臓障害に関連した細胞に対するLNP組成物の投与を伴う。いくつかの実施形態では、方法には、肝臓障害の治療を伴う。特定の実施形態では、方法には、肝細胞とLNP組成物との接触を伴う。特定の実施形態では、方法には、肝細胞とLNP組成物との接触を伴う。いくつかの実施形態では、方法には、ApoE結合細胞とLNP組成物との接触を伴う。
一実施形態では、クラス2CasヌクレアーゼをコードするmRNA及びgRNAを含むLNP組成物をApoE結合細胞などの細胞に投与してよい。さらなる実施形態では、鋳型核酸も細胞に導入される。特定の例では、クラス2Casヌクレアーゼ及びsgRNAを含むLNP組成物をApoE結合細胞などの細胞に投与してよい。一実施形態では、クラス2CasヌクレアーゼをコードするmRNA、gRNA、及び鋳型を含むLNP組成物を細胞に投与してよい。特定の例では、Casヌクレアーゼ及びsgRNAを含むLNP組成物を肝細胞に投与してよい。場合によっては、肝細胞は対象内にある。
特定の実施形態では、対象はLNP組成物の単回投与を受けてよい。他の例では、対象はLNP組成物の多回投与を受けてよい。いくつかの実施形態では、LNP組成物を2~5回投与する。2用量以上を投与する場合、用量は、約1日、2日、3日、4日、5日、6日、7日、14日、21日、もしくは28日の間隔を置くか、約2か月、3か月、4か月、5か月、もしくは6か月の間隔を置くか、または約1年、2年、3年、4年、もしくは5年の間隔を置いて投与してよい。特定の実施形態では、LNP組成物の再投与時、編集が改善する。
一実施形態では、クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNAを含むLNP組成物は、gRNAを含む組成物の投与とは別に細胞に投与してよい。一実施形態では、クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNA及びgRNAを含むLNP組成物は、細胞への鋳型核酸の投与とは別に細胞に投与してよい。一実施形態では、クラス2CasヌクレアーゼなどのCasヌクレアーゼをコードするmRNAを含むLNP組成物を細胞に投与し、その後、gRNAを含むLNP組成物を逐次投与してから、鋳型を細胞に投与してよい。CasヌクレアーゼをコードするmRNAを含むLNP組成物を投与してからgRNAを含むLNP組成物を投与する実施形態では、投与と投与の間を約4時間、6時間、8時間、12時間、もしくは24時間、または2日、3日、4日、5日、6日、もしくは7日空けてよい。
一実施形態では、LNP組成物を使用して、遺伝子ノックアウトを生じさせる遺伝子を編集してよい。一実施形態では、LNP組成物を使用して、細胞集団に遺伝子ノックダウンを生じさせる遺伝子を編集してよい。別の実施形態では、LNP組成物を使用して、遺伝子修正を生じさせる遺伝子を編集してよい。さらなる実施形態では、LNP組成物を使用して、遺伝子挿入を生じさせる細胞を編集してよい。
一実施形態では、LNP組成物の投与により、持続的反応を生じさせる遺伝子編集がもたらされ得る。例えば、投与により、反応の持続時間が1日、1か月、1年、またはそれ以上になり得る。本明細書で使用する場合、「反応の持続時間」とは、本明細書に開示するLNP組成物を使用して細胞が編集された後、それにより生じる修飾が、LNP組成物投与後のある一定期間、依然として存在することを意味する。修飾は、標的タンパク質レベルの測定によって検出され得る。修飾は、標的DNAの検出によって検出され得る。いくつかの実施形態では、反応の持続時間は少なくとも1週間であり得る。他の実施形態では、反応の持続時間は少なくとも2週間であり得る。一実施形態では、反応の持続時間は少なくとも1か月であり得る。いくつかの実施形態では、反応の持続時間は少なくとも2か月であり得る。一実施形態では、反応の持続時間は少なくとも4か月であり得る。一実施形態では、反応の持続時間は少なくとも6か月であり得る。特定の実施形態では、反応の持続時間は約26週間であり得る。いくつかの実施形態では、反応の持続時間は少なくとも1年であり得る。いくつかの実施形態では、反応の持続時間は少なくとも5年であり得る。いくつかの実施形態では、反応の持続時間は少なくとも10年であり得る。いくつかの実施形態では、持続的反応は少なくとも0.5か月、1か月、2か月、3か月、4か月、5か月、6か月、7か月、8か月、9か月、10か月、11か月、12か月、15か月、18か月、21か月、または24か月の後、標的タンパク質レベルの測定によっても標的DNAの検出によっても検出可能である。いくつかの実施形態では、持続的反応は少なくとも1年、2年、3年、4年、5年、6年、7年、8年、9年、10年、12年、14年、16年、18年、または20年の後、標的タンパク質レベルの測定によっても標的DNAの検出によっても検出可能である。
LNP組成物は、非経口投与が可能である。LNP組成物を血流中、組織内、筋内、または内臓内へ直接投与してよい。投与は、例えば、注射または注入などで全身投与してよい。投与は局所投与であってよい。適切な投与手段としては、静脈内、動脈内、髄腔内、脳室内、尿道内、胸骨内、頭蓋内、網膜下、硝子体内、前房内、筋肉内、滑膜内、皮内、及び皮下が挙げられる。適切な投与デバイスとしては、針(includingマイクロニードル)インジェクター、無針、浸透圧ポンプ、及び注入技術が挙げられる。
LNP組成物は必ずというわけではないが一般に、1つ以上の薬理学的に許容される添加剤を含む製剤として投与される。用語「添加剤」には、本開示の化合物(複数可)以外の任意の成分、他の脂質成分(複数可)及び生物学的に活性な薬剤が含まれる。添加剤により、機能的(例えば、薬物放出速度制御)特徴及び/または非機能的(例えば、処理補助または希釈剤)特徴のいずれが製剤に付与されてもよい。添加剤の選択は、個々の投与方法、添加剤が溶解度及び安定性に及ぼす影響、及び剤形の性質などの要因によって大きく異なる。
非経口製剤は典型的に水性もしくは油性の溶液または懸濁液である。製剤が水性の場合、添加剤は糖(グルコース、マンニトール、ソルビトール等が含まれるが、これに限定されるわけではない)、塩、炭水化物及び緩衝剤(好ましくはpHが3~9)などであるが、一部の用途ではこれらは、滅菌非水溶液を用いるか、または滅菌パイロジェンフリー水(WFI)などの適切なビヒクルと併せて使用する乾燥形態としてさらに好適に製剤化されてよい。
本発明は例示実施形態と併せて記載されるが、それらは、本発明を記載の実施形態に限定することを意図するものではないと理解される。むしろ、本発明は、代替案、変更、及び具体的な特徴の同等物を含む同等物のすべてを包含することを意図し、これらは添付の特許請求の範囲によって定義される本発明の範囲内に含まれ得る。
上述された一般的記載及び詳細な説明の両方、ならびに以下の実施例は例示及び説明するのみであり、教示を限定するものではない。本明細書で使用する項目見出しは構成のみを目的としており、所望の主題を何ら限定するもではないと解釈されるべきである。参照により組み込まれる文献が本明細書で定義した用語と矛盾する場合、本明細書が優先する。本出願に記載されるすべての範囲には、特に断らない限り、端点が包含される。
本出願で使用する場合、単数形「a」、「an」及び「the」には、文脈で特に明確に指示されない限り、複数の指示対象が含まれることに留意すべきである。したがって、例えば、「組成物(a composition)」への言及には複数の組成物が含まれ、「細胞(a cell)」への言及には複数の細胞が含まれ、他も同様である。「または」の使用は包括的なものであり、特に断らない限り、「及び/または」を意味する。
数字範囲には、その範囲を定義する数字が含まれる。測定値及び測定可能な値は概数であり、測定に関連する有効数字及び誤差を考慮すべきであると理解される。用語「約(about)」または「約(approximately)」とは、当業者により決定された特定の値について許容される誤差を意味し、値の測定法または決定法によって幾分異なる。範囲の前または列挙されている値の前に「約(about)」などの修飾語の使用により、範囲の各端点または列挙にある各々の値が修飾を受ける。「約(about)」には値または端点も含まれる。例えば、「約50~55」では「約50~約55」が包含される。また、「含む(comprise)」、「含む(comprises)」、「含む(comprising)」、「含有する(contain)」、「含有する(contains)」、「含有している(containing)」、「含む(include)」、「含む(include)」、及び「含む(including)」の使用は限定的なものではない。
上記明細書で特に断りがない限り、明細書中、さまざまな成分を「含む(comprising)」という記述がある実施形態は、記述の成分「からなる(consisting of)」かまたはそれ「から本質的になる(consisting essentially of)」ことも意図され、明細書中、さまざまな成分「からなる(consisting of)」という記述がある実施形態は、記述の成分を「含む(consisting)」かまたはそれ「から本質的になる(consisting essentially of)」ことも意図され、明細書中、さまざまな成分「について(about)」という記述がある実施形態は、記述の成分「にて(at)」であることも意図され、また、明細書中、さまざまな成分「から本質的になる(consisting essentially of)」という記述がある実施形態は、記述の成分「からなる(consisting of)」かまたはそれを「含む(comprising)」ことも意図される(このような互換性は請求項内でこれらの用語を使用する
際には適用されない)。
本発明は、例えば以下の実施形態を包含する:
[実施形態1]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約50~60モル%のアミン脂質と、
約8~10モル%の中性脂質と、
約2.5~4モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約6である、前記脂質ナノ粒子(「LNP」)組成物。
[実施形態2]RNA成分と、
約50~60モル%のアミン脂質と、
約27~39.5モル%のヘルパー脂質と、
約8~10モル%の中性脂質と、
約2.5~4モル%のPEG脂質と
を含み、ここで、LNP組成物のN/P比は約5~7である、前記LNP組成物。
[実施形態3]前記N/P比は約6である、実施形態2に記載のLNP組成物。
[実施形態4]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約50~60モル%のアミン脂質と、
約5~15モル%の中性脂質と、
約2.5~4モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約3~10である、前記LNP組成物。
[実施形態5]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約40~60モル%のアミン脂質と、
約5~15モル%の中性脂質と、
約2.5~4モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約6である、前記LNP組成物。
[実施形態6]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約50~60モル%のアミン脂質と、
約5~15モル%の中性脂質と、
約1.5~10モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約6である、前記LNP組成物。
[実施形態7]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約40~60モル%のアミン脂質と、
約0~10モル%の中性脂質と、
約1.5~10モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約3~10である、前記LNP組成物。
[実施形態8]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約40~60モル%のアミン脂質と、
約1モル%未満の中性脂質と、
約1.5~10モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約3~10である、前記LNP組成物。
[実施形態9]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約40~60モル%のアミン脂質と、
約1.5~10モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約3~10であり、かつ
前記LNP組成物は中性リン脂質を本質的に含まないかまたは含まない、前記LNP組成物。
[実施形態10]RNA成分と、
脂質成分とを含み、ここで、前記脂質成分は、
約50~60モル%のアミン脂質と、
約8~10モル%の中性脂質と、
約2.5~4モル%のPEG脂質と
を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
LNP組成物のN/P比は約3~7である、前記LNP組成物。
[実施形態11]前記RNA成分はmRNAを含む、先行実施形態いずれかに記載の組成物。
[実施形態12]前記RNA成分は、RNA誘導型DNA結合因子、例えば、CasヌクレアーゼmRNAなどを含む、先行実施形態いずれかに記載の組成物。
[実施形態13]前記RNA成分はクラス2CasヌクレアーゼmRNAを含む、先行実施形態いずれかに記載の組成物。
[実施形態14]前記RNA成分はCas9ヌクレアーゼmRNAを含む、先行実施形態いずれかに記載の組成物。
[実施形態15]前記mRNAは修飾mRNAである、実施形態11~14のいずれかに記載の組成物。
[実施形態16]前記RNA成分は、RNA誘導型DNA結合因子をコードするオープンリーディングフレームを含むRNAを含み、ここで、前記オープンリーディングフレームはウリジン含量が、その最小ウリジン含量から、前記最小ウリジン含量の150%までの範囲である、先行実施形態いずれかに記載の組成物。
[実施形態17]前記RNA成分は、RNA誘導型DNA結合因子をコードするオープンリーディングフレームを含むmRNAを含み、ここで、前記オープンリーディングフレームはウリジンジヌクレオチド含量が、その最小ウリジンジヌクレオチド含量から、前記最小ウリジンジヌクレオチド含量の150%までの範囲である、先行実施形態いずれかに記載の組成物。
[実施形態18]前記RNA成分は、配列番号1、4、7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つに対する同一性が少なくとも90%である配列を含むmRNAを含み、ここで、前記mRNAは、RNA誘導型DNA結合因子をコードするオープンリーディングフレームを含む、先行実施形態いずれかに記載の組成物。
[実施形態19]前記RNA成分はgRNA核酸を含む、先行実施形態のいずれかに記載の組成物。
[実施形態20]前記gRNA核酸はgRNAである、実施形態19に記載の組成物。
[実施形態21]前記RNA成分はクラス2CasヌクレアーゼmRNA及びgRNAを含む、先行実施形態いずれかに記載の組成物。
[実施形態22]前記gRNA核酸は、二重ガイドRNA(dgRNA)であるかまたはそれをコードする、実施形態19~21のいずれかに記載の組成物。
[実施形態23]前記gRNA核酸は、sgRNAであるかまたはそれをコードする、実施形態19~21のいずれかに記載の組成物。
[実施形態24]前記gRNAは修飾されている、実施形態19~23のいずれかに記載の組成物。
[実施形態25]前記gRNAは、2’-O-メチル(2’-O-Me)修飾ヌクレオチド、ヌクレオチド間のホスホロチオアート(PS)結合、及び2’-フルオロ(2’-F)修飾ヌクレオチドから選ばれる修飾を含む、実施形態24に記載の組成物。
[実施形態26]前記gRNAは、5’末端の最初の5ヌクレオチドの1つ以上における修飾を含む、実施形態24~25のいずれかに記載の組成物。
[実施形態27]前記gRNAは、3’末端の最後の5ヌクレオチドの1つ以上における修飾を含む、実施形態24~26のいずれかに記載の組成物。
[実施形態28]前記gRNAは、最初の4ヌクレオチド間にPS結合を含む、実施形態24~27のいずれかに記載の組成物。
[実施形態29]前記gRNAは、最後の4ヌクレオチド間にPS結合を含む、実施形態24~28のいずれかに記載の組成物。
[実施形態30]5’末端の最初の3ヌクレオチドに2’-O-Me修飾ヌクレオチドをさらに含む、実施形態24~29のいずれかに記載の組成物。
[実施形態31]3’末端の最後の3ヌクレオチドに2’-O-Me修飾ヌクレオチドをさらに含む、実施形態24~30のいずれかに記載の組成物。
[実施形態32]前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約10:1~約1:10の範囲の比で存在する、実施形態19~31のいずれかに記載の組成物。
[実施形態33]前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約5:1~約1:5の範囲の比で存在する、実施形態19~31のいずれかに記載の組成物。
[実施形態34]前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約3:1~約1:1の範囲の比で存在する、実施形態19~33のいずれかに記載の組成物。
[実施形態35]前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約2:1~約1:1の範囲の比で存在する、実施形態19~34のいずれかに記載の組成物。
[実施形態36]前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約2:1の比で存在する、実施形態19~35のいずれかに記載の組成物。
[実施形態37]前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約1:1の比で存在する、実施形態19~35のいずれかに記載の組成物。
[実施形態38]少なくとも1つの鋳型をさらに含む、先行実施形態いずれかに記載の組成物。
[実施形態39]前記PEG脂質のモル%は約3である、先行実施形態いずれかに記載の組成物。
[実施形態40]前記アミン脂質のモル%は約50である、先行実施形態いずれかに記載の組成物。
[実施形態41]前記アミン脂質のモル%は約55である、先行実施形態いずれかに記載の組成物。
[実施形態42]前記アミン脂質のモル%は±3モル%である、先行実施形態いずれかに記載の組成物。
[実施形態43]前記アミン脂質のモル%は±2モル%である、先行実施形態いずれかに記載の組成物。
[実施形態44]前記アミン脂質のモル%は47~53モル%である、先行実施形態いずれかに記載の組成物。
[実施形態45]前記アミン脂質のモル%は48~53モル%である、先行実施形態いずれかに記載の組成物。
[実施形態46]前記アミン脂質のモル%は53~57モル%である、先行実施形態いずれかに記載の組成物。
[実施形態47]前記N/P比は6±1である、先行実施形態いずれかに記載の組成物。[実施形態48]前記N/P比は6±0.5である、先行実施形態いずれかに記載の組成物。
[実施形態49]前記アミン脂質はリピドAである、先行実施形態いずれかに記載の組成物。
[実施形態50]前記アミン脂質はリピドAの類似体である、先行実施形態いずれかに記載の組成物。
[実施形態51]前記類似体はアセタール類似体である、実施形態50に記載の組成物。[実施形態52]前記アセタール類似体はC4-C12アセタール類似体である、実施形態51に記載の組成物。
[実施形態53]前記アセタール類似体はC5-C12アセタール類似体である、実施形態50に記載の組成物。
[実施形態54]前記アセタール類似体はC5-C10アセタール類似体である、実施形態50に記載の組成物。
[実施形態55]前記アセタール類似体は、C4類似体、C5類似体、C6類似体、C7類似体、C9類似体、C10類似体、C11類似体、及びC12類似体から選ばれる、実施形態50に記載の組成物。
[実施形態56]前記ヘルパー脂質はコレステロールである、先行実施形態いずれかに記載の組成物。
[実施形態57]前記中性脂質はDSPCである、先行実施形態いずれかに記載の組成物。
[実施形態58]前記中性脂質はDPPCである、先行実施形態いずれかに記載の組成物。
[実施形態59]前記PEG脂質はジミリストイルグリセロール(DMG)を含む、先行実施形態いずれかに記載の組成物。
[実施形態60]前記PEG脂質はPEG-2kを含む、先行実施形態いずれかに記載の組成物。
[実施形態61]前記PEG脂質はPEG-DMGである、先行実施形態いずれかに記載の組成物。
[実施形態62]前記PEG-DMGはPEG2k-DMGである、実施形態61に記載の組成物。
[実施形態63]前記LNP組成物は中性脂質を本質的に含まない、実施形態9に記載の組成物。
[実施形態64]前記中性脂質はリン脂質である、実施形態63に記載の組成物。
[実施形態65]細胞を、実施形態12~64のいずれかに記載のLNP組成物と接触させることを含む、遺伝子編集方法。
[実施形態66]クラス2CasヌクレアーゼmRNA及びガイドRNA核酸を細胞に送達することを含む遺伝子編集方法であって、前記クラス2Cas mRNA及び前記ガイドRNA核酸は、実施形態13~64のいずれかに記載の少なくとも1つのLNP組成物として製剤化される、前記方法。
[実施形態67]細胞を、実施形態12~64のいずれかに記載の少なくとも1つのLNP組成物と接触させることを含む、遺伝子操作された細胞を作製する方法。
[実施形態68]前記LNP組成物を少なくとも2回投与する、実施形態65~67のいずれかに記載の方法。
[実施形態69]前記LNP組成物を2~5回投与する、実施形態68に記載の方法。
[実施形態70]再投与時に編集が改善する、実施形態68または69に記載の方法。
[実施形態71]少なくとも1つの鋳型核酸を前記細胞に導入することをさらに含む、実施形態65~70のいずれかに記載の方法。
[実施形態72]前記mRNAを第1のLNP組成物に製剤化し、前記ガイドRNA核酸を第2のLNP組成物に製剤化する、実施形態65~71のいずれかに記載の方法。
[実施形態73]前記第1及び第2のLNP組成物を同時に投与する、実施形態72に記載の方法。
[実施形態74]前記第1及び第2のLNP組成物を順次投与する、実施形態72に記載の方法。
[実施形態75]前記mRNA及び前記ガイドRNA核酸を単一のLNP組成物に製剤化する、実施形態65~73のいずれかに記載の方法。
実施例1-マウスにおけるインビボでの編集用LNP組成物
さまざまなLNP組成物の小規模調製物を調製し、それらの特性を調べた。マウスにおける肝臓での編集割合についてのアッセイでは、Cas9 mRNAと、化学修飾したマウスTTR配列指向性sgRNAとをLNP中に製剤化し、その際、PEGのモル%、リピドAのモル%、及びN:P比を下記表2に記載のようにさまざまに変えた。
Figure 2023103421000006
図1では、LNP製剤は、「%CL;N:P」で表わされる、それらのリピドAモル%及びN:P比に基づいてX軸上で識別されている。図1の凡例で示されるように、2モル%、2.5モル%、3モル%、4モル%、または5モル%の濃度のPEG-2k-DMGは、(1)45モル%のリピドA;N:P比4.5(「45;4.5」)、(2)45モル%のリピドA;N:P比6(「45;6」)、(3)50モル%のリピドA;N:P比4.5(「50;4.5」)、(4)50モル%のリピドA;N:P比6(「50;6」)、(5)55モル%のリピドA;N:P比4.5(「55;4.5」)、及び(6)55モル%のリピドA;N:P比6(「55;6」)で製剤化した。DSPCのモル%は、9モル%で一定に維持され、各製剤の脂質成分の残部が100モル%になるようコレステロール(モル%)を加えた。30種の製剤の各々を以下に記載のように製剤化し、1kg当たり1mgまたは1kg当たり0.5mgのトータルRNA用量(それぞれ、図1A及び図1B)にて単回投与で投与した。
LNP製剤-NanoAssemblr
脂質ナノ粒子成分を、脂質成分を上記のモル比で100%エタノールに溶解させた。RNAカーゴを25mMのクエン酸塩、100mMのNaCl、pH5.0に溶解させ、RNAカーゴの濃度を約0.45mg/mLとした。LNPは、脂質アミンとRNAリン酸塩(N:P)のモル比を約4.5または約6、mRNAとgRNAの比を重量基準で1:1にして製剤化された。
Precision Nanosystems NanoAssemblr(商標) Benchtop Instrumentを製造者の操作手順に従って使用し、脂質とRNA溶液のマイクロ流体混合によってLNPを生成した。混合中は水性溶媒と有機溶媒の比を2:1に維持しつつ、異なる流量を使用した。混合した後、LNPを回収し、水に希釈(約1:1v/v)して、室温で1時間保持し、さらに水で希釈(約1:1v/v)してから最終の緩衝液交換を行った。50mMのTris、45mMのNaCl、5%(w/v)のショ糖、pH7.5(TSS)への最終緩衝液交換はPD-10脱塩カラム(GE)で完了させた。必要に応じ、Amicon 100kDa遠心式フィルター(Millipore)で遠心分離にかけて製剤を濃縮した。その後、得られる混合物を、0.2μm滅菌フィルターを使用してろ過した。最終LNPは、以降の使用時まで-80℃にて保存した。
製剤分析法
本開示のLNPの多分散指数(「pdi」)及び大きさの特徴付けには、動的光散乱法(「DLS」)を使用する。DLSは、試料を光源に当てて得られる光の散乱を測定する。DLS測定から決定されるPDIは、集団における粒径(およその平均粒径)分布を表し、完全に均一な集団の場合、PDIはゼロである。
特定pHにおけるLNPの表面電荷の特徴付けには電気泳動光散乱法を使用する。表面電荷、またはゼータ電位は、LNP懸濁液中の粒子間の静電的反発力/静電的引力の大きさの尺度である。
非対称流フィールド・フロー・フラクショネーション-多角度光散乱法(AF4-MALS)を使用して、流体力学的半径により製剤中の粒子を分離し、その後、分画粒子の分子量、流体力学的半径及び根平均二乗半径を測定する。これにより、分子量及び粒度分布ならびに二次的特徴、例えば、Burchard-Stockmeyerプロット(粒子の内核密度を示唆する、根平均二乗(「rms」)半径と流体力学的半径の経時的な比)及びrmsコンホメーションプロット(得られる線形フィットの傾きがコンパクトなまとまり(compactness)と伸長(elongation)の程度を与える、rms半径の対数と分子量の対数の対比)などを評価することができるようになる。
製剤の粒度分布及び粒子濃度の決定にはナノ粒子トラッキング解析法(NTA、Malvern Nanosight)を使用することができる。LNP試料を適切に希釈し、顕微鏡スライド上に注入する。粒子がゆっくりと視野を通って注がれると、カメラが散乱光を記録する。ムービーが取得されるとナノ粒子トラッキング解析は画素を追跡して拡散係数を算出することによりムービーを処理する。この拡散係数は、粒子の流体力学的半径に翻訳され得る。この装置は、解析時に計数された個々の粒子数を計数して、粒子濃度も与える。
LNPの粒径、形態、及び構造的特徴の決定には低温電子顕微鏡法(「cryo-EM」)を使用することができる。
LNPの脂質組成分析は、液体クロマトグラフィー、その後の荷電化粒子検出(LC-CAD)により決定することができる。この分析では、実際の脂質含量と理論上の脂質含量の対比が得られる。
LNP製剤を、平均粒径、多分散指数(pdi)、トータルRNA含量、RNAの封入率、及びゼータ電位について分析する。脂質分析、AF4-MALS、NTA、及び/またはcryo-EMによってLNP製剤をさらに特徴付けしてよい。平均粒径及び多分散度は、Malvern Zetasizer DLS装置を使用して動的光散乱法(DLS)により測定する。DLSで測定する前に、LNP試料をPBSに30X希釈した。平均粒径の強度基準の測定値であるZ-平均径が数平均径及びpdiと共に報告された。Malvern Zetasizer装置は、LNPのゼータ電位の測定にも使用される。測定に先立ち、試料を0.1X PBS(pH7.4)に1:17(50μLを800μLに)で希釈する。
トータルRNA濃度及び遊離のRNAの決定には蛍光を基にしたアッセイ(Ribogreen(登録商標)、ThermoFisher Scientific)を使用する。封入率は、(トータルRNA-遊離のRNA)/トータルRNAで算出する。トータルRNAを決定するため0.2%Triton-X 100を含有している1× TE緩衝液を用いるか、または遊離のRNAを決定するため1× TE緩衝液を用いてLNP試料を適切に希釈する。製剤を作製するために使用され、その後1× TE緩衝液+/-0.2%Triton-X 100に希釈された、開始時のRNA溶液を使用して標準曲線を作成する。その後、希釈したRiboGreen(登録商標)色素(製造者の取扱説明書に従う)を標準液及び試料のそれぞれに加え、光のない状態で室温にて約10分間インキュベートした。SpectraMax M5プレートリーダー(Molecular Devices)を使用し、励起、オートカットオフ及び発光波長をそれぞれ488nm、515nm、及び525nmに設定して試料の読み取りを行った。適切な標準曲線によりトータルRNA及び遊離RNAを決定する。
封入率は、(トータルRNA-遊離のRNA)/トータルRNAで算出する。同様の手法を使用して、DNAに基づくかまたは核酸を含有するカーゴ成分の封入率を決定してよい。一本鎖DNAにはOligreen Dyeを使用してよく、二本鎖DNAにはPicogreen Dyeを使用してよい。
AF4-MALSを使用して、分子量及び粒度分布、ならびにそれらの計算値による二次統計を調べる。LNPを適宜希釈し、それらが集められているHPLCオートサンプラーを使用してAF4分離チャンネルに注入し、その後、チャンネルを横切る交差流中に指数勾配で溶出させる。流体はすべてHPLCポンプ及びWyatt Eclipse装置で駆動される。粒子はAF4のチャンネル流から溶出し、UV検出器、多角度光散乱検出器、準弾性光散乱検出器及び示差屈折率検出器を通る。Debeyeモデルを使用して生データを処理し、検出器信号から分子量及びrms半径を決定する。
荷電化粒子検出器(CAD)に連結したHPLCにより、LNP中の脂質成分を定量的に分析する。クロマトグラフィーによる4種の脂質成分の分離は逆相HPLCにより達成された。CADは非揮発性化合物を漏れなく検出する質量基準の検出器であり、分析対象物の構造にかかわらずシグナルは一定である。
Cas9 mRNA及びgRNAのカーゴ
Cas9 mRNAカーゴをインビトロ転写により調製した。直鎖状にしたプラスミドDNA鋳型及びT7RNAポリメラーゼを使用してインビトロ転写により、1X NLS(配列番号48)を含むキャップ化しポリアデニル化したCas9 mRNAを作製した。XbaIを以下の200ng/μLのプラスミド、2U/μLのXbaI(NEB)、及び1×反応緩衝液という条件で用いて37℃で2時間インキュベートすることにより、T7プロモーター及び100ntのポリ(A/T)領域を含有しているプラスミドDNAを直鎖状にした。反応物を65℃で20分間加熱してXbaIを不活性化した。直鎖状にしたプラスミドをシリカマキシスピンカラム(Epoch Life Sciences)を使用して酵素及び緩衝塩により精製し、アガロースゲルで分析し、直鎖化を確認した。Cas9修飾mRNAを作製するためのIVT反応物を以下の条件で37℃にて4時間インキュベートした:50ng/μLの直鎖状プラスミド;GTP、ATP、CTP、及びN1-メチルpseudo-UTP(Trilink)を各2mMずつ;10mMのARCA(Trilink);5U/μLのT7 RNAポリメラーゼ(NEB);1U/μLのマウスRNAse阻害剤(NEB);0.004U/μLのE.coli無機ピロホスファターゼ(NEB);及び1×反応緩衝液。4時間インキュベーションした後、TURBO DNase(ThermoFisher)を加えて最終濃度0.01U/μLとし、反応物をさらに30分間インキュベートしてDNA鋳型を除去した。MegaClear Transcription Clean-upキットを製造者(ThermoFisher)の操作手順に従って使用し、Cas9 mRNAを酵素及びヌクレオチドにより精製した。別法として、LiCl沈殿法でCas9 mRNAを精製した。
本実施例でのsgRNAは化学合成したものであり、市販業者により供給されたものであった。sg282配列を以下に記載し、2‘-O-メチル修飾及びホスホロチオアート結合は以下の通り表される(m=2’-OMe;*=ホスホロチオアート):
mU*mU*mA*CAGCCACGUCUACAGCAGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU。(配列番号42)。
LNP
最終LNPの特徴付けを行い、封入率、多分散指数、及び平均粒径を上記の分析方法に従って決定した。
マウスにLNPを投与し(1mg/kgまたは0.5mg/kgでの単回投与)、ゲノムDNAを単離して下記のNGS分析に供した。
インビボでのLNP送達
各試験では6週齢から10週齢までの雌CD-1マウスを使用した。動物の体重を測定し、体重に従って群に分け、群の平均体重に基づいて投与溶液を調製した。LNPを、動物1匹当たり0.2mLの容量(体重1キログラム当たり約10mL)で側尾静脈を介して投与した。投与の約6時間後、動物を有害作用について観察した。投与の24時間後に体重を測定し、さまざまな時点において動物をイソフルラン麻酔下、心臓穿刺を介した放血により安楽死させた。血液を血清分離剤入り管または本明細書に記載のような血漿用の緩衝クエン酸ナトリウム含有チューブに採取した。インビボでの編集を行う試験用に、各動物の中葉または3つの独立した葉(例えば、右中葉、左中葉、及び左側葉)から肝組織を採取し、DNAの抽出及び分析に供した。
マウスのコホートを、次世代シーケンシング(NGS)及び血清TTRレベルによって肝臓での編集について測定した(データ図示せず)。
トランスサイレチン(TTR)ELISA分析
血液を採取し、示されているように血清を単離した。マウスプレアルブミン(トランスサイレチン)ELISキット(Aviva Systems Biology、カタログOKIA00111)を使用してマウスの血清総TTRレベルを決定した。ラット特異的ELISキット(Aviva Systems Biology、カタログ番号OKIA00159)を製造者の操作手順に従って使用し、ラット血清TTRレベルを測定した。簡単に言うと、血清をキットのサンプル希釈剤で段階的に希釈し、最終希釈度10,000倍とした。その後、この希釈サンプルをELISAプレートに加えた後、使用説明書に従ってアッセイを行った。
NGSシークエンシング
手短に言えば、ゲノムにおける標的位置での編集効率を定量的に決定するため、ゲノムDNAを単離し、ディープシークエンシングを利用して、遺伝子編集により導入された挿入及び欠失の存在を同定した。
標的部位(例えば、TTR)周辺にPCRプライマーを設計し、目的のゲノム領域を増幅させた。プライマー配列を以下に提供する。製造者の操作手順(Illumina)に従ってさらなるPCRを実施し、シークエンシングに必要な化学を追加した。アンプリコンの配列決定をIllumina MiSeq装置で行った。品質スコアの低いものを除去した後、読み取ったものをヒト基準ゲノム(例えば、hg38)に対して整列させた。読み取りを含有している結果ファイルを基準ゲノム(BAMファイル)に対してマッピングし、ここで、目的の標的領域と重複した読み取りを選択し、野生型の読み取り数と挿入、置換、または欠失含有する読み取り数との比を計算した。
編集割合(例えば、「編集効率」または「編集率」)は、野生型などの配列読み取り総数に対する、挿入または欠失を含む配列読み取り総数と定義される。
図1は、NGSにより測定したマウス肝臓における編集割合を示す。図1Aに示すように、1kg当たり1mgのRNAを投与した場合、インビボでの編集割合は肝臓での編集が約20%~60%超である。1kg当たり0.5mgを投与した図1Bでは、約10%~60%の肝臓での編集が観察された。このマウスにおけるインビボ試験では、全組成物ともCas9 mRNA及びgRNAを肝細胞に効果的に送達し、各LNP組成物のNGSにより測定された、標的部位における活性なCRISPR/Casヌクレアーゼ活性が認められた。5%のPEG脂質を含有するLNPは封入率が低く(データ図示せず)、効力が幾分低かった。
実施例2-LNP組成物分析法
LNPの特性解析は、リピドA及びPEG脂質を増量して製剤化したLNPにおいて、改善された物理化学的パラメータを示している。PEG脂質を2モル%または3モル%含む組成物(PEG2k-DMG)を下記表3に記載する。
Figure 2023103421000007
LNP製剤-交差流
脂質含有エタノールを、2容量のRNA溶液及び1容積の水と衝突噴流混合してLNPを形成した。脂質含有エタノールを、混合交差部を介して2容量のRNA溶液と混合する。第4流の水を、インラインT字部を介して交差部の出口流と混合する。(WO2016010840の図2を参照のこと)。LNPを室温で1時間維持し、その後、水でさらに希釈した(約1:1v/v)。希釈したLNPを、フラットシートカートリッジ(Sartorius、100kD MWCO)で接線流ろ過を使用して濃縮し、その後、緩衝液を、血液透析濾過によって50mMのTris、45mMのNaCl、5%(w/v)のショ糖、pH7.5(TSS)に交換した。別法として、TSSへの最終緩衝液交換をPD-10脱塩カラム(GE)で完了させた。必要に応じ、Amicon 100kDa遠心式フィルター(Millipore)で遠心分離にかけて製剤を濃縮した。その後、得られる混合物を、0.2μm滅菌フィルターを使用してろ過した。最終LNPを以降の使用時まで4℃または-80℃で保存した。
Cas9 mRNA及びsgRNAを実施例1に記載のように調製したが、キャップ化及びポリアデニル化したCas9 U除去(Cas9 Udep)mRNAが配列番号43を含む点が異なっている。Sg282は実施例1に記載され、sg534(「G534」)の配列を以下に記載する:
mA*mC*mG*CAAAUAUCAGUCCAGCGGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU(配列番号72)
LNP製剤を、平均粒径、多分散度(pdi)、トータルRNA含量及びRNAの封入率について実施例1に記載のように分析した。
平均粒径、多分散度(PDI)、トータルRNA含量及びRNAの封入率の分析を表4に示す。LNP組成物の理論上の脂質濃度に加え、脂質分析により、下記表5に示すような実際の脂質のモル%レベルが示された.
Figure 2023103421000008
Figure 2023103421000009
Figure 2023103421000010
物理化学的性質をさらに分析するため、LNP897、LNP898、LNP966、及びLNP969を非対称流フィールド・フロー・フラクショネーション-多角度光散乱法(AF4-MALS)分析に供した。AF4-MALS装置は粒径及び分子量分布を測定し、粒子のコンホメーション及び密度についての情報を提供する。
LNPは、それらが集められているHPLCオートサンプラーを使用してAF4分離チャンネルに注入し、その後、チャンネルを横切る交差流中に指数勾配で溶出させる。流体はすべてHPLCポンプ及びWyatt Eclipse装置で駆動される。粒子はAF4のチャンネル流から溶出し、UV検出器、Wyatt Heleos II多角度光散乱検出器、準弾性光散乱検出器及びWyatt Optilab T-rEX示差屈折率検出器を通る。Debeyeモデルを使用してWyatt Astra 7ソフトウェアで生データを処理し、検出器信号から分子量及びrms半径を決定する。
LNPについての対数で表すモル質量差プロットを図2Aとして示す。手短に言えば、X軸はモル質量(g/mol)を示し、Y軸は微分数(differential number fraction)を示す。対数で表すモル質量差プロットにより、具体的な製剤について測定した異なる分子量の分布が示される。これにより、製剤中の分子量ならびに分子量の全体的分布の様子に関するデータが与えられ、粒子の異質性に関し平均分子量よりも良好な像が得られる。
異なるモル質量モーメントを測定し、重量平均モル質量(Mw)と数平均モル質量(Mn)の比を計算してMw/Mnの多分散度を得ることによって、各種LNP製剤の異質性を決定する。これらの各種製剤の多分散度グラフを図2Bに記載する。
図2Aに示すように、データは、PEGが3モル%、及びリピドAが50モル%及び55モル%の場合にN/P6.0で粒子分布が密になっていることを示す。これは、図2Bに示すように多分散度が密であることに反映されている。
実施例3-AF4 MALSデータ-さらなる製剤
LNPの特性解析は、リピドAを増量して製剤化したLNPにおいて、改善された物理化学的パラメータを示している。45モル%、50モル%、または55モル%いずれかのリピドAを2つの異なるgRNAと共に含む組成物を下記表6に記載する。
Figure 2023103421000011
LNPを実施例2に記載のように形成した。
Cas9 mRNA及びsgRNAを上記のように調製した。
LNP組成物の特徴付けを行い、封入率、多分散指数、及び平均粒径を実施例1に記載のように決定した。
平均粒径、多分散度(PDI)、トータルRNA含量及びRNAの封入率の分析を表7に示す。LNP組成物の理論上の脂質濃度に加え、脂質分析により、下記表8に示すような実際の脂質のモル%レベルが示された。
Figure 2023103421000012
Figure 2023103421000013
Figure 2023103421000014
Figure 2023103421000015
物理化学的性質をさらに分析するため、LNP1021、LNP1022、LNP1023、LNP1024及びLNP1025を非対称流フィールド・フロー・フラクショネーション-多角度光散乱法(AF4-MALS)分析に供した。AF4-MALS装置は粒径及び分子量分布を測定し、粒子のコンホメーション及び密度についての情報を提供する。
LNPに、実施例1に記載のようにAF4-MALSを実施した。
LNPについての対数で表すモル質量差プロットを図3Aとして示す。手短に言えば、X軸はモル質量(g/mol)を示し、Y軸は微分数(differential number fraction)を示す。対数で表すモル質量差プロットにより、具体的な製剤について算出した異なる分子量の分布が示される。これにより、製剤中の分子量ならびに分子量の全体的分布の様子に関するデータが与えられ、粒子の異質性に関し平均分子量よりも良好な像が得られる。
図3Bでは平均分子量をプロットした。平均分子量は分布全体の平均であるが、その分布の形状に関する情報は得られない。LNP1022及びLNP1025は平均分子量が同じであるが、分布はLNP1022の方がわずかに広い。
異なるモル質量モーメントを調べ、重量平均モル質量(Mw)と数平均モル質量(Mn)の比を計算してMw/Mnの多分散度を得ることによって、各種LNP製剤の異質性を算出する。これらの各種製剤の多分散度グラフを図4Aに記載する。
さらに、LNP製剤のBurchard-Stockmeyerプロットを図4Bとして示す。Burchard-Stockmeyerプロットでは、AF4チャンネルからの製剤の溶出液全体における、rms半径と流体力学的半径との比が示される。これにより、脂質ナノ粒子の内部密度に関する情報が得られる。図4Bは、この測定において、LNP1021、LNP1022及びLNP1023は異なるプロファイルを有することを示している。
実施例4-PEG脂質増量では効力が維持されサイトカイン応答が低下する
別の試験では、PEG脂質を2モル%または3モル%含むLNP製剤で、PEG DMG脂質を比較した。PEG DMGを2モル%、または3モル%いずれかで含む組成物を下記表9に記載する。
Figure 2023103421000016
Figure 2023103421000017
実施例2に記載の方法でLNPを形成した。
Cas9 mRNA及びsgRNAを実施例1に記載のように調製し、sg390(「G390」)の配列を以下に記載する:
mG*mC*mC*GAGUCUGGAGAGCUGCAGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU(配列番号69)。
LNP製剤を、平均粒径、多分散度(pdi)、トータルRNA含量及びRNAの封入率について実施例1に記載のように分析した。
平均粒径、多分散度(PDI)、トータルRNA含量及びRNAの封入率の分析を表10に示す。LNP組成物の理論上の脂質濃度に加え、脂質分析により、下記表11に示すような実際の脂質のモル%レベルが示された。
Figure 2023103421000018
Figure 2023103421000019
Figure 2023103421000020
ラット血清サイトカインを、Luminex磁気ビーズマルチプレックスアッセイ(Milliplex MAP磁気ビーズアッセイ、Millipore Sigma製、カタログ番号RECYTMAG-65K)を使用して、MCP-1、IL-6、TNF-アルファ及びIFN-ガンマを分析して評価した。アッセイビーズをBioRad BioPlex-200で読み取り、BioPlex Managerソフトウェアバージョン6.1で4パラメータロジスティックフィットを使用して、標準曲線からサイトカイン濃度を計算した。データは図5にグラフ化されている。図5A(血清TTR)、図5B(肝臓での編集)、及び図5C(サイトカインp MCP1)を参照のこと。
ラット特異的ELISキット(Aviva Systems Biology、カタログ番号OKIA00159)を製造者の操作手順に従って使用し、ラット血清TTRレベルを測定した。簡単に言えば、血清をキットのサンプル希釈剤で段階的に希釈し、最終希釈度10,000倍とした。その後、この希釈サンプルをELISAプレートに加えた後、使用説明書に従ってアッセイを行った。
約10mgの肝組織からゲノムDNAを単離し、上記のようにNGSを使用して解析した。増幅用PCRプライマー配列を以下に記載する。
図5A及び図5Bは、PEGが2モル%及び3モル%の各製剤において、血清TTRノックダウン及び肝臓での編集が十分であったことを示す。図5Cは、PEGが3モル%の製剤使用時、MCP-1応答が低下していることを示す。
実施例5-非ヒト霊長類へのLNP送達
実施例1に記載のように調製したLNP製剤を用いて3つの試験を行った。特定のモル量及びカーゴを表12~表26に記載する。Cas9 mRNA及びガイドRNA(gRNA)を含有している各製剤はmRNA:gRNA比が重量基準で1:1であった。LNP投与量(単位:mg/kg、トータルRNA含量)、投与経路、及び動物へのデキサメタゾンでの前処置の有無を表に示す。デキサメタゾン(Dex)の前処置を受けた動物の場合、LNPまたはビヒクルの投与の1時間前に、Dexを2mg/kgでIVボーラス注射により投与した。
血液化学分析では、測定した各因子についての下記表で示されている時間に動物から血液を採取した。処理の前後NHPでサイトカイン誘導を測定した。拘束した覚醒動物の末梢静脈から最低の0.5mLの全血を4mL血清分離剤入り管に採取した。血液を室温で最低限30分間凝血させ、その後、2000xgで15分の遠心分離にかけた。血清を2本の120μLポリプロピレン製マイクロチューブに分注し、分析まで-60~-86℃で保存した。Meso Scale Discovery(MSD)製非ヒト霊長類U-Plex Cytokineカスタムキットを使用して分析した。IL-6及びMCP-1に重点を置いて、以下のパラメータ、すなわち、INF-g、IL-1b、IL-2、IL-4、IL-6、IL-8、IL-10、IL-12p40、MCP-1及びTNF-aを分析に含めた。キット試薬及び標準液を製造者の操作手順で指示されているように調製した。NHP血清はそのまま使用した。MSD Sector Imager 6000でプレートの読み取りを実施し、MSD Discoveryワークベンチソフトウェアバージョン4012で分析を実施した。
処置前後の動物で酵素免疫測定法により補体レベルを測定した。拘束した覚醒動物の末梢静脈から全血(0.5mL)を0.5mLのkEDTAを含有する管に採取した。血液を2000xgで15分の遠心分離にかけた。血漿を2本の120μLポリプロピレン製マイクロチューブに分注し、分析まで-60~-86℃で保存した。Quidel MicroVue Complement Plus EIAキット(C3a-カタログ番号A031)または(Bb-カタログ番号A027)を使用して分析した。キット試薬及び標準液を製造者の操作手順で指示されているように調製した。MSD Sector Imager 6000で光学濃度を450nmにしてプレートの読み取りを実施した。4-パラメータ曲線フィッティングを使用して結果を分析した。
サイトカイン誘導及び補体活性化についてのデータを下記表に記載する。「BLQ」は、定量限界未満であることを意味する。
Figure 2023103421000021
Figure 2023103421000022
Figure 2023103421000023
Figure 2023103421000024
Figure 2023103421000025
Figure 2023103421000026
Figure 2023103421000027
Figure 2023103421000028
Figure 2023103421000029
Figure 2023103421000030
Figure 2023103421000031
Figure 2023103421000032
Figure 2023103421000033
Figure 2023103421000034
Figure 2023103421000035
Figure 2023103421000036
Figure 2023103421000037
Figure 2023103421000038
Figure 2023103421000039
Figure 2023103421000040
Figure 2023103421000041
Figure 2023103421000042
Figure 2023103421000043
Figure 2023103421000044
Figure 2023103421000045
Figure 2023103421000046
Figure 2023103421000047
実施例6-PEG脂質スクリーニング
別の試験では、PEG脂質を2モル%または3モル%含むLNP製剤で代替的PEG脂質を比較した。
試験では3種のPEG脂質を使用し、脂質1(DMG-PEG2k;Nof)は、以下のように表される。
Figure 2023103421000048
Heyes,et al.,J.Controlled Release,107(2005),pp.278-279(「Synthesis of PEG2000-C-DMA」を参照のこと)に記載のように合成される脂質2は、以下のように表すことができ、
Figure 2023103421000049
WO2016/010840(化合物S027、段落[00240]から段落[00244]を参照のこと)及びWO2011/076807に開示される脂質3は、以下のように表すことができる。
Figure 2023103421000050
各PEG脂質を2モル%及び3モル%用いてリピドAを製剤化した。脂質ナノ粒子成分を、脂質成分を上記のモル比で100%エタノールに溶解させた。手短に言えば、RNAカーゴを25mMのクエン酸塩、100mMのNaCl、pH5.0に調製し、RNAカーゴの濃度を約0.45mg/mLとした。LNPは、脂質アミンとRNAリン酸塩(N:P)のモル比を約4.5、mRNAとgRNAの比を重量基準で1:1にして製剤化された。
Figure 2023103421000051
Figure 2023103421000052
Cas9 mRNA、sg282、及びLNPを実施例1に記載のように調製した。
脂質1、脂質2、または脂質3を含むLNP組成物を雌CD―1マウスに投与し、1mg/kg体重及び0.5mg/kg体重で実施例1に記載のように評価した。マウスのコホートを、実施例1の方法に従って次世代シーケンシング(NGS)及び血清TTRレベルによって肝臓での編集について測定した。
図6A及び図6Bでは、PEG脂質製剤間の血清TTRレベル比較している。図6Aは血清TTRをμg/mL単位で示し、図6Bはノックダウンの割合(TSS%)としてのデータを示す。図6Cは肝臓で達成された編集率を示す。データは、被験PEG脂質の各々を含むLNP組成物は2モル%及び3モル%において効力を示し、脂質1は一貫して脂質2及び脂質3よりも性能が良好であることを示す。
実施例7-リピドA類似体
リピドAの構造類似体を多数合成し、本明細書に記載のLNP組成物で試験した。
合成:リピドAは、4,4-ビス(オクチルオキシ)ブタン酸(WO2015/095340の実施例13の「中間体13b」)と、(9Z,12Z)-3-ヒドロキシ-2-(ヒドロキシメチル)プロピルオクタデカ-9,12-ジエノアート(「中間体13c」)とを反応させてから、中間体13bと中間体13cの生成物を、3-ジエチルアミノ-1-プロパノールと反応させて頭部基を付加することにより作られる。(WO2015/095340の84~86頁を参照のこと)。
WO2015/095340の中間体13b(4,4ビス(オクチルオキシ)ブタン酸)を4,4-ビス(オクチルオキシ)ブタンニトリルにより以下のとおり合成した。
中間体13a:4,4-ビス(オクチルオキシ)ブタンニトリル
Figure 2023103421000053
4,4-ジエトキシブタンニトリル(9.4g、60mmol)及びオクタン-1-オール(23.1g、178mmol)の混合物にピリジニウムp-トルエンスルホン酸(748mg、3.0mmol)を室温で加えた。混合物を105℃に温め、反応槽を開にし、空気に触れる状態で、還流冷却器を取り付けずに18時間撹拌した。その後、反応混合物を室温まで冷却し、シリカゲル(酢酸エチル含有ヘキサンの勾配0~5%)で精製して10.1g(31.0mmol)の中間体13aを澄明な油状物として得た。H NMR (400 MHz, CDCl) δ 4.55 (t, J = 5.3 Hz, 1H), 3.60 (dt, J = 9.2, 6.6 Hz, 2H), 3.43 (dt, J = 9.2, 6.6 Hz, 2H), 2.42 (t, J = 7.4 Hz, 2H), 1.94 (td, J = 7.4, 5.3 Hz, 2H), 1.63 - 1.50 (m, 4H), 1.38 - 1.19 (m, 20H), 0.93 - 0.82 (m, 6H) ppm。
次に、中間体13a(8.42g、31mmol)のエタノール溶液(30mL)に、31mLの水性水酸化カリウム(2.5M、30.9mL、77.3mmol)を室温で加えた。反応槽に還流冷却器を取り付けた時点で、混合物を110℃まで加熱し、24時間撹拌した。その後、混合物を室温まで冷却し、水性塩化水素酸(1N)で酸性化してpH5とし、ヘキサン中に3回抽出した。合わせた有機抽出物を水(2回)及び食塩水で洗浄して無水硫酸マグネシウムで乾燥させた後、減圧濃縮し、8.15g(23.6mmol)の中間体13bを澄明な油状物として得、これをそれ以上精製せずに使用した。H NMR (400 MHz, CDCl) δ 4.50 (t, J = 5.5 Hz, 1H), 3.57 (dt, J = 9.4, 6.7 Hz, 2H), 3.41 (dt, J = 9.3, 6.7 Hz, 2H), 2.40 (t, J = 7.4 Hz, 2H), 1.92 (td, J = 7.4, 5.3 Hz, 2H), 1.56 (m, 4H), 1.37 - 1.21 (m, 20H), 0.92 - 0.83 (m, 6H) ppm(下記の構造)。
中間体13b
Figure 2023103421000054
上記方法を使用して、C(炭素数5、6、7、9、及び10)-アセタール酸性中間体(中間体B3~F3と呼び、以下に表す)を、適切なアルカン-1-オール試薬を使用して調製した。
中間体B3、4,4-ビス(ペンチルオキシ)ブタン酸
Figure 2023103421000055
H NMR (400 MHz, CDCl3) δ 4.52 (t, J = 5.5 Hz, 1H), 3.58 (dt, J = 9.3, 6.6 Hz, 2H), 3.41 (dt, J = 9.3, 6.7 Hz, 2H), 2.45 (t, J = 7.4 Hz, 2H), 1.94 (m, 2H), 1.57 (m, 4H), 1.32 (m, J = 3.7 Hz, 8H), 0.95 - 0.83 (m, 6H) ppm。
中間体C3:4,4-ビス(ヘキシルオキシ)ブタン酸
Figure 2023103421000056
H NMR (400 MHz, CDCl) δ 4.44 (t, J = 5.6 Hz, 1H), 3.49 (dt, J = 9.3, 6.9 Hz, 2H), 3.39 (dt, J = 9.3, 6.8 Hz, 2H), 2.12 (t, J = 7.6 Hz, 2H), 1.79 (q, J = 7.0 Hz, 2H), 1.54 (m, 4H), 1.29 (m, 12H), 0.94 - 0.82 (m, 6H) ppm。
中間体D3:4,4-ビス(ヘプチルオキシ)ブタン酸
Figure 2023103421000057
H NMR (400 MHz, CDCl) δ 8.85 (br s, 1H), 4.46 (t, J = 5.6 Hz, 1H), 3.52 (dt, J = 9.4, 6.8 Hz, 2H), 3.39 (dt, J = 9.3, 6.8 Hz, 2H), 2.26 (t, J = 7.6 Hz, 2H), 1.85 (q, J = 7.0 Hz, 2H), 1.53 (m, 4H), 1.29 (m, 16H), 0.94 - 0.80 (m, 6H) ppm。
中間体E3:4,4-ビス(ノニルオキシ)ブタン酸
Figure 2023103421000058
H NMR (400 MHz, CDCl) δ 5.32 (br s, 1H), 4.44 (t, J = 5.6 Hz, 1H), 3.49 (dt, J = 9.3, 6.9 Hz, 2H), 3.38 (dt, J = 9.4, 6.9 Hz, 2H), 2.10 (t, J = 7.6 Hz, 2H), 1.78 (q, J = 7.0 Hz, 2H), 1.53 (m, 4H), 1.27 (m, 24H), 0.88 (t, J = 6.6 Hz, 6H) ppm。
中間体F3:4,4-ビス(デシルオキシ)ブタン酸:
Figure 2023103421000059
H NMR (400 MHz, CDCl) δ 4.48 (t, J = 5.5 Hz, 1H), 3.55 (m, 2H), 3.42 (m, 2H), 2.29 (dd, J = 10.8, 7.5 Hz, 2H), 1.90 - 1.82 (m, 2H), 1.55 (m, 4H), 1.27 (m, 28H), 0.88 (t, J = 6.7 Hz, 6H) ppm。
リピドAのアセタール類似体(C(8))は、C(炭素数5、6、7、9、または10)-アセタール酸性中間体(B3~F3)と、中間体13cとを反応させてから、そのステップの生成物を3-ジエチルアミノ-1-プロパノールと反応させることによって合成した。(WO2015/095340の84~86頁を参照のこと)。各類似体を合成し、HNMRで特徴付けを行った(データ図示せず)。
リピドA類似体を45モル%、DMG-PEG2kを2モル%、DSPCを9モル%、及びコレステロールを44モル%にし、N:P比4.5にてC7、C9、及びC10の類似体を製剤化した。それぞれの類似体は、リピドA類似体を55モル%、DMG-PEG2kを2.5モル%、DSPCを9モル%、及びコレステロールを38.5モル%にし、N:P比6にても製剤化された。脂質ナノ粒子成分を、脂質成分を上記のモル比で100%エタノールに溶解させた。RNAカーゴを25mMのクエン酸塩、100mMのNaCl、pH5.0に調製し、RNAカーゴの濃度を約0.45mg/mLとした。
RNAカーゴには、配列番号43を含むCas9 mRNA及びsg282が含まれ、上記のように調製した。LNPを実施例1に記載のように形成した。
C(5)及びC(6)リピドA類似体を含むLNP組成物を含めた拡張パネルのアセタール類似体を、先のパネルと共に試験した。2つの新たな類似体は、リピドA類似体を55モル%、DMG-PEG2kを2.5モル%、DPSCを9モル%、及びコレステロールを33.5モル%にし、N/P比6にて、上記のように製剤化した。分析により、LNPの大きさはいずれも120nmを下回り、PDIは0.2未満、及び封入されたRNAの割合(%)は80%より高いことが示された。製剤の分析結果を下記表28に記載する。
Figure 2023103421000060
水に溶解させた6-(p-トルイジノ)-6-ナフタレンスルホン酸(「TNS」)を使用し、類似体をpKaについて評価した。本アッセイでは、0.1Mのリン酸緩衝液を4.5~10.5の範囲の異なるpH値で調製した。各類似体を100%エタノール中に個々に調製した。その後、脂質及びTNSを個々のpH緩衝液に加えてプレートに移し、SpectraMaxマイクロプレートリーダーで波長321~488nmにて分析した。値をプロットしてpKaを生成した。対数IC50をpKaとして使用する。
雌CD―1マウスに、実施例1に記載のように、0.3mg/kg(図7A-図7E)、または1kg当たり0.1mg(図7F-図7G)を投与した。手短に言えば、Charles River Laboratoriesから得た雌CD-1マウス(n=5/群)にLNP組成物をさまざまな用量で投与した。剖検時(投与後7日)、TTR分析用に血清を採取し、編集分析用に肝臓を採取した。血清TTRアッセイ及び編集率アッセイを実施例1に記載のように実施した。図7Aから図7Eの血清TTRレベル及び肝臓での編集では、すべての類似体が、体重1キログラム当たり0.3ミリグラムにおいてリピドAに匹敵する性能であることが示されている。図7F~図7Gでは、リピドAが最も効力が高かったが、新たに合成した類似体はいずれもTTRノックダウン及び肝臓での編集が適切であることが示されている。
実施例8-用量反応曲線-初代Cyno肝細胞
肝臓の初代肝細胞。初代カニクイザル肝臓肝細胞(PCH)(Gibco)を解凍し、添加物を含有する肝細胞融解培地(Gibco、カタログCM7000)に再懸濁させ、その後、80gで4分間遠心分離にかけた。上清を廃棄し、ペレット状にした細胞を添加物入り肝細胞播種培地パック(Invitrogen,カタログA1217601及びCM3000)に再懸濁させた。細胞を計数し、Bio-coatコラーゲンIコート96ウェルプレート(ThermoFisher、カタログ877272)に50,000細胞/ウェルの密度で播種した。播種細胞を沈殿させ、組織培養インキュベーター(37℃、5%CO雰囲気)に入れて24時間接着させてから、LNPを投与した。インキュベーション後、細胞を単層形成について確認し、肝細胞培地及び無血清の添加物パック(Invitrogen,カタログA1217601及びCM4000)で培地を交換した。
本試験用のLNP製剤(LNP1021、LNP1022、LNP1023、LNP1024、LNP1025、及びLNP897)を上記のように調製した。
カニクイザル初代肝細胞で修飾sgRNAを含有する脂質ナノ粒子製剤をさまざまな用量で試験し、用量反応曲線を作成した。播種して24時間培養した後、6%のカニクイザル血清を含有する肝細胞維持培地でLNPを37℃で5分間インキュベートした。インキュベーション後、LNPをカニクイザル初代肝細胞に、8.2倍の用量反応曲線で100ngのmRNAで開始して加えた。細胞を、処理後72時間溶解させ、実施例1に記載のようにNGS分析を行った。各種LNP組成物について編集率を決定したデータを図8Aにグラフ化している。Cas9 mRNA(配列番号48)及びU-除去Cas9 mRNA(配列番号43)での編集率(%)を図8Bに記載する。LNP組成物は表2(LNP897)及び表5(LNP1021、LNP1022、LNP1023、LNP1024、及びLNP1025)に記載されている。
結果は比較効力評価の定量的評価を示しており、mRNA及びLNP組成物の両方が効力に影響を与えることを示している。
実施例9-RNAカーゴ:mRNA及びgRNA合剤
この試験では、gRNAとmRNAの比が異なる場合のマウスにおけるインビボでの有効性を評価した。ORFの配列番号4、HSD 5’UTR、ヒトアルブミン3’UTR、コザック配列、及びポリA尾部を有するCleanCap(商標)キャップ化Cas9 mRNAを、実施例1に示すウリジン三リン酸の代わりにN1-メチルプソイドウリジン三リン酸を用いてIVT合成により作製した。
LNP製剤を、リピドA、コレステロール、DSPC、及びPEG2k-DMGのモル比を50:38:9:3にし、N:P比6にて記載mRNA及びsg282(配列番号42;G282)から実施例2に記載のように調製した。製剤のgRNA:Cas9 mRNA重量比は表29に示すとおりであった.
Figure 2023103421000061
インビボでの特性解析をするため、上記のLNPを、1kg当たり0.1mgのトータルRNA(ガイドRNA(mg)+mRNA(mg))にてマウスに投与した(n=5/群)。投与後7~9日目、動物を屠殺して血液及び肝臓を採取し、血清TTR及び肝臓での編集を実施例1に記載のように測定した。血清TTR及び肝臓での編集の結果を図9A及び図9Bに示す。陰性対照マウスにはTSSビヒクルを投与した。
さらに、上記LNPをマウスに投与し、その際、mRNAを1kg当たり0.05mgのmRNA(n=5/群)という一定用量にし、gRNAを1kg当たり0.06mg~1kg当たり0.4mgで用量を変えた。投与後7~9日目、動物を屠殺して血液及び肝臓を採取し、血清TTR及び肝臓での編集を測定した。血清TTR及び肝臓での編集の結果を図9C及び図9Dに示す。陰性対照マウスにはTSSビヒクルを投与した。
実施例10-中性脂質
LNPのインビボでの有効性を評価するため、実施例2のmRNA、及びsg534(配列番号72;G534)を用いて実施例2に記載のようにLNP製剤を調製した。脂質ナノ粒子成分を下記の脂質成分モル比で100%エタノールに溶解させた。手短に言えば、25mMのクエン酸塩及び100mMのNaClの緩衝液(pH5.0)にRNAカーゴを調製し、RNAカーゴの濃度を約0.45mg/mLとした。LNPは、脂質アミンとRNAリン酸塩(N:P)のモル比を約6、mRNAとgRNAの比を重量基準で1:2にして製剤化された。
LNP製剤を、平均粒径、多分散度(pdi)、トータルRNA含量及びRNAの封入率について実施例1に記載のように分析した。平均粒径、多分散度(PDI)、トータルRNA含量及びRNAの封入率の分析を表30に示す。脂質のモル比は、アミン脂質(リピドA)/中性脂質/ヘルパー脂質(コレステロール)/PEG脂質(PEG2k-DMG)として記載される。中性脂質は、示されているように、DSP、DPPCであるかまたは不含であった。
Figure 2023103421000062
Figure 2023103421000063
インビボでの特性解析をするため、雌Sprague Dawleyラットに上記のLNPを体重1kg当たり0.3mgのトータルRNA(ガイドRNA及びmRNA)にて静脈内投与した。ラットは1群当たり5匹であった。投与後7日目、動物を屠殺して血液及び肝臓を採取し、血清TTR及び肝臓での編集を実施例1に記載のように測定した。陰性対照動物にはTSSビヒクルを投与した。血清TTR及び肝臓での編集の結果を図10A及び図10B、及び表30(上記)に示す。
Figure 2023103421000064
Figure 2023103421000065
Figure 2023103421000066
Figure 2023103421000067
Figure 2023103421000068
配列そのものについては下記配列表を参照のこと。転写産物配列には一般に、ARCAと共に使用するための最初の3ヌクレオチドとしてGGGが含まれるか、またはCleanCap(商標)と共に使用するための最初の3ヌクレオチドとしてAGGが含まれる。したがって、最初の3ヌクレオチドは、ワクシニアのキャッピング酵素などの、他のキャッピング手法と共に使用するために修飾され得る。プロモーター及びポリA配列は転写産物配列には含まれない。T7プロモーター(配列番号31)などのプロモーター及び配列番号62または63などのポリA配列は、開示の転写産物配列に5’末端及び3’末端でそれぞれ付加することができる。ほとんどのヌクレオチド配列はDNAとして提供されるが、それらはTをUに変えることにより容易にRNAに変換可能である。
配列表
以下の配列表は、本明細書に開示する配列の一覧を提供する。DNA配列(Tを含む)がRNAに関して参照される場合は、TをUに置き換えなければならず(状況に応じて修飾の場合と非修飾の場合がある)、その逆の場合は、逆の置き換えをしなければならないと理解される。
Figure 2023103421000069
Figure 2023103421000070
Figure 2023103421000071
Figure 2023103421000072
Figure 2023103421000073
Figure 2023103421000074
Figure 2023103421000075
Figure 2023103421000076
Figure 2023103421000077
Figure 2023103421000078
Figure 2023103421000079
Figure 2023103421000080
Figure 2023103421000081
Figure 2023103421000082
Figure 2023103421000083
Figure 2023103421000084
Figure 2023103421000085
Figure 2023103421000086
Figure 2023103421000087
Figure 2023103421000088
Figure 2023103421000089
Figure 2023103421000090
Figure 2023103421000091
Figure 2023103421000092
Figure 2023103421000093
Figure 2023103421000094
Figure 2023103421000095
Figure 2023103421000096
Figure 2023103421000097
Figure 2023103421000098
Figure 2023103421000099
Figure 2023103421000100
Figure 2023103421000101
Figure 2023103421000102
Figure 2023103421000103
Figure 2023103421000104
Figure 2023103421000105
Figure 2023103421000106
Figure 2023103421000107
Figure 2023103421000108
Figure 2023103421000109
Figure 2023103421000110
Figure 2023103421000111
Figure 2023103421000112
Figure 2023103421000113
Figure 2023103421000114
Figure 2023103421000115
Figure 2023103421000116
Figure 2023103421000117
Figure 2023103421000118
Figure 2023103421000119
Figure 2023103421000120
Figure 2023103421000121
Figure 2023103421000122
Figure 2023103421000123
Figure 2023103421000124
Figure 2023103421000125
Figure 2023103421000126
Figure 2023103421000127
Figure 2023103421000128
Figure 2023103421000129
Figure 2023103421000130
Figure 2023103421000131
Figure 2023103421000132
Figure 2023103421000133
Figure 2023103421000134
Figure 2023103421000135
Figure 2023103421000136
Figure 2023103421000137
Figure 2023103421000138
Figure 2023103421000139
Figure 2023103421000140
Figure 2023103421000141
Figure 2023103421000142
Figure 2023103421000143
Figure 2023103421000144
Figure 2023103421000145
Figure 2023103421000146
Figure 2023103421000147
Figure 2023103421000148
Figure 2023103421000149
Figure 2023103421000150
Figure 2023103421000151
Figure 2023103421000152
Figure 2023103421000153
Figure 2023103421000154
Figure 2023103421000155
Figure 2023103421000156
Figure 2023103421000157
Figure 2023103421000158
Figure 2023103421000159
Figure 2023103421000160
Figure 2023103421000161
Figure 2023103421000162
Figure 2023103421000163
Figure 2023103421000164
Figure 2023103421000165
Figure 2023103421000166
Figure 2023103421000167
Figure 2023103421000168
Figure 2023103421000169
Figure 2023103421000170
Figure 2023103421000171
Figure 2023103421000172
Figure 2023103421000173
Figure 2023103421000174
Figure 2023103421000175
Figure 2023103421000176
Figure 2023103421000177
Figure 2023103421000178
Figure 2023103421000179
Figure 2023103421000180
Figure 2023103421000181
Figure 2023103421000182
Figure 2023103421000183
Figure 2023103421000184
Figure 2023103421000185
Figure 2023103421000186
Figure 2023103421000187
Figure 2023103421000188
Figure 2023103421000189
Figure 2023103421000190
Figure 2023103421000191
Figure 2023103421000192
Figure 2023103421000193
Figure 2023103421000194
Figure 2023103421000195
Figure 2023103421000196
Figure 2023103421000197
Figure 2023103421000198
Figure 2023103421000199
Figure 2023103421000200
Figure 2023103421000201
Figure 2023103421000202
Figure 2023103421000203
Figure 2023103421000204
Figure 2023103421000205
Figure 2023103421000206
Figure 2023103421000207
Figure 2023103421000208
Figure 2023103421000209
Figure 2023103421000210
Figure 2023103421000211
Figure 2023103421000212
Figure 2023103421000213
Figure 2023103421000214
Figure 2023103421000215
Figure 2023103421000216
Figure 2023103421000217
Figure 2023103421000218
Figure 2023103421000219
Figure 2023103421000220
Figure 2023103421000221
Figure 2023103421000222
Figure 2023103421000223
Figure 2023103421000224
Figure 2023103421000225
Figure 2023103421000226
Figure 2023103421000227
Figure 2023103421000228
Figure 2023103421000229
Figure 2023103421000230
Figure 2023103421000231
Figure 2023103421000232
Figure 2023103421000233
Figure 2023103421000234
Figure 2023103421000235
Figure 2023103421000236
Figure 2023103421000237
Figure 2023103421000238
Figure 2023103421000239
Figure 2023103421000240
Figure 2023103421000241
Figure 2023103421000242
Figure 2023103421000243
Figure 2023103421000244
Figure 2023103421000245
Figure 2023103421000246
Figure 2023103421000247
Figure 2023103421000248
Figure 2023103421000249
Figure 2023103421000250
*=PS結合;「m」=2’-O-Meヌクレオチド
マウスのG000282 NGSプライマー配列
フォワードプライマー:
CACTCTTTCCCTACACGACGCTCTTCCGATCTGTTTTGTTCCAGAGTCTATCACCG
リバースプライマー:
GGAGTTCAGACGTGTGCTCTTCCGATCTACACGAATAAGAGCAAATGGGAAC
ラットG000390NGSプライマー配列
フォワードプライマー:
CACTCTTTCCCTACACGACGCTCTTCCGATCTTGCATTTCATGAGACCGAAAACA
リバースプライマー:
GGAGTTCAGACGTGTGCTCTTCCGATCTGCTACAGTAGAGCTGTACATAAAACTT
GFP配列:
TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTCTAATACGACTCACTATAGGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGTTGCAGGCCTTATTCGGATCCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAGGAATTATGCAGTCTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAATCTAGACTTAAGCTTGATGAGCTCTAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCG
配列表
SEQUENCE LISTING

<110> INTELLIA THERAPEUTICS, INC.

<120> FORMULATIONS

<130> PA23-236

<150> US 62/566,240
<151> 2017-09-29

<160> 84

<170> PatentIn version 3.5

<210> 1
<211> 4140
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 1
atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg atgggcagtc 60

atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa cacagacaga 120

cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga aacagcagaa 180

gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa cagaatctgc 240

tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt cttccacaga 300

ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc gatcttcgga 360

aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca cctgagaaag 420

aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc actggcacac 480

atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga caacagcgac 540

gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga agaaaacccg 600

atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag caagagcaga 660

agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact gttcggaaac 720

ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga cctggcagaa 780

gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa cctgctggca 840

cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag cgacgcaatc 900

ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct gagcgcaagc 960

atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc actggtcaga 1020

cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa cggatacgca 1080

ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa gccgatcctg 1140

gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga cctgctgaga 1200

aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg agaactgcac 1260

gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag agaaaagatc 1320

gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag aggaaacagc 1380

agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa cttcgaagaa 1440

gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa cttcgacaag 1500

aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata cttcacagtc 1560

tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc ggcattcctg 1620

agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag aaaggtcaca 1680

gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag cgtcgaaatc 1740

agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct gctgaagatc 1800

atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga agacatcgtc 1860

ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa gacatacgca 1920

cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac aggatgggga 1980

agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa gacaatcctg 2040

gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat ccacgacgac 2100

agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg agacagcctg 2160

cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat cctgcagaca 2220

gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga aaacatcgtc 2280

atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa ggaacacccg 2400

gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca gaacggaaga 2460

gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga cgtcgaccac 2520

atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa gaagatgaag 2640

aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt cgacaacctg 2700

acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat caagagacag 2760

ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag cagaatgaac 2820

acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac actgaagagc 2880

aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga aatcaacaac 2940

taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact gatcaagaag 3000

tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga cgtcagaaag 3060

atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt cttctacagc 3120

aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat cagaaagaga 3180

ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg aagagacttc 3240

gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa gacagaagtc 3300

cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga caagctgatc 3360

gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc gacagtcgca 3420

tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct gaagagcgtc 3480

aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa cccgatcgac 3540

ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa gctgccgaag 3600

tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc aggagaactg 3660

cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta cctggcaagc 3720

cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct gttcgtcgaa 3780

cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag caagagagtc 3840

atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca cagagacaag 3900

ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa cctgggagca 3960

ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac aagcacaaag 4020

gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga aacaagaatc 4080

gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag aaaggtctag 4140


<210> 2
<211> 4143
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 2
atggataaga agtactcaat cgggctggat atcggaacta attccgtggg ttgggcagtg 60

atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa caccgataga 120

cacagcatca agaaaaatct catcggagcc ctgctgtttg actccggcga aaccgcagaa 180

gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa tcgcatctgc 240

tatctgcaag agatcttttc gaacgaaatg gcaaaggtcg acgacagctt cttccaccgc 300

ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc tatctttgga 360

aacatcgtcg acgaagtggc gtaccacgaa aagtacccga ccatctacca tctgcggaag 420

aagttggttg actcaactga caaggccgac ctcagattga tctacttggc cctcgcccat 480

atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga taactccgac 540

gtggataagc ttttcattca actggtgcag acctacaacc aactgttcga agaaaaccca 600

atcaatgcta gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc gaagtcgcgg 660

cgcctcgaaa acctgatcgc acagctgccg ggagagaaaa agaacggact tttcggcaac 720

ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga cctggccgag 780

gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa tttgctggca 840

caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc ggacgcaatc 900

ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct tagcgcctcg 960

atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc gctcgtgaga 1020

cagcaactgc ctgaaaagta caaggagatc ttcttcgacc agtccaagaa tgggtacgca 1080

gggtacatcg atggaggcgc tagccaggaa gagttctata agttcatcaa gccaatcctg 1140

gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga tctgctccgg 1200

aaacagagaa cctttgacaa cggatccatt ccccaccaga tccatctggg tgagctgcac 1260

gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg ggaaaagatc 1320

gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg cggcaattcg 1380

cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa tttcgaggaa 1440

gttgtggata agggagcttc ggcacaaagc ttcatcgaac gaatgaccaa cttcgacaag 1500

aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata cttcactgtc 1560

tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc ggcctttctg 1620

tccggagaac agaagaaagc aattgtcgat ctgctgttca agaccaaccg caaggtgacc 1680

gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc agtggaaatc 1740

agcggggtgg aggacagatt caacgcttcg ctgggaacct atcatgatct cctgaagatc 1800

atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga agatatcgtc 1860

ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa gacctacgct 1920

catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac tggttggggc 1980

cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa aactatcctg 2040

gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcaattgat ccacgacgac 2100

agcctgacct ttaaggagga catccaaaaa gcacaagtgt ccggacaggg agactcactc 2160

catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat tctgcaaact 2220

gtgaaggtgg tcgacgagct ggtgaaggtc atgggacggc acaaaccgga gaatatcgtg 2280

attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaaaaactc ccgcgaaagg 2340

atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa agagcacccg 2400

gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca aaatggacgg 2460

gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga cgtggaccac 2520

atcgttccac agtcctttct gaaggatgac tcgatcgata acaaggtgtt gactcgcagc 2580

gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa gaagatgaag 2640

aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt tgacaatctc 2700

actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat caaacggcag 2760

ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcttggactc ccgcatgaac 2820

actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac cctgaaaagc 2880

aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga aatcaacaac 2940

taccatcacg cgcatgacgc atacctcaac gctgtggtcg gtaccgccct gatcaaaaag 3000

taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga cgtgaggaag 3060

atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt cttttactca 3120

aacatcatga actttttcaa gactgaaatt acgctggcca atggagaaat caggaagagg 3180

ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg cagggacttc 3240

gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa aaccgaagtg 3300

caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga caagctcatt 3360

gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc gactgtcgca 3420

tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaaaaagct caaatccgtc 3480

aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa cccgattgat 3540

ttcctcgagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa actccccaag 3600

tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc cggagaactc 3660

caaaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta tcttgcttcg 3720

cactacgaaa aactcaaagg gtcaccggaa gataacgaac agaagcagct tttcgtggag 3780

cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc aaagcgcgtg 3840

atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca tagagataag 3900

ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa cctgggagcc 3960

ccagccgcct tcaagtactt cgatactact atcgatcgca aaagatacac gtccaccaag 4020

gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga aactaggatc 4080

gatctgtcgc agctgggtgg cgatggcggt ggatctccga aaaagaagag aaaggtgtaa 4140

tga 4143


<210> 3
<211> 1379
<212> PRT
<213> Unknown

<220>
<221> source
<223> /note="Description of Unknown:
Cas9 sequence"

<400> 3
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1370 1375


<210> 4
<211> 4140
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 4
auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140


<210> 5
<211> 4143
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 5
auggauaaga aguacucaau cgggcuggau aucggaacua auuccguggg uugggcagug 60

aucacggaug aauacaaagu gccguccaag aaguucaagg uccuggggaa caccgauaga 120

cacagcauca agaaaaaucu caucggagcc cugcuguuug acuccggcga aaccgcagaa 180

gcgacccggc ucaaacguac cgcgaggcga cgcuacaccc ggcggaagaa ucgcaucugc 240

uaucugcaag agaucuuuuc gaacgaaaug gcaaaggucg acgacagcuu cuuccaccgc 300

cuggaagaau cuuuccuggu ggaggaggac aagaagcaug aacggcaucc uaucuuugga 360

aacaucgucg acgaaguggc guaccacgaa aaguacccga ccaucuacca ucugcggaag 420

aaguugguug acucaacuga caaggccgac cucagauuga ucuacuuggc ccucgcccau 480

augaucaaau uccgcggaca cuuccugauc gaaggcgauc ugaacccuga uaacuccgac 540

guggauaagc uuuucauuca acuggugcag accuacaacc aacuguucga agaaaaccca 600

aucaaugcua gcggcgucga ugccaaggcc auccuguccg cccggcuguc gaagucgcgg 660

cgccucgaaa accugaucgc acagcugccg ggagagaaaa agaacggacu uuucggcaac 720

uugaucgcuc ucucacuggg acucacuccc aauuucaagu ccaauuuuga ccuggccgag 780

gacgcgaagc ugcaacucuc aaaggacacc uacgacgacg acuuggacaa uuugcuggca 840

caaauuggcg aucaguacgc ggaucuguuc cuugccgcua agaaccuuuc ggacgcaauc 900

uugcuguccg auauccugcg cgugaacacc gaaauaacca aagcgccgcu uagcgccucg 960

augauuaagc gguacgacga gcaucaccag gaucucacgc ugcucaaagc gcucgugaga 1020

cagcaacugc cugaaaagua caaggagauc uucuucgacc aguccaagaa uggguacgca 1080

ggguacaucg auggaggcgc uagccaggaa gaguucuaua aguucaucaa gccaauccug 1140

gaaaagaugg acggaaccga agaacugcug gucaagcuga acagggagga ucugcuccgg 1200

aaacagagaa ccuuugacaa cggauccauu ccccaccaga uccaucuggg ugagcugcac 1260

gccaucuugc ggcgccagga ggacuuuuac ccauuccuca aggacaaccg ggaaaagauc 1320

gagaaaauuc ugacguuccg caucccguau uacgugggcc cacuggcgcg cggcaauucg 1380

cgcuucgcgu ggaugacuag aaaaucagag gaaaccauca cuccuuggaa uuucgaggaa 1440

guuguggaua agggagcuuc ggcacaaagc uucaucgaac gaaugaccaa cuucgacaag 1500

aaucucccaa acgagaaggu gcuuccuaag cacagccucc uuuacgaaua cuucacuguc 1560

uacaacgaac ugacuaaagu gaaauacguu acugaaggaa ugaggaagcc ggccuuucug 1620

uccggagaac agaagaaagc aauugucgau cugcuguuca agaccaaccg caaggugacc 1680

gucaagcagc uuaaagagga cuacuucaag aagaucgagu guuucgacuc aguggaaauc 1740

agcggggugg aggacagauu caacgcuucg cugggaaccu aucaugaucu ccugaagauc 1800

aucaaggaca aggacuuccu ugacaacgag gagaacgagg acauccugga agauaucguc 1860

cugaccuuga cccuuuucga ggaucgcgag augaucgagg agaggcuuaa gaccuacgcu 1920

caucucuucg acgauaaggu caugaaacaa cucaagcgcc gccgguacac ugguuggggc 1980

cgccucuccc gcaagcugau caacgguauu cgcgauaaac agagcgguaa aacuauccug 2040

gauuuccuca aaucggaugg cuucgcuaau cguaacuuca ugcaauugau ccacgacgac 2100

agccugaccu uuaaggagga cauccaaaaa gcacaagugu ccggacaggg agacucacuc 2160

caugaacaca ucgcgaaucu ggccgguucg ccggcgauua agaagggaau ucugcaaacu 2220

gugaaggugg ucgacgagcu ggugaagguc augggacggc acaaaccgga gaauaucgug 2280

auugaaaugg cccgagaaaa ccagacuacc cagaagggcc agaaaaacuc ccgcgaaagg 2340

augaagcgga ucgaagaagg aaucaaggag cugggcagcc agauccugaa agagcacccg 2400

guggaaaaca cgcagcugca gaacgagaag cucuaccugu acuauuugca aaauggacgg 2460

gacauguacg uggaccaaga gcuggacauc aaucgguugu cugauuacga cguggaccac 2520

aucguuccac aguccuuucu gaaggaugac ucgaucgaua acaagguguu gacucgcagc 2580

gacaagaaca gagggaaguc agauaaugug ccaucggagg aggucgugaa gaagaugaag 2640

aauuacuggc ggcagcuccu gaaugcgaag cugauuaccc agagaaaguu ugacaaucuc 2700

acuaaagccg agcgcggcgg acucucagag cuggauaagg cuggauucau caaacggcag 2760

cuggucgaga cucggcagau uaccaagcac guggcgcaga ucuuggacuc ccgcaugaac 2820

acuaaauacg acgagaacga uaagcucauc cgggaaguga aggugauuac ccugaaaagc 2880

aaacuugugu cggacuuucg gaaggacuuu caguuuuaca aagugagaga aaucaacaac 2940

uaccaucacg cgcaugacgc auaccucaac gcuguggucg guaccgcccu gaucaaaaag 3000

uacccuaaac uugaaucgga guuuguguac ggagacuaca aggucuacga cgugaggaag 3060

augauagcca aguccgaaca ggaaaucggg aaagcaacug cgaaauacuu cuuuuacuca 3120

aacaucauga acuuuuucaa gacugaaauu acgcuggcca auggagaaau caggaagagg 3180

ccacugaucg aaacuaacgg agaaacgggc gaaaucgugu gggacaaggg cagggacuuc 3240

gcaacuguuc gcaaagugcu cucuaugccg caagucaaua uugugaagaa aaccgaagug 3300

caaaccggcg gauuuucaaa ggaaucgauc cucccaaaga gaaauagcga caagcucauu 3360

gcacgcaaga aagacuggga cccgaagaag uacggaggau ucgauucgcc gacugucgca 3420

uacuccgucc ucgugguggc caagguggag aagggaaaga gcaaaaagcu caaauccguc 3480

aaagagcugc uggggauuac caucauggaa cgauccucgu ucgagaagaa cccgauugau 3540

uuccucgagg cgaaggguua caaggaggug aagaaggauc ugaucaucaa acuccccaag 3600

uacucacugu ucgaacugga aaauggucgg aagcgcaugc uggcuucggc cggagaacuc 3660

caaaaaggaa augagcuggc cuugccuagc aaguacguca acuuccucua ucuugcuucg 3720

cacuacgaaa aacucaaagg gucaccggaa gauaacgaac agaagcagcu uuucguggag 3780

cagcacaagc auuaucugga ugaaaucauc gaacaaaucu ccgaguuuuc aaagcgcgug 3840

auccucgccg acgccaaccu cgacaaaguc cugucggccu acaauaagca uagagauaag 3900

ccgaucagag aacaggccga gaacauuauc cacuuguuca cccugacuaa ccugggagcc 3960

ccagccgccu ucaaguacuu cgauacuacu aucgaucgca aaagauacac guccaccaag 4020

gaaguucugg acgcgacccu gauccaccaa agcaucacug gacucuacga aacuaggauc 4080

gaucugucgc agcugggugg cgauggcggu ggaucuccga aaaagaagag aaagguguaa 4140

uga 4143


<210> 6
<211> 1379
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 6
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1370 1375


<210> 7
<211> 4140
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 7
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140


<210> 8
<211> 1379
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 8
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val
1370 1375


<210> 9
<211> 4140
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 9
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140


<210> 10
<211> 4134
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 10
gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134


<210> 11
<211> 4134
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 11
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134


<210> 12
<211> 4134
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 12
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134


<210> 13
<211> 1368
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 13
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


<210> 14
<211> 4107
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 14
auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacuag 4107


<210> 15
<211> 4101
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 15
gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga c 4101


<210> 16
<211> 1368
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 16
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


<210> 17
<211> 4107
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 17
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacuag 4107


<210> 18
<211> 4101
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 18
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga c 4101


<210> 19
<211> 1368
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 19
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


<210> 20
<211> 4107
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 20
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacuag 4107


<210> 21
<211> 4113
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 21
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga cggaggagga agc 4113


<210> 22
<211> 1392
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 22
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro
1370 1375 1380


Lys Lys Lys Arg Lys Val Asp Ser Gly
1385 1390


<210> 23
<211> 4179
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 23
auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140

ggaagcccga agaagaagag aaaggucgac agcggauag 4179


<210> 24
<211> 4173
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 24
gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140

agcccgaaga agaagagaaa ggucgacagc gga 4173


<210> 25
<211> 1392
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 25
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro
1370 1375 1380


Lys Lys Lys Arg Lys Val Asp Ser Gly
1385 1390


<210> 26
<211> 4179
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 26
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140

ggaagcccga agaagaagag aaaggucgac agcggauag 4179


<210> 27
<211> 4173
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 27
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140

agcccgaaga agaagagaaa ggucgacagc gga 4173


<210> 28
<211> 1392
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polypeptide"

<400> 28
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1 5 10 15


Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30


Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45


Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60


Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80


Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95


Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110


His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125


His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140


Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160


Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175


Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190


Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205


Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220


Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240


Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255


Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270


Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285


Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300


Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320


Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335


Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350


Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365


Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380


Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400


Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415


Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430


Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445


Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460


Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480


Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495


Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510


Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525


Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540


Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560


Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575


Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590


Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605


Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620


Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640


His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655


Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670


Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685


Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700


Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720


His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735


Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750


Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765


Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780


Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800


Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815


Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830


Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845


Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860


Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880


Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895


Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910


Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925


Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940


Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960


Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975


Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990


Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005


Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020


Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035


Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050


Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065


Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080


Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095


Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110


Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125


Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140


Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155


Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170


Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185


Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200


Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215


Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230


Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245


Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260


His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275


Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290


Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305


Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320


Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335


Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350


Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365


Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro
1370 1375 1380


Lys Lys Lys Arg Lys Val Asp Ser Gly
1385 1390


<210> 29
<211> 4179
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 29
auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60

aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120

cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180

gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240

uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300

cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360

aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420

aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480

augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540

gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600

aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660

agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720

cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780

gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840

cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900

cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960

augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020

cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080

ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140

gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200

aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260

gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320

gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380

agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440

gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500

aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560

uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620

agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680

gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740

agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800

aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860

cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920

caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980

agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040

gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100

agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160

cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220

gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280

aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400

gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460

gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520

aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640

aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700

acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760

cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820

acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880

aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940

uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000

uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060

augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120

aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180

ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240

gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300

cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360

gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420

uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480

aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540

uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600

uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660

cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720

cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780

cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840

auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900

ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960

ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020

gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080

gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140

ggaagcccga agaagaagag aaaggucgac agcggauag 4179


<210> 30
<211> 4173
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 30
gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60

acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120

agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180

acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240

cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300

gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360

aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420

cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480

aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540

gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600

aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660

cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720

aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780

gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840

aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900

cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960

aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020

cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080

uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140

aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200

cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260

auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320

aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380

uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440

gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500

cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560

aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620

ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680

aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740

ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800

aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860

acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920

cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980

cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040

uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100

cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160

gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220

aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280

gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340

aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400

gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460

auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520

gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580

aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640

uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700

aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760

gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820

aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880

cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940

caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000

ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060

aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120

aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180

cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240

acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300

acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360

agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420

agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480

gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540

cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600

agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660

aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720

uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780

cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840

cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900

aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960

gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020

guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080

cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140

agcccgaaga agaagagaaa ggucgacagc gga 4173


<210> 31
<211> 17
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"

<400> 31
taatacgact cactata 17


<210> 32
<211> 50
<212> DNA
<213> Homo sapiens

<400> 32
acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc 50


<210> 33
<211> 132
<212> DNA
<213> Homo sapiens

<400> 33
gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60

taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120

tattttcatt gc 132


<210> 34
<211> 66
<212> DNA
<213> Homo sapiens

<400> 34
cataaaccct ggcgcgctcg cggcccggca ctcttctggt ccccacagac tcagagagaa 60

cccacc 66


<210> 35
<211> 110
<212> DNA
<213> Homo sapiens

<400> 35
gctggagcct cggtggccat gcttcttgcc ccttgggcct ccccccagcc cctcctcccc 60

ttcctgcacc cgtacccccg tggtctttga ataaagtctg agtgggcggc 110


<210> 36
<211> 29
<212> DNA
<213> Xenopus laevis

<400> 36
aagctcagaa taaacgctca actttggcc 29


<210> 37
<211> 130
<212> DNA
<213> Xenopus laevis

<400> 37
accagcctca agaacacccg aatggagtct ctaagctaca taataccaac ttacacttta 60

caaaatgttg tcccccaaaa tgtagccatt cgtatctgct cctaataaaa agaaagtttc 120

ttcacattct 130


<210> 38
<211> 27
<212> DNA
<213> Bos sp.

<400> 38
cagggtcctg tggacagctc accagct 27


<210> 39
<211> 102
<212> DNA
<213> Bos sp.

<400> 39
ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 60

tcccactgtc ctttcctaat aaaatgagga aattgcatcg ca 102


<210> 40
<211> 93
<212> DNA
<213> Mus musculus

<400> 40
gctgccttct gcggggcttg ccttctggcc atgcccttct tctctccctt gcacctgtac 60

ctcttggtct ttgaataaag cctgagtagg aag 93


<210> 41
<211> 61
<212> DNA
<213> Unknown

<220>
<221> source
<223> /note="Description of Unknown:
HSD17B4 5' UTR sequence"

<400> 41
tcccgcagtc ggcgtccagc ggctctgctt gttcgtgtgt gtgtcgttgc aggccttatt 60

c 61


<210> 42
<211> 100
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"


<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage

<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified

<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage

<400> 42
uuacagccac gucuacagca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100


<210> 43
<211> 4411
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 43
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120

cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180

gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240

cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300

aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360

cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420

acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480

ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540

cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600

cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660

gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720

actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780

cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840

cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900

ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960

cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020

accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080

gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140

caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200

catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260

agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320

cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380

caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440

ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500

gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560

gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620

cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680

aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740

aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800

cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860

cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920

cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980

actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040

atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100

cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160

gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220

acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280

gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340

gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400

gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460

cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520

cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580

ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640

ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700

cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760

aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820

attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880

ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940

catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000

cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060

agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120

ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180

gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240

agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300

caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360

caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420

cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480

cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540

gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600

aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660

catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720

aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780

cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840

gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900

attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960

caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020

gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080

atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140

gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200

gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260

gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320

ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380

tcaattaata aaaaatggaa agaacctcga g 4411


<210> 44
<211> 4405
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 44
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg 120

atgggcagtc atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa 180

cacagacaga cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga 240

aacagcagaa gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa 300

cagaatctgc tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt 360

cttccacaga ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc 420

gatcttcgga aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca 480

cctgagaaag aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc 540

actggcacac atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga 600

caacagcgac gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga 660

agaaaacccg atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag 720

caagagcaga agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact 780

gttcggaaac ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga 840

cctggcagaa gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa 900

cctgctggca cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag 960

cgacgcaatc ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct 1020

gagcgcaagc atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc 1080

actggtcaga cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa 1140

cggatacgca ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa 1200

gccgatcctg gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga 1260

cctgctgaga aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg 1320

agaactgcac gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag 1380

agaaaagatc gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag 1440

aggaaacagc agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa 1500

cttcgaagaa gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa 1560

cttcgacaag aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata 1620

cttcacagtc tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc 1680

ggcattcctg agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag 1740

aaaggtcaca gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag 1800

cgtcgaaatc agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct 1860

gctgaagatc atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga 1920

agacatcgtc ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa 1980

gacatacgca cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac 2040

aggatgggga agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa 2100

gacaatcctg gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat 2160

ccacgacgac agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg 2220

agacagcctg cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat 2280

cctgcagaca gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga 2340

aaacatcgtc atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag 2400

cagagaaaga atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa 2460

ggaacacccg gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca 2520

gaacggaaga gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga 2580

cgtcgaccac atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct 2640

gacaagaagc gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa 2700

gaagatgaag aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt 2760

cgacaacctg acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat 2820

caagagacag ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag 2880

cagaatgaac acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac 2940

actgaagagc aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga 3000

aatcaacaac taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact 3060

gatcaagaag tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga 3120

cgtcagaaag atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt 3180

cttctacagc aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat 3240

cagaaagaga ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg 3300

aagagacttc gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa 3360

gacagaagtc cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga 3420

caagctgatc gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc 3480

gacagtcgca tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct 3540

gaagagcgtc aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa 3600

cccgatcgac ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa 3660

gctgccgaag tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc 3720

aggagaactg cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta 3780

cctggcaagc cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct 3840

gttcgtcgaa cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag 3900

caagagagtc atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca 3960

cagagacaag ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa 4020

cctgggagca ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac 4080

aagcacaaag gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga 4140

aacaagaatc gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag 4200

aaaggtctag ctagccatca catttaaaag catctcagcc taccatgaga ataagagaaa 4260

gaaaatgaag atcaatagct tattcatctc tttttctttt tcgttggtgt aaagccaaca 4320

ccctgtctaa aaaacataaa tttctttaat cattttgcct cttttctctg tgcttcaatt 4380

aataaaaaat ggaaagaacc tcgag 4405


<210> 45
<211> 4188
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 45
atggataaga agtactcgat cgggctggat atcggaacta attccgtggg ttgggcagtg 60

atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa caccgataga 120

cacagcatca agaagaatct catcggagcc ctgctgtttg actccggcga aaccgcagaa 180

gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa tcgcatctgc 240

tatctgcaag aaatcttttc gaacgaaatg gcaaaggtgg acgacagctt cttccaccgc 300

ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc tatctttgga 360

aacatcgtgg acgaagtggc gtaccacgaa aagtacccga ccatctacca tctgcggaag 420

aagttggttg actcaactga caaggccgac ctcagattga tctacttggc cctcgcccat 480

atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga taactccgac 540

gtggataagc tgttcattca actggtgcag acctacaacc aactgttcga agaaaaccca 600

atcaatgcca gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc gaagtcgcgg 660

cgcctcgaaa acctgatcgc acagctgccg ggagagaaga agaacggact tttcggcaac 720

ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga cctggccgag 780

gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa tttgctggca 840

caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc ggacgcaatc 900

ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct tagcgcctcg 960

atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc gctcgtgaga 1020

cagcaactgc ctgaaaagta caaggagatt ttcttcgacc agtccaagaa tgggtacgca 1080

gggtacatcg atggaggcgc cagccaggaa gagttctata agttcatcaa gccaatcctg 1140

gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga tctgctccgc 1200

aaacagagaa cctttgacaa cggaagcatt ccacaccaga tccatctggg tgagctgcac 1260

gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg ggaaaagatc 1320

gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg cggcaattcg 1380

cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa tttcgaggaa 1440

gttgtggata agggagcttc ggcacaatcc ttcatcgaac gaatgaccaa cttcgacaag 1500

aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata cttcactgtc 1560

tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc ggcctttctg 1620

agcggagaac agaagaaagc gattgtcgat ctgctgttca agaccaaccg caaggtgacc 1680

gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc agtggaaatc 1740

agcggagtgg aggacagatt caacgcttcg ctgggaacct atcatgatct cctgaagatc 1800

atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga agatatcgtc 1860

ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa gacctacgct 1920

catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac tggttggggc 1980

cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa aactatcctg 2040

gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcagttgat ccacgacgac 2100

agcctgacct ttaaggagga catccagaaa gcacaagtga gcggacaggg agactcactc 2160

catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat cctgcaaact 2220

gtgaaggtgg tggacgagct ggtgaaggtc atgggacggc acaaaccgga gaatatcgtg 2280

attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaagaactc ccgcgaaagg 2340

atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa agagcacccg 2400

gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca aaatggacgg 2460

gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga cgtggaccac 2520

atcgttccac agtcctttct gaaggatgac tccatcgata acaaggtgtt gactcgcagc 2580

gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa gaagatgaag 2640

aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt tgacaatctc 2700

actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat caaacggcag 2760

ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcctggactc ccgcatgaac 2820

actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac cctgaaaagc 2880

aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga aatcaacaac 2940

taccatcacg cgcatgacgc atacctcaac gctgtggtcg gcaccgccct gatcaagaag 3000

taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga cgtgaggaag 3060

atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt cttttactca 3120

aacatcatga acttcttcaa gactgaaatt acgctggcca atggagaaat caggaagagg 3180

ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg cagggacttc 3240

gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa aaccgaagtg 3300

caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga caagctcatt 3360

gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc gactgtcgca 3420

tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaagaagct caaatccgtc 3480

aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa cccgattgat 3540

ttcctggagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa actgcccaag 3600

tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc cggagaactc 3660

cagaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta tcttgcttcg 3720

cactacgaga aactcaaagg gtcaccggaa gataacgaac agaagcagct tttcgtggag 3780

cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc aaagcgcgtg 3840

atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca tagagataag 3900

ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa cctgggagct 3960

ccagccgcct tcaagtactt cgatactact atcgaccgca aaagatacac gtccaccaag 4020

gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga aactaggatc 4080

gatctgtcgc agctgggtgg cgatggtggc ggtggatcct acccatacga cgtgcctgac 4140

tacgcctccg gaggtggtgg ccccaagaag aaacggaagg tgtgatag 4188


<210> 46
<211> 4459
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 46
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatct gccaccatgg ataagaagta ctcgatcggg ctggatatcg gaactaattc 120

cgtgggttgg gcagtgatca cggatgaata caaagtgccg tccaagaagt tcaaggtcct 180

ggggaacacc gatagacaca gcatcaagaa gaatctcatc ggagccctgc tgtttgactc 240

cggcgaaacc gcagaagcga cccggctcaa acgtaccgcg aggcgacgct acacccggcg 300

gaagaatcgc atctgctatc tgcaagaaat cttttcgaac gaaatggcaa aggtggacga 360

cagcttcttc caccgcctgg aagaatcttt cctggtggag gaggacaaga agcatgaacg 420

gcatcctatc tttggaaaca tcgtggacga agtggcgtac cacgaaaagt acccgaccat 480

ctaccatctg cggaagaagt tggttgactc aactgacaag gccgacctca gattgatcta 540

cttggccctc gcccatatga tcaaattccg cggacacttc ctgatcgaag gcgatctgaa 600

ccctgataac tccgacgtgg ataagctgtt cattcaactg gtgcagacct acaaccaact 660

gttcgaagaa aacccaatca atgccagcgg cgtcgatgcc aaggccatcc tgtccgcccg 720

gctgtcgaag tcgcggcgcc tcgaaaacct gatcgcacag ctgccgggag agaagaagaa 780

cggacttttc ggcaacttga tcgctctctc actgggactc actcccaatt tcaagtccaa 840

ttttgacctg gccgaggacg cgaagctgca actctcaaag gacacctacg acgacgactt 900

ggacaatttg ctggcacaaa ttggcgatca gtacgcggat ctgttccttg ccgctaagaa 960

cctttcggac gcaatcttgc tgtccgatat cctgcgcgtg aacaccgaaa taaccaaagc 1020

gccgcttagc gcctcgatga ttaagcggta cgacgagcat caccaggatc tcacgctgct 1080

caaagcgctc gtgagacagc aactgcctga aaagtacaag gagattttct tcgaccagtc 1140

caagaatggg tacgcagggt acatcgatgg aggcgccagc caggaagagt tctataagtt 1200

catcaagcca atcctggaaa agatggacgg aaccgaagaa ctgctggtca agctgaacag 1260

ggaggatctg ctccgcaaac agagaacctt tgacaacgga agcattccac accagatcca 1320

tctgggtgag ctgcacgcca tcttgcggcg ccaggaggac ttttacccat tcctcaagga 1380

caaccgggaa aagatcgaga aaattctgac gttccgcatc ccgtattacg tgggcccact 1440

ggcgcgcggc aattcgcgct tcgcgtggat gactagaaaa tcagaggaaa ccatcactcc 1500

ttggaatttc gaggaagttg tggataaggg agcttcggca caatccttca tcgaacgaat 1560

gaccaacttc gacaagaatc tcccaaacga gaaggtgctt cctaagcaca gcctccttta 1620

cgaatacttc actgtctaca acgaactgac taaagtgaaa tacgttactg aaggaatgag 1680

gaagccggcc tttctgagcg gagaacagaa gaaagcgatt gtcgatctgc tgttcaagac 1740

caaccgcaag gtgaccgtca agcagcttaa agaggactac ttcaagaaga tcgagtgttt 1800

cgactcagtg gaaatcagcg gagtggagga cagattcaac gcttcgctgg gaacctatca 1860

tgatctcctg aagatcatca aggacaagga cttccttgac aacgaggaga acgaggacat 1920

cctggaagat atcgtcctga ccttgaccct tttcgaggat cgcgagatga tcgaggagag 1980

gcttaagacc tacgctcatc tcttcgacga taaggtcatg aaacaactca agcgccgccg 2040

gtacactggt tggggccgcc tctcccgcaa gctgatcaac ggtattcgcg ataaacagag 2100

cggtaaaact atcctggatt tcctcaaatc ggatggcttc gctaatcgta acttcatgca 2160

gttgatccac gacgacagcc tgacctttaa ggaggacatc cagaaagcac aagtgagcgg 2220

acagggagac tcactccatg aacacatcgc gaatctggcc ggttcgccgg cgattaagaa 2280

gggaatcctg caaactgtga aggtggtgga cgagctggtg aaggtcatgg gacggcacaa 2340

accggagaat atcgtgattg aaatggcccg agaaaaccag actacccaga agggccagaa 2400

gaactcccgc gaaaggatga agcggatcga agaaggaatc aaggagctgg gcagccagat 2460

cctgaaagag cacccggtgg aaaacacgca gctgcagaac gagaagctct acctgtacta 2520

tttgcaaaat ggacgggaca tgtacgtgga ccaagagctg gacatcaatc ggttgtctga 2580

ttacgacgtg gaccacatcg ttccacagtc ctttctgaag gatgactcca tcgataacaa 2640

ggtgttgact cgcagcgaca agaacagagg gaagtcagat aatgtgccat cggaggaggt 2700

cgtgaagaag atgaagaatt actggcggca gctcctgaat gcgaagctga ttacccagag 2760

aaagtttgac aatctcacta aagccgagcg cggcggactc tcagagctgg ataaggctgg 2820

attcatcaaa cggcagctgg tcgagactcg gcagattacc aagcacgtgg cgcagatcct 2880

ggactcccgc atgaacacta aatacgacga gaacgataag ctcatccggg aagtgaaggt 2940

gattaccctg aaaagcaaac ttgtgtcgga ctttcggaag gactttcagt tttacaaagt 3000

gagagaaatc aacaactacc atcacgcgca tgacgcatac ctcaacgctg tggtcggcac 3060

cgccctgatc aagaagtacc ctaaacttga atcggagttt gtgtacggag actacaaggt 3120

ctacgacgtg aggaagatga tagccaagtc cgaacaggaa atcgggaaag caactgcgaa 3180

atacttcttt tactcaaaca tcatgaactt cttcaagact gaaattacgc tggccaatgg 3240

agaaatcagg aagaggccac tgatcgaaac taacggagaa acgggcgaaa tcgtgtggga 3300

caagggcagg gacttcgcaa ctgttcgcaa agtgctctct atgccgcaag tcaatattgt 3360

gaagaaaacc gaagtgcaaa ccggcggatt ttcaaaggaa tcgatcctcc caaagagaaa 3420

tagcgacaag ctcattgcac gcaagaaaga ctgggacccg aagaagtacg gaggattcga 3480

ttcgccgact gtcgcatact ccgtcctcgt ggtggccaag gtggagaagg gaaagagcaa 3540

gaagctcaaa tccgtcaaag agctgctggg gattaccatc atggaacgat cctcgttcga 3600

gaagaacccg attgatttcc tggaggcgaa gggttacaag gaggtgaaga aggatctgat 3660

catcaaactg cccaagtact cactgttcga actggaaaat ggtcggaagc gcatgctggc 3720

ttcggccgga gaactccaga aaggaaatga gctggccttg cctagcaagt acgtcaactt 3780

cctctatctt gcttcgcact acgagaaact caaagggtca ccggaagata acgaacagaa 3840

gcagcttttc gtggagcagc acaagcatta tctggatgaa atcatcgaac aaatctccga 3900

gttttcaaag cgcgtgatcc tcgccgacgc caacctcgac aaagtcctgt cggcctacaa 3960

taagcataga gataagccga tcagagaaca ggccgagaac attatccact tgttcaccct 4020

gactaacctg ggagctccag ccgccttcaa gtacttcgat actactatcg accgcaaaag 4080

atacacgtcc accaaggaag ttctggacgc gaccctgatc caccaaagca tcactggact 4140

ctacgaaact aggatcgatc tgtcgcagct gggtggcgat ggtggcggtg gatcctaccc 4200

atacgacgtg cctgactacg cctccggagg tggtggcccc aagaagaaac ggaaggtgtg 4260

atagctagcc atcacattta aaagcatctc agcctaccat gagaataaga gaaagaaaat 4320

gaagatcaat agcttattca tctctttttc tttttcgttg gtgtaaagcc aacaccctgt 4380

ctaaaaaaca taaatttctt taatcatttt gcctcttttc tctgtgcttc aattaataaa 4440

aaatggaaag aacctcgag 4459


<210> 47
<211> 4453
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 47
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatct atggataaga agtactcgat cgggctggat atcggaacta attccgtggg 120

ttgggcagtg atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa 180

caccgataga cacagcatca agaagaatct catcggagcc ctgctgtttg actccggcga 240

aaccgcagaa gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa 300

tcgcatctgc tatctgcaag aaatcttttc gaacgaaatg gcaaaggtgg acgacagctt 360

cttccaccgc ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc 420

tatctttgga aacatcgtgg acgaagtggc gtaccacgaa aagtacccga ccatctacca 480

tctgcggaag aagttggttg actcaactga caaggccgac ctcagattga tctacttggc 540

cctcgcccat atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga 600

taactccgac gtggataagc tgttcattca actggtgcag acctacaacc aactgttcga 660

agaaaaccca atcaatgcca gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc 720

gaagtcgcgg cgcctcgaaa acctgatcgc acagctgccg ggagagaaga agaacggact 780

tttcggcaac ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga 840

cctggccgag gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa 900

tttgctggca caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc 960

ggacgcaatc ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct 1020

tagcgcctcg atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc 1080

gctcgtgaga cagcaactgc ctgaaaagta caaggagatt ttcttcgacc agtccaagaa 1140

tgggtacgca gggtacatcg atggaggcgc cagccaggaa gagttctata agttcatcaa 1200

gccaatcctg gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga 1260

tctgctccgc aaacagagaa cctttgacaa cggaagcatt ccacaccaga tccatctggg 1320

tgagctgcac gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg 1380

ggaaaagatc gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg 1440

cggcaattcg cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa 1500

tttcgaggaa gttgtggata agggagcttc ggcacaatcc ttcatcgaac gaatgaccaa 1560

cttcgacaag aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata 1620

cttcactgtc tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc 1680

ggcctttctg agcggagaac agaagaaagc gattgtcgat ctgctgttca agaccaaccg 1740

caaggtgacc gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc 1800

agtggaaatc agcggagtgg aggacagatt caacgcttcg ctgggaacct atcatgatct 1860

cctgaagatc atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga 1920

agatatcgtc ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa 1980

gacctacgct catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac 2040

tggttggggc cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa 2100

aactatcctg gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcagttgat 2160

ccacgacgac agcctgacct ttaaggagga catccagaaa gcacaagtga gcggacaggg 2220

agactcactc catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat 2280

cctgcaaact gtgaaggtgg tggacgagct ggtgaaggtc atgggacggc acaaaccgga 2340

gaatatcgtg attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaagaactc 2400

ccgcgaaagg atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa 2460

agagcacccg gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca 2520

aaatggacgg gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga 2580

cgtggaccac atcgttccac agtcctttct gaaggatgac tccatcgata acaaggtgtt 2640

gactcgcagc gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa 2700

gaagatgaag aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt 2760

tgacaatctc actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat 2820

caaacggcag ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcctggactc 2880

ccgcatgaac actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac 2940

cctgaaaagc aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga 3000

aatcaacaac taccatcacg cgcatgacgc atacctcaac gctgtggtcg gcaccgccct 3060

gatcaagaag taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga 3120

cgtgaggaag atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt 3180

cttttactca aacatcatga acttcttcaa gactgaaatt acgctggcca atggagaaat 3240

caggaagagg ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg 3300

cagggacttc gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa 3360

aaccgaagtg caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga 3420

caagctcatt gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc 3480

gactgtcgca tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaagaagct 3540

caaatccgtc aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa 3600

cccgattgat ttcctggagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa 3660

actgcccaag tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc 3720

cggagaactc cagaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta 3780

tcttgcttcg cactacgaga aactcaaagg gtcaccggaa gataacgaac agaagcagct 3840

tttcgtggag cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc 3900

aaagcgcgtg atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca 3960

tagagataag ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa 4020

cctgggagct ccagccgcct tcaagtactt cgatactact atcgaccgca aaagatacac 4080

gtccaccaag gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga 4140

aactaggatc gatctgtcgc agctgggtgg cgatggtggc ggtggatcct acccatacga 4200

cgtgcctgac tacgcctccg gaggtggtgg ccccaagaag aaacggaagg tgtgatagct 4260

agccatcaca tttaaaagca tctcagccta ccatgagaat aagagaaaga aaatgaagat 4320

caatagctta ttcatctctt tttctttttc gttggtgtaa agccaacacc ctgtctaaaa 4380

aacataaatt tctttaatca ttttgcctct tttctctgtg cttcaattaa taaaaaatgg 4440

aaagaacctc gag 4453


<210> 48
<211> 4403
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 48
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc atgcctaaga aaaagcggaa ggtcgacggg gataagaagt actcaatcgg 120

gctggatatc ggaactaatt ccgtgggttg ggcagtgatc acggatgaat acaaagtgcc 180

gtccaagaag ttcaaggtcc tggggaacac cgatagacac agcatcaaga aaaatctcat 240

cggagccctg ctgtttgact ccggcgaaac cgcagaagcg acccggctca aacgtaccgc 300

gaggcgacgc tacacccggc ggaagaatcg catctgctat ctgcaagaga tcttttcgaa 360

cgaaatggca aaggtcgacg acagcttctt ccaccgcctg gaagaatctt tcctggtgga 420

ggaggacaag aagcatgaac ggcatcctat ctttggaaac atcgtcgacg aagtggcgta 480

ccacgaaaag tacccgacca tctaccatct gcggaagaag ttggttgact caactgacaa 540

ggccgacctc agattgatct acttggccct cgcccatatg atcaaattcc gcggacactt 600

cctgatcgaa ggcgatctga accctgataa ctccgacgtg gataagcttt tcattcaact 660

ggtgcagacc tacaaccaac tgttcgaaga aaacccaatc aatgctagcg gcgtcgatgc 720

caaggccatc ctgtccgccc ggctgtcgaa gtcgcggcgc ctcgaaaacc tgatcgcaca 780

gctgccggga gagaaaaaga acggactttt cggcaacttg atcgctctct cactgggact 840

cactcccaat ttcaagtcca attttgacct ggccgaggac gcgaagctgc aactctcaaa 900

ggacacctac gacgacgact tggacaattt gctggcacaa attggcgatc agtacgcgga 960

tctgttcctt gccgctaaga acctttcgga cgcaatcttg ctgtccgata tcctgcgcgt 1020

gaacaccgaa ataaccaaag cgccgcttag cgcctcgatg attaagcggt acgacgagca 1080

tcaccaggat ctcacgctgc tcaaagcgct cgtgagacag caactgcctg aaaagtacaa 1140

ggagatcttc ttcgaccagt ccaagaatgg gtacgcaggg tacatcgatg gaggcgctag 1200

ccaggaagag ttctataagt tcatcaagcc aatcctggaa aagatggacg gaaccgaaga 1260

actgctggtc aagctgaaca gggaggatct gctccggaaa cagagaacct ttgacaacgg 1320

atccattccc caccagatcc atctgggtga gctgcacgcc atcttgcggc gccaggagga 1380

cttttaccca ttcctcaagg acaaccggga aaagatcgag aaaattctga cgttccgcat 1440

cccgtattac gtgggcccac tggcgcgcgg caattcgcgc ttcgcgtgga tgactagaaa 1500

atcagaggaa accatcactc cttggaattt cgaggaagtt gtggataagg gagcttcggc 1560

acaaagcttc atcgaacgaa tgaccaactt cgacaagaat ctcccaaacg agaaggtgct 1620

tcctaagcac agcctccttt acgaatactt cactgtctac aacgaactga ctaaagtgaa 1680

atacgttact gaaggaatga ggaagccggc ctttctgtcc ggagaacaga agaaagcaat 1740

tgtcgatctg ctgttcaaga ccaaccgcaa ggtgaccgtc aagcagctta aagaggacta 1800

cttcaagaag atcgagtgtt tcgactcagt ggaaatcagc ggggtggagg acagattcaa 1860

cgcttcgctg ggaacctatc atgatctcct gaagatcatc aaggacaagg acttccttga 1920

caacgaggag aacgaggaca tcctggaaga tatcgtcctg accttgaccc ttttcgagga 1980

tcgcgagatg atcgaggaga ggcttaagac ctacgctcat ctcttcgacg ataaggtcat 2040

gaaacaactc aagcgccgcc ggtacactgg ttggggccgc ctctcccgca agctgatcaa 2100

cggtattcgc gataaacaga gcggtaaaac tatcctggat ttcctcaaat cggatggctt 2160

cgctaatcgt aacttcatgc aattgatcca cgacgacagc ctgaccttta aggaggacat 2220

ccaaaaagca caagtgtccg gacagggaga ctcactccat gaacacatcg cgaatctggc 2280

cggttcgccg gcgattaaga agggaattct gcaaactgtg aaggtggtcg acgagctggt 2340

gaaggtcatg ggacggcaca aaccggagaa tatcgtgatt gaaatggccc gagaaaacca 2400

gactacccag aagggccaga aaaactcccg cgaaaggatg aagcggatcg aagaaggaat 2460

caaggagctg ggcagccaga tcctgaaaga gcacccggtg gaaaacacgc agctgcagaa 2520

cgagaagctc tacctgtact atttgcaaaa tggacgggac atgtacgtgg accaagagct 2580

ggacatcaat cggttgtctg attacgacgt ggaccacatc gttccacagt cctttctgaa 2640

ggatgactcg atcgataaca aggtgttgac tcgcagcgac aagaacagag ggaagtcaga 2700

taatgtgcca tcggaggagg tcgtgaagaa gatgaagaat tactggcggc agctcctgaa 2760

tgcgaagctg attacccaga gaaagtttga caatctcact aaagccgagc gcggcggact 2820

ctcagagctg gataaggctg gattcatcaa acggcagctg gtcgagactc ggcagattac 2880

caagcacgtg gcgcagatct tggactcccg catgaacact aaatacgacg agaacgataa 2940

gctcatccgg gaagtgaagg tgattaccct gaaaagcaaa cttgtgtcgg actttcggaa 3000

ggactttcag ttttacaaag tgagagaaat caacaactac catcacgcgc atgacgcata 3060

cctcaacgct gtggtcggta ccgccctgat caaaaagtac cctaaacttg aatcggagtt 3120

tgtgtacgga gactacaagg tctacgacgt gaggaagatg atagccaagt ccgaacagga 3180

aatcgggaaa gcaactgcga aatacttctt ttactcaaac atcatgaact ttttcaagac 3240

tgaaattacg ctggccaatg gagaaatcag gaagaggcca ctgatcgaaa ctaacggaga 3300

aacgggcgaa atcgtgtggg acaagggcag ggacttcgca actgttcgca aagtgctctc 3360

tatgccgcaa gtcaatattg tgaagaaaac cgaagtgcaa accggcggat tttcaaagga 3420

atcgatcctc ccaaagagaa atagcgacaa gctcattgca cgcaagaaag actgggaccc 3480

gaagaagtac ggaggattcg attcgccgac tgtcgcatac tccgtcctcg tggtggccaa 3540

ggtggagaag ggaaagagca aaaagctcaa atccgtcaaa gagctgctgg ggattaccat 3600

catggaacga tcctcgttcg agaagaaccc gattgatttc ctcgaggcga agggttacaa 3660

ggaggtgaag aaggatctga tcatcaaact ccccaagtac tcactgttcg aactggaaaa 3720

tggtcggaag cgcatgctgg cttcggccgg agaactccaa aaaggaaatg agctggcctt 3780

gcctagcaag tacgtcaact tcctctatct tgcttcgcac tacgaaaaac tcaaagggtc 3840

accggaagat aacgaacaga agcagctttt cgtggagcag cacaagcatt atctggatga 3900

aatcatcgaa caaatctccg agttttcaaa gcgcgtgatc ctcgccgacg ccaacctcga 3960

caaagtcctg tcggcctaca ataagcatag agataagccg atcagagaac aggccgagaa 4020

cattatccac ttgttcaccc tgactaacct gggagcccca gccgccttca agtacttcga 4080

tactactatc gatcgcaaaa gatacacgtc caccaaggaa gttctggacg cgaccctgat 4140

ccaccaaagc atcactggac tctacgaaac taggatcgat ctgtcgcagc tgggtggcga 4200

ttgatagtct agccatcaca tttaaaagca tctcagccta ccatgagaat aagagaaaga 4260

aaatgaagat caatagctta ttcatctctt tttctttttc gttggtgtaa agccaacacc 4320

ctgtctaaaa aacataaatt tctttaatca ttttgcctct tttctctgtg cttcaattaa 4380

taaaaaatgg aaagaacctc gag 4403


<210> 49
<211> 4409
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 49
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc gccaccatgc ctaagaaaaa gcggaaggtc gacggggata agaagtactc 120

aatcgggctg gatatcggaa ctaattccgt gggttgggca gtgatcacgg atgaatacaa 180

agtgccgtcc aagaagttca aggtcctggg gaacaccgat agacacagca tcaagaaaaa 240

tctcatcgga gccctgctgt ttgactccgg cgaaaccgca gaagcgaccc ggctcaaacg 300

taccgcgagg cgacgctaca cccggcggaa gaatcgcatc tgctatctgc aagagatctt 360

ttcgaacgaa atggcaaagg tcgacgacag cttcttccac cgcctggaag aatctttcct 420

ggtggaggag gacaagaagc atgaacggca tcctatcttt ggaaacatcg tcgacgaagt 480

ggcgtaccac gaaaagtacc cgaccatcta ccatctgcgg aagaagttgg ttgactcaac 540

tgacaaggcc gacctcagat tgatctactt ggccctcgcc catatgatca aattccgcgg 600

acacttcctg atcgaaggcg atctgaaccc tgataactcc gacgtggata agcttttcat 660

tcaactggtg cagacctaca accaactgtt cgaagaaaac ccaatcaatg ctagcggcgt 720

cgatgccaag gccatcctgt ccgcccggct gtcgaagtcg cggcgcctcg aaaacctgat 780

cgcacagctg ccgggagaga aaaagaacgg acttttcggc aacttgatcg ctctctcact 840

gggactcact cccaatttca agtccaattt tgacctggcc gaggacgcga agctgcaact 900

ctcaaaggac acctacgacg acgacttgga caatttgctg gcacaaattg gcgatcagta 960

cgcggatctg ttccttgccg ctaagaacct ttcggacgca atcttgctgt ccgatatcct 1020

gcgcgtgaac accgaaataa ccaaagcgcc gcttagcgcc tcgatgatta agcggtacga 1080

cgagcatcac caggatctca cgctgctcaa agcgctcgtg agacagcaac tgcctgaaaa 1140

gtacaaggag atcttcttcg accagtccaa gaatgggtac gcagggtaca tcgatggagg 1200

cgctagccag gaagagttct ataagttcat caagccaatc ctggaaaaga tggacggaac 1260

cgaagaactg ctggtcaagc tgaacaggga ggatctgctc cggaaacaga gaacctttga 1320

caacggatcc attccccacc agatccatct gggtgagctg cacgccatct tgcggcgcca 1380

ggaggacttt tacccattcc tcaaggacaa ccgggaaaag atcgagaaaa ttctgacgtt 1440

ccgcatcccg tattacgtgg gcccactggc gcgcggcaat tcgcgcttcg cgtggatgac 1500

tagaaaatca gaggaaacca tcactccttg gaatttcgag gaagttgtgg ataagggagc 1560

ttcggcacaa agcttcatcg aacgaatgac caacttcgac aagaatctcc caaacgagaa 1620

ggtgcttcct aagcacagcc tcctttacga atacttcact gtctacaacg aactgactaa 1680

agtgaaatac gttactgaag gaatgaggaa gccggccttt ctgtccggag aacagaagaa 1740

agcaattgtc gatctgctgt tcaagaccaa ccgcaaggtg accgtcaagc agcttaaaga 1800

ggactacttc aagaagatcg agtgtttcga ctcagtggaa atcagcgggg tggaggacag 1860

attcaacgct tcgctgggaa cctatcatga tctcctgaag atcatcaagg acaaggactt 1920

ccttgacaac gaggagaacg aggacatcct ggaagatatc gtcctgacct tgaccctttt 1980

cgaggatcgc gagatgatcg aggagaggct taagacctac gctcatctct tcgacgataa 2040

ggtcatgaaa caactcaagc gccgccggta cactggttgg ggccgcctct cccgcaagct 2100

gatcaacggt attcgcgata aacagagcgg taaaactatc ctggatttcc tcaaatcgga 2160

tggcttcgct aatcgtaact tcatgcaatt gatccacgac gacagcctga cctttaagga 2220

ggacatccaa aaagcacaag tgtccggaca gggagactca ctccatgaac acatcgcgaa 2280

tctggccggt tcgccggcga ttaagaaggg aattctgcaa actgtgaagg tggtcgacga 2340

gctggtgaag gtcatgggac ggcacaaacc ggagaatatc gtgattgaaa tggcccgaga 2400

aaaccagact acccagaagg gccagaaaaa ctcccgcgaa aggatgaagc ggatcgaaga 2460

aggaatcaag gagctgggca gccagatcct gaaagagcac ccggtggaaa acacgcagct 2520

gcagaacgag aagctctacc tgtactattt gcaaaatgga cgggacatgt acgtggacca 2580

agagctggac atcaatcggt tgtctgatta cgacgtggac cacatcgttc cacagtcctt 2640

tctgaaggat gactcgatcg ataacaaggt gttgactcgc agcgacaaga acagagggaa 2700

gtcagataat gtgccatcgg aggaggtcgt gaagaagatg aagaattact ggcggcagct 2760

cctgaatgcg aagctgatta cccagagaaa gtttgacaat ctcactaaag ccgagcgcgg 2820

cggactctca gagctggata aggctggatt catcaaacgg cagctggtcg agactcggca 2880

gattaccaag cacgtggcgc agatcttgga ctcccgcatg aacactaaat acgacgagaa 2940

cgataagctc atccgggaag tgaaggtgat taccctgaaa agcaaacttg tgtcggactt 3000

tcggaaggac tttcagtttt acaaagtgag agaaatcaac aactaccatc acgcgcatga 3060

cgcatacctc aacgctgtgg tcggtaccgc cctgatcaaa aagtacccta aacttgaatc 3120

ggagtttgtg tacggagact acaaggtcta cgacgtgagg aagatgatag ccaagtccga 3180

acaggaaatc gggaaagcaa ctgcgaaata cttcttttac tcaaacatca tgaacttttt 3240

caagactgaa attacgctgg ccaatggaga aatcaggaag aggccactga tcgaaactaa 3300

cggagaaacg ggcgaaatcg tgtgggacaa gggcagggac ttcgcaactg ttcgcaaagt 3360

gctctctatg ccgcaagtca atattgtgaa gaaaaccgaa gtgcaaaccg gcggattttc 3420

aaaggaatcg atcctcccaa agagaaatag cgacaagctc attgcacgca agaaagactg 3480

ggacccgaag aagtacggag gattcgattc gccgactgtc gcatactccg tcctcgtggt 3540

ggccaaggtg gagaagggaa agagcaaaaa gctcaaatcc gtcaaagagc tgctggggat 3600

taccatcatg gaacgatcct cgttcgagaa gaacccgatt gatttcctcg aggcgaaggg 3660

ttacaaggag gtgaagaagg atctgatcat caaactcccc aagtactcac tgttcgaact 3720

ggaaaatggt cggaagcgca tgctggcttc ggccggagaa ctccaaaaag gaaatgagct 3780

ggccttgcct agcaagtacg tcaacttcct ctatcttgct tcgcactacg aaaaactcaa 3840

agggtcaccg gaagataacg aacagaagca gcttttcgtg gagcagcaca agcattatct 3900

ggatgaaatc atcgaacaaa tctccgagtt ttcaaagcgc gtgatcctcg ccgacgccaa 3960

cctcgacaaa gtcctgtcgg cctacaataa gcatagagat aagccgatca gagaacaggc 4020

cgagaacatt atccacttgt tcaccctgac taacctggga gccccagccg ccttcaagta 4080

cttcgatact actatcgatc gcaaaagata cacgtccacc aaggaagttc tggacgcgac 4140

cctgatccac caaagcatca ctggactcta cgaaactagg atcgatctgt cgcagctggg 4200

tggcgattga tagtctagcc atcacattta aaagcatctc agcctaccat gagaataaga 4260

gaaagaaaat gaagatcaat agcttattca tctctttttc tttttcgttg gtgtaaagcc 4320

aacaccctgt ctaaaaaaca taaatttctt taatcatttt gcctcttttc tctgtgcttc 4380

aattaataaa aaatggaaag aacctcgag 4409


<210> 50
<211> 4140
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 50
atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg atgggcagtc 60

atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa cacagacaga 120

cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga aacagcagaa 180

gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa cagaatctgc 240

tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt cttccaccgg 300

ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc gatcttcgga 360

aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca cctgagaaag 420

aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc actggcacac 480

atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga caacagcgac 540

gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga agaaaacccg 600

atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag caagagcaga 660

agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact gttcggaaac 720

ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga cctggcagaa 780

gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa cctgctggca 840

cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag cgacgcaatc 900

ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct gagcgcaagc 960

atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc actggtcaga 1020

cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa cggatacgca 1080

ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa gccgatcctg 1140

gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga cctgctgaga 1200

aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg agaactgcac 1260

gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag agaaaagatc 1320

gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag aggaaacagc 1380

agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa cttcgaagaa 1440

gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa cttcgacaag 1500

aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata cttcacagtc 1560

tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc ggcattcctg 1620

agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag aaaggtcaca 1680

gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag cgtcgaaatc 1740

agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct gctgaagatc 1800

atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga agacatcgtc 1860

ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa gacatacgca 1920

cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac aggatgggga 1980

agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa gacaatcctg 2040

gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat ccacgacgac 2100

agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg agacagcctg 2160

cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat cctgcagaca 2220

gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga aaacatcgtc 2280

atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340

atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa ggaacacccg 2400

gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca aaacggaaga 2460

gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga cgtcgaccac 2520

atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct gacaagaagc 2580

gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa gaagatgaag 2640

aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt cgacaacctg 2700

acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat caagagacag 2760

ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag cagaatgaac 2820

acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac actgaagagc 2880

aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga aatcaacaac 2940

taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact gatcaagaag 3000

tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga cgtcagaaag 3060

atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt cttctacagc 3120

aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat cagaaagaga 3180

ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg aagagacttc 3240

gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa gacagaagtc 3300

cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga caagctgatc 3360

gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc gacagtcgca 3420

tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct gaagagcgtc 3480

aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa cccgatcgac 3540

ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa gctgccgaag 3600

tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc aggagaactg 3660

cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta cctggcaagc 3720

cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct gttcgtcgaa 3780

cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag caagagagtc 3840

atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca cagagacaag 3900

ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa cctgggagca 3960

ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac aagcacaaag 4020

gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga aacaagaatc 4080

gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag aaaggtctag 4140


<210> 51
<211> 4411
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 51
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120

cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180

gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240

cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300

aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360

cagcttcttc caccggctgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420

acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480

ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540

cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600

cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660

gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720

actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780

cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840

cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900

ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960

cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020

accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080

gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140

caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200

catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260

agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320

cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380

caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440

ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500

gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560

gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620

cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680

aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740

aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800

cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860

cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920

cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980

actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040

atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100

cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160

gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220

acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280

gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340

gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400

gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460

cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520

cctgcaaaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580

ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640

ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700

cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760

aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820

attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880

ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940

catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000

cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060

agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120

ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180

gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240

agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300

caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360

caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420

cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480

cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540

gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600

aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660

catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720

aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780

cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840

gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900

attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960

caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020

gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080

atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140

gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200

gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260

gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320

ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380

tcaattaata aaaaatggaa agaacctcga g 4411


<210> 52
<211> 4140
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 52
atggacaaga agtacagcat cggcctggac atcggcacca acagcgtggg ctgggccgtg 60

atcaccgacg agtacaaggt gcccagcaag aagttcaagg tgctgggcaa caccgacaga 120

cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180

gccaccagac tgaagagaac cgccagaaga agatacacca gaagaaagaa cagaatctgc 240

tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300

ctggaggaga gcttcctggt ggaggaggac aagaagcacg agagacaccc catcttcggc 360

aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420

aagctggtgg acagcaccga caaggccgac ctgagactga tctacctggc cctggcccac 480

atgatcaagt tcagaggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540

gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600

atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg ccagactgag caagagcaga 660

agactggaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720

ctgatcgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780

gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840

cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900

ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgccagc 960

atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgaga 1020

cagcagctgc ccgagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080

ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gcccatcctg 1140

gagaagatgg acggcaccga ggagctgctg gtgaagctga acagagagga cctgctgaga 1200

aagcagagaa ccttcgacaa cggcagcatc ccccaccaga tccacctggg cgagctgcac 1260

gccatcctga gaagacagga ggacttctac cccttcctga aggacaacag agagaagatc 1320

gagaagatcc tgaccttcag aatcccctac tacgtgggcc ccctggccag aggcaacagc 1380

agattcgcct ggatgaccag aaagagcgag gagaccatca ccccctggaa cttcgaggag 1440

gtggtggaca agggcgccag cgcccagagc ttcatcgaga gaatgaccaa cttcgacaag 1500

aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560

tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgagaaagcc cgccttcctg 1620

agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaacag aaaggtgacc 1680

gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740

agcggcgtgg aggacagatt caacgccagc ctgggcacct accacgacct gctgaagatc 1800

atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860

ctgaccctga ccctgttcga ggacagagag atgatcgagg agagactgaa gacctacgcc 1920

cacctgttcg acgacaaggt gatgaagcag ctgaagagaa gaagatacac cggctggggc 1980

agactgagca gaaagctgat caacggcatc agagacaagc agagcggcaa gaccatcctg 2040

gacttcctga agagcgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100

agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160

cacgagcaca tcgccaacct ggccggcagc cccgccatca agaagggcat cctgcagacc 2220

gtgaaggtgg tggacgagct ggtgaaggtg atgggcagac acaagcccga gaacatcgtg 2280

atcgagatgg ccagagagaa ccagaccacc cagaagggcc agaagaacag cagagagaga 2340

atgaagagaa tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccc 2400

gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggcaga 2460

gacatgtacg tggaccagga gctggacatc aacagactga gcgactacga cgtggaccac 2520

atcgtgcccc agagcttcct gaaggacgac agcatcgaca acaaggtgct gaccagaagc 2580

gacaagaaca gaggcaagag cgacaacgtg cccagcgagg aggtggtgaa gaagatgaag 2640

aactactgga gacagctgct gaacgccaag ctgatcaccc agagaaagtt cgacaacctg 2700

accaaggccg agagaggcgg cctgagcgag ctggacaagg ccggcttcat caagagacag 2760

ctggtggaga ccagacagat caccaagcac gtggcccaga tcctggacag cagaatgaac 2820

accaagtacg acgagaacga caagctgatc agagaggtga aggtgatcac cctgaagagc 2880

aagctggtga gcgacttcag aaaggacttc cagttctaca aggtgagaga gatcaacaac 2940

taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gatcaagaag 3000

taccccaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgagaaag 3060

atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120

aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat cagaaagaga 3180

cccctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg cagagacttc 3240

gccaccgtga gaaaggtgct gagcatgccc caggtgaaca tcgtgaagaa gaccgaggtg 3300

cagaccggcg gcttcagcaa ggagagcatc ctgcccaaga gaaacagcga caagctgatc 3360

gccagaaaga aggactggga ccccaagaag tacggcggct tcgacagccc caccgtggcc 3420

tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480

aaggagctgc tgggcatcac catcatggag agaagcagct tcgagaagaa ccccatcgac 3540

ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcatcaa gctgcccaag 3600

tacagcctgt tcgagctgga gaacggcaga aagagaatgc tggccagcgc cggcgagctg 3660

cagaagggca acgagctggc cctgcccagc aagtacgtga acttcctgta cctggccagc 3720

cactacgaga agctgaaggg cagccccgag gacaacgagc agaagcagct gttcgtggag 3780

cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagagagtg 3840

atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca cagagacaag 3900

cccatcagag agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960

cccgccgcct tcaagtactt cgacaccacc atcgacagaa agagatacac cagcaccaag 4020

gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gaccagaatc 4080

gacctgagcc agctgggcgg cgacggcggc ggcagcccca agaagaagag aaaggtgtga 4140


<210> 53
<211> 4411
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 53
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc gccaccatgg acaagaagta cagcatcggc ctggacatcg gcaccaacag 120

cgtgggctgg gccgtgatca ccgacgagta caaggtgccc agcaagaagt tcaaggtgct 180

gggcaacacc gacagacaca gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag 240

cggcgagacc gccgaggcca ccagactgaa gagaaccgcc agaagaagat acaccagaag 300

aaagaacaga atctgctacc tgcaggagat cttcagcaac gagatggcca aggtggacga 360

cagcttcttc cacagactgg aggagagctt cctggtggag gaggacaaga agcacgagag 420

acaccccatc ttcggcaaca tcgtggacga ggtggcctac cacgagaagt accccaccat 480

ctaccacctg agaaagaagc tggtggacag caccgacaag gccgacctga gactgatcta 540

cctggccctg gcccacatga tcaagttcag aggccacttc ctgatcgagg gcgacctgaa 600

ccccgacaac agcgacgtgg acaagctgtt catccagctg gtgcagacct acaaccagct 660

gttcgaggag aaccccatca acgccagcgg cgtggacgcc aaggccatcc tgagcgccag 720

actgagcaag agcagaagac tggagaacct gatcgcccag ctgcccggcg agaagaagaa 780

cggcctgttc ggcaacctga tcgccctgag cctgggcctg acccccaact tcaagagcaa 840

cttcgacctg gccgaggacg ccaagctgca gctgagcaag gacacctacg acgacgacct 900

ggacaacctg ctggcccaga tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa 960

cctgagcgac gccatcctgc tgagcgacat cctgagagtg aacaccgaga tcaccaaggc 1020

ccccctgagc gccagcatga tcaagagata cgacgagcac caccaggacc tgaccctgct 1080

gaaggccctg gtgagacagc agctgcccga gaagtacaag gagatcttct tcgaccagag 1140

caagaacggc tacgccggct acatcgacgg cggcgccagc caggaggagt tctacaagtt 1200

catcaagccc atcctggaga agatggacgg caccgaggag ctgctggtga agctgaacag 1260

agaggacctg ctgagaaagc agagaacctt cgacaacggc agcatccccc accagatcca 1320

cctgggcgag ctgcacgcca tcctgagaag acaggaggac ttctacccct tcctgaagga 1380

caacagagag aagatcgaga agatcctgac cttcagaatc ccctactacg tgggccccct 1440

ggccagaggc aacagcagat tcgcctggat gaccagaaag agcgaggaga ccatcacccc 1500

ctggaacttc gaggaggtgg tggacaaggg cgccagcgcc cagagcttca tcgagagaat 1560

gaccaacttc gacaagaacc tgcccaacga gaaggtgctg cccaagcaca gcctgctgta 1620

cgagtacttc accgtgtaca acgagctgac caaggtgaag tacgtgaccg agggcatgag 1680

aaagcccgcc ttcctgagcg gcgagcagaa gaaggccatc gtggacctgc tgttcaagac 1740

caacagaaag gtgaccgtga agcagctgaa ggaggactac ttcaagaaga tcgagtgctt 1800

cgacagcgtg gagatcagcg gcgtggagga cagattcaac gccagcctgg gcacctacca 1860

cgacctgctg aagatcatca aggacaagga cttcctggac aacgaggaga acgaggacat 1920

cctggaggac atcgtgctga ccctgaccct gttcgaggac agagagatga tcgaggagag 1980

actgaagacc tacgcccacc tgttcgacga caaggtgatg aagcagctga agagaagaag 2040

atacaccggc tggggcagac tgagcagaaa gctgatcaac ggcatcagag acaagcagag 2100

cggcaagacc atcctggact tcctgaagag cgacggcttc gccaacagaa acttcatgca 2160

gctgatccac gacgacagcc tgaccttcaa ggaggacatc cagaaggccc aggtgagcgg 2220

ccagggcgac agcctgcacg agcacatcgc caacctggcc ggcagccccg ccatcaagaa 2280

gggcatcctg cagaccgtga aggtggtgga cgagctggtg aaggtgatgg gcagacacaa 2340

gcccgagaac atcgtgatcg agatggccag agagaaccag accacccaga agggccagaa 2400

gaacagcaga gagagaatga agagaatcga ggagggcatc aaggagctgg gcagccagat 2460

cctgaaggag caccccgtgg agaacaccca gctgcagaac gagaagctgt acctgtacta 2520

cctgcagaac ggcagagaca tgtacgtgga ccaggagctg gacatcaaca gactgagcga 2580

ctacgacgtg gaccacatcg tgccccagag cttcctgaag gacgacagca tcgacaacaa 2640

ggtgctgacc agaagcgaca agaacagagg caagagcgac aacgtgccca gcgaggaggt 2700

ggtgaagaag atgaagaact actggagaca gctgctgaac gccaagctga tcacccagag 2760

aaagttcgac aacctgacca aggccgagag aggcggcctg agcgagctgg acaaggccgg 2820

cttcatcaag agacagctgg tggagaccag acagatcacc aagcacgtgg cccagatcct 2880

ggacagcaga atgaacacca agtacgacga gaacgacaag ctgatcagag aggtgaaggt 2940

gatcaccctg aagagcaagc tggtgagcga cttcagaaag gacttccagt tctacaaggt 3000

gagagagatc aacaactacc accacgccca cgacgcctac ctgaacgccg tggtgggcac 3060

cgccctgatc aagaagtacc ccaagctgga gagcgagttc gtgtacggcg actacaaggt 3120

gtacgacgtg agaaagatga tcgccaagag cgagcaggag atcggcaagg ccaccgccaa 3180

gtacttcttc tacagcaaca tcatgaactt cttcaagacc gagatcaccc tggccaacgg 3240

cgagatcaga aagagacccc tgatcgagac caacggcgag accggcgaga tcgtgtggga 3300

caagggcaga gacttcgcca ccgtgagaaa ggtgctgagc atgccccagg tgaacatcgt 3360

gaagaagacc gaggtgcaga ccggcggctt cagcaaggag agcatcctgc ccaagagaaa 3420

cagcgacaag ctgatcgcca gaaagaagga ctgggacccc aagaagtacg gcggcttcga 3480

cagccccacc gtggcctaca gcgtgctggt ggtggccaag gtggagaagg gcaagagcaa 3540

gaagctgaag agcgtgaagg agctgctggg catcaccatc atggagagaa gcagcttcga 3600

gaagaacccc atcgacttcc tggaggccaa gggctacaag gaggtgaaga aggacctgat 3660

catcaagctg cccaagtaca gcctgttcga gctggagaac ggcagaaaga gaatgctggc 3720

cagcgccggc gagctgcaga agggcaacga gctggccctg cccagcaagt acgtgaactt 3780

cctgtacctg gccagccact acgagaagct gaagggcagc cccgaggaca acgagcagaa 3840

gcagctgttc gtggagcagc acaagcacta cctggacgag atcatcgagc agatcagcga 3900

gttcagcaag agagtgatcc tggccgacgc caacctggac aaggtgctga gcgcctacaa 3960

caagcacaga gacaagccca tcagagagca ggccgagaac atcatccacc tgttcaccct 4020

gaccaacctg ggcgcccccg ccgccttcaa gtacttcgac accaccatcg acagaaagag 4080

atacaccagc accaaggagg tgctggacgc caccctgatc caccagagca tcaccggcct 4140

gtacgagacc agaatcgacc tgagccagct gggcggcgac ggcggcggca gccccaagaa 4200

gaagagaaag gtgtgactag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260

gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320

ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380

tcaattaata aaaaatggaa agaacctcga g 4411


<210> 54
<211> 4140
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 54
atggacaaaa aatacagcat agggctagac atagggacga acagcgtagg gtgggcggta 60

ataacggacg aatacaaagt accgagcaaa aaattcaaag tactagggaa cacggaccga 120

cacagcataa aaaaaaacct aataggggcg ctactattcg acagcgggga aacggcggaa 180

gcgacgcgac taaaacgaac ggcgcgacga cgatacacgc gacgaaaaaa ccgaatatgc 240

tacctacaag aaatattcag caacgaaatg gcgaaagtag acgacagctt cttccaccga 300

ctagaagaaa gcttcctagt agaagaagac aaaaaacacg aacgacaccc gatattcggg 360

aacatagtag acgaagtagc gtaccacgaa aaatacccga cgatatacca cctacgaaaa 420

aaactagtag acagcacgga caaagcggac ctacgactaa tatacctagc gctagcgcac 480

atgataaaat tccgagggca cttcctaata gaaggggacc taaacccgga caacagcgac 540

gtagacaaac tattcataca actagtacaa acgtacaacc aactattcga agaaaacccg 600

ataaacgcga gcggggtaga cgcgaaagcg atactaagcg cgcgactaag caaaagccga 660

cgactagaaa acctaatagc gcaactaccg ggggaaaaaa aaaacgggct attcgggaac 720

ctaatagcgc taagcctagg gctaacgccg aacttcaaaa gcaacttcga cctagcggaa 780

gacgcgaaac tacaactaag caaagacacg tacgacgacg acctagacaa cctactagcg 840

caaatagggg accaatacgc ggacctattc ctagcggcga aaaacctaag cgacgcgata 900

ctactaagcg acatactacg agtaaacacg gaaataacga aagcgccgct aagcgcgagc 960

atgataaaac gatacgacga acaccaccaa gacctaacgc tactaaaagc gctagtacga 1020

caacaactac cggaaaaata caaagaaata ttcttcgacc aaagcaaaaa cgggtacgcg 1080

gggtacatag acgggggggc gagccaagaa gaattctaca aattcataaa accgatacta 1140

gaaaaaatgg acgggacgga agaactacta gtaaaactaa accgagaaga cctactacga 1200

aaacaacgaa cgttcgacaa cgggagcata ccgcaccaaa tacacctagg ggaactacac 1260

gcgatactac gacgacaaga agacttctac ccgttcctaa aagacaaccg agaaaaaata 1320

gaaaaaatac taacgttccg aataccgtac tacgtagggc cgctagcgcg agggaacagc 1380

cgattcgcgt ggatgacgcg aaaaagcgaa gaaacgataa cgccgtggaa cttcgaagaa 1440

gtagtagaca aaggggcgag cgcgcaaagc ttcatagaac gaatgacgaa cttcgacaaa 1500

aacctaccga acgaaaaagt actaccgaaa cacagcctac tatacgaata cttcacggta 1560

tacaacgaac taacgaaagt aaaatacgta acggaaggga tgcgaaaacc ggcgttccta 1620

agcggggaac aaaaaaaagc gatagtagac ctactattca aaacgaaccg aaaagtaacg 1680

gtaaaacaac taaaagaaga ctacttcaaa aaaatagaat gcttcgacag cgtagaaata 1740

agcggggtag aagaccgatt caacgcgagc ctagggacgt accacgacct actaaaaata 1800

ataaaagaca aagacttcct agacaacgaa gaaaacgaag acatactaga agacatagta 1860

ctaacgctaa cgctattcga agaccgagaa atgatagaag aacgactaaa aacgtacgcg 1920

cacctattcg acgacaaagt aatgaaacaa ctaaaacgac gacgatacac ggggtggggg 1980

cgactaagcc gaaaactaat aaacgggata cgagacaaac aaagcgggaa aacgatacta 2040

gacttcctaa aaagcgacgg gttcgcgaac cgaaacttca tgcaactaat acacgacgac 2100

agcctaacgt tcaaagaaga catacaaaaa gcgcaagtaa gcgggcaagg ggacagccta 2160

cacgaacaca tagcgaacct agcggggagc ccggcgataa aaaaagggat actacaaacg 2220

gtaaaagtag tagacgaact agtaaaagta atggggcgac acaaaccgga aaacatagta 2280

atagaaatgg cgcgagaaaa ccaaacgacg caaaaagggc aaaaaaacag ccgagaacga 2340

atgaaacgaa tagaagaagg gataaaagaa ctagggagcc aaatactaaa agaacacccg 2400

gtagaaaaca cgcaactaca aaacgaaaaa ctatacctat actacctaca aaacgggcga 2460

gacatgtacg tagaccaaga actagacata aaccgactaa gcgactacga cgtagaccac 2520

atagtaccgc aaagcttcct aaaagacgac agcatagaca acaaagtact aacgcgaagc 2580

gacaaaaacc gagggaaaag cgacaacgta ccgagcgaag aagtagtaaa aaaaatgaaa 2640

aactactggc gacaactact aaacgcgaaa ctaataacgc aacgaaaatt cgacaaccta 2700

acgaaagcgg aacgaggggg gctaagcgaa ctagacaaag cggggttcat aaaacgacaa 2760

ctagtagaaa cgcgacaaat aacgaaacac gtagcgcaaa tactagacag ccgaatgaac 2820

acgaaatacg acgaaaacga caaactaata cgagaagtaa aagtaataac gctaaaaagc 2880

aaactagtaa gcgacttccg aaaagacttc caattctaca aagtacgaga aataaacaac 2940

taccaccacg cgcacgacgc gtacctaaac gcggtagtag ggacggcgct aataaaaaaa 3000

tacccgaaac tagaaagcga attcgtatac ggggactaca aagtatacga cgtacgaaaa 3060

atgatagcga aaagcgaaca agaaataggg aaagcgacgg cgaaatactt cttctacagc 3120

aacataatga acttcttcaa aacggaaata acgctagcga acggggaaat acgaaaacga 3180

ccgctaatag aaacgaacgg ggaaacgggg gaaatagtat gggacaaagg gcgagacttc 3240

gcgacggtac gaaaagtact aagcatgccg caagtaaaca tagtaaaaaa aacggaagta 3300

caaacggggg ggttcagcaa agaaagcata ctaccgaaac gaaacagcga caaactaata 3360

gcgcgaaaaa aagactggga cccgaaaaaa tacggggggt tcgacagccc gacggtagcg 3420

tacagcgtac tagtagtagc gaaagtagaa aaagggaaaa gcaaaaaact aaaaagcgta 3480

aaagaactac tagggataac gataatggaa cgaagcagct tcgaaaaaaa cccgatagac 3540

ttcctagaag cgaaagggta caaagaagta aaaaaagacc taataataaa actaccgaaa 3600

tacagcctat tcgaactaga aaacgggcga aaacgaatgc tagcgagcgc gggggaacta 3660

caaaaaggga acgaactagc gctaccgagc aaatacgtaa acttcctata cctagcgagc 3720

cactacgaaa aactaaaagg gagcccggaa gacaacgaac aaaaacaact attcgtagaa 3780

caacacaaac actacctaga cgaaataata gaacaaataa gcgaattcag caaacgagta 3840

atactagcgg acgcgaacct agacaaagta ctaagcgcgt acaacaaaca ccgagacaaa 3900

ccgatacgag aacaagcgga aaacataata cacctattca cgctaacgaa cctaggggcg 3960

ccggcggcgt tcaaatactt cgacacgacg atagaccgaa aacgatacac gagcacgaaa 4020

gaagtactag acgcgacgct aatacaccaa agcataacgg ggctatacga aacgcgaata 4080

gacctaagcc aactaggggg ggacgggggg gggagcccga aaaaaaaacg aaaagtatga 4140


<210> 55
<211> 4411
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 55
gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc gccaccatgg acaaaaaata cagcataggg ctagacatag ggacgaacag 120

cgtagggtgg gcggtaataa cggacgaata caaagtaccg agcaaaaaat tcaaagtact 180

agggaacacg gaccgacaca gcataaaaaa aaacctaata ggggcgctac tattcgacag 240

cggggaaacg gcggaagcga cgcgactaaa acgaacggcg cgacgacgat acacgcgacg 300

aaaaaaccga atatgctacc tacaagaaat attcagcaac gaaatggcga aagtagacga 360

cagcttcttc caccgactag aagaaagctt cctagtagaa gaagacaaaa aacacgaacg 420

acacccgata ttcgggaaca tagtagacga agtagcgtac cacgaaaaat acccgacgat 480

ataccaccta cgaaaaaaac tagtagacag cacggacaaa gcggacctac gactaatata 540

cctagcgcta gcgcacatga taaaattccg agggcacttc ctaatagaag gggacctaaa 600

cccggacaac agcgacgtag acaaactatt catacaacta gtacaaacgt acaaccaact 660

attcgaagaa aacccgataa acgcgagcgg ggtagacgcg aaagcgatac taagcgcgcg 720

actaagcaaa agccgacgac tagaaaacct aatagcgcaa ctaccggggg aaaaaaaaaa 780

cgggctattc gggaacctaa tagcgctaag cctagggcta acgccgaact tcaaaagcaa 840

cttcgaccta gcggaagacg cgaaactaca actaagcaaa gacacgtacg acgacgacct 900

agacaaccta ctagcgcaaa taggggacca atacgcggac ctattcctag cggcgaaaaa 960

cctaagcgac gcgatactac taagcgacat actacgagta aacacggaaa taacgaaagc 1020

gccgctaagc gcgagcatga taaaacgata cgacgaacac caccaagacc taacgctact 1080

aaaagcgcta gtacgacaac aactaccgga aaaatacaaa gaaatattct tcgaccaaag 1140

caaaaacggg tacgcggggt acatagacgg gggggcgagc caagaagaat tctacaaatt 1200

cataaaaccg atactagaaa aaatggacgg gacggaagaa ctactagtaa aactaaaccg 1260

agaagaccta ctacgaaaac aacgaacgtt cgacaacggg agcataccgc accaaataca 1320

cctaggggaa ctacacgcga tactacgacg acaagaagac ttctacccgt tcctaaaaga 1380

caaccgagaa aaaatagaaa aaatactaac gttccgaata ccgtactacg tagggccgct 1440

agcgcgaggg aacagccgat tcgcgtggat gacgcgaaaa agcgaagaaa cgataacgcc 1500

gtggaacttc gaagaagtag tagacaaagg ggcgagcgcg caaagcttca tagaacgaat 1560

gacgaacttc gacaaaaacc taccgaacga aaaagtacta ccgaaacaca gcctactata 1620

cgaatacttc acggtataca acgaactaac gaaagtaaaa tacgtaacgg aagggatgcg 1680

aaaaccggcg ttcctaagcg gggaacaaaa aaaagcgata gtagacctac tattcaaaac 1740

gaaccgaaaa gtaacggtaa aacaactaaa agaagactac ttcaaaaaaa tagaatgctt 1800

cgacagcgta gaaataagcg gggtagaaga ccgattcaac gcgagcctag ggacgtacca 1860

cgacctacta aaaataataa aagacaaaga cttcctagac aacgaagaaa acgaagacat 1920

actagaagac atagtactaa cgctaacgct attcgaagac cgagaaatga tagaagaacg 1980

actaaaaacg tacgcgcacc tattcgacga caaagtaatg aaacaactaa aacgacgacg 2040

atacacgggg tgggggcgac taagccgaaa actaataaac gggatacgag acaaacaaag 2100

cgggaaaacg atactagact tcctaaaaag cgacgggttc gcgaaccgaa acttcatgca 2160

actaatacac gacgacagcc taacgttcaa agaagacata caaaaagcgc aagtaagcgg 2220

gcaaggggac agcctacacg aacacatagc gaacctagcg gggagcccgg cgataaaaaa 2280

agggatacta caaacggtaa aagtagtaga cgaactagta aaagtaatgg ggcgacacaa 2340

accggaaaac atagtaatag aaatggcgcg agaaaaccaa acgacgcaaa aagggcaaaa 2400

aaacagccga gaacgaatga aacgaataga agaagggata aaagaactag ggagccaaat 2460

actaaaagaa cacccggtag aaaacacgca actacaaaac gaaaaactat acctatacta 2520

cctacaaaac gggcgagaca tgtacgtaga ccaagaacta gacataaacc gactaagcga 2580

ctacgacgta gaccacatag taccgcaaag cttcctaaaa gacgacagca tagacaacaa 2640

agtactaacg cgaagcgaca aaaaccgagg gaaaagcgac aacgtaccga gcgaagaagt 2700

agtaaaaaaa atgaaaaact actggcgaca actactaaac gcgaaactaa taacgcaacg 2760

aaaattcgac aacctaacga aagcggaacg aggggggcta agcgaactag acaaagcggg 2820

gttcataaaa cgacaactag tagaaacgcg acaaataacg aaacacgtag cgcaaatact 2880

agacagccga atgaacacga aatacgacga aaacgacaaa ctaatacgag aagtaaaagt 2940

aataacgcta aaaagcaaac tagtaagcga cttccgaaaa gacttccaat tctacaaagt 3000

acgagaaata aacaactacc accacgcgca cgacgcgtac ctaaacgcgg tagtagggac 3060

ggcgctaata aaaaaatacc cgaaactaga aagcgaattc gtatacgggg actacaaagt 3120

atacgacgta cgaaaaatga tagcgaaaag cgaacaagaa atagggaaag cgacggcgaa 3180

atacttcttc tacagcaaca taatgaactt cttcaaaacg gaaataacgc tagcgaacgg 3240

ggaaatacga aaacgaccgc taatagaaac gaacggggaa acgggggaaa tagtatggga 3300

caaagggcga gacttcgcga cggtacgaaa agtactaagc atgccgcaag taaacatagt 3360

aaaaaaaacg gaagtacaaa cgggggggtt cagcaaagaa agcatactac cgaaacgaaa 3420

cagcgacaaa ctaatagcgc gaaaaaaaga ctgggacccg aaaaaatacg gggggttcga 3480

cagcccgacg gtagcgtaca gcgtactagt agtagcgaaa gtagaaaaag ggaaaagcaa 3540

aaaactaaaa agcgtaaaag aactactagg gataacgata atggaacgaa gcagcttcga 3600

aaaaaacccg atagacttcc tagaagcgaa agggtacaaa gaagtaaaaa aagacctaat 3660

aataaaacta ccgaaataca gcctattcga actagaaaac gggcgaaaac gaatgctagc 3720

gagcgcgggg gaactacaaa aagggaacga actagcgcta ccgagcaaat acgtaaactt 3780

cctataccta gcgagccact acgaaaaact aaaagggagc ccggaagaca acgaacaaaa 3840

acaactattc gtagaacaac acaaacacta cctagacgaa ataatagaac aaataagcga 3900

attcagcaaa cgagtaatac tagcggacgc gaacctagac aaagtactaa gcgcgtacaa 3960

caaacaccga gacaaaccga tacgagaaca agcggaaaac ataatacacc tattcacgct 4020

aacgaaccta ggggcgccgg cggcgttcaa atacttcgac acgacgatag accgaaaacg 4080

atacacgagc acgaaagaag tactagacgc gacgctaata caccaaagca taacggggct 4140

atacgaaacg cgaatagacc taagccaact agggggggac ggggggggga gcccgaaaaa 4200

aaaacgaaaa gtatgactag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260

gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320

ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380

tcaattaata aaaaatggaa agaacctcga g 4411


<210> 56
<211> 4411
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 56
aggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120

cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180

gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240

cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300

aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360

cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420

acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480

ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540

cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600

cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660

gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720

actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780

cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840

cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900

ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960

cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020

accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080

gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140

caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200

catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260

agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320

cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380

caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440

ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500

gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560

gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620

cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680

aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740

aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800

cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860

cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920

cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980

actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040

atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100

cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160

gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220

acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280

gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340

gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400

gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460

cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520

cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580

ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640

ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700

cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760

aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820

attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880

ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940

catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000

cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060

agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120

ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180

gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240

agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300

caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360

caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420

cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480

cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540

gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600

aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660

catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720

aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780

cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840

gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900

attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960

caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020

gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080

atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140

gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200

gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260

gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320

ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380

tcaattaata aaaaatggaa agaacctcga g 4411


<210> 57
<211> 4481
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 57
gggcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac 60

cgatccagcc tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt 120

gactcaccgt ccttgacacg gccaccatgg acaagaagta cagcatcgga ctggacatcg 180

gaacaaacag cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt 240

tcaaggtcct gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc 300

tgttcgacag cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat 360

acacaagaag aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa 420

aggtcgacga cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga 480

agcacgaaag acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt 540

acccgacaat ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga 600

gactgatcta cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag 660

gagacctgaa cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat 720

acaaccagct gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc 780

tgagcgcaag actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag 840

aaaagaagaa cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact 900

tcaagagcaa cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg 960

acgacgacct ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg 1020

cagcaaagaa cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa 1080

tcacaaaggc accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc 1140

tgacactgct gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct 1200

tcgaccagag caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat 1260

tctacaagtt catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca 1320

agctgaacag agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc 1380

accagatcca cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt 1440

tcctgaagga caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg 1500

tcggaccgct ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa 1560

caatcacacc gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca 1620

tcgaaagaat gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca 1680

gcctgctgta cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag 1740

aaggaatgag aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc 1800

tgttcaagac aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga 1860

tcgaatgctt cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg 1920

gaacatacca cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa 1980

acgaagacat cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga 2040

tcgaagaaag actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga 2100

agagaagaag atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag 2160

acaagcagag cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa 2220

acttcatgca gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac 2280

aggtcagcgg acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg 2340

caatcaagaa gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg 2400

gaagacacaa gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga 2460

agggacagaa gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg 2520

gaagccagat cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt 2580

acctgtacta cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca 2640

gactgagcga ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca 2700

tcgacaacaa ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga 2760

gcgaagaagt cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga 2820

tcacacagag aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg 2880

acaaggcagg attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg 2940

cacagatcct ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag 3000

aagtcaaggt catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt 3060

tctacaaggt cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag 3120

tcgtcggaac agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag 3180

actacaaggt ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg 3240

caacagcaaa gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac 3300

tggcaaacgg agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa 3360

tcgtctggga caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg 3420

tcaacatcgt caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc 3480

cgaagagaaa cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg 3540

gaggattcga cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg 3600

gaaagagcaa gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa 3660

gcagcttcga aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga 3720

aggacctgat catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga 3780

gaatgctggc aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt 3840

acgtcaactt cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca 3900

acgaacagaa gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac 3960

agatcagcga attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga 4020

gcgcatacaa caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc 4080

tgttcacact gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg 4140

acagaaagag atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca 4200

tcacaggact gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa 4260

gcccgaagaa gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc 4320

atgagaataa gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt 4380

tggtgtaaag ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt 4440

tctctgtgct tcaattaata aaaaatggaa agaacctcga g 4481


<210> 58
<211> 4348
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 58
gggacatttg cttctgacac aactgtgttc actagcaacc tcaaacagac accggatctg 60

ccaccatgga caagaagtac agcatcggac tggacatcgg aacaaacagc gtcggatggg 120

cagtcatcac agacgaatac aaggtcccga gcaagaagtt caaggtcctg ggaaacacag 180

acagacacag catcaagaag aacctgatcg gagcactgct gttcgacagc ggagaaacag 240

cagaagcaac aagactgaag agaacagcaa gaagaagata cacaagaaga aagaacagaa 300

tctgctacct gcaggaaatc ttcagcaacg aaatggcaaa ggtcgacgac agcttcttcc 360

acagactgga agaaagcttc ctggtcgaag aagacaagaa gcacgaaaga cacccgatct 420

tcggaaacat cgtcgacgaa gtcgcatacc acgaaaagta cccgacaatc taccacctga 480

gaaagaagct ggtcgacagc acagacaagg cagacctgag actgatctac ctggcactgg 540

cacacatgat caagttcaga ggacacttcc tgatcgaagg agacctgaac ccggacaaca 600

gcgacgtcga caagctgttc atccagctgg tccagacata caaccagctg ttcgaagaaa 660

acccgatcaa cgcaagcgga gtcgacgcaa aggcaatcct gagcgcaaga ctgagcaaga 720

gcagaagact ggaaaacctg atcgcacagc tgccgggaga aaagaagaac ggactgttcg 780

gaaacctgat cgcactgagc ctgggactga caccgaactt caagagcaac ttcgacctgg 840

cagaagacgc aaagctgcag ctgagcaagg acacatacga cgacgacctg gacaacctgc 900

tggcacagat cggagaccag tacgcagacc tgttcctggc agcaaagaac ctgagcgacg 960

caatcctgct gagcgacatc ctgagagtca acacagaaat cacaaaggca ccgctgagcg 1020

caagcatgat caagagatac gacgaacacc accaggacct gacactgctg aaggcactgg 1080

tcagacagca gctgccggaa aagtacaagg aaatcttctt cgaccagagc aagaacggat 1140

acgcaggata catcgacgga ggagcaagcc aggaagaatt ctacaagttc atcaagccga 1200

tcctggaaaa gatggacgga acagaagaac tgctggtcaa gctgaacaga gaagacctgc 1260

tgagaaagca gagaacattc gacaacggaa gcatcccgca ccagatccac ctgggagaac 1320

tgcacgcaat cctgagaaga caggaagact tctacccgtt cctgaaggac aacagagaaa 1380

agatcgaaaa gatcctgaca ttcagaatcc cgtactacgt cggaccgctg gcaagaggaa 1440

acagcagatt cgcatggatg acaagaaaga gcgaagaaac aatcacaccg tggaacttcg 1500

aagaagtcgt cgacaaggga gcaagcgcac agagcttcat cgaaagaatg acaaacttcg 1560

acaagaacct gccgaacgaa aaggtcctgc cgaagcacag cctgctgtac gaatacttca 1620

cagtctacaa cgaactgaca aaggtcaagt acgtcacaga aggaatgaga aagccggcat 1680

tcctgagcgg agaacagaag aaggcaatcg tcgacctgct gttcaagaca aacagaaagg 1740

tcacagtcaa gcagctgaag gaagactact tcaagaagat cgaatgcttc gacagcgtcg 1800

aaatcagcgg agtcgaagac agattcaacg caagcctggg aacataccac gacctgctga 1860

agatcatcaa ggacaaggac ttcctggaca acgaagaaaa cgaagacatc ctggaagaca 1920

tcgtcctgac actgacactg ttcgaagaca gagaaatgat cgaagaaaga ctgaagacat 1980

acgcacacct gttcgacgac aaggtcatga agcagctgaa gagaagaaga tacacaggat 2040

ggggaagact gagcagaaag ctgatcaacg gaatcagaga caagcagagc ggaaagacaa 2100

tcctggactt cctgaagagc gacggattcg caaacagaaa cttcatgcag ctgatccacg 2160

acgacagcct gacattcaag gaagacatcc agaaggcaca ggtcagcgga cagggagaca 2220

gcctgcacga acacatcgca aacctggcag gaagcccggc aatcaagaag ggaatcctgc 2280

agacagtcaa ggtcgtcgac gaactggtca aggtcatggg aagacacaag ccggaaaaca 2340

tcgtcatcga aatggcaaga gaaaaccaga caacacagaa gggacagaag aacagcagag 2400

aaagaatgaa gagaatcgaa gaaggaatca aggaactggg aagccagatc ctgaaggaac 2460

acccggtcga aaacacacag ctgcagaacg aaaagctgta cctgtactac ctgcagaacg 2520

gaagagacat gtacgtcgac caggaactgg acatcaacag actgagcgac tacgacgtcg 2580

accacatcgt cccgcagagc ttcctgaagg acgacagcat cgacaacaag gtcctgacaa 2640

gaagcgacaa gaacagagga aagagcgaca acgtcccgag cgaagaagtc gtcaagaaga 2700

tgaagaacta ctggagacag ctgctgaacg caaagctgat cacacagaga aagttcgaca 2760

acctgacaaa ggcagagaga ggaggactga gcgaactgga caaggcagga ttcatcaaga 2820

gacagctggt cgaaacaaga cagatcacaa agcacgtcgc acagatcctg gacagcagaa 2880

tgaacacaaa gtacgacgaa aacgacaagc tgatcagaga agtcaaggtc atcacactga 2940

agagcaagct ggtcagcgac ttcagaaagg acttccagtt ctacaaggtc agagaaatca 3000

acaactacca ccacgcacac gacgcatacc tgaacgcagt cgtcggaaca gcactgatca 3060

agaagtaccc gaagctggaa agcgaattcg tctacggaga ctacaaggtc tacgacgtca 3120

gaaagatgat cgcaaagagc gaacaggaaa tcggaaaggc aacagcaaag tacttcttct 3180

acagcaacat catgaacttc ttcaagacag aaatcacact ggcaaacgga gaaatcagaa 3240

agagaccgct gatcgaaaca aacggagaaa caggagaaat cgtctgggac aagggaagag 3300

acttcgcaac agtcagaaag gtcctgagca tgccgcaggt caacatcgtc aagaagacag 3360

aagtccagac aggaggattc agcaaggaaa gcatcctgcc gaagagaaac agcgacaagc 3420

tgatcgcaag aaagaaggac tgggacccga agaagtacgg aggattcgac agcccgacag 3480

tcgcatacag cgtcctggtc gtcgcaaagg tcgaaaaggg aaagagcaag aagctgaaga 3540

gcgtcaagga actgctggga atcacaatca tggaaagaag cagcttcgaa aagaacccga 3600

tcgacttcct ggaagcaaag ggatacaagg aagtcaagaa ggacctgatc atcaagctgc 3660

cgaagtacag cctgttcgaa ctggaaaacg gaagaaagag aatgctggca agcgcaggag 3720

aactgcagaa gggaaacgaa ctggcactgc cgagcaagta cgtcaacttc ctgtacctgg 3780

caagccacta cgaaaagctg aagggaagcc cggaagacaa cgaacagaag cagctgttcg 3840

tcgaacagca caagcactac ctggacgaaa tcatcgaaca gatcagcgaa ttcagcaaga 3900

gagtcatcct ggcagacgca aacctggaca aggtcctgag cgcatacaac aagcacagag 3960

acaagccgat cagagaacag gcagaaaaca tcatccacct gttcacactg acaaacctgg 4020

gagcaccggc agcattcaag tacttcgaca caacaatcga cagaaagaga tacacaagca 4080

caaaggaagt cctggacgca acactgatcc accagagcat cacaggactg tacgaaacaa 4140

gaatcgacct gagccagctg ggaggagacg gaggaggaag cccgaagaag aagagaaagg 4200

tctagctagc gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa 4260

gtccaactac taaactgggg gatattatga agggccttga gcatctggat tctgcctaat 4320

aaaaaacatt tattttcatt gcctcgag 4348


<210> 59
<211> 4325
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 59
gggaagctca gaataaacgc tcaactttgg ccggatctgc caccatggac aagaagtaca 60

gcatcggact ggacatcgga acaaacagcg tcggatgggc agtcatcaca gacgaataca 120

aggtcccgag caagaagttc aaggtcctgg gaaacacaga cagacacagc atcaagaaga 180

acctgatcgg agcactgctg ttcgacagcg gagaaacagc agaagcaaca agactgaaga 240

gaacagcaag aagaagatac acaagaagaa agaacagaat ctgctacctg caggaaatct 300

tcagcaacga aatggcaaag gtcgacgaca gcttcttcca cagactggaa gaaagcttcc 360

tggtcgaaga agacaagaag cacgaaagac acccgatctt cggaaacatc gtcgacgaag 420

tcgcatacca cgaaaagtac ccgacaatct accacctgag aaagaagctg gtcgacagca 480

cagacaaggc agacctgaga ctgatctacc tggcactggc acacatgatc aagttcagag 540

gacacttcct gatcgaagga gacctgaacc cggacaacag cgacgtcgac aagctgttca 600

tccagctggt ccagacatac aaccagctgt tcgaagaaaa cccgatcaac gcaagcggag 660

tcgacgcaaa ggcaatcctg agcgcaagac tgagcaagag cagaagactg gaaaacctga 720

tcgcacagct gccgggagaa aagaagaacg gactgttcgg aaacctgatc gcactgagcc 780

tgggactgac accgaacttc aagagcaact tcgacctggc agaagacgca aagctgcagc 840

tgagcaagga cacatacgac gacgacctgg acaacctgct ggcacagatc ggagaccagt 900

acgcagacct gttcctggca gcaaagaacc tgagcgacgc aatcctgctg agcgacatcc 960

tgagagtcaa cacagaaatc acaaaggcac cgctgagcgc aagcatgatc aagagatacg 1020

acgaacacca ccaggacctg acactgctga aggcactggt cagacagcag ctgccggaaa 1080

agtacaagga aatcttcttc gaccagagca agaacggata cgcaggatac atcgacggag 1140

gagcaagcca ggaagaattc tacaagttca tcaagccgat cctggaaaag atggacggaa 1200

cagaagaact gctggtcaag ctgaacagag aagacctgct gagaaagcag agaacattcg 1260

acaacggaag catcccgcac cagatccacc tgggagaact gcacgcaatc ctgagaagac 1320

aggaagactt ctacccgttc ctgaaggaca acagagaaaa gatcgaaaag atcctgacat 1380

tcagaatccc gtactacgtc ggaccgctgg caagaggaaa cagcagattc gcatggatga 1440

caagaaagag cgaagaaaca atcacaccgt ggaacttcga agaagtcgtc gacaagggag 1500

caagcgcaca gagcttcatc gaaagaatga caaacttcga caagaacctg ccgaacgaaa 1560

aggtcctgcc gaagcacagc ctgctgtacg aatacttcac agtctacaac gaactgacaa 1620

aggtcaagta cgtcacagaa ggaatgagaa agccggcatt cctgagcgga gaacagaaga 1680

aggcaatcgt cgacctgctg ttcaagacaa acagaaaggt cacagtcaag cagctgaagg 1740

aagactactt caagaagatc gaatgcttcg acagcgtcga aatcagcgga gtcgaagaca 1800

gattcaacgc aagcctggga acataccacg acctgctgaa gatcatcaag gacaaggact 1860

tcctggacaa cgaagaaaac gaagacatcc tggaagacat cgtcctgaca ctgacactgt 1920

tcgaagacag agaaatgatc gaagaaagac tgaagacata cgcacacctg ttcgacgaca 1980

aggtcatgaa gcagctgaag agaagaagat acacaggatg gggaagactg agcagaaagc 2040

tgatcaacgg aatcagagac aagcagagcg gaaagacaat cctggacttc ctgaagagcg 2100

acggattcgc aaacagaaac ttcatgcagc tgatccacga cgacagcctg acattcaagg 2160

aagacatcca gaaggcacag gtcagcggac agggagacag cctgcacgaa cacatcgcaa 2220

acctggcagg aagcccggca atcaagaagg gaatcctgca gacagtcaag gtcgtcgacg 2280

aactggtcaa ggtcatggga agacacaagc cggaaaacat cgtcatcgaa atggcaagag 2340

aaaaccagac aacacagaag ggacagaaga acagcagaga aagaatgaag agaatcgaag 2400

aaggaatcaa ggaactggga agccagatcc tgaaggaaca cccggtcgaa aacacacagc 2460

tgcagaacga aaagctgtac ctgtactacc tgcagaacgg aagagacatg tacgtcgacc 2520

aggaactgga catcaacaga ctgagcgact acgacgtcga ccacatcgtc ccgcagagct 2580

tcctgaagga cgacagcatc gacaacaagg tcctgacaag aagcgacaag aacagaggaa 2640

agagcgacaa cgtcccgagc gaagaagtcg tcaagaagat gaagaactac tggagacagc 2700

tgctgaacgc aaagctgatc acacagagaa agttcgacaa cctgacaaag gcagagagag 2760

gaggactgag cgaactggac aaggcaggat tcatcaagag acagctggtc gaaacaagac 2820

agatcacaaa gcacgtcgca cagatcctgg acagcagaat gaacacaaag tacgacgaaa 2880

acgacaagct gatcagagaa gtcaaggtca tcacactgaa gagcaagctg gtcagcgact 2940

tcagaaagga cttccagttc tacaaggtca gagaaatcaa caactaccac cacgcacacg 3000

acgcatacct gaacgcagtc gtcggaacag cactgatcaa gaagtacccg aagctggaaa 3060

gcgaattcgt ctacggagac tacaaggtct acgacgtcag aaagatgatc gcaaagagcg 3120

aacaggaaat cggaaaggca acagcaaagt acttcttcta cagcaacatc atgaacttct 3180

tcaagacaga aatcacactg gcaaacggag aaatcagaaa gagaccgctg atcgaaacaa 3240

acggagaaac aggagaaatc gtctgggaca agggaagaga cttcgcaaca gtcagaaagg 3300

tcctgagcat gccgcaggtc aacatcgtca agaagacaga agtccagaca ggaggattca 3360

gcaaggaaag catcctgccg aagagaaaca gcgacaagct gatcgcaaga aagaaggact 3420

gggacccgaa gaagtacgga ggattcgaca gcccgacagt cgcatacagc gtcctggtcg 3480

tcgcaaaggt cgaaaaggga aagagcaaga agctgaagag cgtcaaggaa ctgctgggaa 3540

tcacaatcat ggaaagaagc agcttcgaaa agaacccgat cgacttcctg gaagcaaagg 3600

gatacaagga agtcaagaag gacctgatca tcaagctgcc gaagtacagc ctgttcgaac 3660

tggaaaacgg aagaaagaga atgctggcaa gcgcaggaga actgcagaag ggaaacgaac 3720

tggcactgcc gagcaagtac gtcaacttcc tgtacctggc aagccactac gaaaagctga 3780

agggaagccc ggaagacaac gaacagaagc agctgttcgt cgaacagcac aagcactacc 3840

tggacgaaat catcgaacag atcagcgaat tcagcaagag agtcatcctg gcagacgcaa 3900

acctggacaa ggtcctgagc gcatacaaca agcacagaga caagccgatc agagaacagg 3960

cagaaaacat catccacctg ttcacactga caaacctggg agcaccggca gcattcaagt 4020

acttcgacac aacaatcgac agaaagagat acacaagcac aaaggaagtc ctggacgcaa 4080

cactgatcca ccagagcatc acaggactgt acgaaacaag aatcgacctg agccagctgg 4140

gaggagacgg aggaggaagc ccgaagaaga agagaaaggt ctagctagca ccagcctcaa 4200

gaacacccga atggagtctc taagctacat aataccaact tacactttac aaaatgttgt 4260

cccccaaaat gtagccattc gtatctgctc ctaataaaaa gaaagtttct tcacattctc 4320

tcgag 4325


<210> 60
<211> 4325
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 60
aggaagctca gaataaacgc tcaactttgg ccggatctgc caccatggac aagaagtaca 60

gcatcggact ggacatcgga acaaacagcg tcggatgggc agtcatcaca gacgaataca 120

aggtcccgag caagaagttc aaggtcctgg gaaacacaga cagacacagc atcaagaaga 180

acctgatcgg agcactgctg ttcgacagcg gagaaacagc agaagcaaca agactgaaga 240

gaacagcaag aagaagatac acaagaagaa agaacagaat ctgctacctg caggaaatct 300

tcagcaacga aatggcaaag gtcgacgaca gcttcttcca cagactggaa gaaagcttcc 360

tggtcgaaga agacaagaag cacgaaagac acccgatctt cggaaacatc gtcgacgaag 420

tcgcatacca cgaaaagtac ccgacaatct accacctgag aaagaagctg gtcgacagca 480

cagacaaggc agacctgaga ctgatctacc tggcactggc acacatgatc aagttcagag 540

gacacttcct gatcgaagga gacctgaacc cggacaacag cgacgtcgac aagctgttca 600

tccagctggt ccagacatac aaccagctgt tcgaagaaaa cccgatcaac gcaagcggag 660

tcgacgcaaa ggcaatcctg agcgcaagac tgagcaagag cagaagactg gaaaacctga 720

tcgcacagct gccgggagaa aagaagaacg gactgttcgg aaacctgatc gcactgagcc 780

tgggactgac accgaacttc aagagcaact tcgacctggc agaagacgca aagctgcagc 840

tgagcaagga cacatacgac gacgacctgg acaacctgct ggcacagatc ggagaccagt 900

acgcagacct gttcctggca gcaaagaacc tgagcgacgc aatcctgctg agcgacatcc 960

tgagagtcaa cacagaaatc acaaaggcac cgctgagcgc aagcatgatc aagagatacg 1020

acgaacacca ccaggacctg acactgctga aggcactggt cagacagcag ctgccggaaa 1080

agtacaagga aatcttcttc gaccagagca agaacggata cgcaggatac atcgacggag 1140

gagcaagcca ggaagaattc tacaagttca tcaagccgat cctggaaaag atggacggaa 1200

cagaagaact gctggtcaag ctgaacagag aagacctgct gagaaagcag agaacattcg 1260

acaacggaag catcccgcac cagatccacc tgggagaact gcacgcaatc ctgagaagac 1320

aggaagactt ctacccgttc ctgaaggaca acagagaaaa gatcgaaaag atcctgacat 1380

tcagaatccc gtactacgtc ggaccgctgg caagaggaaa cagcagattc gcatggatga 1440

caagaaagag cgaagaaaca atcacaccgt ggaacttcga agaagtcgtc gacaagggag 1500

caagcgcaca gagcttcatc gaaagaatga caaacttcga caagaacctg ccgaacgaaa 1560

aggtcctgcc gaagcacagc ctgctgtacg aatacttcac agtctacaac gaactgacaa 1620

aggtcaagta cgtcacagaa ggaatgagaa agccggcatt cctgagcgga gaacagaaga 1680

aggcaatcgt cgacctgctg ttcaagacaa acagaaaggt cacagtcaag cagctgaagg 1740

aagactactt caagaagatc gaatgcttcg acagcgtcga aatcagcgga gtcgaagaca 1800

gattcaacgc aagcctggga acataccacg acctgctgaa gatcatcaag gacaaggact 1860

tcctggacaa cgaagaaaac gaagacatcc tggaagacat cgtcctgaca ctgacactgt 1920

tcgaagacag agaaatgatc gaagaaagac tgaagacata cgcacacctg ttcgacgaca 1980

aggtcatgaa gcagctgaag agaagaagat acacaggatg gggaagactg agcagaaagc 2040

tgatcaacgg aatcagagac aagcagagcg gaaagacaat cctggacttc ctgaagagcg 2100

acggattcgc aaacagaaac ttcatgcagc tgatccacga cgacagcctg acattcaagg 2160

aagacatcca gaaggcacag gtcagcggac agggagacag cctgcacgaa cacatcgcaa 2220

acctggcagg aagcccggca atcaagaagg gaatcctgca gacagtcaag gtcgtcgacg 2280

aactggtcaa ggtcatggga agacacaagc cggaaaacat cgtcatcgaa atggcaagag 2340

aaaaccagac aacacagaag ggacagaaga acagcagaga aagaatgaag agaatcgaag 2400

aaggaatcaa ggaactggga agccagatcc tgaaggaaca cccggtcgaa aacacacagc 2460

tgcagaacga aaagctgtac ctgtactacc tgcagaacgg aagagacatg tacgtcgacc 2520

aggaactgga catcaacaga ctgagcgact acgacgtcga ccacatcgtc ccgcagagct 2580

tcctgaagga cgacagcatc gacaacaagg tcctgacaag aagcgacaag aacagaggaa 2640

agagcgacaa cgtcccgagc gaagaagtcg tcaagaagat gaagaactac tggagacagc 2700

tgctgaacgc aaagctgatc acacagagaa agttcgacaa cctgacaaag gcagagagag 2760

gaggactgag cgaactggac aaggcaggat tcatcaagag acagctggtc gaaacaagac 2820

agatcacaaa gcacgtcgca cagatcctgg acagcagaat gaacacaaag tacgacgaaa 2880

acgacaagct gatcagagaa gtcaaggtca tcacactgaa gagcaagctg gtcagcgact 2940

tcagaaagga cttccagttc tacaaggtca gagaaatcaa caactaccac cacgcacacg 3000

acgcatacct gaacgcagtc gtcggaacag cactgatcaa gaagtacccg aagctggaaa 3060

gcgaattcgt ctacggagac tacaaggtct acgacgtcag aaagatgatc gcaaagagcg 3120

aacaggaaat cggaaaggca acagcaaagt acttcttcta cagcaacatc atgaacttct 3180

tcaagacaga aatcacactg gcaaacggag aaatcagaaa gagaccgctg atcgaaacaa 3240

acggagaaac aggagaaatc gtctgggaca agggaagaga cttcgcaaca gtcagaaagg 3300

tcctgagcat gccgcaggtc aacatcgtca agaagacaga agtccagaca ggaggattca 3360

gcaaggaaag catcctgccg aagagaaaca gcgacaagct gatcgcaaga aagaaggact 3420

gggacccgaa gaagtacgga ggattcgaca gcccgacagt cgcatacagc gtcctggtcg 3480

tcgcaaaggt cgaaaaggga aagagcaaga agctgaagag cgtcaaggaa ctgctgggaa 3540

tcacaatcat ggaaagaagc agcttcgaaa agaacccgat cgacttcctg gaagcaaagg 3600

gatacaagga agtcaagaag gacctgatca tcaagctgcc gaagtacagc ctgttcgaac 3660

tggaaaacgg aagaaagaga atgctggcaa gcgcaggaga actgcagaag ggaaacgaac 3720

tggcactgcc gagcaagtac gtcaacttcc tgtacctggc aagccactac gaaaagctga 3780

agggaagccc ggaagacaac gaacagaagc agctgttcgt cgaacagcac aagcactacc 3840

tggacgaaat catcgaacag atcagcgaat tcagcaagag agtcatcctg gcagacgcaa 3900

acctggacaa ggtcctgagc gcatacaaca agcacagaga caagccgatc agagaacagg 3960

cagaaaacat catccacctg ttcacactga caaacctggg agcaccggca gcattcaagt 4020

acttcgacac aacaatcgac agaaagagat acacaagcac aaaggaagtc ctggacgcaa 4080

cactgatcca ccagagcatc acaggactgt acgaaacaag aatcgacctg agccagctgg 4140

gaggagacgg aggaggaagc ccgaagaaga agagaaaggt ctagctagca ccagcctcaa 4200

gaacacccga atggagtctc taagctacat aataccaact tacactttac aaaatgttgt 4260

cccccaaaat gtagccattc gtatctgctc ctaataaaaa gaaagtttct tcacattctc 4320

tcgag 4325


<210> 61
<211> 4411
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 61
aggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60

attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120

cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180

gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240

cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300

aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360

cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420

acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480

ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540

cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600

cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660

gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720

actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780

cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840

cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900

ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960

cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020

accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080

gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140

caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200

catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260

agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320

cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380

caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440

ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500

gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560

gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620

cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680

aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740

aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800

cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860

cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920

cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980

actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040

atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100

cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160

gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220

acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280

gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340

gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400

gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460

cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520

cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580

ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640

ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700

cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760

aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820

attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880

ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940

catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000

cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060

agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120

ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180

gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240

agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300

caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360

caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420

cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480

cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540

gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600

aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660

catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720

aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780

cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840

gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900

attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960

caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020

gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080

atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140

gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200

gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260

gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320

ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380

tcaattaata aaaaatggaa agaacctcga g 4411


<210> 62
<211> 105
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 62
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gcgaaaaaaa aaaaaaaaaa aaaaaaaaaa 60

aaaccgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 105


<210> 63
<211> 93
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
oligonucleotide"

<400> 63
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 93


<210> 64
<211> 100
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"


<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage

<220>
<221> modified_base
<222> (97)..(99)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage

<400> 64
ccaguccagc gaggcaaagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100


<210> 65
<211> 3312
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 65
atggcagcat tcaagccgaa ctcgatcaac tacatcctgg gactggacat cggaatcgca 60

tcggtcggat gggcaatggt cgaaatcgac gaagaagaaa acccgatcag actgatcgac 120

ctgggagtca gagtcttcga aagagcagaa gtcccgaaga caggagactc gctggcaatg 180

gcaagaagac tggcaagatc ggtcagaaga ctgacaagaa gaagagcaca cagactgctg 240

agaacaagaa gactgctgaa gagagaagga gtcctgcagg cagcaaactt cgacgaaaac 300

ggactgatca agtcgctgcc gaacacaccg tggcagctga gagcagcagc actggacaga 360

aagctgacac cgctggaatg gtcggcagtc ctgctgcacc tgatcaagca cagaggatac 420

ctgtcgcaga gaaagaacga aggagaaaca gcagacaagg aactgggagc actgctgaag 480

ggagtcgcag gaaacgcaca cgcactgcag acaggagact tcagaacacc ggcagaactg 540

gcactgaaca agttcgaaaa ggaatcggga cacatcagaa accagagatc ggactactcg 600

cacacattct cgagaaagga cctgcaggca gaactgatcc tgctgttcga aaagcagaag 660

gaattcggaa acccgcacgt ctcgggagga ctgaaggaag gaatcgaaac actgctgatg 720

acacagagac cggcactgtc gggagacgca gtccagaaga tgctgggaca ctgcacattc 780

gaaccggcag aaccgaaggc agcaaagaac acatacacag cagaaagatt catctggctg 840

acaaagctga acaacctgag aatcctggaa cagggatcgg aaagaccgct gacagacaca 900

gaaagagcaa cactgatgga cgaaccgtac agaaagtcga agctgacata cgcacaggca 960

agaaagctgc tgggactgga agacacagca ttcttcaagg gactgagata cggaaaggac 1020

aacgcagaag catcgacact gatggaaatg aaggcatacc acgcaatctc gagagcactg 1080

gaaaaggaag gactgaagga caagaagtcg ccgctgaacc tgtcgccgga actgcaggac 1140

gaaatcggaa cagcattctc gctgttcaag acagacgaag acatcacagg aagactgaag 1200

gacagaatcc agccggaaat cctggaagca ctgctgaagc acatctcgtt cgacaagttc 1260

gtccagatct cgctgaaggc actgagaaga atcgtcccgc tgatggaaca gggaaagaga 1320

tacgacgaag catgcgcaga aatctacgga gaccactacg gaaagaagaa cacagaagaa 1380

aagatctacc tgccgccgat cccggcagac gaaatcagaa acccggtcgt cctgagagca 1440

ctgtcgcagg caagaaaggt catcaacgga gtcgtcagaa gatacggatc gccggcaaga 1500

atccacatcg aaacagcaag agaagtcgga aagtcgttca aggacagaaa ggaaatcgaa 1560

aagagacagg aagaaaacag aaaggacaga gaaaaggcag cagcaaagtt cagagaatac 1620

ttcccgaact tcgtcggaga accgaagtcg aaggacatcc tgaagctgag actgtacgaa 1680

cagcagcacg gaaagtgcct gtactcggga aaggaaatca acctgggaag actgaacgaa 1740

aagggatacg tcgaaatcga ccacgcactg ccgttctcga gaacatggga cgactcgttc 1800

aacaacaagg tcctggtcct gggatcggaa aaccagaaca agggaaacca gacaccgtac 1860

gaatacttca acggaaagga caactcgaga gaatggcagg aattcaaggc aagagtcgaa 1920

acatcgagat tcccgagatc gaagaagcag agaatcctgc tgcagaagtt cgacgaagac 1980

ggattcaagg aaagaaacct gaacgacaca agatacgtca acagattcct gtgccagttc 2040

gtcgcagaca gaatgagact gacaggaaag ggaaagaaga gagtcttcgc atcgaacgga 2100

cagatcacaa acctgctgag aggattctgg ggactgagaa aggtcagagc agaaaacgac 2160

agacaccacg cactggacgc agtcgtcgtc gcatgctcga cagtcgcaat gcagcagaag 2220

atcacaagat tcgtcagata caaggaaatg aacgcattcg acggaaagac aatcgacaag 2280

gaaacaggag aagtcctgca ccagaagaca cacttcccgc agccgtggga attcttcgca 2340

caggaagtca tgatcagagt cttcggaaag ccggacggaa agccggaatt cgaagaagca 2400

gacacactgg aaaagctgag aacactgctg gcagaaaagc tgtcgtcgag accggaagca 2460

gtccacgaat acgtcacacc gctgttcgtc tcgagagcac cgaacagaaa gatgtcggga 2520

cagggacaca tggaaacagt caagtcggca aagagactgg acgaaggagt ctcggtcctg 2580

agagtcccgc tgacacagct gaagctgaag gacctggaaa agatggtcaa cagagaaaga 2640

gaaccgaagc tgtacgaagc actgaaggca agactggaag cacacaagga cgacccggca 2700

aaggcattcg cagaaccgtt ctacaagtac gacaaggcag gaaacagaac acagcaggtc 2760

aaggcagtca gagtcgaaca ggtccagaag acaggagtct gggtcagaaa ccacaacgga 2820

atcgcagaca acgcaacaat ggtcagagta gacgtcttcg aaaagggaga caagtactac 2880

ctggtcccga tctactcgtg gcaggtcgca aagggaatcc tgccggacag agcagtcgtc 2940

cagggaaagg acgaagaaga ctggcagctg atcgacgact cgttcaactt caagttctcg 3000

ctgcacccga acgacctggt cgaagtcatc acaaagaagg caagaatgtt cggatacttc 3060

gcatcgtgcc acagaggaac aggaaacatc aacatcagaa tccacgacct ggaccacaag 3120

atcggaaaga acggaatcct ggaaggaatc ggagtcaaga cagcactgtc gttccagaag 3180

taccagatcg acgaactggg aaaggaaatc agaccgtgca gactgaagaa gagaccgccg 3240

gtcagatccg gaaagagaac agcagacgga tcggaattcg aatcgccgaa gaagaagaga 3300

aaggtcgaat ga 3312


<210> 66
<211> 3306
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 66
gcagcattca agccgaactc gatcaactac atcctgggac tggacatcgg aatcgcatcg 60

gtcggatggg caatggtcga aatcgacgaa gaagaaaacc cgatcagact gatcgacctg 120

ggagtcagag tcttcgaaag agcagaagtc ccgaagacag gagactcgct ggcaatggca 180

agaagactgg caagatcggt cagaagactg acaagaagaa gagcacacag actgctgaga 240

acaagaagac tgctgaagag agaaggagtc ctgcaggcag caaacttcga cgaaaacgga 300

ctgatcaagt cgctgccgaa cacaccgtgg cagctgagag cagcagcact ggacagaaag 360

ctgacaccgc tggaatggtc ggcagtcctg ctgcacctga tcaagcacag aggatacctg 420

tcgcagagaa agaacgaagg agaaacagca gacaaggaac tgggagcact gctgaaggga 480

gtcgcaggaa acgcacacgc actgcagaca ggagacttca gaacaccggc agaactggca 540

ctgaacaagt tcgaaaagga atcgggacac atcagaaacc agagatcgga ctactcgcac 600

acattctcga gaaaggacct gcaggcagaa ctgatcctgc tgttcgaaaa gcagaaggaa 660

ttcggaaacc cgcacgtctc gggaggactg aaggaaggaa tcgaaacact gctgatgaca 720

cagagaccgg cactgtcggg agacgcagtc cagaagatgc tgggacactg cacattcgaa 780

ccggcagaac cgaaggcagc aaagaacaca tacacagcag aaagattcat ctggctgaca 840

aagctgaaca acctgagaat cctggaacag ggatcggaaa gaccgctgac agacacagaa 900

agagcaacac tgatggacga accgtacaga aagtcgaagc tgacatacgc acaggcaaga 960

aagctgctgg gactggaaga cacagcattc ttcaagggac tgagatacgg aaaggacaac 1020

gcagaagcat cgacactgat ggaaatgaag gcataccacg caatctcgag agcactggaa 1080

aaggaaggac tgaaggacaa gaagtcgccg ctgaacctgt cgccggaact gcaggacgaa 1140

atcggaacag cattctcgct gttcaagaca gacgaagaca tcacaggaag actgaaggac 1200

agaatccagc cggaaatcct ggaagcactg ctgaagcaca tctcgttcga caagttcgtc 1260

cagatctcgc tgaaggcact gagaagaatc gtcccgctga tggaacaggg aaagagatac 1320

gacgaagcat gcgcagaaat ctacggagac cactacggaa agaagaacac agaagaaaag 1380

atctacctgc cgccgatccc ggcagacgaa atcagaaacc cggtcgtcct gagagcactg 1440

tcgcaggcaa gaaaggtcat caacggagtc gtcagaagat acggatcgcc ggcaagaatc 1500

cacatcgaaa cagcaagaga agtcggaaag tcgttcaagg acagaaagga aatcgaaaag 1560

agacaggaag aaaacagaaa ggacagagaa aaggcagcag caaagttcag agaatacttc 1620

ccgaacttcg tcggagaacc gaagtcgaag gacatcctga agctgagact gtacgaacag 1680

cagcacggaa agtgcctgta ctcgggaaag gaaatcaacc tgggaagact gaacgaaaag 1740

ggatacgtcg aaatcgacca cgcactgccg ttctcgagaa catgggacga ctcgttcaac 1800

aacaaggtcc tggtcctggg atcggaaaac cagaacaagg gaaaccagac accgtacgaa 1860

tacttcaacg gaaaggacaa ctcgagagaa tggcaggaat tcaaggcaag agtcgaaaca 1920

tcgagattcc cgagatcgaa gaagcagaga atcctgctgc agaagttcga cgaagacgga 1980

ttcaaggaaa gaaacctgaa cgacacaaga tacgtcaaca gattcctgtg ccagttcgtc 2040

gcagacagaa tgagactgac aggaaaggga aagaagagag tcttcgcatc gaacggacag 2100

atcacaaacc tgctgagagg attctgggga ctgagaaagg tcagagcaga aaacgacaga 2160

caccacgcac tggacgcagt cgtcgtcgca tgctcgacag tcgcaatgca gcagaagatc 2220

acaagattcg tcagatacaa ggaaatgaac gcattcgacg gaaagacaat cgacaaggaa 2280

acaggagaag tcctgcacca gaagacacac ttcccgcagc cgtgggaatt cttcgcacag 2340

gaagtcatga tcagagtctt cggaaagccg gacggaaagc cggaattcga agaagcagac 2400

acactggaaa agctgagaac actgctggca gaaaagctgt cgtcgagacc ggaagcagtc 2460

cacgaatacg tcacaccgct gttcgtctcg agagcaccga acagaaagat gtcgggacag 2520

ggacacatgg aaacagtcaa gtcggcaaag agactggacg aaggagtctc ggtcctgaga 2580

gtcccgctga cacagctgaa gctgaaggac ctggaaaaga tggtcaacag agaaagagaa 2640

ccgaagctgt acgaagcact gaaggcaaga ctggaagcac acaaggacga cccggcaaag 2700

gcattcgcag aaccgttcta caagtacgac aaggcaggaa acagaacaca gcaggtcaag 2760

gcagtcagag tcgaacaggt ccagaagaca ggagtctggg tcagaaacca caacggaatc 2820

gcagacaacg caacaatggt cagagtagac gtcttcgaaa agggagacaa gtactacctg 2880

gtcccgatct actcgtggca ggtcgcaaag ggaatcctgc cggacagagc agtcgtccag 2940

ggaaaggacg aagaagactg gcagctgatc gacgactcgt tcaacttcaa gttctcgctg 3000

cacccgaacg acctggtcga agtcatcaca aagaaggcaa gaatgttcgg atacttcgca 3060

tcgtgccaca gaggaacagg aaacatcaac atcagaatcc acgacctgga ccacaagatc 3120

ggaaagaacg gaatcctgga aggaatcgga gtcaagacag cactgtcgtt ccagaagtac 3180

cagatcgacg aactgggaaa ggaaatcaga ccgtgcagac tgaagaagag accgccggtc 3240

agatccggaa agagaacagc agacggatcg gaattcgaat cgccgaagaa gaagagaaag 3300

gtcgaa 3306


<210> 67
<211> 3636
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 67
gggagaccca agctggctag cgtttaaact taagcttgga tccgccacca tggcagcatt 60

caagccgaac tcgatcaact acatcctggg actggacatc ggaatcgcat cggtcggatg 120

ggcaatggtc gaaatcgacg aagaagaaaa cccgatcaga ctgatcgacc tgggagtcag 180

agtcttcgaa agagcagaag tcccgaagac aggagactcg ctggcaatgg caagaagact 240

ggcaagatcg gtcagaagac tgacaagaag aagagcacac agactgctga gaacaagaag 300

actgctgaag agagaaggag tcctgcaggc agcaaacttc gacgaaaacg gactgatcaa 360

gtcgctgccg aacacaccgt ggcagctgag agcagcagca ctggacagaa agctgacacc 420

gctggaatgg tcggcagtcc tgctgcacct gatcaagcac agaggatacc tgtcgcagag 480

aaagaacgaa ggagaaacag cagacaagga actgggagca ctgctgaagg gagtcgcagg 540

aaacgcacac gcactgcaga caggagactt cagaacaccg gcagaactgg cactgaacaa 600

gttcgaaaag gaatcgggac acatcagaaa ccagagatcg gactactcgc acacattctc 660

gagaaaggac ctgcaggcag aactgatcct gctgttcgaa aagcagaagg aattcggaaa 720

cccgcacgtc tcgggaggac tgaaggaagg aatcgaaaca ctgctgatga cacagagacc 780

ggcactgtcg ggagacgcag tccagaagat gctgggacac tgcacattcg aaccggcaga 840

accgaaggca gcaaagaaca catacacagc agaaagattc atctggctga caaagctgaa 900

caacctgaga atcctggaac agggatcgga aagaccgctg acagacacag aaagagcaac 960

actgatggac gaaccgtaca gaaagtcgaa gctgacatac gcacaggcaa gaaagctgct 1020

gggactggaa gacacagcat tcttcaaggg actgagatac ggaaaggaca acgcagaagc 1080

atcgacactg atggaaatga aggcatacca cgcaatctcg agagcactgg aaaaggaagg 1140

actgaaggac aagaagtcgc cgctgaacct gtcgccggaa ctgcaggacg aaatcggaac 1200

agcattctcg ctgttcaaga cagacgaaga catcacagga agactgaagg acagaatcca 1260

gccggaaatc ctggaagcac tgctgaagca catctcgttc gacaagttcg tccagatctc 1320

gctgaaggca ctgagaagaa tcgtcccgct gatggaacag ggaaagagat acgacgaagc 1380

atgcgcagaa atctacggag accactacgg aaagaagaac acagaagaaa agatctacct 1440

gccgccgatc ccggcagacg aaatcagaaa cccggtcgtc ctgagagcac tgtcgcaggc 1500

aagaaaggtc atcaacggag tcgtcagaag atacggatcg ccggcaagaa tccacatcga 1560

aacagcaaga gaagtcggaa agtcgttcaa ggacagaaag gaaatcgaaa agagacagga 1620

agaaaacaga aaggacagag aaaaggcagc agcaaagttc agagaatact tcccgaactt 1680

cgtcggagaa ccgaagtcga aggacatcct gaagctgaga ctgtacgaac agcagcacgg 1740

aaagtgcctg tactcgggaa aggaaatcaa cctgggaaga ctgaacgaaa agggatacgt 1800

cgaaatcgac cacgcactgc cgttctcgag aacatgggac gactcgttca acaacaaggt 1860

cctggtcctg ggatcggaaa accagaacaa gggaaaccag acaccgtacg aatacttcaa 1920

cggaaaggac aactcgagag aatggcagga attcaaggca agagtcgaaa catcgagatt 1980

cccgagatcg aagaagcaga gaatcctgct gcagaagttc gacgaagacg gattcaagga 2040

aagaaacctg aacgacacaa gatacgtcaa cagattcctg tgccagttcg tcgcagacag 2100

aatgagactg acaggaaagg gaaagaagag agtcttcgca tcgaacggac agatcacaaa 2160

cctgctgaga ggattctggg gactgagaaa ggtcagagca gaaaacgaca gacaccacgc 2220

actggacgca gtcgtcgtcg catgctcgac agtcgcaatg cagcagaaga tcacaagatt 2280

cgtcagatac aaggaaatga acgcattcga cggaaagaca atcgacaagg aaacaggaga 2340

agtcctgcac cagaagacac acttcccgca gccgtgggaa ttcttcgcac aggaagtcat 2400

gatcagagtc ttcggaaagc cggacggaaa gccggaattc gaagaagcag acacactgga 2460

aaagctgaga acactgctgg cagaaaagct gtcgtcgaga ccggaagcag tccacgaata 2520

cgtcacaccg ctgttcgtct cgagagcacc gaacagaaag atgtcgggac agggacacat 2580

ggaaacagtc aagtcggcaa agagactgga cgaaggagtc tcggtcctga gagtcccgct 2640

gacacagctg aagctgaagg acctggaaaa gatggtcaac agagaaagag aaccgaagct 2700

gtacgaagca ctgaaggcaa gactggaagc acacaaggac gacccggcaa aggcattcgc 2760

agaaccgttc tacaagtacg acaaggcagg aaacagaaca cagcaggtca aggcagtcag 2820

agtcgaacag gtccagaaga caggagtctg ggtcagaaac cacaacggaa tcgcagacaa 2880

cgcaacaatg gtcagagtag acgtcttcga aaagggagac aagtactacc tggtcccgat 2940

ctactcgtgg caggtcgcaa agggaatcct gccggacaga gcagtcgtcc agggaaagga 3000

cgaagaagac tggcagctga tcgacgactc gttcaacttc aagttctcgc tgcacccgaa 3060

cgacctggtc gaagtcatca caaagaaggc aagaatgttc ggatacttcg catcgtgcca 3120

cagaggaaca ggaaacatca acatcagaat ccacgacctg gaccacaaga tcggaaagaa 3180

cggaatcctg gaaggaatcg gagtcaagac agcactgtcg ttccagaagt accagatcga 3240

cgaactggga aaggaaatca gaccgtgcag actgaagaag agaccgccgg tcagatccgg 3300

aaagagaaca gcagacggat cggaattcga atcgccgaag aagaagagaa aggtcgaatg 3360

atagctagct cgagtctaga gggcccgttt aaacccgctg atcagcctcg actgtgcctt 3420

ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 3480

ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 3540

gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3600

atagcaggca tgctggggat gcggtgggct ctatgg 3636


<210> 68
<211> 1103
<212> PRT
<213> Neisseria meningitidis

<400> 68
Met Ala Ala Phe Lys Pro Asn Ser Ile Asn Tyr Ile Leu Gly Leu Asp
1 5 10 15


Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu
20 25 30


Glu Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg
35 40 45


Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu
50 55 60


Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu
65 70 75 80


Arg Thr Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asn
85 90 95


Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln
100 105 110


Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser
115 120 125


Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg
130 135 140


Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys
145 150 155 160


Gly Val Ala Gly Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr
165 170 175


Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile
180 185 190


Arg Asn Gln Arg Ser Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu
195 200 205


Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn
210 215 220


Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met
225 230 235 240


Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly
245 250 255


His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr
260 265 270


Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile
275 280 285


Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr
290 295 300


Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala
305 310 315 320


Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg
325 330 335


Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala
340 345 350


Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys
355 360 365


Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr
370 375 380


Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys
385 390 395 400


Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser
405 410 415


Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val
420 425 430


Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile
435 440 445


Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu
450 455 460


Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala
465 470 475 480


Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly
485 490 495


Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser
500 505 510


Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys
515 520 525


Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe
530 535 540


Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu
545 550 555 560


Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly
565 570 575


Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe
580 585 590


Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly
595 600 605


Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn
610 615 620


Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu
625 630 635 640


Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys
645 650 655


Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr
660 665 670


Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr
675 680 685


Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn
690 695 700


Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp
705 710 715 720


Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala
725 730 735


Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala
740 745 750


Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln
755 760 765


Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met
770 775 780


Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala
785 790 795 800


Asp Thr Leu Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser
805 810 815


Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg
820 825 830


Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys
835 840 845


Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu
850 855 860


Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg
865 870 875 880


Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys
885 890 895


Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys
900 905 910


Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val
915 920 925


Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn
930 935 940


Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr
945 950 955 960


Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp
965 970 975


Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp
980 985 990


Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu
995 1000 1005


Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys
1010 1015 1020


His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp
1025 1030 1035


His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys
1040 1045 1050


Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys
1055 1060 1065


Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg Ser
1070 1075 1080


Gly Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys
1085 1090 1095


Lys Arg Lys Val Glu
1100


<210> 69
<211> 100
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"


<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage

<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified

<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage

<400> 69
gccgagucug gagagcugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100


<210> 70
<211> 100
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"


<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage

<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified

<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage

<400> 70
acacaaauac caguccagcg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100


<210> 71
<211> 100
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"


<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage

<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified

<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage

<400> 71
aaaguucuag augccguccg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100


<210> 72
<211> 100
<212> RNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"


<220>
<221> modified_base
<222> (1)..(3)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (1)..(4)
<223> Phosphorothioate linkage

<220>
<221> modified_base
<222> (29)..(40)
<223> 2'-O-methyl modified

<220>
<221> modified_base
<222> (69)..(100)
<223> 2'-O-methyl modified

<220>
<221> misc_feature
<222> (97)..(100)
<223> Phosphorothioate linkage

<400> 72
acgcaaauau caguccagcg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60

cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100


<210> 73
<211> 7
<212> PRT
<213> Simian virus 40

<400> 73
Pro Lys Lys Lys Arg Lys Val
1 5


<210> 74
<211> 7
<212> PRT
<213> Simian virus 40

<400> 74
Pro Lys Lys Lys Arg Arg Val
1 5


<210> 75
<211> 16
<212> PRT
<213> Unknown

<220>
<221> source
<223> /note="Description of Unknown:
Nucleoplasmin bipartite NLS sequence"

<400> 75
Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys
1 5 10 15


<210> 76
<211> 6
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
6xHis tag"

<400> 76
His His His His His His
1 5


<210> 77
<211> 8
<212> PRT
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
8xHis tag"

<400> 77
His His His His His His His His
1 5


<210> 78
<211> 10
<212> RNA
<213> Unknown

<220>
<221> source
<223> /note="Description of Unknown:
Kozak sequence"

<400> 78
gccrccaugg 10


<210> 79
<211> 13
<212> RNA
<213> Unknown

<220>
<221> source
<223> /note="Description of Unknown:
Kozak sequence"

<400> 79
gccgccrcca ugg 13


<210> 80
<211> 56
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"

<400> 80
cactctttcc ctacacgacg ctcttccgat ctgttttgtt ccagagtcta tcaccg 56


<210> 81
<211> 52
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"

<400> 81
ggagttcaga cgtgtgctct tccgatctac acgaataaga gcaaatggga ac 52


<210> 82
<211> 55
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"

<400> 82
cactctttcc ctacacgacg ctcttccgat cttgcatttc atgagaccga aaaca 55


<210> 83
<211> 55
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
primer"

<400> 83
ggagttcaga cgtgtgctct tccgatctgc tacagtagag ctgtacataa aactt 55


<210> 84
<211> 3783
<212> DNA
<213> Artificial Sequence

<220>
<221> source
<223> /note="Description of Artificial Sequence: Synthetic
polynucleotide"

<400> 84
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60

cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120

ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180

accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240

attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300

tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360

tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ctaatacgac tcactatagg 420

gtcccgcagt cggcgtccag cggctctgct tgttcgtgtg tgtgtcgttg caggccttat 480

tcggatccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 540

agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 600

ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 660

ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc 720

acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 780

ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 840

acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 900

tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc 960

agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc 1020

agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1080

acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc 1140

acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1200

acaagtaata ggaattatgc agtctagcca tcacatttaa aagcatctca gcctaccatg 1260

agaataagag aaagaaaatg aagatcaata gcttattcat ctctttttct ttttcgttgg 1320

tgtaaagcca acaccctgtc taaaaaacat aaatttcttt aatcattttg cctcttttct 1380

ctgtgcttca attaataaaa aatggaaaga acctcgagaa aaaaaaaaaa aaaaaaaaaa 1440

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1500

aaaaaaaaaa aaaaaaaatc tagacttaag cttgatgagc tctagcttgg cgtaatcatg 1560

gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 1620

cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 1680

gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 1740

cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 1800

tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 1860

aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 1920

gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1980

ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 2040

ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 2100

gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 2160

ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 2220

cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 2280

cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 2340

gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 2400

aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 2460

tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 2520

gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2580

tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2640

gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2700

tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2760

ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2820

ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 2880

tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2940

aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 3000

gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 3060

gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 3120

ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 3180

gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 3240

gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 3300

gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 3360

tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 3420

gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 3480

agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3540

aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3600

ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3660

gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 3720

agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 3780

tcg 3783

Claims (75)

  1. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約50~60モル%のアミン脂質と、
    約8~10モル%の中性脂質と、
    約2.5~4モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約6である、前記脂質ナノ粒子(「LNP」)組成物。
  2. RNA成分と、
    約50~60モル%のアミン脂質と、
    約27~39.5モル%のヘルパー脂質と、
    約8~10モル%の中性脂質と、
    約2.5~4モル%のPEG脂質と
    を含み、ここで、LNP組成物のN/P比は約5~7である、前記LNP組成物。
  3. 前記N/P比は約6である、請求項2に記載のLNP組成物。
  4. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約50~60モル%のアミン脂質と、
    約5~15モル%の中性脂質と、
    約2.5~4モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約3~10である、前記LNP組成物。
  5. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約40~60モル%のアミン脂質と、
    約5~15モル%の中性脂質と、
    約2.5~4モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約6である、前記LNP組成物。
  6. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約50~60モル%のアミン脂質と、
    約5~15モル%の中性脂質と、
    約1.5~10モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約6である、前記LNP組成物。
  7. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約40~60モル%のアミン脂質と、
    約0~10モル%の中性脂質と、
    約1.5~10モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約3~10である、前記LNP組成物。
  8. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約40~60モル%のアミン脂質と、
    約1モル%未満の中性脂質と、
    約1.5~10モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約3~10である、前記LNP組成物。
  9. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約40~60モル%のアミン脂質と、
    約1.5~10モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約3~10であり、かつ
    前記LNP組成物は中性リン脂質を本質的に含まないかまたは含まない、前記LNP組成物。
  10. RNA成分と、
    脂質成分とを含み、ここで、前記脂質成分は、
    約50~60モル%のアミン脂質と、
    約8~10モル%の中性脂質と、
    約2.5~4モル%のPEG脂質と
    を含み、ここで、前記脂質成分の残部はヘルパー脂質であり、
    LNP組成物のN/P比は約3~7である、前記LNP組成物。
  11. 前記RNA成分はmRNAを含む、先行請求項いずれかに記載の組成物。
  12. 前記RNA成分は、RNA誘導型DNA結合因子、例えば、CasヌクレアーゼmRNAなどを含む、先行請求項いずれかに記載の組成物。
  13. 前記RNA成分はクラス2CasヌクレアーゼmRNAを含む、先行請求項いずれかに記載の組成物。
  14. 前記RNA成分はCas9ヌクレアーゼmRNAを含む、先行請求項いずれかに記載の組成物。
  15. 前記mRNAは修飾mRNAである、請求項11~14のいずれかに記載の組成物。
  16. 前記RNA成分は、RNA誘導型DNA結合因子をコードするオープンリーディングフレームを含むRNAを含み、ここで、前記オープンリーディングフレームはウリジン含量が、その最小ウリジン含量から、前記最小ウリジン含量の150%までの範囲である、先行請求項いずれかに記載の組成物。
  17. 前記RNA成分は、RNA誘導型DNA結合因子をコードするオープンリーディングフレームを含むmRNAを含み、ここで、前記オープンリーディングフレームはウリジンジヌクレオチド含量が、その最小ウリジンジヌクレオチド含量から、前記最小ウリジンジヌクレオチド含量の150%までの範囲である、先行請求項いずれかに記載の組成物。
  18. 前記RNA成分は、配列番号1、4、7、9、10、11、12、14、15、17、18、20、21、23、24、26、27、29、30、50、52、54、65、または66のいずれか1つに対する同一性が少なくとも90%である配列を含むmRNAを含み、ここで、前記mRNAは、RNA誘導型DNA結合因子をコードするオープンリーディングフレームを含む、先行請求項いずれかに記載の組成物。
  19. 前記RNA成分はgRNA核酸を含む、先行請求項のいずれかに記載の組成物。
  20. 前記gRNA核酸はgRNAである、請求項19に記載の組成物。
  21. 前記RNA成分はクラス2CasヌクレアーゼmRNA及びgRNAを含む、先行請求項いずれかに記載の組成物。
  22. 前記gRNA核酸は、二重ガイドRNA(dgRNA)であるかまたはそれをコードする、請求項19~21のいずれかに記載の組成物。
  23. 前記gRNA核酸は、sgRNAであるかまたはそれをコードする、請求項19~21のいずれかに記載の組成物。
  24. 前記gRNAは修飾されている、請求項19~23のいずれかに記載の組成物。
  25. 前記gRNAは、2’-O-メチル(2’-O-Me)修飾ヌクレオチド、ヌクレオチド間のホスホロチオアート(PS)結合、及び2’-フルオロ(2’-F)修飾ヌクレオチドから選ばれる修飾を含む、請求項24に記載の組成物。
  26. 前記gRNAは、5’末端の最初の5ヌクレオチドの1つ以上における修飾を含む、請求項24~25のいずれかに記載の組成物。
  27. 前記gRNAは、3’末端の最後の5ヌクレオチドの1つ以上における修飾を含む、請求項24~26のいずれかに記載の組成物。
  28. 前記gRNAは、最初の4ヌクレオチド間にPS結合を含む、請求項24~27のいずれかに記載の組成物。
  29. 前記gRNAは、最後の4ヌクレオチド間にPS結合を含む、請求項24~28のいずれかに記載の組成物。
  30. 5’末端の最初の3ヌクレオチドに2’-O-Me修飾ヌクレオチドをさらに含む、請求項24~29のいずれかに記載の組成物。
  31. 3’末端の最後の3ヌクレオチドに2’-O-Me修飾ヌクレオチドをさらに含む、請求項24~30のいずれかに記載の組成物。
  32. 前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約10:1~約1:10の範囲の比で存在する、請求項19~31のいずれかに記載の組成物。
  33. 前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約5:1~約1:5の範囲の比で存在する、請求項19~31のいずれかに記載の組成物。
  34. 前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約3:1~約1:1の範囲の比で存在する、請求項19~33のいずれかに記載の組成物。
  35. 前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約2:1~約1:1の範囲の比で存在する、請求項19~34のいずれかに記載の組成物。
  36. 前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約2:1の比で存在する、請求項19~35のいずれかに記載の組成物。
  37. 前記gRNA及びクラス2CasヌクレアーゼmRNAは、重量基準で約1:1の比で存在する、請求項19~35のいずれかに記載の組成物。
  38. 少なくとも1つの鋳型をさらに含む、先行請求項いずれかに記載の組成物。
  39. 前記PEG脂質のモル%は約3である、先行請求項いずれかに記載の組成物。
  40. 前記アミン脂質のモル%は約50である、先行請求項いずれかに記載の組成物。
  41. 前記アミン脂質のモル%は約55である、先行請求項いずれかに記載の組成物。
  42. 前記アミン脂質のモル%は±3モル%である、先行請求項いずれかに記載の組成物。
  43. 前記アミン脂質のモル%は±2モル%である、先行請求項いずれかに記載の組成物。
  44. 前記アミン脂質のモル%は47~53モル%である、先行請求項いずれかに記載の組成物。
  45. 前記アミン脂質のモル%は48~53モル%である、先行請求項いずれかに記載の組成物。
  46. 前記アミン脂質のモル%は53~57モル%である、先行請求項いずれかに記載の組成物。
  47. 前記N/P比は6±1である、先行請求項いずれかに記載の組成物。
  48. 前記N/P比は6±0.5である、先行請求項いずれかに記載の組成物。
  49. 前記アミン脂質はリピドAである、先行請求項いずれかに記載の組成物。
  50. 前記アミン脂質はリピドAの類似体である、先行請求項いずれかに記載の組成物。
  51. 前記類似体はアセタール類似体である、請求項50に記載の組成物。
  52. 前記アセタール類似体はC4-C12アセタール類似体である、請求項51に記載の組成物。
  53. 前記アセタール類似体はC5-C12アセタール類似体である、請求項50に記載の組成物。
  54. 前記アセタール類似体はC5-C10アセタール類似体である、請求項50に記載の組成物。
  55. 前記アセタール類似体は、C4類似体、C5類似体、C6類似体、C7類似体、C9類似体、C10類似体、C11類似体、及びC12類似体から選ばれる、請求項50に記載の組成物。
  56. 前記ヘルパー脂質はコレステロールである、先行請求項いずれかに記載の組成物。
  57. 前記中性脂質はDSPCである、先行請求項いずれかに記載の組成物。
  58. 前記中性脂質はDPPCである、先行請求項いずれかに記載の組成物。
  59. 前記PEG脂質はジミリストイルグリセロール(DMG)を含む、先行請求項いずれかに記載の組成物。
  60. 前記PEG脂質はPEG-2kを含む、先行請求項いずれかに記載の組成物。
  61. 前記PEG脂質はPEG-DMGである、先行請求項いずれかに記載の組成物。
  62. 前記PEG-DMGはPEG2k-DMGである、請求項61に記載の組成物。
  63. 前記LNP組成物は中性脂質を本質的に含まない、請求項9に記載の組成物。
  64. 前記中性脂質はリン脂質である、請求項63に記載の組成物。
  65. 細胞を、請求項12~64のいずれかに記載のLNP組成物と接触させることを含む、遺伝子編集方法。
  66. クラス2CasヌクレアーゼmRNA及びガイドRNA核酸を細胞に送達することを含む遺伝子編集方法であって、前記クラス2Cas mRNA及び前記ガイドRNA核酸は、請求項13~64のいずれかに記載の少なくとも1つのLNP組成物として製剤化される、前記方法。
  67. 細胞を、請求項12~64のいずれかに記載の少なくとも1つのLNP組成物と接触させることを含む、遺伝子操作された細胞を作製する方法。
  68. 前記LNP組成物を少なくとも2回投与する、請求項65~67のいずれかに記載の方法。
  69. 前記LNP組成物を2~5回投与する、請求項68に記載の方法。
  70. 再投与時に編集が改善する、請求項68または69に記載の方法。
  71. 少なくとも1つの鋳型核酸を前記細胞に導入することをさらに含む、請求項65~70のいずれかに記載の方法。
  72. 前記mRNAを第1のLNP組成物に製剤化し、前記ガイドRNA核酸を第2のLNP組成物に製剤化する、請求項65~71のいずれかに記載の方法。
  73. 前記第1及び第2のLNP組成物を同時に投与する、請求項72に記載の方法。
  74. 前記第1及び第2のLNP組成物を順次投与する、請求項72に記載の方法。
  75. 前記mRNA及び前記ガイドRNA核酸を単一のLNP組成物に製剤化する、請求項65~73のいずれかに記載の方法。
JP2023082312A 2017-09-29 2023-05-18 製剤 Active JP7645929B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2025033724A JP2025084955A (ja) 2017-09-29 2025-03-04 製剤

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201762566240P 2017-09-29 2017-09-29
US62/566,240 2017-09-29
JP2020540244A JP7284179B2 (ja) 2017-09-29 2018-09-28 製剤

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2020540244A Division JP7284179B2 (ja) 2017-09-29 2018-09-28 製剤

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2025033724A Division JP2025084955A (ja) 2017-09-29 2025-03-04 製剤

Publications (2)

Publication Number Publication Date
JP2023103421A true JP2023103421A (ja) 2023-07-26
JP7645929B2 JP7645929B2 (ja) 2025-03-14

Family

ID=64267891

Family Applications (3)

Application Number Title Priority Date Filing Date
JP2020540244A Active JP7284179B2 (ja) 2017-09-29 2018-09-28 製剤
JP2023082312A Active JP7645929B2 (ja) 2017-09-29 2023-05-18 製剤
JP2025033724A Pending JP2025084955A (ja) 2017-09-29 2025-03-04 製剤

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2020540244A Active JP7284179B2 (ja) 2017-09-29 2018-09-28 製剤

Family Applications After (1)

Application Number Title Priority Date Filing Date
JP2025033724A Pending JP2025084955A (ja) 2017-09-29 2025-03-04 製剤

Country Status (30)

Country Link
US (1) US20230140670A1 (ja)
EP (2) EP3688162B1 (ja)
JP (3) JP7284179B2 (ja)
KR (2) KR20250042147A (ja)
CN (1) CN111406108A (ja)
AR (1) AR113031A1 (ja)
AU (2) AU2018338915C1 (ja)
BR (1) BR112020006300A2 (ja)
CA (1) CA3077413A1 (ja)
DK (1) DK3688162T3 (ja)
EA (1) EA202090868A1 (ja)
ES (1) ES2980114T3 (ja)
FI (1) FI3688162T3 (ja)
HR (1) HRP20240627T1 (ja)
HU (1) HUE066630T2 (ja)
IL (2) IL320823A (ja)
LT (1) LT3688162T (ja)
MX (2) MX2020007148A (ja)
MY (1) MY204993A (ja)
PH (1) PH12020552306A1 (ja)
PL (1) PL3688162T3 (ja)
PT (1) PT3688162T (ja)
RS (1) RS65493B1 (ja)
SA (1) SA520411636B1 (ja)
SG (1) SG11202002653UA (ja)
SI (1) SI3688162T1 (ja)
SM (1) SMT202400172T1 (ja)
TW (1) TWI833708B (ja)
UA (1) UA129257C2 (ja)
WO (1) WO2019067992A1 (ja)

Families Citing this family (119)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018165631A1 (en) 2017-03-09 2018-09-13 President And Fellows Of Harvard College Cancer vaccine
CN111801345A (zh) 2017-07-28 2020-10-20 哈佛大学的校长及成员们 使用噬菌体辅助连续进化(pace)的进化碱基编辑器的方法和组合物
JP7578590B2 (ja) 2018-10-18 2024-11-06 インテリア セラピューティクス,インコーポレーテッド 第ix因子を発現するための組成物及び方法
WO2020154500A1 (en) 2019-01-23 2020-07-30 The Broad Institute, Inc. Supernegatively charged proteins and uses thereof
MX2021011690A (es) 2019-03-28 2022-01-06 Intellia Therapeutics Inc Composiciones y métodos para la edición del gen ttr y el tratamiento de la amiloidosis attr que comprende un corticosteroide o uso de este.
BR112021019196A2 (pt) 2019-03-28 2022-01-18 Intellia Therapeutics Inc Composições e métodos compreendendo um rna guia de ttr e um polinucleotídeo codificando um agente de ligação de dna guiado por rna
JP2022536364A (ja) 2019-06-13 2022-08-15 ザ ジェネラル ホスピタル コーポレイション 操作されたヒト内在性ウイルス様粒子および細胞への送達のためのその使用方法
WO2021008708A1 (en) * 2019-07-18 2021-01-21 Biontech Rna Pharmaceuticals Gmbh Method for determining at least one parameter of a sample composition comprising nucleic acid, such as rna, and optionally particles
EP3999642A1 (en) 2019-07-19 2022-05-25 Flagship Pioneering Innovations VI, LLC Recombinase compositions and methods of use
EP4013385B1 (en) 2019-08-14 2024-07-03 Acuitas Therapeutics, Inc. Improved lipid nanoparticles for delivery of nucleic acids
TW202136509A (zh) * 2019-12-11 2021-10-01 美商英特利亞醫療公司 用於基因編輯之經修飾引導rna
MX2022010991A (es) 2020-03-04 2023-02-09 Flagship Pioneering Innovations Vi Llc Metodos y composiciones para modular un genoma.
CN116096429A (zh) 2020-04-09 2023-05-09 维乎医疗有限公司 Pcsk9的碱基编辑及其用于治疗疾病的使用方法
BR112022021676A2 (pt) 2020-04-28 2023-01-31 Intellia Therapeutics Inc Métodos de distribuição de célula in vitro
WO2021236980A1 (en) 2020-05-20 2021-11-25 Flagship Pioneering Innovations Vi, Llc Coronavirus antigen compositions and their uses
TW202208629A (zh) 2020-05-20 2022-03-01 美商旗艦先鋒創新有限責任公司 免疫原性組成物及其用途
US20230203510A1 (en) 2020-05-29 2023-06-29 Flagship Pioneering Innovations Vi, Llc Trem compositions and methods relating thereto
WO2021243301A2 (en) 2020-05-29 2021-12-02 Flagship Pioneering Innovations Vi, Llc. Trem compositions and methods relating thereto
AU2021310950A1 (en) 2020-07-24 2023-02-16 President And Fellows Of Harvard College Enhanced virus-like particles and methods of use thereof for delivery to cells
TW202218669A (zh) 2020-09-03 2022-05-16 美商旗艦先鋒創新有限責任公司 免疫原性組成物及其用途
WO2022060871A1 (en) 2020-09-15 2022-03-24 Verve Therapeutics, Inc. Lipid formulations for gene editing
KR20230124927A (ko) 2020-11-25 2023-08-28 아카제라 메디신즈, 인크. 핵산 전달을 위한 지질 나노입자, 및 관련 사용 방법
CA3204997A1 (en) 2020-12-11 2022-06-16 Intellia Therapeutics, Inc. Compositions and methods for reducing mhc class ii in a cell
CR20230305A (es) 2020-12-11 2023-11-10 Intellia Therapeutics Inc Polinucleótidos, composiciones y métodos para la edición del genoma que implican desaminación
AU2021409732A1 (en) 2020-12-23 2023-07-20 Intellia Therapeutics, Inc. Compositions and methods for reducing hla-a in a cell
CA3205042A1 (en) 2020-12-23 2022-06-30 Intellia Therapeutics, Inc. Compositions and methods for genetically modifying ciita in a cell
JP2024501288A (ja) 2020-12-23 2024-01-11 フラッグシップ パイオニアリング イノベーションズ シックス,エルエルシー 修飾tremの組成物及びその使用
WO2022147133A1 (en) 2020-12-30 2022-07-07 Intellia Therapeutics, Inc. Engineered t cells
WO2022212784A1 (en) 2021-03-31 2022-10-06 Flagship Pioneering Innovations V, Inc. Thanotransmission polypeptides and their use in treating cancer
IL307740A (en) 2021-04-17 2023-12-01 Intellia Therapeutics Inc DNA-dependent protein kinase inhibitors and their compositions and uses
AU2022290565A1 (en) 2021-06-10 2023-12-21 Intellia Therapeutics, Inc. Modified guide rnas comprising an internal linker for gene editing
AU2022296523A1 (en) 2021-06-22 2023-12-21 Intellia Therapeutics, Inc. Methods for in vivo editing of a liver gene
WO2023009547A1 (en) 2021-07-26 2023-02-02 Flagship Pioneering Innovations Vi, Llc Trem compositions and uses thereof
MX2024002927A (es) 2021-09-08 2024-05-29 Flagship Pioneering Innovations Vi Llc Metodos y composiciones para modular un genoma.
ES2994006T3 (en) 2021-09-17 2025-01-16 Flagship Pioneering Innovations Vi Llc Compositions and methods for producing circular polyribonucleotides
TW202322826A (zh) 2021-10-18 2023-06-16 美商旗艦先鋒創新有限責任公司 用於純化多核糖核苷酸之組成物及方法
US20240415980A1 (en) 2021-10-28 2024-12-19 Regeneron Pharmaceuticals, Inc. Crispr/cas-related methods and compositions for knocking out c5
TW202325848A (zh) 2021-11-03 2023-07-01 美商英特利亞醫療公司 用於基因體編輯之多核苷酸、組合物及方法
EP4436984A1 (en) 2021-11-24 2024-10-02 Flagship Pioneering Innovations VI, LLC Coronavirus immunogen compositions and their uses
CN118401544A (zh) 2021-11-24 2024-07-26 旗舰创业创新六公司 水痘-带状疱疹病毒免疫原组合物及其用途
EP4436598A2 (en) 2021-11-24 2024-10-02 Flagship Pioneering Innovations VI, LLC Immunogenic compositions and their uses
JP2024544013A (ja) 2021-12-03 2024-11-26 ザ ブロード インスティテュート,インコーポレーテッド 有効なin vivo送達のための組成物および方法
AU2022417517A1 (en) 2021-12-22 2024-06-27 Flagship Pioneering Innovations Vi, Llc Compositions and methods for purifying polyribonucleotides
CN118922211A (zh) 2021-12-23 2024-11-08 旗舰创业创新六公司 编码抗融合多肽的环状多核糖核苷酸
US20250032642A1 (en) 2022-02-02 2025-01-30 Regeneron Pharmaceuticals, Inc. Crispr-mediated transgene insertion in neonatal cells
KR20240157096A (ko) 2022-03-23 2024-10-31 나노베이션 테라퓨틱스 인크. 고 스테롤-함유 지질 나노입자
EP4499829A2 (en) 2022-03-29 2025-02-05 Accuredit Therapeutics (Suzhou) Co., Ltd. Compositions and methods for treatment of transthyretin amyloidosis
KR20240167063A (ko) 2022-04-01 2024-11-26 나노베이션 테라퓨틱스 인크. mRNA 전달 방법 및 이의 조성물
EP4504252A2 (en) 2022-04-08 2025-02-12 Flagship Pioneering Innovations VII, LLC Vaccines and related methods
US20250268940A1 (en) 2022-04-19 2025-08-28 Intellia Therapeutics, Inc. Chimeric antigen receptor compositions and uses
CN119487200A (zh) 2022-04-29 2025-02-18 瑞泽恩制药公司 用于基因治疗方法的组织特异性基因外安全港的鉴定
US20250302998A1 (en) 2022-05-09 2025-10-02 Regeneron Pharmaceuticals, Inc. Vectors and methods for in vivo antibody production
WO2023220083A1 (en) 2022-05-09 2023-11-16 Flagship Pioneering Innovations Vi, Llc Trem compositions and methods of use for treating proliferative disorders
JP2025516638A (ja) 2022-05-13 2025-05-30 フラッグシップ パイオニアリング イノベーションズ セブン,エルエルシー 二本鎖dna組成物及び関連する方法
WO2023225572A2 (en) 2022-05-17 2023-11-23 Nvelop Therapeutics, Inc. Compositions and methods for efficient in vivo delivery
CN119562806A (zh) 2022-05-25 2025-03-04 阿卡格拉医药公司 用于递送核酸的脂质纳米粒及其使用方法
WO2023235725A2 (en) 2022-05-31 2023-12-07 Regeneron Pharmaceuticals, Inc. Crispr-based therapeutics for c9orf72 repeat expansion disease
JP2025521154A (ja) 2022-05-31 2025-07-08 リジェネロン・ファーマシューティカルズ・インコーポレイテッド C9orf72反復伸長疾患のためのcrispr干渉療法
JP2023181989A (ja) * 2022-06-13 2023-12-25 上海臻上医薬科技有限公司 マイクロニードル注射製剤およびその使用
CN119384498A (zh) 2022-06-16 2025-01-28 因特利亚治疗公司 用于对细胞进行遗传修饰的方法和组合物
EP4544043A1 (en) 2022-06-22 2025-04-30 Flagship Pioneering Innovations VI, LLC Compositions of modified trems and uses thereof
JP2025525437A (ja) 2022-06-29 2025-08-05 インテリア セラピューティクス,インコーポレイテッド 操作されたt細胞
AU2023314808A1 (en) 2022-07-29 2025-03-20 Regeneron Pharmaceuticals, Inc. Compositions and methods for transferrin receptor (tfr)-mediated delivery to the brain and muscle
WO2024030856A2 (en) 2022-08-01 2024-02-08 Flagship Pioneering Innovations Vii, Llc Immunomodulatory proteins and related methods
WO2024035952A1 (en) 2022-08-12 2024-02-15 Remix Therapeutics Inc. Methods and compositions for modulating splicing at alternative splice sites
EP4590820A2 (en) 2022-09-22 2025-07-30 Accuredit Therapeutics (Suzhou) Co., Ltd. Compositions and methods for treatment of hypercholesterolemia and/or cardiovascular disease
WO2024077191A1 (en) 2022-10-05 2024-04-11 Flagship Pioneering Innovations V, Inc. Nucleic acid molecules encoding trif and additionalpolypeptides and their use in treating cancer
EP4612296A1 (en) 2022-10-31 2025-09-10 Flagship Pioneering Innovations VI, LLC Compositions and methods for purifying polyribonucleotides
EP4612184A1 (en) 2022-11-04 2025-09-10 Regeneron Pharmaceuticals, Inc. Calcium voltage-gated channel auxiliary subunit gamma 1 (cacng1) binding proteins and cacng1-mediated delivery to skeletal muscle
EP4615465A1 (en) 2022-11-08 2025-09-17 Flagship Pioneering Innovations VI, LLC Compositions and methods for producing circular polyribonucleotides
WO2024102434A1 (en) 2022-11-10 2024-05-16 Senda Biosciences, Inc. Rna compositions comprising lipid nanoparticles or lipid reconstructed natural messenger packs
EP4619438A2 (en) 2022-11-14 2025-09-24 Regeneron Pharmaceuticals, Inc. Compositions and methods for fibroblast growth factor receptor 3-mediated delivery to astrocytes
WO2024129988A1 (en) 2022-12-14 2024-06-20 Flagship Pioneering Innovations Vii, Llc Compositions and methods for delivery of therapeutic agents to bone
CN118236344A (zh) * 2022-12-15 2024-06-25 深圳瑞吉生物科技有限公司 一种核酸脂质纳米载体及其制备方法与应用
AU2023409835A1 (en) * 2022-12-20 2025-07-03 Seqirus Inc. Lipid nanoparticle composition
CN120641573A (zh) 2022-12-22 2025-09-12 英特利亚治疗股份有限公司 用于分析脂质核酸组装体的核酸运载物的方法
TW202428878A (zh) 2022-12-23 2024-07-16 美商英特利亞醫療公司 用於基因體編輯之系統及方法
WO2024151687A1 (en) 2023-01-09 2024-07-18 Flagship Pioneering Innovations V, Inc. Genetic switches and their use in treating cancer
WO2024151673A2 (en) 2023-01-09 2024-07-18 President And Fellows Of Harvard College Recombinant nucleic acid molecules and their use in wound healing
TW202438673A (zh) 2023-01-09 2024-10-01 美商旗艦先鋒創新有限責任(Vii)公司 疫苗及相關方法
US20240252520A1 (en) 2023-01-09 2024-08-01 Beth Israel Deaconess Medical Center, Inc. Therapeutic agents and their use for treating chronic wounds
US20240269263A1 (en) 2023-02-06 2024-08-15 Flagship Pioneering Innovations Vii, Llc Immunomodulatory compositions and related methods
WO2024173307A2 (en) 2023-02-13 2024-08-22 Flagship Pioneering Innovation Vii, Llc Cleavable linker-containing ionizable lipids and lipid carriers for therapeutic compositions
US20240285805A1 (en) 2023-02-17 2024-08-29 Flagship Pioneering Innovations Vii, Llc Dna compositions comprising modified uracil
AU2024220221A1 (en) 2023-02-17 2025-08-07 Flagship Pioneering Innovations Vii, Llc Dna compositions comprising modified cytosine
WO2024192422A1 (en) 2023-03-15 2024-09-19 Flagship Pioneering Innovations Vi, Llc Immunogenic compositions and uses thereof
AU2024235803A1 (en) 2023-03-15 2025-09-25 Flagship Pioneering Innovations Vi, Llc Compositions comprising polyribonucleotides and uses thereof
WO2024216128A1 (en) 2023-04-12 2024-10-17 Flagship Pioneering Innovations Vi, Llc Trems for use in correction of missense mutations
WO2024216191A1 (en) 2023-04-12 2024-10-17 Flagship Pioneering Innovations Vi, Llc Modified trems, compositions, and related methods thereof
WO2024220746A2 (en) 2023-04-21 2024-10-24 Flagship Pioneering Innovations Vii, Llc Rnai agents targeting fatty acid synthase and related methods
WO2024258829A1 (en) 2023-06-12 2024-12-19 Flagship Pioneering Innovations Vii, Llc Sars-cov-2 vaccine compositions and related methods
WO2024259135A1 (en) 2023-06-13 2024-12-19 Intellia Therapeutics, Inc. Assays for analysis of ribonucleic acid (rna) molecules
WO2025006684A1 (en) 2023-06-28 2025-01-02 Flagship Pioneering Innovations Vi, Llc Circular polyribonucleotides encoding antifusogenic polypeptides
WO2025006963A1 (en) 2023-06-30 2025-01-02 Regeneron Pharmaceuticals, Inc. Methods and compositions for increasing homology-directed repair
US20250092426A1 (en) 2023-07-25 2025-03-20 Flagship Pioneering Innovations Vii, Llc Cas endonucleases and related methods
WO2025029654A2 (en) 2023-07-28 2025-02-06 Regeneron Pharmaceuticals, Inc. Use of bgh-sv40l tandem polya to enhance transgene expression during unidirectional gene insertion
WO2025029662A1 (en) 2023-07-28 2025-02-06 Regeneron Pharmaceuticals, Inc. Anti-tfr: acid sphingomyelinase for treatment of acid sphingomyelinase deficiency
WO2025038646A1 (en) 2023-08-14 2025-02-20 Intellia Therapeutics, Inc. Cd70 car-t compositions and methods for cell-based therapy
TW202515994A (zh) 2023-08-14 2025-04-16 美商英特利亞醫療公司 用於對cd70進行基因修飾之組合物及方法
WO2025038648A1 (en) 2023-08-14 2025-02-20 Intellia Therapeutics, Inc. Compositions and methods for genetically modifying transforming growth factor beta receptor type 2 (tgfβr2)
WO2025038637A1 (en) 2023-08-14 2025-02-20 Intellia Therapeutics, Inc. Compositions and methods for genetically modifying transforming growth factor beta receptor type 2 (tgfβr2)
WO2025042786A1 (en) 2023-08-18 2025-02-27 Flagship Pioneering Innovations Vi, Llc Compositions comprising circular polyribonucleotides and uses thereof
WO2025049481A1 (en) 2023-08-28 2025-03-06 Intellia Therapeutics, Inc. Methods of editing an hla-a gene in vitro
WO2025045247A1 (en) * 2023-08-31 2025-03-06 Geneditbio Limited Nucleic acids encoding crispr-associated proteins and uses thereof
WO2025054236A2 (en) 2023-09-06 2025-03-13 Flagship Pioneering Innovations Vii, Llc Sars-cov-2 vaccine compositions and related methods
WO2025064396A1 (en) 2023-09-18 2025-03-27 Intellia Therapeutics, Inc. Nuclease resistant double stranded dna product for non-viral delivery to a cell and methods of production thereof
WO2025064401A1 (en) 2023-09-18 2025-03-27 Intellia Therapeutics, Inc. Nuclease resistant single stranded dna product for non-viral delivery to a cell and methods of production thereof
TW202525266A (zh) 2023-09-18 2025-07-01 美商旗艦先鋒創新有限責任(Vii)公司 可電離類脂質組成物及其治療用途
WO2025072331A1 (en) 2023-09-26 2025-04-03 Flagship Pioneering Innovations Vii, Llc Cas nucleases and related methods
WO2025096807A2 (en) 2023-10-31 2025-05-08 Flagship Pioneering Innovations Vii, Llc Novel therapeutic dna forms
US20250162981A1 (en) 2023-11-14 2025-05-22 Flagship Pioneering Innovations Vii, Llc Ionizable lipidoid compositions and therapeutic uses thereof
US20250161347A1 (en) 2023-11-22 2025-05-22 Flagship Pioneering Innovations Vii, Llc Methods and compositions for treating non-alcoholic fatty liver disease
WO2025117877A2 (en) 2023-12-01 2025-06-05 Flagship Pioneering Innovations Vii, Llc Cas nucleases and related methods
WO2025128871A2 (en) 2023-12-13 2025-06-19 Renagade Therapeutics Management Inc. Lipid nanoparticles comprising coding rna molecules for use in gene editing and as vaccines and therapeutic agents
WO2025137439A2 (en) 2023-12-20 2025-06-26 Intellia Therapeutics, Inc. Engineered t cells
WO2025137301A1 (en) 2023-12-20 2025-06-26 Intellia Therapeutics, Inc. Methods for rapid engineering of cells
WO2025160340A2 (en) 2024-01-26 2025-07-31 Regeneron Pharmaceuticals, Inc. Combination immunosuppression for inhibiting an immune response and enabling immunogen administration and re-administration
WO2025160334A1 (en) 2024-01-26 2025-07-31 Flagship Pioneering Innovations Vii, Llc Immunoreceptor inhibitory proteins and related methods
WO2025194019A1 (en) 2024-03-14 2025-09-18 Flagship Pioneering Innovations Vii, Llc Methods for treating liver fibrosis and non-alcoholic fatty liver disease

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015095340A1 (en) * 2013-12-19 2015-06-25 Novartis Ag Lipids and lipid compositions for the delivery of active agents
WO2016153012A1 (ja) * 2015-03-24 2016-09-29 協和発酵キリン株式会社 核酸含有脂質ナノ粒子
WO2016197133A1 (en) * 2015-06-04 2016-12-08 Protiva Biotherapeutics, Inc. Delivering crispr therapeutics with lipid nanoparticles
WO2017093804A2 (en) * 2015-12-01 2017-06-08 Crispr Therapeutics Ag Materials and methods for treatment of alpha-1 antitrypsin deficiency
WO2017109757A1 (en) * 2015-12-23 2017-06-29 Crispr Therapeutics Ag Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration
WO2017127750A1 (en) * 2016-01-22 2017-07-27 Modernatx, Inc. Messenger ribonucleic acids for the production of intracellular binding polypeptides and methods of use thereof

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102905763B (zh) 2009-12-23 2015-06-17 诺华股份有限公司 脂质、脂质组合物和使用它们的方法
US8691750B2 (en) * 2011-05-17 2014-04-08 Axolabs Gmbh Lipids and compositions for intracellular delivery of biologically active compounds
ES2576128T3 (es) 2012-12-12 2016-07-05 The Broad Institute, Inc. Modificación por tecnología genética y optimización de sistemas, métodos y composiciones para la manipulación de secuencias con dominios funcionales
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
SG10201912991WA (en) 2012-12-17 2020-03-30 Harvard College Rna-guided human genome engineering
EP2964608B1 (en) 2013-03-08 2019-08-28 Novartis AG Lipids and lipid compositions for the delivery of active agents
US10342760B2 (en) * 2013-03-15 2019-07-09 The University Of British Columbia Lipid nanoparticles for transfection and related methods
DK3019619T3 (da) * 2013-07-11 2021-10-11 Modernatx Inc Sammensætninger, der omfatter syntetiske polynukleotider, som koder for crispr-beslægtede proteiner, og syntetiske sgrna'er, og anvendelsesfremgangsmåder
US20150166982A1 (en) 2013-12-12 2015-06-18 President And Fellows Of Harvard College Methods for correcting pi3k point mutations
EP3470089A1 (en) * 2013-12-12 2019-04-17 The Broad Institute Inc. Delivery, use and therapeutic applications of the crispr-cas systems and compositions for targeting disorders and diseases using particle delivery components
CN106794141B (zh) 2014-07-16 2021-05-28 诺华股份有限公司 将核酸包封在脂质纳米粒主体中的方法
EP3858990A1 (en) 2015-03-03 2021-08-04 The General Hospital Corporation Engineered crispr-cas9 nucleases with altered pam specificity
US20190054112A1 (en) * 2015-09-18 2019-02-21 Moderna Therapeutics, Inc. Polynucleotide formulations for use in the treatment of renal diseases
CN109475646A (zh) * 2016-03-30 2019-03-15 因特利亚治疗公司 用于crispr/cas成分的脂质纳米颗粒制剂
MX2019007594A (es) * 2016-12-22 2019-12-16 Intellia Therapeutics Inc Composiciones y metodos para tratar la deficiencia de alfa-1 antitripsina.

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2015095340A1 (en) * 2013-12-19 2015-06-25 Novartis Ag Lipids and lipid compositions for the delivery of active agents
WO2016153012A1 (ja) * 2015-03-24 2016-09-29 協和発酵キリン株式会社 核酸含有脂質ナノ粒子
WO2016197133A1 (en) * 2015-06-04 2016-12-08 Protiva Biotherapeutics, Inc. Delivering crispr therapeutics with lipid nanoparticles
WO2017093804A2 (en) * 2015-12-01 2017-06-08 Crispr Therapeutics Ag Materials and methods for treatment of alpha-1 antitrypsin deficiency
WO2017109757A1 (en) * 2015-12-23 2017-06-29 Crispr Therapeutics Ag Materials and methods for treatment of amyotrophic lateral sclerosis and/or frontal temporal lobular degeneration
WO2017127750A1 (en) * 2016-01-22 2017-07-27 Modernatx, Inc. Messenger ribonucleic acids for the production of intracellular binding polypeptides and methods of use thereof

Also Published As

Publication number Publication date
EP3688162B1 (en) 2024-03-06
SG11202002653UA (en) 2020-04-29
IL320823A (en) 2025-07-01
JP2020536125A (ja) 2020-12-10
MX2020007148A (es) 2020-10-08
JP2025084955A (ja) 2025-06-03
AU2024224004A1 (en) 2024-10-24
AU2018338915B2 (en) 2024-10-24
SA520411636B1 (ar) 2024-06-09
CN111406108A (zh) 2020-07-10
IL273541A (en) 2020-05-31
MY204993A (en) 2024-09-26
IL273541B1 (en) 2025-06-01
TW201924724A (zh) 2019-07-01
EP3688162A1 (en) 2020-08-05
AU2018338915A1 (en) 2020-04-23
JP7645929B2 (ja) 2025-03-14
US20230140670A1 (en) 2023-05-04
BR112020006300A2 (pt) 2020-10-20
LT3688162T (lt) 2024-05-27
JP7284179B2 (ja) 2023-05-30
KR20250042147A (ko) 2025-03-26
MX2024013597A (es) 2024-12-06
TWI833708B (zh) 2024-03-01
PH12020552306A1 (en) 2023-07-17
AU2018338915C1 (en) 2025-05-08
UA129257C2 (uk) 2025-03-05
KR20200079497A (ko) 2020-07-03
CA3077413A1 (en) 2019-04-04
DK3688162T3 (da) 2024-05-13
HRP20240627T1 (hr) 2024-08-02
RS65493B1 (sr) 2024-05-31
SMT202400172T1 (it) 2024-07-09
PT3688162T (pt) 2024-04-23
FI3688162T3 (fi) 2024-05-15
EP4385514A3 (en) 2024-10-23
WO2019067992A1 (en) 2019-04-04
HUE066630T2 (hu) 2024-08-28
EA202090868A1 (ru) 2020-09-16
PL3688162T3 (pl) 2024-06-10
AR113031A1 (es) 2020-01-15
ES2980114T3 (es) 2024-09-30
EP4385514A2 (en) 2024-06-19
SI3688162T1 (sl) 2024-06-28

Similar Documents

Publication Publication Date Title
JP7645929B2 (ja) 製剤
AU2018339089B2 (en) Polynucleotides, compositions, and methods for genome editing
KR102832035B1 (ko) 지질 나노파티클을 이용한 mRNA 전달의 체외 방법
KR20220004648A (ko) Ttr 가이드 rna, 및 rna-가이드 dna 결합제를 암호화하는 폴리뉴클레오티드를 포함하는 조성물 및 방법
KR20220004984A (ko) Ttr 유전자 편집을 위한 조성물 및 방법 및 코르티코스테로이드를 포함하는 attr 아밀로이드증의 치료 또는 그의 용도
KR20200058509A (ko) Attr 아밀로이드증의 ttr 유전자 편집 및 치료를 위한 조성물 및 방법
KR20210027389A (ko) 공여자 폴리뉴클레오티드의 삽입에 의한 게놈 편집을 위한 조성물 및 방법
KR20220004649A (ko) 폴리펩티드 발현을 위한 폴리뉴클레오티드, 조성물 및 방법
TW202309034A (zh) Dna依賴性蛋白質激酶抑制劑以及其組合物及用途
KR20230042005A (ko) 반감기가 연장된 mrna 치료제를 포함하는 lnp 조성물
WO2024229386A1 (en) Myotis lucifugus transposase engineering
WO2025019807A2 (en) Compositions and methods for epigenetic regulation of rfxap expression
HK40025999B (en) Formulations
HK40025999A (en) Formulations
HK40033101A (en) Formulations

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230616

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230616

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230707

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240312

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20240612

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20240708

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20240827

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20241118

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250304

R150 Certificate of patent or registration of utility model

Ref document number: 7645929

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150